無塵粉碎系統(tǒng) 脈沖式氣流混合系統(tǒng) 自動提升料斗混合機 無塵投料站 噸袋卸料機 真空輸送設(shè)備 計量分裝機 CIP清洗單元 代理設(shè)備—干法制粒機
摘要:近年來,隨著低值大宗氨基酸產(chǎn)品產(chǎn)業(yè)逐漸向發(fā)展中國家轉(zhuǎn)移,我國已成為世界氨基酸發(fā)酵產(chǎn)業(yè)大國,氨基酸需求量不斷增加,應(yīng)用范圍不斷拓展。由于氨基酸發(fā)酵屬于技術(shù)密集型產(chǎn)業(yè),涉及的化工單元操作比較多,因此,保證關(guān)鍵工藝參數(shù)的可控性和重現(xiàn)性對連續(xù)自動化生產(chǎn)至關(guān)重要。為了提高發(fā)酵過程分析和控制水平,提高產(chǎn)品產(chǎn)率和轉(zhuǎn)化率,采用基于化學(xué)計量學(xué)的近紅外光譜技術(shù)的分析過程,建立一個穩(wěn)定、可靠的氨基酸發(fā)酵過程預(yù)測模型,實時監(jiān)測發(fā)酵過程中各參數(shù)的濃度,為氨基酸發(fā)酵生產(chǎn)過程優(yōu)化與自動化控制奠定了理論基礎(chǔ)。
關(guān)鍵詞:近紅外光譜;化學(xué)計量學(xué)分析;氨基酸發(fā)酵;預(yù)測模型
一、引言
近年來,隨著低值大宗氨基酸產(chǎn)品產(chǎn)業(yè)逐漸向發(fā)展中國家轉(zhuǎn)移,我國已成為世界氨基酸發(fā)酵產(chǎn)業(yè)大國,氨基酸需求量不斷增加,其應(yīng)用范圍不斷拓展。當(dāng)前,發(fā)酵過程分析的重點問題是及時地自動監(jiān)測各大關(guān)鍵工藝參數(shù),對數(shù)據(jù)的最終結(jié)果進行統(tǒng)計、整理、分析,同時要反映出實際控制工藝的整體操作環(huán)節(jié),切實保障批次之間的控制工藝能夠統(tǒng)一,產(chǎn)品的品質(zhì)無可挑剔,降低廢品出現(xiàn)的可能性,節(jié)省勞動力方面的支出以及避免人力所導(dǎo)致的誤差,落實及時化的產(chǎn)品通過幾率,大大縮減整體生產(chǎn)周期,這將更有益于工藝優(yōu)化以及交接。近年來,近紅外光譜技術(shù)廣泛地應(yīng)用在發(fā)酵領(lǐng)域的諸多方面,主要集中在發(fā)酵底物和終產(chǎn)品的檢測方面,而應(yīng)用于發(fā)酵過程監(jiān)測和自動控制的研究基本處于空白。
(一)氨基酸發(fā)酵產(chǎn)業(yè)
氨基酸發(fā)酵產(chǎn)業(yè)歸根結(jié)底來說屬于技術(shù)密集型產(chǎn)業(yè),它所觸及的化工單元操作極為繁多,西方發(fā)達(dá)國家以往常用的間斷型非持續(xù)化的制造方法已逐步被替換為效率顯然更優(yōu)化的連續(xù)化自動生產(chǎn)方法。國內(nèi)的氨基酸產(chǎn)業(yè)在控制技術(shù)層面上一般表現(xiàn)得較為滯后,制造階段依然將人力控制作為常有的方式,電腦技術(shù)的運用起始時間相對比較晚,普及率也極為一般。針對氨基酸發(fā)酵這一問題來說,明確保障關(guān)鍵工藝參數(shù)本身的可操控特性以及重現(xiàn)特性對于連續(xù)化自動生產(chǎn)而言極為必要。氨基酸發(fā)酵的整體過程的要點大體上被歸納為如下內(nèi)容:
第一,在各方面始終堅持純培養(yǎng),包括設(shè)備、培養(yǎng)液以及空氣滅菌處理:對于發(fā)酵的整體過程而言,不管是屬于分批次的發(fā)酵還是連續(xù)性的發(fā)酵,其第一大準(zhǔn)則就是在實操進行期間內(nèi)一定要堅持純培養(yǎng),唯有堅持這一點方能確保常規(guī)化的生產(chǎn)過程,氨基酸發(fā)酵亦不能區(qū)別對待。
第二、對發(fā)酵過程實施整體的控制,比如pH、溫度、通氣以及消泡沫:對發(fā)酵過程實施控制的目的是要令其保障菌體能夠用最佳速度發(fā)育,并實現(xiàn)其產(chǎn)物的無異?;铣?/span>[1]。發(fā)酵過程從根本上能夠劃分成兩個重要的階段:一個是生長期(即從細(xì)胞初始化地生長直至指數(shù)生長完為止),一個是生產(chǎn)期(即指數(shù)生長完直到細(xì)胞開啟代謝過程并累積了氨基酸為止)。
第三、產(chǎn)物的形成(溶氧以及代謝):氨基酸的發(fā)酵其實是消耗氧氣的一個過程,因此,產(chǎn)物生產(chǎn)和溶氧之間有著極大的關(guān)聯(lián)[2],諸如此類的氨基酸發(fā)酵過程避免不了地需要足量的氧氣,使其符合細(xì)胞呼吸的條件,發(fā)酵液所具有的溶氧壓力則必須要維持在0.0003的大氣壓以上方可獲得高產(chǎn)量。
(二)近紅外光譜分析技術(shù)
近紅外光譜分析技術(shù)(Near Infrared Spectroscopy)作為“綠色檢測技術(shù)”克服了傳統(tǒng)分析方法檢測速度慢、樣品處理步驟復(fù)雜等缺點,被廣泛應(yīng)用于制藥、食品、石油化工等領(lǐng)域。該技術(shù)可根據(jù)有機物含氫基團(主要包括C-H,N-H,O-H,S-H)對近紅外光譜吸收的差異區(qū)分不同物質(zhì)并測定其濃度。NIR光譜儀擁有多種檢測終端,如光纖探頭、液體流通池、積分球等,可以采用透射(透反射、漫透射)、反射(漫反射)等檢測方法進行測定。NIR測定對樣品要求簡單,可以直接測定(一般不進行預(yù)處理或者簡單預(yù)處理,如除氣和過濾等),且測定速度快,可以進行多理化參數(shù)同時分析,結(jié)果可靠,非常適合生產(chǎn)中的PAT要求[3]。NIR光譜技術(shù)在生物發(fā)酵應(yīng)用場景整體組成如圖1所示。
圖1 NIR光譜技術(shù)在生物發(fā)酵應(yīng)用場景
二、基于化學(xué)計量學(xué)的近紅外光譜技術(shù)分析
基于化學(xué)計量學(xué)的近紅外光譜分析的基本信息流程處理環(huán)節(jié)主要有:多元信息采集,多元數(shù)據(jù)關(guān)鍵特征提取及多元數(shù)據(jù)建模。根據(jù)不同環(huán)節(jié)在預(yù)測模型性能中的作用,主要有以下幾種技術(shù)分析方法。
(一)數(shù)據(jù)采集
樣本數(shù)據(jù)采集是近紅外建模分析的第一步,對預(yù)測模型關(guān)系信息和范圍信息起決定性作用。實際信息采集過程通常包括三個環(huán)節(jié):代表性樣本選擇、光譜信息測量和參比值測量。因此,從以下幾個方面進行數(shù)據(jù)采集方法的介紹。
1、選擇代表性樣品
選擇具有一定范圍的樣品類型信息,其中樣品的化學(xué)范圍信息構(gòu)成參比值的結(jié)構(gòu)范圍,濃度成分范圍和物理空間范圍分別構(gòu)成樣品的濃度范圍和空間范圍。簡單說,就是選擇樣品時需要同時考慮深度和縱度,其中深度表示參比值的大小范圍,縱度則表示相同濃度下不同產(chǎn)地或產(chǎn)區(qū)樣品的數(shù)目。
2、測定光譜數(shù)據(jù)
建模數(shù)據(jù)集中通常包含確定信息和不確定信息,其中確定信息是預(yù)測模型關(guān)聯(lián)中對應(yīng)于參比值的光譜特征,其可靠程度決定了預(yù)測模型的準(zhǔn)確度和精確度。確定信息測量一般需要考慮儀器校正、預(yù)熱、樣品擺放、光纖是否損壞、燈源(特指鹵鎢燈)是否有效等等,而不確定信息一般是指光譜數(shù)據(jù)集中各樣品光譜測定所用的儀器參數(shù)、進樣參數(shù)與環(huán)境參數(shù)等可能變動的信息,這些不確定信息的變動范圍決定了預(yù)測模型應(yīng)對樣品光譜測量時的應(yīng)變能力,即決定了預(yù)測模型的穩(wěn)健性。
3、測定參比值
所有光譜定量分析預(yù)測模型的基礎(chǔ)是建立光譜變量和參比值之間的關(guān)系預(yù)測模型,但是近紅外屬于間接測量,其參比值通過標(biāo)準(zhǔn)物樣品的真值獲得,而實際分析過程中則通常是采用標(biāo)準(zhǔn)方法測定建模樣品中的樣品參比值,不同實驗人員的操作規(guī)范性、實驗環(huán)境以及儀器的校正使用都對分析結(jié)果產(chǎn)生隨機誤差和系統(tǒng)誤差,導(dǎo)致獲取的參比值通常含有誤差。
(二)數(shù)據(jù)處理與關(guān)聯(lián)分析
實驗獲取的近紅外光譜數(shù)據(jù)在建模之前需要進行預(yù)處理,目的是提高數(shù)據(jù)質(zhì)量;然后,進行特征工程以壓縮信息規(guī)模,進而提高信息表征能力;最后,基于化學(xué)計量學(xué)建模分析預(yù)測模型。
1、 數(shù)據(jù)預(yù)處理
數(shù)據(jù)預(yù)處理包括很多方面,譬如異常樣本剔除、光譜背景校正、去噪、樣本范圍確定以及樣品參比值正態(tài)分布檢驗。首先,需要考慮異常樣本剔除問題,通常來說,光譜吸光度、參比值偏大或偏小的一般屬于異常樣本,如果兩者同時偏大或偏小,則有可能是異常樣本,也有可能是范圍邊緣樣本,此時需要謹(jǐn)慎對待;然后,對剔除異常樣本的數(shù)據(jù)進行光譜預(yù)處理,主要有歸一化、移動窗口平滑、 SavitZky-Golay(SG)卷積平滑、 SG求導(dǎo)、標(biāo)準(zhǔn)正態(tài)變量校正(SNV)和多元散射校正(MSC)等[4-9],下一步根據(jù)文獻(xiàn)確定分析變量的范圍,最終確定建模樣本。
2、數(shù)據(jù)特征工程
預(yù)處理后的光譜數(shù)據(jù)維度較高,無法直接進行建模分析,需要進行變量的特征工程處理確定特征變量。特征工程泛指從數(shù)據(jù)中提取需要的特征變量,現(xiàn)有的方法主要有偏 最 小 二 乘 (Partialleast Squares, PLS)、主 成 分 分 析 (Principal Component Analysis,PCA)、線性 判 別 分 析 (Linear Discriminant Analysis,LDA)、正交線性判別分析(Orthogonal Linear Discriminant Analysis,OLDA)等不同方法[10-12],針對不同的對象可采用合適的方法。其中,PCA是目前應(yīng)用范圍較廣的分析方法之一,但是其解釋性較弱,現(xiàn)在也有應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)做近紅外光譜分析的,結(jié)果通常比較漂亮,但是很難用數(shù)學(xué)去表達(dá)其處理過程。
3、建模與模型應(yīng)用
近紅外預(yù)測模型的最后一步是建模分析及應(yīng)用,其中建模過程是指建立特征和參比值矩陣的關(guān)聯(lián)模型,分為線性和非線性方法,對于基于儀器的預(yù)測模型而言,所有的工作都集合在一起,整個過程全部都按照設(shè)定程序執(zhí)行;對于預(yù)測模型應(yīng)用,通常需要確定分析樣品光譜是否在分析范圍之內(nèi)。
按照上述思路,基于化學(xué)計量學(xué)近紅外光譜分析的基本技術(shù)思路是:建立與應(yīng)用容變性的關(guān)系模型,以解決光譜變動對分析結(jié)果的影響。其中,容變性模型是指關(guān)系模型的關(guān)系可靠性與模型分析范圍的容變性,即前面所述的關(guān)系信息和范圍信息。由圖2可知,相比于常規(guī)光譜分析,近紅外光譜分析過程在建立關(guān)系模型的同時,也需要采集與處理模型范圍信息,并根據(jù)分析結(jié)果進行反向優(yōu)化模型結(jié)構(gòu)和模型參數(shù)等,實現(xiàn)模型優(yōu)化。
圖2 常規(guī)光譜分析與近紅外光譜分析技術(shù)思路對比
三、近紅外光譜技術(shù)在氨基酸發(fā)酵過程應(yīng)用
(一)近紅外光譜對色氨酸發(fā)酵L-色氨酸質(zhì)量濃度定量分析預(yù)測
文獻(xiàn)[13]提出將偏最小二乘算法(PLS)L-色氨酸近紅外光譜預(yù)測模型作為實驗參考對象;采用Tensor37傅里葉近紅外分析儀采集發(fā)酵液近紅外光譜L-色氨酸樣本,采用11種預(yù)處理方法處理,選擇不同預(yù)處理下最合適波數(shù)范圍,結(jié)合PLS算法以及的條件下建立最優(yōu)L-色氨酸濃度定量分析預(yù)測模型。表1展示了不同光譜預(yù)處理方式對應(yīng)的預(yù)測模型性能評估指標(biāo)結(jié)果值。
表1 不同光譜預(yù)處理條件下的L-色氨酸濃度最優(yōu)模型
從表1可知,最終選擇模型的構(gòu)建方法為:預(yù)處理方法為二階導(dǎo)數(shù),波數(shù)范圍為6101.8-5450cm-1,再結(jié)合偏最小二乘算法建立校正模型。二階導(dǎo)數(shù)可以消除由于氣泡、細(xì)胞的懸濁物存在所引起的基線漂移,加強光譜的微小差異。
(二)近紅外光譜對谷氨酸發(fā)酵乳酸質(zhì)量濃度定量分析預(yù)測
文獻(xiàn)[14]采用近紅外光譜技術(shù)結(jié)合偏最小二乘的方法建立并優(yōu)化谷氨酸溫度敏感突變株發(fā)酵過程中乳酸濃度預(yù)測模型。首先,采用近紅外分析軟件OPUS7.0分別在全圖譜和波數(shù)為6000-8000 cm-1條件下利用原始光譜和不同光譜預(yù)處理方式,建立和優(yōu)化發(fā)酵液中乳酸濃度校正模型,所得各模型參數(shù)如表2所示。
表2 不同光譜預(yù)處理和波數(shù)范圍條件下乳酸濃度最優(yōu)模型
從表2可知,作為評價模型的重要指標(biāo),RMSECV值越小,說明所建模型的預(yù)測能力越強;對全圖譜范圍及不同預(yù)處理條件下各模型RMSECV值分析后可知,當(dāng)預(yù)處理為1st+SNV時RMSECV值、RPD值以及決定系數(shù)(R2)分別為0.822g/L、3.5和0.753,優(yōu)于其他模型;而在波數(shù)為6000-8000cm-1范圍內(nèi),預(yù)處理為1st+SNV時RMSECV值最?。?/span>0.544g/L),說明全圖譜中含有大量噪音,對模型有一定影響,而在6000-8000cm-1范圍內(nèi)有利于提取光譜有效信息,適合模型的建立。表3展示了在光譜預(yù)處理為1st+SNV條件下,選擇不同波數(shù)范圍進一步優(yōu)化乳酸濃度校正模型各項參數(shù)結(jié)果。
表3 1st+SNV條件下不同波數(shù)范圍對乳酸濃度模型的影響
從表3可知,模型28中RMSECV值(0.482g/L)低于其他模型,R2為0.912,較模型18有所提高。因此,5500-6000cm-1和4200-4900cm-1兩個特征區(qū)域所蘊含的有效信息有利于模型優(yōu)化。因此,結(jié)合偏最小二乘的方法,在光譜預(yù)處理為一階導(dǎo)數(shù)+矢量歸一化(1st+SNV)、波數(shù)為5500-7500cm-1+4200-4900cm-1條件下獲得最優(yōu)乳酸濃度預(yù)測模型。
(三)近紅外光譜對異亮氨酸發(fā)酵異亮氨酸質(zhì)量濃度定量分析預(yù)測
文獻(xiàn)[15]提出利用近紅外分析儀和相關(guān)近紅外軟件,建立谷氨酸棒桿菌發(fā)酵過程中異亮氨酸質(zhì)量濃度的近紅外預(yù)測模型;采用近紅外分析軟件OPUS7.0,分別在全波長和7400-9100cm-1波數(shù)范圍內(nèi)選擇原始光譜和不同光譜預(yù)處理的方法,建立異亮氨酸質(zhì)量濃度PLS最優(yōu)校正模型,模型各項參數(shù)結(jié)果如表4所示。
表4 不同光譜預(yù)處理的異亮氨酸質(zhì)量濃度模型
由表4可知,在相同光譜預(yù)處理條件下7400-9100cm-1波數(shù)范圍內(nèi)所建立模型RMSECV值均小于全波長;當(dāng)光譜預(yù)處理為減去一條直線時,相比其他預(yù)處理RMSECV值最小為1.73g/L,決定系數(shù)達(dá)到0.997,因此,結(jié)合偏最小二乘法,在波數(shù)為7400-9100cm-1,減去一條直線作為光譜預(yù)處理的條件,獲得異亮氨酸質(zhì)量濃度最優(yōu)近紅外近紅外預(yù)測模型。
四、近紅外光譜技術(shù)應(yīng)用前期與展望
近紅外光譜技術(shù)在氨基酸發(fā)酵過程中以物質(zhì)濃度預(yù)測模型為基礎(chǔ),可以結(jié)合代謝網(wǎng)絡(luò)定量分析結(jié)果、分析菌體生長、產(chǎn)物合成和基質(zhì)消耗的動力學(xué)特征,以溫度、PH值、攪拌轉(zhuǎn)速及溶解氧濃度等環(huán)境變量為狀態(tài)變量,以底物、重要中間代謝物及目標(biāo)產(chǎn)物等生化指標(biāo)變量為證據(jù)變量,基于合適時間單位對不確定性、非線性的發(fā)酵過程進行實時建模。為了更好的檢測氨基酸發(fā)酵過程中底物消耗、產(chǎn)物積累等數(shù)據(jù),基于化學(xué)計量學(xué)可以逐步建立和調(diào)整獲得最優(yōu)化的氨基酸發(fā)酵過程參數(shù)模型數(shù)據(jù)庫;在發(fā)酵過程中引入近紅外光譜技術(shù)可以提高生產(chǎn)過程可控性,實現(xiàn)生產(chǎn)的連續(xù)化,降低成本、提高生產(chǎn)效率,使得產(chǎn)品更加符合GMP要求。
參考文獻(xiàn):
[1]王志仁.氨基酸發(fā)酵[J].發(fā)酵科技通訊,1981(2):002.
[2]謝微.含氧化合物紅外光譜信息特征的研究[D].四川大學(xué),2006.
[3]嚴(yán)衍祿,編.近紅外光譜分析基礎(chǔ)及應(yīng)用[M].北京:中國輕工業(yè)出版社,2005.
[4] BAITie-cheng,WANGTao,etal.Spectroscopy and Spectral Analysis,2019,39(4):1323-1328.
[5] Anastassia Baxevani,Krzysztof Podgorski.Communications in Statistics-TheoryandMethods,2018,13(2):448.
[6] NikonovA V,Davletshin R V,Iakovleva N I,etal.Journal of Communications Technology and Electronics,2017 on conversion(9):1048.
[7] Tong Peijin,Dua Yiping,Zheng Kaiyi,etal.,Chemometrics and Intelligent Laboratory Systems,2015,143:40.
[8] Li Wenbing,Lu Jidong,Dong Meirong,etal.Energy& Fuels,2018,32(1):24.
[9]Taddeuccia T N,Haighta R C,Leea H Y,etal.Nuclear Data Sheets,2015,123:135.
[10] Mendes T O Junqueira G M A,Porto B L S,etal.JournalofRamanSpectroscopy,2016,47(6):692.
[11] Konstantinos E Parsopoulos,Michael N Vrahatis.Particle Swarm Optimization and Intelligence.1 sted.Hershey,New York:Informa-tion Science Reference,2010.
[12] Qin H,Ma J Y,Chen S J,etc.Infrared Technology,2015,1(37):78.
[13]郭宇飛,蘇毅,徐慶陽.基于近紅外檢測技術(shù)建立發(fā)酵過程中L-色氨酸濃度預(yù)測模型[J].生物技術(shù)通訊,2016(3).
[14]桂勇利,等.基于近紅外技術(shù)谷氨酸發(fā)酵過程中乳酸濃度預(yù)測模型的建立[J].食品與發(fā)酵工業(yè),2014(8).
[15]郭宇飛,石拓,徐慶陽.異亮氨酸發(fā)酵過程中濃度近紅外預(yù)測模型的建立[J].發(fā)酵科技通訊,2017(3).