3月19日,國際學(xué)術(shù)期刊Bioinformatics 在線發(fā)表了中國科學(xué)院上海生命科學(xué)研究院生物化學(xué)與細胞生物學(xué)研究所系統(tǒng)生物學(xué)重點實驗室陳洛南研究組題為Detecting critical state before phase transition of complex biological systems by hidden Markov model 的最新研究成果。該成果展示了通過分析時序列生物數(shù)據(jù),建立生物過程相應(yīng)的隱馬爾科夫模型,同時利用機器學(xué)習(xí)算法對復(fù)雜生物系統(tǒng)動態(tài)發(fā)展過程中的狀態(tài)臨界遷移進行預(yù)警的新方法。
基于數(shù)據(jù)進行復(fù)雜系統(tǒng)臨界變化的預(yù)測一直是生命科學(xué)、環(huán)境科學(xué)、金融學(xué)等領(lǐng)域的研究熱點,大數(shù)據(jù)時代的來臨更為開發(fā)穩(wěn)定、有效、能夠標識臨界狀態(tài)的標志物帶來了新的手段和可能。然而,現(xiàn)實的復(fù)雜系統(tǒng)往往具有如下特點:一是容易受到外界噪聲的干擾;二是在系統(tǒng)真正到達臨界點前不會表現(xiàn)出明顯的表型或特征;三是個體差異的普遍存在使得科學(xué)家很難找到普適的生物標志物。因此,如何利用個體的時序列動態(tài)信息,準確預(yù)測系統(tǒng)狀態(tài)發(fā)生遷移的臨界點,已經(jīng)成為一個極具科研價值和現(xiàn)實意義的研究熱點。
針對復(fù)雜生物過程的時序列數(shù)據(jù),陳洛南研究組與華南理工大學(xué)劉銳研究組合作開發(fā)了一套新的數(shù)據(jù)處理和分析方法,即:利用隱馬爾科夫模型對數(shù)據(jù)進行分段刻畫。具體來說,他們根據(jù)生物過程發(fā)生狀態(tài)的動態(tài)轉(zhuǎn)移特點,把生物動態(tài)過程劃分成三個階段:轉(zhuǎn)移前狀態(tài)、臨界狀態(tài)和轉(zhuǎn)移后狀態(tài),并把轉(zhuǎn)移前狀態(tài)和轉(zhuǎn)移后狀態(tài)這兩個穩(wěn)定狀態(tài)看作是平穩(wěn)的馬爾科夫過程(stationary Markov process),把臨界狀態(tài)看作是一個時變的馬爾科夫過程(time-varying Markov process),于是把探測將要發(fā)生的臨界現(xiàn)象轉(zhuǎn)化成探測轉(zhuǎn)移前狀態(tài)這個平穩(wěn)馬爾科夫過程的終點。該方法利用的是機器學(xué)習(xí)中的非監(jiān)督學(xué)習(xí)方法,具有效率高、穩(wěn)定性強和僅依賴于個體的動態(tài)數(shù)據(jù)等優(yōu)勢,并能準確捕捉到系統(tǒng)發(fā)生狀態(tài)變化的預(yù)警信號。該方法成功應(yīng)用在三組生物數(shù)據(jù)上,成功預(yù)警了小鼠肺部急性傷害的臨界期、MCF-7乳腺癌的臨界期以及肝部腫瘤的臨界期。
該研究得到了中國科學(xué)院和國家自然科學(xué)基金委的經(jīng)費支持。
運用馬爾科夫模型預(yù)測生物系統(tǒng)臨界狀態(tài)
標簽:
相關(guān)資訊