為了對抗冠狀病毒的變種或其他流行病,人們需要加快速度確定變種,從而制造出相應的疫苗。面對如此多的可能性,數學模型可能會幫上很大的忙,如南加州大學研究員保羅-博格丹及其團隊一起開發的模型。 他們的工作被刊登在《科學報告》的COVID-19專集上。
這項工作的起源來自于博格丹對核苷酸的思考:“我們如何能夠學習DNA或RNA序列、打印機或計算機程序以及打印機如何編碼背后的‘算法’。”
博格丹認為,這個數學模型能夠利用算法信息理論,為破譯病毒的內部工作規則打開分析路徑。
這項工作與直接比較基因組序列的傳統方法形成對比。相反,來自南加州大學和加州理工學院的研究團隊提出了一種計算、機器學習的方法,確定RNA序列背后的生成器/程序的算法,并在這些生成器/程序之間進行比較。博格丹說,生成器類似于計算機程序,因為它們編碼了隱藏的相似性、依賴性和規則,這些規則可能存在于RNA序列的兩個RNA核苷酸之間。這個工具可以根據區域或長度以及可能進化的時間段來評估基因組序列和變異。這就像病毒的祖先網。
科學家表示,除了研究人類宿主之外,這種方法還可以用來追蹤影響農作物的病原體,這樣一來,受到影響的整個行業都會得到保護。
該研究論文題為"Generator based approach to analyze mutations in genomic datasets",已發表在《科學報告》期刊上。
前瞻經濟學人APP資訊組
論文原文:https://www.nature.com/articles/s41598-021-00609-8?gclid=EAIaIQobChMIhcrZy8-c9QIVjuF3Ch2PgAUXEAAYASAAEgIZkPD_BwE