近日,由中國(guó)科學(xué)院北京基因組研究所(國(guó)家生物信息中心)團(tuán)隊(duì)發(fā)布了新冠信息庫(kù)RCoV19的升級(jí)版。該研究?jī)?nèi)容以“RCoV19: A One-stop Hub for SARS-CoV-2 Genome Data Integration, Variant Monitoring, and Risk Pre-warning”為題在國(guó)際學(xué)術(shù)期刊Genomics Proteomics & Bioinformatics 在線發(fā)表。 2020年1月22日,北京基因組所(國(guó)家生物信息中心)率先公開發(fā)布全球第一個(gè)新冠病毒綜合性信息庫(kù)RCoV19(原名2019nCoVR),動(dòng)態(tài)整合全球新冠病毒基因組信息,支持全球新冠病毒基因組數(shù)據(jù)的匯交存儲(chǔ)與共享,并提供突變注釋信息和演化支系等信息。經(jīng)過持續(xù)更新,RCoV19已發(fā)展為國(guó)際上規(guī)模最大、資源最豐富的新冠病毒研究公共平臺(tái)。 
新冠信息庫(kù)首頁(yè)
為更好服務(wù)新冠病毒科學(xué)研究與基于基因組大數(shù)據(jù)的監(jiān)測(cè)預(yù)警體系建設(shè),研究團(tuán)隊(duì)近期對(duì)RCoV19進(jìn)行了升級(jí)和完善。新冠肺炎是近一個(gè)世紀(jì)以來傳播范圍最廣、影響最大的流行病,新冠病毒的基因組序列數(shù)量遠(yuǎn)超其他已知病毒序列的總和。新冠病毒基因組序列來源多標(biāo)準(zhǔn)不統(tǒng)一、數(shù)據(jù)量大、持續(xù)增長(zhǎng),為數(shù)據(jù)的快速整合分析與挖掘帶來了巨大挑戰(zhàn)。同時(shí),新冠肺炎疫情仍在全球蔓延,新冠病毒基因組也在不斷發(fā)生變異和演化。為此,團(tuán)隊(duì)發(fā)展并建立大規(guī)模新冠病毒基因組數(shù)據(jù)的自動(dòng)化整合、實(shí)時(shí)監(jiān)測(cè)和高風(fēng)險(xiǎn)株系預(yù)警的方法和平臺(tái)。
團(tuán)隊(duì)研發(fā)了新冠病毒基因組數(shù)據(jù)整合審編的標(biāo)準(zhǔn)規(guī)范和處理流程,構(gòu)建了自動(dòng)化的數(shù)據(jù)審編模型和高效的數(shù)據(jù)共享平臺(tái),實(shí)現(xiàn)了全球新冠病毒基因組數(shù)據(jù)收集、去冗余、交叉引用、質(zhì)量評(píng)估、更新入庫(kù)的一站式自動(dòng)化操作和分析,提供了實(shí)時(shí)全面的新冠病毒基因組元信息、全球分布與統(tǒng)計(jì)等信息,以及高效的個(gè)性化高級(jí)檢索服務(wù);跀(shù)據(jù)庫(kù)整合的海量數(shù)據(jù),團(tuán)隊(duì)建立了基因組快速變異解析流程、單倍型網(wǎng)絡(luò)演化構(gòu)建算法以及基于機(jī)器學(xué)習(xí)的高風(fēng)險(xiǎn)株系預(yù)警模型,開發(fā)了新冠病毒傳播演化實(shí)時(shí)監(jiān)測(cè)平臺(tái)、高風(fēng)險(xiǎn)變異株預(yù)警可視化系統(tǒng)和交互式突變譜快速比對(duì)功能模塊,實(shí)現(xiàn)了新冠病毒基因組序列、變異和演化支系的可視化動(dòng)態(tài)監(jiān)測(cè),高風(fēng)險(xiǎn)變異株的及早預(yù)警,以及重要序列或譜系的變異特征規(guī)律分析。上述方法平臺(tái)為基因組大數(shù)據(jù)驅(qū)動(dòng)的公共衛(wèi)生安全響應(yīng)提供了重要的技術(shù)和數(shù)據(jù)支持。此外,人工審編了新冠病毒基因組突變的效應(yīng)知識(shí),涵蓋感染性/傳染性、抗體抗性、藥物抗性和T細(xì)胞表位等,幫助科研人員及防控政策決策人員更好地理解新冠病毒的變異特性,為科學(xué)研究及防控決策提供重要的參考。 北京基因組所(國(guó)家生物信息中心)李翠萍工程師、馬利娜副研究員(第九批會(huì)員)、鄒東高級(jí)工程師和碩士生張榮欽為該文共同第一作者,鮑一明研究員和宋述慧研究員(第七批會(huì)員)為該文共同通訊作者。本研究得到了中國(guó)科學(xué)院青年創(chuàng)新促進(jìn)會(huì)、中國(guó)科學(xué)院戰(zhàn)略重點(diǎn)研究計(jì)劃、2022年度“一帶一路”國(guó)際科學(xué)組織聯(lián)盟聯(lián)合研究合作專項(xiàng)、國(guó)家自然科學(xué)基金等項(xiàng)目的支持。 |