近日,中國科學院北京基因組研究所(國家生物信息中心)高遠團隊與動物研究所趙方慶團隊,開發出面向TB級轉錄組數據的高效環形RNA檢測與定量工具CIRI3,通過反向剪接序列比對與跨樣本整合算法設計,實現了TB級數據的超高速處理,并可高靈敏識別低豐度及非傳統剪接信號的新型環形RNA,突破了環形RNA大規模檢測方法的靈敏度與計算效率瓶頸。
針對現有環形RNA計算工具效率低、內存占用大等問題,CIRI3采用動態多線程任務劃分與分塊查找策略,實現了TB級測序數據的超高效處理(處理21TB SAM文件僅需105小時,峰值內存占用45.85 GB)。CIRI3可實現對大規模樣本的聯合分析。相較于單一樣本分析,聯合分析可有效防止“漏檢”,使得環形RNA的檢出率提升19.3%,并提升了低豐度環形RNA的檢測靈敏度與定量精度。同時,CIRI3對非經典剪接信號等關鍵特征具有高度的可擴展性,實現了對內含子自連接型環狀RNA等新亞型的系統性識別。綜合性能評估表明,CIRI3在環形RNA的識別與定量方面均優于現有工具,可為大規模環形RNA研究及疾病生物標志物的挖掘提供技術支撐。
基于CIRI3的大規模數據挖掘能力,研究團隊對涵蓋30種癌癥類型的2535個人類癌癥及正常樣本轉錄組測序數據進行整合挖掘,構建出迄今規模最大的AI-ready腫瘤相關環形RNA數據資源CIRIonco。評估表明,CIRI3計算的環形RNA剪接比率在不同批次和不同來源的樣本間表現出高度的穩健性,其批次效應低于傳統的反向剪接讀段數,使其成為跨批次、跨平臺整合分析的更優指標。進一步,基于差異剪接的環形RNA,團隊構建了基于人工智能的組織類型溯源與疾病表型預測模型,實現了樣本來源器官系統、組織類型及疾病水平的精準預測,展示了環形RNA作為疾病分子分型與早期診斷生物標志物的潛力。該模型可在用戶小規模數據集上遷移學習,實現優于從頭訓練模型的預測性能,為解析環形RNA的生成調控與功能機制提供了計算工具。
CIRI3是可在TB級人群隊列轉錄組數據中高效檢測和精確定量環形RNA的工具;CIRIonco數據庫為癌癥相關環形RNA的研究與功能探索提供了AI-ready數據集與計算模型,并為環形RNA在癌癥分型和精準診斷中的應用提供了方法學工具和數據基礎。
相關研究成果發表在《自然-生物技術》(Nature Biotechnology)上。研究工作得到國家重點研發計劃、國家自然科學基金、中國科學院戰略性先導科技專項等的支持。
論文鏈接:https://doi.org/10.1038/s41587-025-02835-1
CIRI3源代碼、在線分析網頁:https://ngdc.cncb.ac.cn/biocode/tool/BT007594;https://ngdc.cncb.ac.cn/bit/ciri3
CIRIonco數據庫:https://ngdc.cncb.ac.cn/cirionco

CIRI3方法原理

CIRIonco數據庫及組織類型溯源與疾病表型預測模型
近日,中國科學院北京基因組研究所(國家生物信息中心)高遠團隊與動物研究所趙方慶團隊,開發出面向TB級轉錄組數據的高效環形RNA檢測與定量工具CIRI3,通過反向剪接序列比對與跨樣本整合算法設計,實現了......
近日,中國科學院北京基因組研究所(國家生物信息中心)高遠團隊與動物研究所趙方慶團隊,開發出面向TB級轉錄組數據的高效環形RNA檢測與定量工具CIRI3,通過反向剪接序列比對與跨樣本整合算法設計,實現了......
近日,中國科學院北京基因組研究所(國家生物信息中心)高遠團隊與動物研究所趙方慶團隊,開發出面向TB級轉錄組數據的高效環形RNA檢測與定量工具CIRI3,通過反向剪接序列比對與跨樣本整合算法設計,實現了......
圖轉錄組光催化標記技術CAT-seq及同步多組學光催化標記技術CAT-ortho在國家自然科學基金項目(批準號:22222701、92478119、22321005、92253301)等資助下,北京大......
7月11日,由臨港實驗室牽頭,聯合上海科學智能研究院、上海交通大學、東京大學國際神經智能研究中心等多家單位,共同發布了全球首個跨物種大腦空間轉錄組基礎模型BrainBeacon。生命科學中的細胞“語言......
7月11日,由臨港實驗室牽頭,聯合上海科學智能研究院、上海交通大學、東京大學國際神經智能研究中心等多家單位,共同發布了全球首個跨物種大腦空間轉錄組基礎模型BrainBeacon。生命科學中的細胞“語言......
近日,中國農業科學院生物技術研究所玉米功能基因組創新團隊首次在單細胞水平解析了玉米根系細胞對熱脅迫的特異性響應機制,揭示了熱脅迫下植物根系的細胞異質性、根系類型的差異和分化軌跡,鑒定了單雙子葉植物響應......
環形RNA(circularRNA,circRNA)是一類廣泛存在于真核細胞中的內源性非編碼RNA分子,在生物體發育過程中發揮著重要作用。其獨特的環狀結構使其免受外切酶降解,因此比線性RNA更加穩定。......
通過轉錄組測序獲得人的基因表達譜數據,能進一步挖掘疾病相關的生物標志物,為臨床診斷提供依據。目前,由于轉錄組測序無法溯源,導致不同實驗室及測序平臺產出的數據可比性和測序結果的準確性面臨挑戰。中國計量科......
酒,是人類文明的產物,酒文化伴隨著整個人類文明的發展而不斷壯大。何以解憂?唯有杜康。無論是悲歡,還是離合,酒從不缺席。有趣的是,古有溫酒斬華雄,今有冰啤加燒烤,關于飲酒的最適溫度一直廣為爭論,就像豆腐......