• <li id="yyyyw"><noscript id="yyyyw"></noscript></li>
  • <table id="yyyyw"><noscript id="yyyyw"></noscript></table>
  • <td id="yyyyw"><option id="yyyyw"></option></td>
  • 發布時間:2015-08-12 16:44 原文鏈接: NatureMethods:超快速的基因組分析工具

      近年來,測序市場呈現出百花齊放的美好局面。這使得測序的成本不斷下降,但同時也帶來了數據分析的難題。經濟而又高效地處理全基因組測序的數據,相信是每個人的愿望。如今,一個開源的基因組分析平臺也許能滿足你的愿望。

      這個平臺被稱為SpeedSeq,由華盛頓大學醫學院等機構的研究人員開發。它利用低成本的服務器,在短短的13小時內即可完成50x人類基因組的比對、變異檢測和功能注釋。這項成果本周在線發表于《Nature Methods》上。

      二代測序技術的進步降低了全基因組測序所需的成本和時間,為人類基因組的深入探索提供了機會。然而,計算處理和變異解釋的瓶頸阻礙了這些技術的廣泛采用。通常,人們要使用多個工具和60-70個小時來處理50x人類全基因組,才能從原始序列數據中獲得變異檢出。此外,區分致病和良性的突變,也是一個費時費力的過程。

      此次開發的SpeedSeq是一套開放源代碼的軟件,專為快速的全基因組變異檢測和解釋所設計。它采用模塊化的架構和通用的格式,適合各種實驗設計,并與行業標準的軟件兼容。SpeedSeq可將50x WGS原始數據轉化成單核苷酸變異(SNV)、短的插入缺失(indel)和結構變異(SV),而只需要一臺32線程的服務器和128 GB的內存,成本低于1萬美元。

      研究人員利用瓶中基因組計劃(GIAB)的人類樣本NA 12878來評估SpeedSeq在SNV和indel檢出上的準確性。他們發現,對于生殖細胞的SNV和indel,SpeedSeq分別實現了99.9%和89.9%的靈敏度,而錯誤發現率也在可接受的范圍(分別為0.4%和1.1%)。這些表現甚至超過了人們常用的GATK-UG工具。

      癌癥基因組分析也是科研和臨床環境中一個常見的WGS應用,對時間頗為敏感。為了檢驗SpeedSeq在癌癥數據上的表現,研究人員獲得了五組腫瘤-正常的WGS數據(50x腫瘤、30x正常),其體細胞突變經過驗證。SpeedSeq檢出了五組數據中2,746個正交驗證突變中的96.4%,包括癌癥相關基因中98.8%的突變。

      結構變異的確定也是基因組全面分析中重要的一部分,當然也存在一定的挑戰。據介紹,SpeedSeq通過三個互補的工具而實現了全面的結構變異分析。它的核心是LUMPY,一個斷裂點檢測工具;CNVnator利用讀取深度分析來檢測LUMPY發現不了的CNV;SVTyper這種算法能夠對結構變異進行基因分型。通過這種組合,SpeedSeq能輕松找到基因組重排。

      作者認為,SpeedSeq在檢測生殖細胞和體細胞的單核苷酸變異、結構變異、插入和缺失時,其表現與現有方法相當或更佳。

    相關文章

    南亞人基因組揭示喝牛奶的起源

    南亞地區的人們以酸奶、印度奶酪和印度酥油等乳制品為食。現在,這一地區正幫助解開一個長期存在的謎題:人類是如何獲得消化牛奶的能力的。一項針對印度、巴基斯坦和孟加拉國現代及古代人類基因組的研究表明,一種能......

    數據基礎設施建設典型案例之五十|數據元件互聯互通實踐助力跨區域跨行業釋放數據價值

    數據元件互聯互通實踐助力跨區域跨行業釋放數據價值推薦單位:中國電子信息產業集團有限公司申報單位:中電數據產業集團有限公司中電數據產業集團有限公司依托數據元件理論,基于國產自主軟硬件,融合大數據、人工智......

    基因組研究證實:南部非洲智人曾半隔離生活數十萬年

    一項發表在最新一期《自然》雜志上的研究,通過對生活在10200至150年前的南非個體基因組進行分析,證實了在南部非洲,一群智人在半隔離的狀態下生活了數十萬年。這是迄今規模最大的對非洲古代DNA的研究,......

    因美納推出5堿基解決方案以驅動多組學發現,開啟基因組與表觀基因組的同步洞察

    ? 在美國人類遺傳學會(ASHG)年會上,因美納5堿基解決方案的早期試用客戶——倫敦健康科學中心研究所將展示該技術在加速罕見病病例解析方面的強大潛力。? 因美納專有的5堿基化學技術......

    許瑞明研究組合作揭示人逆轉座子LINE1靶向整合基因組的重要機制

    人類基因組中存在大量具有"跳躍"能力的逆轉座子(retrotransposon)序列。在胚胎發育早期、免疫和神經系統等特定階段和環境下,它們會被激活,發揮重要生理功能;在病毒感染、......

    高精度完整基因組助橡膠育種駛入“快車道”

    橡膠樹是天然橡膠的主要來源。“橡膠樹育種面臨的主要困難在于周期長和效率低,通過常規育種方法將多抗、高產性狀聚合往往需要30~40年。”中國熱帶農業科學院橡膠研究所研究員程漢告訴《中國科學報》。然而,目......

    小麥野生近緣種基因組“密碼”被破解

    記者宋喜群、馮帆從山東農業大學獲悉,該校農學院教授孔令讓研究團隊首次組裝了小麥遠緣雜交常用物種中間偃麥草和鵝觀草染色體水平的高質量基因組序列,解析了二者基因組結構差異與獨立多倍化演化路徑,對兩者攜帶的......

    煙草分枝發育的“開關基因”被發現

    近日,中國農業科學院煙草研究所煙草功能基因組創新團隊發現煙草分枝發育“開關基因”,預示著未來作物株型調控有了新靶點。相關研究成果發表在《植物生物技術》(PlantBiotechnologyJourna......

    數據“中毒”會讓AI“自己學壞”

    在一個繁忙的火車站,監控攝像頭正全方位追蹤站臺的情況,乘客流量、軌道占用、衛生狀況……所有信息實時傳輸給中央人工智能(AI)系統。這個系統的任務是幫助調度列車,讓它們安全準點進站。然而,一旦有人惡意干......

    新研究破譯薇甘菊入侵基因密碼

    薇甘菊作為全球十大最具危害的惡性入侵雜草之一,以其驚人的繁殖速度和強大的環境適應性,在亞洲、太平洋地區及中國華南地區造成嚴重生態破壞。然而,其基因組層面的適應性進化機制長期未被系統解析,制約了科學防控......

  • <li id="yyyyw"><noscript id="yyyyw"></noscript></li>
  • <table id="yyyyw"><noscript id="yyyyw"></noscript></table>
  • <td id="yyyyw"><option id="yyyyw"></option></td>
  • caoporn免费视频国产