千人基因組計劃,旨在繪制迄今最詳盡、最有醫(yī)學(xué)應(yīng)用價值的人類基因多態(tài)性圖譜,該圖譜由中美英等國科研機(jī)構(gòu)發(fā)起的“千人基因組計劃”共同協(xié)作完成,標(biāo)志著人類基因研究取得重大突破。這項計劃于2008年啟動,目前該項目擁有超過1700個樣本,高達(dá)200TB數(shù)據(jù)量的DNA序列。2012年開始全部數(shù)據(jù)將免費(fèi)對外開放。
千人基因組計劃
千人基因組計劃 - 概述
千人基因組計劃,由美國國立人類基因組研究所、中國深圳華大基因研究院、英國桑格研究所等75家公司和組織協(xié)同建立,用以建立最詳細(xì)的人類遺傳變異目錄。項目于2008年啟動,旨在繪制迄今最詳盡、最有醫(yī)學(xué)應(yīng)用價值的人類基因多態(tài)性圖譜,為基因變異如何影響健康以及與疾病間關(guān)系的研究奠定基礎(chǔ)[1] 。
基因多態(tài)性是指人與人之間的基因差異,人的基因組總體上差不多,但在有些位置上你我他都不一樣,存在各種基因變種,它們最終導(dǎo)致了人與人之間的差異。
中美英等協(xié)作組采用了新一代測序技術(shù),使用全球數(shù)千人的全基因組測序數(shù)據(jù),構(gòu)建了迄今為止最詳盡的人類基因組遺傳多態(tài)性圖譜。
目前該項目擁有超過1700個樣本,高達(dá)200TB數(shù)據(jù)量的DNA序列。
千人基因組計劃 - 研究成果
千人基因組計劃共同主席、英國桑格研究所基因?qū)<摇ⅰ蹲匀弧贩饷嫖恼轮饕髡咧焕聿榈?middot;德賓說這一計劃已經(jīng)取得了兩個重要成果,第一是獲得了迄今最詳盡的人類基因多態(tài)性圖譜,第二是探索出了研究基因多態(tài)性的新技術(shù)手段。
在第一個成果方面,研究人員找出了1000多萬個大大小小的基因變種,其中約800萬個都是前所未知的。對于人群攜帶率在1%以上的基因變種,本次研究的覆蓋率達(dá)到95%以上,得出了迄今最詳盡的基因多態(tài)性圖譜。這一成果在醫(yī)學(xué)等領(lǐng)域有很高的應(yīng)用價值,比如通過參照圖譜,可以方便地找出致病的基因變種。
在第二個成果方面,研究人員驗證了在大型基因研究中綜合使用多種基因測序手段的可行性。由于基因測序成本目前仍很高昂,如果能在“精測”一些基因序列的同時,對另一些基因序列只需“粗測”就能保證最終結(jié)果的準(zhǔn)確性,將可以大幅降低基因測序研究的成本。
千人基因組計劃 - 全部數(shù)據(jù)免費(fèi)對外開放
2012年3月29日,美國國立衛(wèi)生研究院宣布,他們的千人基因組計劃的全部數(shù)據(jù)將免費(fèi)對外開放[1] 。這些數(shù)據(jù)總量達(dá)到200TB,是世界上最大的人類基因變異數(shù)據(jù)集。亞馬遜旗下的云計算公司——“亞馬遜網(wǎng)絡(luò)服務(wù)”將存儲這個龐大的數(shù)據(jù)庫。所有數(shù)據(jù)免費(fèi)對外開放意味著更多科學(xué)家可以利用這些數(shù)據(jù)進(jìn)行研究,以更快的速度得出基因型與癌癥、糖尿病等疾病間關(guān)系的發(fā)現(xiàn)。
由于類似千人基因組計劃這樣的數(shù)據(jù)集規(guī)模龐大,很少有研究人員具備處理能力,因此也就無法使用。根據(jù)國立衛(wèi)生研究院的計算,千人基因組計劃的數(shù)據(jù)如果打印出來,可放滿1600萬個檔案柜;如果使用標(biāo)準(zhǔn)DVD存儲,需要3萬多張DVD。對于科學(xué)家和他們所在的研究機(jī)構(gòu)來說,千人基因組計劃數(shù)據(jù)進(jìn)行云存儲無疑是一個好消息,對于亞馬遜網(wǎng)絡(luò)服務(wù)公司來說,存儲千人基因組計劃的數(shù)據(jù)可能也是一個好消息。美國《紐約時報》報道稱,處理如此海量數(shù)據(jù)需要極大的運(yùn)算能力,亞馬遜網(wǎng)絡(luò)服務(wù)公司可以要求獲得額外的資源,用于進(jìn)一步處理或者分析這些數(shù)據(jù)。