后基因組時(shí)代,如何挖掘海量的基因數(shù)據(jù)?

      網(wǎng)友投稿 814 2025-03-31

      圖片來源:Pixabay


      后基因組時(shí)代,如何挖掘海量的基因數(shù)據(jù)?

      人類擁有23對(duì)染色體,約含有30億對(duì)堿基,某種程度上可以說這些堿基是我們每個(gè)人的“代碼”,而解讀基因則是實(shí)現(xiàn)人的“數(shù)字化”。

      1975年,英國(guó)科學(xué)家Frederick Sanger發(fā)明了Sanger測(cè)序技術(shù),由此開啟了基因測(cè)序的新篇章。隨后,技術(shù)更迭,以高通量測(cè)序(NGS)為主的測(cè)序方法讓“基因解讀”成本快速下降、速度大力提升、通量也隨之?dāng)U大。

      得益于此,從疾病的篩查、診斷到治療、預(yù)后,越來越來的臨床基因檢測(cè)項(xiàng)目落地、產(chǎn)品商業(yè)化,例如無創(chuàng)產(chǎn)前檢測(cè)、試管嬰兒中的胚胎植入前檢測(cè)、新生兒疾病篩查、腫瘤易感基因篩查、腫瘤個(gè)性化用藥、遺傳病篩查……

      除了臨床級(jí)、科研級(jí)應(yīng)用,越來越多的人開始對(duì)消費(fèi)級(jí)基因測(cè)序產(chǎn)品感興趣,“祖源分析”、“運(yùn)動(dòng)基因”、“皮膚特性”等項(xiàng)目讓大家重新認(rèn)識(shí)基因的“奇妙”。這也預(yù)示著,基因檢測(cè)正從醫(yī)療技術(shù)走向消費(fèi)級(jí)技術(shù)。

      從上世紀(jì)60年代“DNA雙螺旋結(jié)構(gòu)”被人類發(fā)現(xiàn),到15年前“人類基因組計(jì)劃”正式宣告完成,再到今天的“個(gè)性化醫(yī)療”,現(xiàn)代醫(yī)學(xué)正從“經(jīng)驗(yàn)試錯(cuò)、同病同治”的傳統(tǒng)模式朝著“同病異治、循證醫(yī)學(xué)”的方向升級(jí),而基因測(cè)序也正發(fā)展成其中的重要組成部分。

      據(jù)測(cè)算,一個(gè)人一生與健康相關(guān)的數(shù)據(jù)整合起來大約10TB,一百萬人的數(shù)據(jù)量約為10EB。此外,還有大量動(dòng)植物基因組、轉(zhuǎn)錄組、微生物基因組及宏基因組測(cè)序分析等科研服務(wù)項(xiàng)目,數(shù)據(jù)類型和數(shù)量異常龐大。

      隨著高通量測(cè)序的廣泛應(yīng)用、測(cè)序設(shè)備自動(dòng)化程度的提高,測(cè)序數(shù)據(jù)正成幾何增長(zhǎng),這無疑會(huì)對(duì)數(shù)據(jù)計(jì)算能力提出挑戰(zhàn)。

      而且,測(cè)序儀運(yùn)行產(chǎn)生的原始數(shù)據(jù)并不能直接提供關(guān)于疾病的信息,測(cè)序企業(yè)需要依據(jù)生物信息學(xué)的方法,對(duì)海量的測(cè)序數(shù)據(jù)進(jìn)行復(fù)雜的過濾、比對(duì)、拼接和處理、數(shù)據(jù)分析等重重步驟,才能獲得基因組上的變異信息,再結(jié)合遺傳學(xué)、病理學(xué)以及其他組學(xué)等信息共同分析,最終才能轉(zhuǎn)化為人們可理解的生物學(xué)數(shù)據(jù),為疾病的診療提供參考和指導(dǎo)。

      依據(jù)現(xiàn)有測(cè)序技術(shù)計(jì)算,每次單人全測(cè)序可能產(chǎn)生1.5T數(shù)據(jù),傳統(tǒng)IT計(jì)算能力針對(duì)這些數(shù)據(jù)分析和解讀,每次計(jì)算至少需6天時(shí)間。這對(duì)于臨床應(yīng)用而言,時(shí)間上無疑是耗不起的。

      如何解決“算的沒有測(cè)的快”?如何從海量數(shù)據(jù)中挖掘有效的信息??這是專注于精準(zhǔn)醫(yī)療領(lǐng)域的企業(yè)未來可能需要面臨的難題之一。測(cè)序數(shù)據(jù)處理和分析的技術(shù)壁壘較高,是掣肘基因測(cè)序企業(yè)發(fā)展的關(guān)鍵因素,也是企業(yè)核心競(jìng)爭(zhēng)力所在。

      此外,數(shù)據(jù)是“敏感”的,它牽扯隱私問題。傳統(tǒng)的基因公司在IT方向能力較弱,容易忽視大數(shù)據(jù)的安全存儲(chǔ)、授權(quán)共享等問題。而且,樣本數(shù)據(jù)庫需要流通,孤立的數(shù)據(jù)無法發(fā)揮最大價(jià)值。這些問題都是測(cè)序行業(yè)亟待謹(jǐn)慎解決的課題。

      海量數(shù)據(jù)面前,人工智能的呼聲越來越高,生命科學(xué)行業(yè)“云化發(fā)展”也成為一種趨勢(shì)。它可以免去傳統(tǒng)測(cè)序企業(yè)自建數(shù)據(jù)中心的繁瑣和成本(包括購置大型計(jì)算和存儲(chǔ)設(shè)備,日常維護(hù)等),保證輕資產(chǎn)運(yùn)營(yíng)的同時(shí)實(shí)現(xiàn)測(cè)序數(shù)據(jù)的存儲(chǔ)、共享和解讀。

      參考華金證券股份有限公司研究所報(bào)告,目前國(guó)家基因庫的原始數(shù)據(jù)量已經(jīng)達(dá)到1000TB,對(duì)于這種規(guī)模的數(shù)據(jù)庫,簡(jiǎn)單的數(shù)據(jù)分析就可能需要很長(zhǎng)的時(shí)間,會(huì)碰到嚴(yán)重的數(shù)據(jù)輸入/輸出問題。本地計(jì)算機(jī)顯然難以單獨(dú)完成,因此目前通常采用云計(jì)算解決。

      以華為云為例:在計(jì)算上,云服務(wù)器可以搭載基因測(cè)序?qū)S盟惴ǎ宰钌俚臅r(shí)間計(jì)算出結(jié)果,降低計(jì)算成本;在存儲(chǔ)上,云平臺(tái)基于分布式架構(gòu)能夠提供可彈性擴(kuò)展的塊存儲(chǔ)服務(wù);在傳輸上,測(cè)序儀產(chǎn)生的大量數(shù)據(jù)可以依靠專線、裸光纖網(wǎng)絡(luò)進(jìn)行共享,且可實(shí)現(xiàn)數(shù)據(jù)的加密。

      此外,基因測(cè)序有各種復(fù)雜的工作場(chǎng)景,華為云非常重視資源打通,即聯(lián)合各類頂尖企業(yè)共同建設(shè)整個(gè)基因技術(shù)生態(tài)。華為云專注于底層資源算力的領(lǐng)先,上層選擇與這些企業(yè)生態(tài)伙伴合作,共同創(chuàng)新,形成聯(lián)合解決方案滿足基因行業(yè)多樣化的技術(shù)訴求,并且對(duì)客戶和合作企業(yè)的數(shù)據(jù)保持清晰的邊界。

      據(jù)悉,華為云已與武漢未來組、貝瑞基因、金橡醫(yī)學(xué)等企業(yè)達(dá)成合作,為測(cè)序企業(yè)的數(shù)據(jù)運(yùn)算、存儲(chǔ)保駕護(hù)航。

      “云計(jì)算的到來,使數(shù)據(jù)以及計(jì)算全部可以在云上完成,滿足企業(yè)數(shù)據(jù)不下云、高效完成計(jì)算的需求。這一做法減少了企業(yè)重資產(chǎn)以及維護(hù)的工作,使客戶更聚焦在自身的業(yè)務(wù)發(fā)展上。”華為云相關(guān)負(fù)責(zé)人總結(jié)道,“云化發(fā)展可以提供高性能、高可靠、簡(jiǎn)便安全的計(jì)算服務(wù),滿足生物醫(yī)藥中基因測(cè)序等需求,縮短產(chǎn)品上市周期,提升企業(yè)效益。選擇華為云更可靠。”

      中國(guó)工程院院士、北京大學(xué)醫(yī)學(xué)部主任詹啟敏曾說過,精準(zhǔn)醫(yī)療的重點(diǎn)不在“醫(yī)療”,而在“精準(zhǔn)”。通過基因組、蛋白質(zhì)組、代謝組等組學(xué)技術(shù)和醫(yī)學(xué)前沿技術(shù),對(duì)于大樣本人群與特定疾病類型進(jìn)行生物標(biāo)記物的分析與鑒定、驗(yàn)證與應(yīng)用,從而精確尋找到疾病的原因和治療的靶點(diǎn),并對(duì)一種疾病不同狀態(tài)和過程進(jìn)行精確分類,最終實(shí)現(xiàn)對(duì)于疾病和特定患者進(jìn)行個(gè)性化精準(zhǔn)治療的目的,提高疾病診治與預(yù)防的效益。

      基因數(shù)據(jù)是人類的重要資源,從其測(cè)序、存儲(chǔ)、共享,到輸出給科研、醫(yī)療機(jī)構(gòu),只有最終轉(zhuǎn)變?yōu)橛行У倪z傳解讀、診療手段或者藥物,方能顯示出價(jià)值。

      本文轉(zhuǎn)自:生物探索

      云計(jì)算

      版權(quán)聲明:本文內(nèi)容由網(wǎng)絡(luò)用戶投稿,版權(quán)歸原作者所有,本站不擁有其著作權(quán),亦不承擔(dān)相應(yīng)法律責(zé)任。如果您發(fā)現(xiàn)本站中有涉嫌抄襲或描述失實(shí)的內(nèi)容,請(qǐng)聯(lián)系我們jiasou666@gmail.com 處理,核實(shí)后本網(wǎng)站將在24小時(shí)內(nèi)刪除侵權(quán)內(nèi)容。

      版權(quán)聲明:本文內(nèi)容由網(wǎng)絡(luò)用戶投稿,版權(quán)歸原作者所有,本站不擁有其著作權(quán),亦不承擔(dān)相應(yīng)法律責(zé)任。如果您發(fā)現(xiàn)本站中有涉嫌抄襲或描述失實(shí)的內(nèi)容,請(qǐng)聯(lián)系我們jiasou666@gmail.com 處理,核實(shí)后本網(wǎng)站將在24小時(shí)內(nèi)刪除侵權(quán)內(nèi)容。

      上一篇:Excel中文本格式數(shù)字轉(zhuǎn)化為數(shù)字格式的操作方法
      下一篇:如何設(shè)置特殊的Word文字格式(word文檔怎么設(shè)置文字格式)
      相關(guān)文章
      亚洲制服丝袜第一页| 亚洲国产av无码精品| 亚洲精品尤物yw在线影院 | 久久精品亚洲中文字幕无码麻豆| 中文字幕亚洲图片| 亚洲精品97久久中文字幕无码| 亚洲av无码一区二区三区天堂 | 亚洲精品无码专区久久同性男| 亚洲乱码中文字幕在线| 亚洲粉嫩美白在线| 亚洲综合av一区二区三区| 亚洲国产视频久久| 亚洲精品天堂在线观看| 亚洲乱码无限2021芒果| 亚洲中文字幕久久精品无码2021| 亚洲人色大成年网站在线观看| 亚洲欧洲另类春色校园小说| 亚洲综合激情另类小说区| 亚洲综合色一区二区三区小说| 亚洲综合区图片小说区| 亚洲精品一卡2卡3卡三卡四卡| 亚洲午夜久久久久久尤物| 亚洲a∨无码男人的天堂| 国产精品高清视亚洲精品| 精品丝袜国产自在线拍亚洲| 中文字幕 亚洲 有码 在线| 亚洲中文字幕无码av永久| 亚洲色成人四虎在线观看| 亚洲AV无码专区国产乱码不卡| 亚洲AV第一成肉网| 亚洲国产精品不卡毛片a在线| 久久国产成人亚洲精品影院| 亚洲一区无码中文字幕| 亚洲国产精品成人精品无码区 | 亚洲人成色77777在线观看| 亚洲国产成人综合精品| 色噜噜噜噜亚洲第一| 亚洲国产主播精品极品网红| 久久久亚洲精品蜜桃臀| 亚洲AV无码一区东京热| 亚洲综合激情六月婷婷在线观看|