HDC.Cloud2021 | 知識計算助力醫學科研探索,輔助提升新冠藥物篩選效率

      網友投稿 789 2022-05-30

      去年,在華為開發者大會2020(Cloud)期間, 華為云發布了企業級知識圖譜云服務及應用套件,提供一站式知識圖譜構建管理及應用平臺,賦能各行業企業高效進行知識化轉型。

      經過一年的發展,華為云通過知識圖譜云服務提供更好的算法套件及應用能力,進一步提升知識圖譜構建及應用效率,讓傳統企業客戶可高效完成知識圖譜的場景化落地。

      隨著疫情的發展,醫學研究人員迫切需要能夠系統梳理和整合新型冠狀病毒的相關知識,加速對新冠病毒的機制研究及抗病毒藥物研發篩選。例如,新冠病毒所屬的病毒族系是什么,新冠病毒的重要屬性有哪些,抗病毒藥物與病毒靶點之間的關系是什么,以及病毒親緣關系等。以上這些知識存在于眾多的知識庫或者最新發表的學術文獻中,很難被科研人員系統的檢索和使用。

      為了解決這一問題,華為云知識計算團隊自研醫學領域AI算法模型,并結合華為云知識圖譜云服務,實現從公開發表的新冠學術文獻及公開數據庫中快速構建新冠科研知識圖譜,并提供知識搜索、可視化分析、知識問答及智能關系預測等應用,協助科研人員更快速、有效的開展抗疫科學研究和藥物研發篩選。

      圖1 新冠科研知識圖譜構建及應用架構圖

      新冠科研知識計算平臺包括面向醫學領域知識圖譜的構建及應用兩部分,如圖1所示。知識圖譜構建部分包括數據準備和知識建模兩部分,其中數據準備部分完成本體設計、數據預處理以及數據標注工作。知識建模主要提供信息抽取算法模型并結合人工審核流程完成知識圖譜的構建和部署,包括信息抽取模型訓練優化、實體鏈接、知識融合等內容。基于構建好的醫學領域知識圖譜,知識計算平臺提供基于知識圖譜的問答KBQA、知識搜索可視化以及智能關系預測等應用,面向藥物研發等科研場景,華為云提供知識圖譜、ModelArts以及大數據云服務等完備平臺工具,高效支撐數據準備、知識建模以及知識應用。

      在知識圖譜構建過程中,數據準備包括本體設計、數據預處理以及數據標注。其中,本體設計需要醫學領域專家與知識圖譜專家合作完成,例如:定義“病毒”、“藥物”、“蛋白”、“疫病”等實體類型及相應的屬性內容,同時定義各實體類型之間的語義關系,“病毒”-“引發”-“疾病”,“藥物”-“靶點”-“蛋白”等。數據預處理則需要根據數據來源和格式,完成數據解析以及轉換等工作。數據標注需要借助標注工具,通過人工標注的形式來完成,如華為云ModelArts標注工具或開源標注工具等。

      知識圖譜構建的核心是知識建模工作,而知識建模的核心是信息抽取算法及模型。信息抽取的目的是通過算法模型完成三元組的自動抽取,如圖2所示,在科研文獻中,抽取“SARS-CoV-specific monoclonal antibodies“-“effect”-“2019nCoV”這種形式的三元組結果,即Drug-effect-Virus類型三元組。

      圖2 三元組標注抽取示例

      信息抽取的難點在于如何實現高精度的領域實體識別及關系抽取(即三元組抽取)。當前主流的方法是基于機器閱讀理解的端到端深度學習算法,通過模型級聯的改進以及醫學領域預訓練模型的結合,可以有效提升新冠科研信息抽取的效果。與此同時,由于三元組標注較為繁瑣,工作量較大,一般很難標注大量的訓練樣本。因此,我們基于領域詞典數據庫等已有知識庫,通過遠程監督及小樣本學習技術,進行樣本數據擴充,并利用無監督語料在樣本數量較少情況下構建模型,最終通過多輪迭代+人工審核的方式(Snowball滾雪球方式)快速的積累標注訓練數據,最終在較短時間實現效果優異的信息抽取模型。

      多輪知識圖譜問答:包括在線和離線兩部分,離線部分主要進行模板學習,獲得查詢匹配模板和模型。在線部分完成每一輪問答交互的在線計算及回復,通過實體識別、實體鏈接、本體識別等一系列技術完成意圖的識別和答案的獲取,最終返回每一輪的答案回復。

      智能關系預測應用:基于TransE該類知識圖譜表示學習方法,設計了AutoTransX 自適應算法,通過結合AutoML、集成學習思想并優化損失函數,在病毒-蛋白-藥物等關系預測方面,Hit@10指標提升約10%,可以有效用于輔助藥物篩選的工作。

      圖3 新冠科研圖譜-知識搜索及可視化

      圖4 新冠科研圖譜-知識圖譜問答

      HDC.Cloud2021 | 知識計算助力醫學科研探索,輔助提升新冠藥物篩選效率

      華為云知識計算解決方案,加速企業知識+AI落地,助力企業知識化轉型

      華為云發布業界首個全生命周期知識計算解決方案。知識計算解決方案是行業知識與AI結合的一條全新且有效的路徑,通過將行業知識與AI技術相結合,實現機器控制更加精準,實現輔助高效分析和決策,幫助行業專家專注業務創新性工作,助力企業實現知識傳承與共享,提升人員培養效率。

      圖5 知識計算解決方案邏輯視圖

      華為云知識計算解決方案依托于華為云在自然語言處理長期積累和實踐上的優勢,能夠有效減少知識圖譜構建時的信息損失,可以一站式完成知識獲取、知識建模、知識管理、知識應用,覆蓋知識在企業的生產環節中獲取到應用的全生命周期。企業可以基于華為云知識計算解決方案打造專屬的知識計算平臺,通過主動推薦知識、輔助推理與決策 ,從而進而提高企業的經營效率。

      華為云知識計算解決方案已在石油、化纖、煤焦化、鋼鐵、汽車等行業落地,賦能企業構建知識計算平臺,廣泛運用于研發、生產、運營、銷售、售后服務等企業核心流程。

      AI HDC2021 知識圖譜

      版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。

      上一篇:DAOS 分布式異步對象存儲|Container
      下一篇:模型評估中目標檢測模型的目標框清晰度敏感度分析以及相關的解決方法
      相關文章
      亚洲av区一区二区三| 成人伊人亚洲人综合网站222| 日本亚洲高清乱码中文在线观看| 亚洲国产精品久久丫| 亚洲av女电影网| 亚洲国产成人片在线观看无码| 中文字幕在亚洲第一在线| www.亚洲一区| 国产精品自拍亚洲| WWW亚洲色大成网络.COM| 亚洲国产精品无码久久| 亚洲精品无播放器在线播放 | 亚洲精品无码成人片久久| 综合亚洲伊人午夜网| 久久国产成人亚洲精品影院| 亚洲欧洲自拍拍偷精品 美利坚 | 日韩精品亚洲人成在线观看| 亚洲人成网www| 亚洲黄色在线观看| 亚洲福利视频网址| 色老板亚洲视频免在线观| 精品国产成人亚洲午夜福利| 亚洲一区二区三区在线观看网站| 亚洲欧美日韩中文无线码| 亚洲av无码一区二区三区在线播放| 亚洲成aⅴ人片久青草影院按摩| 亚洲风情亚Aⅴ在线发布| 看亚洲a级一级毛片| 亚洲精品国产日韩无码AV永久免费网| 亚洲JIZZJIZZ中国少妇中文| 国产成人精品曰本亚洲79ren| 自拍偷自拍亚洲精品第1页| 国产亚洲一区二区精品| 亚洲国产精品热久久| 亚洲成a人片7777| 亚洲欧美精品午睡沙发| jizzjizz亚洲| 亚洲情XO亚洲色XO无码| 久久久久久亚洲精品| 亚洲国产精品午夜电影| 亚洲美国产亚洲AV|