【TensorFlow】01 TensorFlow簡介與Python基礎
764
2025-03-31
當前新冠藥物篩選的痛點
1、病毒機制,藥物作用機制等研究,需要查詢大量的科研文獻,數據庫等知識,知識獲取效率低,不全面,當前知識文化水平及服務需求非常迫切。
2、抗病毒藥物,病毒蛋白,病毒種類非常多,關系錯綜復雜,如何通過AI技術輔助科研人員進行藥物篩選,提升藥物篩選效率,是當前的難點和挑戰之一。
3、醫學數據種類繁多,未有效融合,缺少高效檢索能力、交互式關聯分析、智能化關系預測等知識化服務。
第一步:初步準備包括面向數據做數據準備、預處理,知識體系定義、樣本進行標注。本體是知識圖譜的范疇,需要抽取到知識圖譜當中的實體關系,并對其進行嚴格的定義。比如,新冠科研知識圖譜,那么應該包括哪些知識、病毒知識呢? 對權威的科研文獻網站,權威的數據庫等等,需要把數據源進行很好的整理和準備,對數據進行預處理,甚至數據格式轉換;最后,對樣本進行標注。
第二步,知識建模做好知識抽取,知識體系定義,圖譜構建。知識建模說白了就是要基于算法模型,做信息抽取,目的是能構建出來知識圖譜,基于機器學,機器閱讀理解信息抽取模型、語言模型、預訓練模型,領域系列模型,例如medicalknowledge,knowledge。
知識建模優化方式有多種:
醫學預監督信息抽取模型:華為云CHIEF框架,針對醫學數據特點融入多類醫學數據,優化信息抽提模型;
三元組信息抽取:基于聯合學習的算法,預訓練的模型的拼接,整個過程其實分為,主語的抽取部分和賓語加謂語的聯合抽取的部分,主語抽取部分就是深度學習框架,去做主語的抽取
小樣本學習優化:在少量標注的數據的情況下,比如說每類別關系只有3~5個標注樣本的情況下,就可以啟動抽取的工作,小樣本抽取完之后可以滾出來更多的訓練的數據,再進入到第二步聯合學習模型,通過滾雪球的方式,可以很快把信息抽取的工作,快速的收斂,基本上就能達到非常不錯的效果。
預訓練模型優化:基于通用的語料(新聞、資訊)做預訓練的模型。
知識建模經驗總結:
第一點,遠程監督技術是非常有用,可以基于詞典,權威的數據庫做遠程監督,它的目的就是基于技術衍生出來更多的標注數據。通過小樣本學習技術,啟動信息抽取工作,然后迭代更新模型。
第二點,數據增強,指小樣本技術,可以在標志數據很少的情況下,也可以啟動工作,同時模型預訓練加人工矯正思想也是可以復用的。
第三點,預訓練模型,知識抽取要結合行業的特點,運用領域場景語料訓練模型。
除此之外,新冠科研圖譜構建與應用還需要運用到多輪知識圖譜問答、圖譜關系自動預測模型(智能關系預測)。
那要如何提升知識計算的效率呢?這就需要用到知識圖譜,華為云知識計算平臺提供多輪知識圖譜問答能力,包含離線模塊,模塊主要是用來做模板學習,生成的查詢模板,意圖匹配的模型。例如,問題進來后需要做實體識別,概念識別,包括意圖的理解和匹配,對話策略,對話狀態的記錄等。多輪知識圖譜問答屬于后端技術,在前端展示是以一種對話問答的機器人形式。
智能關系預測主要用途是挖掘出來某些病毒和蛋白之間的關系,比如說新冠病毒跟哪些蛋白有關系?然后蛋白又跟哪些藥物有關系?目的就是說能夠找到某個藥物是不是真的能夠作用到某些蛋白,再繼續作用到某些病毒。這里運用到 了AutoML自研的算法,把整個網絡結構自動的去做學習,同時還引入了 softmax函數,增強它的隨機性,最后就是集成思想,提升模型能力。
總的來說,面向醫療行業的端到端知識計算平臺提供能力如下:
提供統一的知識圖譜底座,,給不同的科研機構,科研人員提供共享支持、應用。
醫學科研者可以在搜索窗搜自己想要的東西,提供問答、機器人能力。
在算法方面,提供科研文獻三元組抽取算法。
華為云知識計算解決方案,實現行業知識與AI結合的新路徑
AI其實已經進入到很多的行業了,AI能力對于企業的降本增效,創收,盈利起到了非常大的價值。那么當前行業知識要如何和AI更好地結合呢?
華為云知識計算解決方案,利用計算機和人工智能技術,實現機器對知識的獲取、建模、管理、應用等方面。圍繞知識生命周期進行抽象和劃分的,主要分為:
知識的獲取:行業數據解析器、網頁解析器、語音識別、專家標注、多模態信息抽取、文字識別等
知識建模:用合適的方式運用AI技術完成相應建模知識表征、圖譜構建、知識融合、多模態表征、圖嵌入、機理建模
知識管理:通過知識圖譜或規則庫,進行生命周期管理、質量管理、知識補全和維護
知識應用:最后體現的價值是在業務價值,業務價值體現在應用能力,包含知識搜索、智能對話、知識推薦、預測分析、知識推理等。
華為云知識圖譜云服務,提供多人流水線的形式工具,可以讓開發者或企業技術人員快速構建屬于自己的知識圖譜。本體設計通過可視化形式進行快速構建,信息抽取嵌入了預制信息抽取算法的模板,知識服務面向企業場景,可通過一鍵開啟的形式,提供搜索、實體鏈接、問答以及可視化等主流的應用。
企業知識計算案例分享,從行業知識+AI到知識計算平臺及應用
除了運用在藥物科研領域,華為云知識計算平臺,還可以應用在金融領域知識問答、汽車維修知識計算、汽車對話機器人構建Demo、油氣領域知識計算等場景
金融領域知識問答:主要面向網點咨詢場景,首先給銀行構建網點郵件時間,辦理業務等等知識圖譜,提供問答應用,多輪多場景的自由式交互,同時也支持語義方面的理解。
汽車維修知識計算:通過平臺和工具,快速把問答應用構建,通過知識圖譜的形式,把分散在各地的數據進行匯總和建模,提供多輪問答的應用,最后維修技師通過語音的形式和應用完成交互。
汽車對話機器人構建Demo:不僅運用到了知識圖譜技術,還用到了ocr技術,通過ocr技術掃描車的參數,、型號、發動機類型等紙質信息進行電子化,做表格的抽取,進行知識圖譜的構建,基于結構化數據,自動構建本體。問答對話機器人應用自動一鍵開啟。
油氣領域知識計算:油氣開采涉及到如何精準識別哪個深度有油?此場景下,主要用到知識圖譜的圖嵌入表示,即是知識表征技術,然后結合深度學習預測方法預測結果,做一定的人工的分析,模型還要結合其他的相關的報告給專家做輔助,目的是讓他們能夠在測井解釋過程當中,提升效率,節省時間的開銷。
結語:
AI作為新的通用目的技術,正在進入千行百業,未來的人工智能將會把知識、數據、算法和算力四要素結合同時發力,才能夠構建出更好的AI,讓AI落地到各行各業當中。
AI 知識圖譜
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。