elasticsearch入門系列">elasticsearch入門系列
1392
2022-05-30
1. 知識圖譜的典型應用
1.2 原圖應用
知識圖譜是人工智能應用鏈條的第一步,是人工智能的底層技術。知識圖譜在高效數據處理和知識加工推理方面的能力,可以推動人工智能既有產品的升級或提供更有效的解決方案,同時也可以轉化為新的商業產品形式。
知識圖譜的產品形式可以分為原圖應用和算法支撐兩類。原圖應用指基于知識圖譜的圖結構和豐富的語義關系,直接通過圖譜產生價值的服務形式,例如圖挖掘、關聯分析等。通用知識圖譜被視為下一代搜索引擎的核心技術,而行業知識圖譜由于有具體場景的認知深度,能很好地滿足垂直領域知識類查詢的需求,如企業業務流程查詢、司法領域案例查詢等。算法支撐指通過知識圖譜對于信息源的數據進行處理,將產出的結構化關聯數據用于其他人工智能任務的算法模型訓練和應用中,得到能解決具體場景問題的研判建議,形成解決辦法產生價值的服務形式。
1.2 算法支撐:支撐其他人工智能任務:搜索、問答、推薦
知識圖譜為其他人工智能任務提供算法支撐的典型應用主要包括智能問答、智能搜索和智能推薦、決策分析系統等,目前都已產生了成熟且廣泛應用的商業產品,同時也是各領域知識圖譜中的重要一環。基于知識圖譜的智能搜索能對文本、圖片、視頻等復雜多元對象進行跨媒體搜索,也能實現篇章級、段落級、語句級的多粒度搜索。智能搜索讓計算機更準確地識別和理解用戶深層的搜索意圖和需求,在知識圖譜中查找出目標實體及其相關內容,對結果內容進行實體排序和分類,并以符合人類習慣的自然語言的形式展示,從而提高搜索體驗。智能問答可以分為直接回答、統計回答和推理回答。基于知識圖譜的智能問答能從實體和短句兩個維度進行挖掘,能理解多樣問法和有噪音問法,具有較高的準確率、召回率。在對話結構和流程設計上,能實現實體間上下文會話的識別與推理,最終實現更自然的人機交互。基于知識圖譜的智能推薦則通過獲得用戶和物品的精確畫像,從而實現準確的匹配和有針對性的推薦,實現場景化、任務型的推薦。
2.? 知識圖譜在各領域中的應用概覽
數據繁雜、單一價值有限、問題抽象需要可視化展現、五層關聯維度以上的應用場景更加適合搭建知識圖譜
應用場景
3.? 知識圖譜在行業中的應用
3.1 城市治理知識圖譜應用場景
知識圖譜賦能城市智能公共管理系統,打造城市“數字大腦”
中國城市存在巨大的存量治理和精細化發展需求。隨著城市公共管理的數據來源由政務數據不斷拓展至交通、視頻、環境等其他城市運行感知數據以及企業數據,城市大數據平臺也從政務共享交換平臺,發展成為多方共建共用共享的大數據平臺。基于知識圖譜技術,將分散在政府各個部門、生產生活各個領域的相互孤立的數據資源聯通共享,實現多源數據集成交換,從而對政務數據和社會數據進行深度挖掘。通過數據融合分析與管控,最大化發揮數據要素的效能,發現不同群體、不同行業的服務需求,實現政務服務的精準化供給、政府科學決策和高效社會治理。
3.2 公安知識圖譜應用場景
重點解決數據關聯性和數據價值挖掘問題,賦能線索情報分析與案件預警
公安大數據是全面助推公安工作質量、效率、動力變革的重要力量。隨著跨部門、警種、業務的協同和整合大趨勢的到來,知識圖譜能通過數據分析、文本語義分析等手段,抽取出人、物、地、機構、虛擬身份等實體,并根據其中的屬性、時空、語義、特征、位置聯系等建立相互關聯,構建一張多維多層的,實體與實體、實體與事件的關系網絡。在解決公安大數據發展中面臨的數據缺乏關聯性、缺乏全警種智能應用等問題時發揮重要作用,真正激發大數據的價值。
建設公安知識圖譜仍遵循知識圖譜搭建邏輯,但其中知識抽取、本體層建設和實戰應用開發等環節需要運用分布式儲存、關聯算法、語義推理等技術,將公安部門多年業務中積累的技戰法進行總結和可視化處理,與技術算法相互轉換,以集成犯罪和預測模型,實現重點人員場所關聯分析、物品關聯分析、團伙關系分析、異常事件挖掘、相似案件推理等功能,提升公安信息化的智能化水平,促進公安情報研判的演進,高效服務公安的打防管控工作,甚至做到精準的犯罪預測預警。
3.3 醫療健康知識圖譜應用場景
在就醫導診、輔助診斷、藥企市場拓展等領域提供知識服務
醫療健康是典型的數據海量且多源異構的行業,且限于數據專業性強、結構復雜,數據融合在醫療健康行業應用場景中更加困難。利用知識圖譜的能力,可以聚合核心醫學概念和全方位的醫療生態圈知識,從海量的臨床案例中對經驗和知識進行提煉整理、錄入標注、體系構建,在解決優質醫療資源供給不足和醫療服務需求持續增加的矛盾中產生重要的作用。
3.4 教育知識圖譜應用場景
教育知識圖譜與機器學習算法結合實現智適應教育
當前人工智能技術更多應用在如拍照搜題、口語評測、課堂監控等外圍需求的工具上,并未能有效深入到教學場景中,而真正產生生產價值建立在充分且必要的數據基礎上,搭建貫穿教材知識體系、教學資源管理和受教育者學習軌跡的知識圖譜,將教與學的全過程進行可視化展現,使靜態知識點數據與動態教學活動的數據產生關聯,為算法利用提供支撐環境。
知識圖譜在教育領域主要有以下幾種應用場景:一是將學科教材知識進行本體建模,形成可關聯性查詢的知識網絡;二是以圖結構將教學資源以及關系進行語義化組織,以便合理調用;三是在知識圖譜的基礎上,應用大數據、AI等技術形成面向學習目標的個性化學習路徑,實現千人千面的教學方案;四是面對受教育者搭建個人知識圖譜,通過對其知識點學習進度和考試反饋數據的實時關聯,形成知識掌握狀態的可視化個人畫像,以至于習題推送和老師一對一教學有的放矢;五是將教育領域碎片化多源異構數據進行處理,形成標準化的關聯數據集,為機器學習算法訓練提供充要條件。
通過以上五點應用,勾勒出基于知識圖譜的數字中臺形式,最大限度地對教育領域數據進行資源整合,為上層智能化應用提供支撐,改變了“傳統教育披上人工智能外衣”的狀況,用技術起底教育邏輯,形成數據指導下自適應學習的價值閉環。
3.5 通用制造業知識圖譜應用場景
對基礎數據進行建模,在制造全流程實現多方面協調管控
制造業體系龐大、場景豐富、產品類型多、定制化程度高,具有數據龐大且知識結構復雜的特性,存在著如工序流程和工藝制造知識等事理知識,同時也存在大量的定量知識。事件之間存在著大量的事理邏輯關系,而不同角色本體構造提出的需求也不盡相同。引入知識圖譜技術,將工廠車間、人工資源、物料組件、設備制具、工藝流程、故障等制造業的基礎數據進行知識分類和建模,通過對知識的抽取,對定量知識與事理知識的融合以及對實體之間復雜關系的挖掘,構建制造業知識服務平臺,建立產品規劃、設計、生產、試制、量產、使用、服務、營銷和企業管理等全生命周期的互聯,還能融合環境、焚燒、水務、模具、能源管理等多個相關行業的知識內容,通過快速搜索和推理關系中的趨勢、異常和共性更好地組織、管理和理解制造業體系的內部聯系,將知識轉化為決策依據,破除產品封閉式的重復研發實現創新,進行全流程多方面的協調管控,提高制造流程中問題的預見和解決能力,提升資源管理能力、生產效率和產品質量。
3.6 智慧建筑知識圖譜應用場景
集合構建以BIM數據與規范為主的建筑工程行業知識圖譜
當前建筑行業仍是勞動力密集型行業,擁有動態且復雜的行業結構。根據不同項目類型、項目階段和項目目標,將項目過程中不斷重復的知識、使用知識本體的方式進行組織化的設計和管理,以實現從圖紙設計、審圖、施工、驗收到樓宇運維全流程內知識的重復使用和組織化管理,是建筑行業實現智能化的目標。當前建筑信息模型(BIM, BuildingInformation Modelling)從工程實踐到管理理念上都在給建筑業與施工業帶來不同程度的變革。作為含有豐富語義信息的三維模型載體,BIM的屬性與信息體系包含了建筑的空間幾何信息、屬性信息等,是實體建筑的數字化表達,具有真實性和全面性的特點都可以有效分類和聚集成為若干知識本體,結合知識圖譜的知識抽取、知識融合及知識加工等構建技術,集合成以BIM數據與規范為主的建筑工程行業知識圖譜,從而提升設計階段BIM審圖規范與效率、輔助施工階段質量管理與決策、改善運維階段數據流轉與分析能力。
3.7 智能風控與信用評估
知識圖譜與機器學習相結合,重塑金融領域智能風控過程
無論是傳統金融或是互聯網金融領域,信用評估、反欺詐和風險控制都是最為關鍵的環節,隨著近些年金融數據的爆發式增長,傳統風控系統逐漸力有不逮,而應用機器學習算法和知識圖譜的智能風控系統在風險識別能力和大規模運算方面具有突出優勢,逐漸成為金融領域風控反欺詐的主要手段。機器學習和知識圖譜相結合是目前主流的解決方案。
機器學習算法通過概率計算的方式,以數學運算特征反應風險情況,形成易于機器計算的風控模型;而知識圖譜通過權威經驗和規則創建本體模型和抽取實體的范圍,根據實體間關系形成關聯數據網的圖譜形式,打通相關數據,動態、實時地描畫囊括個人基礎信息、金融行為、社交網絡行為等用戶綜合畫像,并結合業務場景,根據畫像的情況與模型對應,形成具有金融業務特性的風控體系,在解決方案的決策環節結合規則和概率的綜合評價,給出最終的風險評估,整個過程能夠實現秒級響應。知識圖譜的應用不僅能夠為缺乏可解釋性的機器學習算法帶來必要的參考系,還可以串聯金融業務中產生的大量多源異構數據形成知識庫或知識中臺,挖掘數據深層價值,為實現標簽體系構建、投資關系梳理、產業鏈風險預警、智能催收等上層應用打下基礎。
3.8 智能投資研究顧問
通過自動抓取和產業鏈關系推理解決投研領域痛點
對一級或二級市場的投資研究,一直是泛金融領域重要的課題,上市公司或一些重要的標的公司在公開網絡中披露了眾多如財務數據、定期公告、公司研報等有價值的信息,為投資者行為提供了充分的參考依據。傳統投研工作需要分析師通過各種渠道搜集和判別信息,憑借個人經驗對零散的數據進行組織建模,以報告的形式產出趨勢觀點和數據分析,大部分的物料和時間成本都花費在信息和數據的搜集上,加之金融資訊信息時效性極強,成果可控性不高,縱使頭部金融數據機構提供了相應的軟件產品,但數據的顆粒度和產業鏈關聯性仍難以滿足多元需求。此外,金融行業人才流動快,專精于某一領域的分析師一旦離職,將直接影響這個行業分析的延續。
利用NLP技術自動抓取關鍵信息,搭建投研領域知識圖譜,能減少基礎數據處理的工作,將各個行業的發展變化抽象導入數字層面,為知識查詢和應用開發提供實現基礎。由于券商研報中80%的數據指標在傳統軟件產品中無法被查詢,分析師在進入一個新領域時要耗費大量時間搜集類似數據,知識圖譜投研產品可以大大縮短這一必要勞動時間,大幅提高投研效率。除靜態領域圖譜外,基于時間序列還能搭建對網絡報道、新聞事件進行抓取的事理圖譜,兩相結合,從行業固有邏輯和實時信息雙管齊下,推導事情的發展脈絡和趨勢走向,梳理關聯脈絡,為后續判斷投資機會等研判類應用提供數據支撐。
轉載引用于:2020年面向人工智能新基建的知識圖譜行業白皮書
知識圖譜 自然語言技術
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。