知識圖譜術(shù)語定義搜集與斟酌
知識圖譜(Knowledge Graph)
WikiPedia的定義:在知識表示和推理中,知識圖譜是使用圖結(jié)構(gòu)的數(shù)據(jù)模型或拓撲來集成數(shù)據(jù)的知識庫。知識圖譜通常用于存儲具有自由形式語義的實體(對象、事件、情況或抽象概念)的相互關聯(lián)描述。
網(wǎng)上看到的一種定義:
知識圖譜是由本體(Ontology)作為Schema層,和RDF數(shù)據(jù)模型兼容的結(jié)構(gòu)化數(shù)據(jù)集。(從形式出發(fā)作出的定義)
個人比較認可的定義:描述真實世界中存在的各種事物的自身性質(zhì)和事物之間聯(lián)系的語義網(wǎng)絡。(從作用出發(fā)作出的定義)
理由:大家都知道知識圖譜本質(zhì)上是一種語義網(wǎng)絡,其脫胎于語義網(wǎng)絡,是語義網(wǎng)絡的一個子集,那么其不同于其他語義網(wǎng)絡的關鍵就在于它的用途和作用。最初Google提出知識圖譜是為了更好的理解用戶輸入的文本背后的含義,這就是知識圖譜最大的作用:建立起文字與真實世界的事物的聯(lián)系,發(fā)現(xiàn)文字中指代事物的背后性質(zhì)與聯(lián)系。就圖譜本身來說,人只要看到其中的節(jié)點和邊就能立刻知道它是什么;就圖譜與文字的關系來說,二者能夠通過真實世界這樣一個橋梁聯(lián)系起來,從而能作為理解人類語言背后指代的事物和事物性質(zhì)與聯(lián)系的工具;就圖譜與機器的關系來說,計算機利用結(jié)構(gòu)化圖譜數(shù)據(jù)的效率遠遠高于利用人類自然語言,圖譜也就成為了人類和機器指代各種事物的媒介。這些都是知識圖譜與一般語義網(wǎng)絡不同的地方所在,即它是用來描述真實世界中的事物的,其中的節(jié)點和關系都能夠在真實世界中找到對應的事物與事物之間的聯(lián)系。
語義網(wǎng)絡(Semantic Network)
WikiPedia的定義:
語義網(wǎng)絡(英語:Semantic Network)是表示網(wǎng)絡中概念之間語義關系的知識庫,常常用作知識表示的一種形式。它其實是一種有向圖;其中,頂點代表的是概念,而邊則表示的是這些概念之間的語義關系。
網(wǎng)上看到的定義
一種以有向圖的形態(tài)表示人類知識的形式,在一個語義網(wǎng)絡中,信息被表達為一組結(jié)點(頂點),結(jié)點通過一組帶標記的有向直線彼此相連,用于表示結(jié)點間的關系(邊)。
另一種網(wǎng)上看到的定義:
語義網(wǎng)絡是由Quillian于上世紀60年代提出的知識表達模式,其用相互連接的節(jié)點和邊來表示知識。節(jié)點表示對象、概念,邊表示節(jié)點之間的關系。
需要與之區(qū)分開來的另一個概念叫語義網(wǎng)(Semantic Web),它在WikiPedia上面的定義:由萬維網(wǎng)聯(lián)盟的蒂姆·伯納斯-李(Tim Berners-Lee)在1998年提出的一個概念,它的核心是:通過給萬維網(wǎng)上的文檔(如: HTML文檔)添加能夠被計算機所理解的語義(元數(shù)據(jù)),從而使整個互聯(lián)網(wǎng)成為一個通用的信息交換介質(zhì)。語義萬維網(wǎng)通過使用標準、置標語言和相關的處理工具來擴展萬維網(wǎng)的能力。不過語意網(wǎng)概念實際上是基于很多已有技術(shù)的,也依賴于后來和text-and-markup與知識表現(xiàn)的綜合。“語義”網(wǎng)是由比現(xiàn)今成熟的網(wǎng)際搜索工具更加行之有效的、更加廣泛意義的并且自動聚集和搜集信息的文檔組成的。其最基本的元素就是語義鏈接。
說明:
知識圖譜、語義網(wǎng)絡、語義網(wǎng)三者之間的關系:知識圖譜是語義網(wǎng)絡的一個子集,語義網(wǎng)是語義網(wǎng)絡的一個實現(xiàn);
知識圖譜與語義網(wǎng)絡形式上最大的區(qū)別:語義網(wǎng)絡的節(jié)點和邊的值沒有標準,不區(qū)分概念節(jié)點和對象節(jié)點,;知識圖譜有一套不斷完善的標準(RDF/RDFS/OWL等)給概念、實體、關系作出限定,使用本體層存放概念節(jié)點、數(shù)據(jù)層存放對象節(jié)點。
本體(ontology)
WikiPedia的定義:
本體論(英語:Ontology),是研究諸如生存、存在、成為和現(xiàn)實之類的概念的哲學分支。它包括以下問題:如何將實體分為基本類別,以及哪些實體存在于最基本的層次上。本體論有時被稱為存在的科學,并且屬于被稱為形而上學的哲學的主要分支。
網(wǎng)上看到的一個定義:
本體本身是個哲學名詞。在上個世紀80年代,人工智能研究人員將這一概念引入了計算機領域。Tom Gruber把本體定義為“概念和關系的形式化描述”。通俗點講,本體相似于數(shù)據(jù)庫中的Schema,主要用來定義類和關系,以及類層次和關系層次等。OWL是最常用的本體描述語言。本體通常被用來為知識圖譜定義Schema。
另一種網(wǎng)上看到的定義:
本體(ontology)是對概念進行建模的規(guī)范,是描述客觀世界的抽象模型,以形式化的方式對概念及其之間的聯(lián)系給出明確定義。
本體(ontology):對特定領域之中某套概念及其相互之間關系的形式化表達,知識圖譜的本體可以理解為知識圖譜的數(shù)據(jù)模式,通常也可以描述為一個語義網(wǎng)絡,描述了知識圖譜中有哪些類型的實體(實體類),每個類型的實體有哪些類型的屬性(屬性類),各類實體之間有哪些類型的關系(關系類)。
知識圖譜中的元素
實體(entity):指具有可區(qū)別性且獨立存在的某種事物,是知識圖譜的最基本元素,在知識圖譜中表現(xiàn)為語義網(wǎng)絡中的頂點。
屬性(attribute):指描述事物自身性質(zhì)或者事物間聯(lián)系的性質(zhì)的信息,在知識圖譜中表現(xiàn)為實體的鍵值對數(shù)據(jù)(屬性名和屬性值)。
關系(relation):指事物之間普遍存在的聯(lián)系,在知識圖譜中就是描述實體之間聯(lián)系的語義邊。
概念(concept):具有同種特性的事物構(gòu)成集合的名稱,一般指集合、類別、對象類型、事物的種類等。在知識圖譜中一般表示為本體中的元素,與上面知識圖譜中的元素對應,可以分為以下幾類:
實體類(實體概念),具有同種特性的實體構(gòu)成的集合;
屬性類(屬性概念),同類實體擁有的自身性質(zhì)的概念描述;
關系類(關系概念),各類實體之間存在關系的概念描述。
知識圖譜
版權(quán)聲明:本文內(nèi)容由網(wǎng)絡用戶投稿,版權(quán)歸原作者所有,本站不擁有其著作權(quán),亦不承擔相應法律責任。如果您發(fā)現(xiàn)本站中有涉嫌抄襲或描述失實的內(nèi)容,請聯(lián)系我們jiasou666@gmail.com 處理,核實后本網(wǎng)站將在24小時內(nèi)刪除侵權(quán)內(nèi)容。