知識圖譜的入門建議:第一條,從本文開始

管理員賬號

2019-12-03

2012年Google發布知識圖譜以來,知識圖譜技術飛速發展,其理論體系日趨完善,其應用效果日益明顯。在知識圖譜技術的引領下,知識工程新的歷史篇章——大數據知識工程已初具輪廓;在知識圖譜技術的推動下,各行各業的智能化升級與轉型的宏偉畫卷正逐步展開。

知識圖譜能解決很多問題,比如,知識圖譜可以讓機器實現語言認知、人工智能、與數據驅動一道成為另外一種解決問題的范式,比如應用在搜索、決策、問答、支持等等。

知識圖譜是較為典型的交叉領域,涉及了知識工程、自然語言處理、機器學習、圖數據庫等多個領域。面對如此龐雜的知識體系,下文為大家帶來幾點建議。

█ 知識圖譜的入門建議 █

無論是一名學生還是一名從業人員,真正要了解所謂的“知識”,閱讀是一個很重要途徑,所以說要從讀一本好書開始。

另外,要牢固掌握基礎知識和技能。知識表示、數據庫(圖數據庫)管理、自然語言處理、機器學習(深度學習),這些都是要掌握的基本技能,有了這些基礎以后,無論是深入學知識圖譜,還是看書、理解模型,都會比較順,更能讀懂、理解。

因為知識圖譜是一門偏應用、偏工程的學科,所以落地實踐非常重要。只有真正的去實踐,并秉持數據驅動、應用導向的思想,真正的完成了一個實際的工程項目,碰到實際的問題真正去解決了以后,才能有更好的領悟體會,最終才能有更大的收獲。

最后,由于知識圖譜才剛剛起步,還有很多挑戰和問題沒有解決,有些相關研究還不多,技術不夠成熟,暫無真正成功的落地實踐。知識圖譜領域還有很多挑戰,我們要以開放的心態去直面挑戰,然后通過解決實際問題中獲得的收獲,逐漸形成體系,讓我們知識的積累、書籍的積累越來越多,才能讓我們的學科研究、從業隊伍、及各項事業更好的向前發展。

█ 歲尾巨獻《知識圖譜》 █

隨著知識圖譜技術研究與應用的深化,知識圖譜技術吸引了來自工業界與學術界的廣泛關注。知識圖譜領域涌現出大量的理論與技術研究成果,以及一批優秀的工程實踐案例。一方面,對于這些理論工作與工程實踐,需要進行系統性的梳理;另一方面,隨著研究與應用的深入,業界也迫切需要一本系統性的知識圖譜教材。

鑒于此,復旦大學知識工場實驗室創始人肖仰華教授攜團隊帶來了博文視點歲尾巨獻、人工智能領域重量級作品——《知識圖譜:概念與技術》

本書緊密圍繞知識圖譜開展知識體系的梳理,盡量突出知識圖譜與相關學科(特別是自然語言處理、語義網與數據庫等學科)的差別,盡可能的為大家清晰地界定知識圖譜與各分支學科的根本不同。

不同于市面上的其他相關書籍,本書更加注重的是關于知識圖譜的整個知識體系,從最基礎的基本概念、基礎理論到設計、技術、模型、方法都做了全面的介紹。

本書的內容體系基本成型于2018年8月,從2017年到2019年,其先后兩次在復旦大學相關課程中進行講授,2018年8月和12月其分別在上海財經大學和北京理工大學面向全國公開講授,累計近千人次完成了課程的學習。從2018年年底至今,本書編寫組完成了書稿,并經多輪修訂,最終形成大家手中的這個版本。

█ 關于主要作者

肖仰華

博士,復旦大學教授、博士生導師、復旦大學知識工場實驗室創始人。曾擔任多家企業高級技術顧問與首席科學家。曾獲得十多個國家、省/市、企業級的研究獎項,曾承擔三十多項國家、省/市、企業級研發項目。在國際頂級學術會議與期刊(包括SIGMOD、VLDB、ICDE、IJCAI、AAAI、ACL、TKDE等)上發表論文百余篇,授權近20項知識圖譜專利。擔任多個國際期刊編委,百余次為國際/國內學術機構/會議提供學術服務工作。領導構建了知識工場平臺,發布了一系列知識圖譜,包括CN-DBpedia、CN-Probase等。

█ 本書內容架構

全書共五篇,由16章構成,力求涵蓋知識圖譜相關的基本概念與關鍵技術。

第1篇 基礎篇

包含前兩章。第1章介紹知識圖譜的基本概念、歷史沿革、研究意義、應用價值等。第2章介紹知識圖譜所必需的基礎知識,主要介紹與知識圖譜密切相關的知識表示、機器學習、自然語言處理的基本概念。

第2篇 構建篇

介紹知識圖譜的構建。大規模高質量知識圖譜的構建是整個知識圖譜技術落地的核心,因此也是整本書的重點。本篇的核心是第3章與第4章。在這兩章中,我們介紹了知識圖譜中知識獲取的兩個核心問題。其中一個是點的識別與建立,知識圖譜中的點可以是詞匯與實體,因此第3章重點介紹了詞匯挖掘與實體識別。有了知識圖譜中的點之后,建立點之間的關系是知識圖譜構建的核心問題。為此,第4章主要介紹了關系抽?。◤奈谋局蝎@取關系實例)。

在此基礎上,第2篇進一步對兩類重要的知識圖譜,即概念圖譜(第5章)與百科圖譜(第6章)的構建展開了具體介紹。這兩類知識圖譜在知識圖譜技術發展歷程中有著突出地位,有很多實際應用。最后,第2篇再對其中的兩個專題:眾包構建(第7章)與質量控制(第8章)展開介紹。當前的知識圖譜構建還離不開人,如何把人力用好是第7章的主題。質量控制是知識圖譜構建的核心,第8章從質量視角再次盤點整個知識圖譜構建的全流程。

可以看出,我們在構建部分濃墨重彩,從構建的關鍵環節(詞匯挖掘、實體識別、關系抽?。?、兩類重要知識圖譜的構建,以及構建的兩個專題等三個切面對知識圖譜構建進行了全方位的論述。其目的在于向讀者立體式地呈現知識圖譜構建的完整體系。這也從一個側面說明了知識圖譜知識體系的龐雜。

第3篇 管理篇

介紹知識圖譜的建模與存儲(第9章)、查詢與檢索(第10章)以及圖數據管理系統(第11章)。這一篇旨在從數據管理的角度系統闡述知識圖譜如何建模、如何存儲、如何查詢、如何檢索,以及如何實現系統性的高效管理。

第4篇 應用篇

把知識圖譜構建好、管理好的目的還是為了應用好。第4篇對于基于知識圖譜的應用技術展開介紹,包括搜索與推薦(第13章)、自然語言問答(第14章)。這些應用本質上都依賴基于知識圖譜的自然語言理解,因此這一專題也單獨成章(第12章)。

第5篇 實踐篇

知識圖譜實踐有哪些基本原則和最佳實踐(第15章),以及在知識圖譜應用過程中還存在哪些挑戰(第16章),都會在這一篇中回答。

讀者評論

相關專題

相關博文

  • 機器學習:數據驅動的科學

    機器學習:數據驅動的科學

    管理員賬號 2017-05-27

    小編說:傳統上,計算機會按照我們輸入的指令一步步執行。而機器學習卻是通過輸入數據而不是指令來進行各種工作。 機器學習,也被稱為統計機器學習,是人工智能領域的一個分支,其基本思想是基于數據構建統計模型,并利用模型對數據進行分析和預測...

    管理員賬號 2017-05-27
    1051 0 0 0
  • 你聽過無人駕駛,但你了解無人駕駛的算法嗎?

    你聽過無人駕駛,但你了解無人駕駛的算法嗎?

    管理員賬號 2017-05-26

    小編說:我們已經拉開了全自動無人駕駛的序幕,在幕布之后是我們精彩的未來,但你可能不知道的是無人駕駛系統是一個復雜的系統,系統主要由三部分組成:算法端、Client端和云端。算法端從傳感器原始數據中提取有意義的信息以了解周遭的環境情況,...

    管理員賬號 2017-05-26
    1252 0 0 0
  • 無人駕駛的分級以及產品化后會帶來的改善

    無人駕駛的分級以及產品化后會帶來的改善

    管理員賬號 2017-05-24

    小編說:人工智能是時代,機器人開始作為服務的承載體出現,其中的一個具體事例就是無人駕駛的產品化。無人駕駛并不是一個單一的新技術,而是一系列技術的整合。本文將向您介紹這一技術對生活帶來的改善以及無人駕駛的分級。本文選自《第一本無人駕駛技...

    管理員賬號 2017-05-24
    218 0 0 0
澳洲幸运10现场开奖 江西11选5中奖查询 _中国百家乐 河北快3正规网上销售平台 青海快3跨度表 广东快乐十分人工计划 天津快乐十分开奖一定牛 河内5分彩计划app 北京快乐8是国家开的吗 幸运赛车开奖网 广西快乐十分同步直播