码迷,mamicode.com
首页 > 其他好文 > 详细

开源知识图谱介绍

时间:2020-02-18 20:25:47      阅读:126      评论:0      收藏:0      [点我收藏+]

标签:检索   data   规模   首页   高质量   存储   互动   表示   组织   

中文开源知识图谱:

(1)中文通用百科知识图谱(CN-DBpedia)

介绍

CN-DBpedia是由复旦大学知识工场实验室研发并维护的大规模通用领域结构化百科,其前身是复旦GDM中文知识图谱

CN-DBpedia主要从中文百科类网站(如百度百科、互动百科、中文维基百科等)的纯文本页面中提取信息,经过滤、融合、推断等操作后,最终形成高质量的结构化数据,供机器和人使用。

下载地址:

http://kw.fudan.edu.cn/cndbpedia/download/

 

(2)思知知识图谱(个人感觉比CN-DBpedia质量更高)

一个名为 OwnThink 的平台在 GitHub 上开源了中文知识图谱项目,这也是目前已开源的最大规模的中文知识图谱,数据是以(实体、属性、值),(实体、关系、实体)混合的形式组织,数据格式采用csv格式,总共有 1.4 亿个三元组。

AI科技大本营(ID:rgznai100)采访了该知识图谱开源项目的算法工程师 Yener,他是开源平台 OwnThink 的作者,主要从事知识图谱、对话机器人、语义理解方面的研究。他表示,知识图谱的开发过程是一个标准的百科知识图谱构建流程,数据抽取来源于结构化数据、半结构化数据、非结构化数据,对各大百科进行抽取后,再对知识进行融合、实时更新等一系列操作。

GitHub 链接:

https://github.com/ownthink/KnowledgeGraphData

百度网盘链接:

https://pan.baidu.com/s/1LZjs9Dsta0yD9NH-1y0sAw 提取码: 3hpp

注:解压密码是 OwnThink 首页地址:https://www.ownthink.com/

 

(3)OPENKG

OpenKG主要关注知识图谱数据(或者称为结构化数据、语义数据、知识库)的开放,广义上OpenKG属于开放数据的一种。

「知识」包含:

  1. 音乐、电影、书籍等的内容
  2. 科学、历史、地理或其他的数据
  3. 政府或其他行政信息

下载地址:

链接:http://openkg.cn/

 

英文开源知识图谱:

(1)wikidata

链接:https://www.wikidata.org/wiki/Wikidata:Database_download/zh

说明:包含所有维基数据实体列表

(2)freebase

链接:https://developers.google.com/freebase/

说明:类似维基百科,不同的时freebase是结构化数据

(3)webkb-2

链接:http://www.webkb.org/

说明:允许Web用户在WebKB服务器机器上的一个大的知识库中存储、组织和检索知识

(4)dbpedia

链接:https://wiki.dbpedia.org/

说明:它从维基百科的词条里撷取出结构化的资料,并将其他资料集连结至维基百科。DBpedia 同时也是世界上最大的多领域知识本体之一

(5)wordnet

链接:https://wordnet.princeton.edu/

说明:它是一个覆盖范围宽广的英语词汇语义网

开源知识图谱介绍

标签:检索   data   规模   首页   高质量   存储   互动   表示   组织   

原文地址:https://www.cnblogs.com/jetHu/p/12327629.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!