首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Wikidata】维基数据详解

【导读】维基数据(Wikidata)是一个具有超过4600万个数据项维基数据库,本文介绍了利用SPARQL方法对维基数据进行查询等操作,以便大家对维基数据有更深入了解。...---- ---- 要从维基数据中获取数据,只需使用三元组(如上所述)来编写SPARQL查询。 请注意,我们使用特定标识符来定义正确关系和项目: SELECT ?...如何获得正确标识符? ---- ---- 对于所有查询,正确确定项目和关系是至关重要。 为此,Wikidata使用特定标识符。...了解法国是欧盟成员之一,我会检查其维基数据项目: 1. 在Wikipedia中打开法国查看其Wikidata项目: ? 2. 检查WikiData项: ?...在这里,你只需将鼠标悬停在关系“成员”和“欧盟”项目即可获得他们标识码。 更多例子 ---- ---- 你还记得引言中问题吗? 下面的查询可以回答这些问题: 1.

4K20

电子书资源网站,有这几个就够了。

鸠摩搜书 ☞ www.jiumodiary.com 鸠摩搜书是一个很强大电子书搜索引擎。 它汇集了多个网盘和电子书平台资源,真所谓大而全。...这也是一个神奇网站,基本所有的外文书籍和论文都可以搜到并下载,最近学术论文也可以下载。...Free ebooks - Project Gutenberg ☞ http://www.gutenberg.org/ 古登堡计划(Project Gutenberg)是一个自由和电子化形式,基于互联网...最初是在1971年7月由Michael Hart发起。它是世界上第一个数字图书馆,所有书籍输入都是由志愿者来完成,并将这些书籍文本化。...最初书籍都是英文,到目前已经有超过25种语言书籍。古登堡计划是一个完全志愿性组织,这一点和维基百科很相似。

5.5K40
您找到你想要的搜索结果了吗?
是的
没有找到

(含源码)「自然语言处理(QA)」基于常识对话生成&&多任务学习(MTL)&&多实例学习&&结构化语义表示

此外,本文还提出了结果导向注意和多步解码策略,引导我们模型专注于相关特征来产生结果。在两个基准数据集实验表明,本文提出模型在生成信息丰富、对话流畅方面具有较强鲁棒性。 ? ?...高质量数据集包括1,500个复杂程度不同俄语问题,英语机器翻译,对WikidataSPARQL查询,参考答案以及包含带有俄语标签实体Wikidata样本(三元组)。...数据集创建始于大量来自在线测验问答对, 数据经过自动过滤,人群辅助实体链接,SPARQL查询自动生成以及随后内部验证。 ?...这类任务将一个自然语言问题映射到一个可执行表单,例如SPARQL,这样就可以从给定知识库中提取答案。...到目前为止,提出大多数解决方案是单语,且并依赖一组硬编码规则来解释问题,最后将它们映射到SPARQL查询中。

1.6K20

从语义网到知识图谱

答案可能是主观,因为在这个领域里没有明确共识。 一种观点认为,该领域长期目标是创建语义网产品 ,以及创建、维护和应用所需所有必要工具和方法。...通过将语义网描述为 W3C 标准 RDF、 OWL 和 SPARQL 为核心来研究本体论、关联数据和知识图谱基础和应用,可以对该领域进行限制,但实际可能是相对精确描述。 ?...在一个更精确意义 ,本体论实际一个概念(即,类型或类别,“哺乳动物”和“胎生动物”)及其关系(“哺乳动物产下胎生动物”)知识库,在一个基于形式逻辑本体语言中指定。...从这个角度来看,OWL本体可以作为RDF图模式(或类型逻辑)。 一个用于RDF查询语言 W3C 标准,称为 SPARQL,在2008年发布,在2013年进行了更新,3与 OWL 更加兼容。...Wikidata 基于与维基百科类似的想法,即众包信息。然而,维基百科提供了百科全书式文本(人类读者为主要消费者) ,Wikidata 则是关于创建可用于程序或其他项目的结构化数据。

1.7K10

微软MIT出品,AI自动朗读古腾堡6万本电子书,还能用自己声音定制化

世界最大电子书库正被AI转录为有声书,免费向所有人开放! 这个项目由微软,谷歌和古腾堡计划共同发起,有望将古腾堡计划包含接近6万本电子书库,利用AI文本转语音技术,全部转化为有声读物。...任何用户都可以通过以下5个平台,免费获取到生成语音书。...https://podcasts.apple.com/au/podcast/the-project-gutenberg-open-audiobook-collection/id1680867884 古腾堡计划是全球最大开源电子书库...首先,研究人员开发了一种算法,可以理解基于HTML电子书结构,并区分主要文本和不重要元素,脚注、页码或表格。 这个解析之后,是文本到语音实际转换(文本到语音,TTS)过程。...研究团队使用这些HTML文件集群构建了一个基于规则HTML标准化工具,将最大电子书类别转换为可以自动解析标准表征格式。 这种解析过程使研究团队能够创建一个可以快速、确定地解析大量书籍系统。

28230

命令行数据科学第二版 四、创建命令行工具

命令行工具具有两个世界优点:它们可以从命令行使用,接受参数,并且只需创建一次。在这一章中,你将熟悉用两种方式创建命令行工具。首先,我解释了如何将这些一行程序转换成可重用命令行工具。...➌ 使用grep提取所有单词,并将每个单词放在单独。 ➍ 用sort将这些单词按字母顺序排序。 ➎ 去掉所有重复,用uniq统计每个单词在列表中出现频率。...55 gryphon ➊ 从一个文件中获取模式(在我们例子中是停用词),每行一个,用-f。...我们正在使用文件扩展名.sh说明我们正在创建一个 Shell 脚本。然而,命令行工具不需要有扩展。事实,命令行工具很少有扩展。...在命令行,大多数工具方式将数据传输到下一个命令行工具。有一些命令行工具在将数据写入标准输出之前需要完整数据,比如sort。这意味着管道被这样命令行工具阻塞了。

2.2K40

大规模数据集成: Linked Data

在本系列前两篇文章(“ 使用 RDF 创建数据网络 ” 和 “ 使用 SPARQL 查询 RDF 数据 ”)中,您了解了资源描述框架和 SPARQL 协议和 RDF 查询语言 (SPARQL),它们是万维网联盟...URI 标准提供了一种命名模式模式:一种创建命名模式模式。只要您知道如何在系统中解析、表达以及可能存储 URI,就可以接受来自其他任何符合该标准系统标识符。...因此,要表明一本(学术)图书是由一位特定研究人员为一个已知主题编写,不仅涉及到这 3 个不同标识符,还涉及到 3 种不同模式!拥有一种标准模式来引用所有这些事物,显然非常有意义。...从那时起,您可以使用任何理解 OWL 语义推理系统来查询任何等同资源,从所有这些资源获取属性。这里重点是,这些机制为您提供了将您术语与其他术语联系起来途径。...在这里,加利福尼亚各个县位置分类到一起,通过该关系,您可从一个县访问您知道其他县。您导航链接实际是在后台处理隐含 SPARQL 查询一个等效查询是: ?

4.3K91

知识图谱之图数据库如何选型:知识图谱存储与图数据库总结、主流图数据库对比(JanusGraph、HugeGraph、Neo4j、Dgraph、NebulaGraph、Tugrapg)

水平表每行记录存储知识图谱中一个主语所有谓语 和宾语。实际, 水平表相当于知识图谱邻接表。水平表列数是知识图谱中不同谓语数量, 行数是知识图 谱中不同主语数量。...(2) 对于一行来说,仅在极 少数列上具有值, 表中存在大量空值, 空值过多会影响表存储、索引和查询性能 (3) 在知识图谱中,同一主语 和谓语可能具有多个不同宾语,即一对多联系或多值属性,而水平表一行一列只能存储一个值...实际,水平表就是属性表一种极端情况,即水平表是将所有主语划归为一类,因此属性表中空值问题得到很大缓解。...缺点: (1) 需要创建数目与知识图谱中不同谓语数目相等,而大规模真实知识图谱 ( DBpedia、YAGO、WikiData 等) 中谓语数目可能超过几千个,在关系数据库中维护如此规模表需要花费很大开销...它是世界能够托管具有数百亿个顶点(节点)和数万亿条边(关系)图形最佳解决方案,具有毫秒级延迟。

2.7K11

(含源码)「自然语言处理(QA)」完全数据驱动对话系统&&新型知识感知图网络&&双向专注记忆网络

为了生成任意数量答案实体(即使这些实体从未出现在训练集中),我们设计了一个动态知识查询器,它根据不同局部环境在单个响应中不同位置选择不同答案实体。...与需要从知识库中提取单个事实简单问题不同,复杂问题基于不止一个三元组,需要逻辑和比较推理。提出问答系统将自然语言问题转换为SPARQL语言进行查询,执行该查询会给出一个答案。...该系统首先定义了与问题对应SPARQL查询模板,然后用实体、关系和数值填充模板中槽模型。实体检测采用基于BERT序列标记模型。利用BiLSTM和基于BERT模型,分两步对候选关系进行排序。...本文研究了神经机器翻译范式在问题解析中应用,使用一个序列到序列模型来学习SPARQL查询语言中图模式及其组成。...我们使用Wikidata知识库和可用回答问题数据集来为问答数据实体链接创建基准。在这个数据,我们方法比以前最先进系统表现更好,最终分数平均提高了8%。 ? ?

1.5K50

清华大学李涓子:AI系统如何实现认知推理?

第一代人工智能标志是“符号主义”,图灵奖获得者西蒙和纽威尔提出实现智能充分必要条件是构造出一个物理符号系统。费根鲍姆也因为建立了领域知识库和推理构成专家系统获得图灵奖。...为此,我们提出了 KQA Pro 数据集,该数据集包含近 12 万个经过筛选高质量问题。 图 26:主要思路 目前大多数与 KBQA 相关研究都会把问题表示 SPARQL查询。...图 32:数据集简介 KQA Pro 数据集程序中函数组成、问题类型分布、问题长度如图 32 所示。 图 33:采样 我们还为每一个问答对设计了对应 SPARQL 程序。...图 37:KQA Pro+ 目前,我们将该框架应用于完整 Wikidata 数据,该数据集涉及到 2000 多个属性。我们试图利用属性生成复杂问题,目前已经生成了上百万问题。...我们希望可以用自然语言问答 Wikidata 生成问题,对于任何存在于 Wikidata 知识,我们都可以得到正确对问题理解,生成用户想要答案。

1.1K40

面向初学者的人工智能教程(2)--知识表示与专家系统

例如,我们构建了以下关于编程语言三元组: 图片 层次表征强调了这样一个事实,即我们经常在头脑中创建对象层次结构。例如,我们知道金丝雀是一种鸟,所有的鸟都有翅膀。...它们基于从一个或多个人类专家提取知识库,并且它们包含一个推理引擎,该推理引擎在其执行一些推理。...它从工作内存中可用问题一些初始数据开始,然后执行以下推理循环: 如果目标属性存在于工作内存中-停止并给予结果 查找当前满足条件所有规则-获取冲突规则集。...大部分数据都是从Wikipedia InfoBoxes中挖掘出来,这是维基百科页面中结构化内容。您可以使用SPARQL查询维基数据,SPARQL是一种用于语义Web特殊查询语言。...我们将采取一个家庭树表示在通用GEDCOM格式和家庭关系本体,并建立一个图表所有家庭关系为给定一组个人。 Microsoft概念图 在大多数情况下,本体是手工精心创建

49350

# 知识图谱之图数据库如何选型:知识图谱存储与图数据库总结、主流图数据库对比(JanusGraph、HugeGraph、Neo4j、Dgraph、NebulaG

水平表每行记录存储知识图谱中一个主语所有谓语 和宾语。实际, 水平表相当于知识图谱邻接表。水平表列数是知识图谱中不同谓语数量, 行数是知识图 谱中不同主语数量。...对于一行来说,仅在极 少数列上具有值, 表中存在大量空值, 空值过多会影响表存储、索引和查询性能(3) 在知识图谱中,同一主语 和谓语可能具有多个不同宾语,即一对多联系或多值属性,而水平表一行一列只能存储一个值...实际,水平表就是属性表一种极端情况,即水平表是将所有主语划归为一类,因此属性表中空值问题得到很大缓解。...快速执行不同谓 语表连接查询操作.缺点:(1) 需要创建数目与知识图谱中不同谓语数目相等,而大规模真实知识图谱 ( DBpedia、YAGO、WikiData 等) 中谓语数目可能超过几千个...它是世界能够托管具有数百亿个顶点(节点)和数万亿条边(关系)图形最佳解决方案,具有毫秒级延迟。

65510

命令行数据科学第二版:十、多语言数据科学

我们在第四章中非常清楚地看到了这一点,在那里我们用 Bash、Python 和 R 创建了命令行工具。此外,我们直接在 CSV 文件执行 SQL 查询,并从命令行执行 R 表达式。...10.2 Jupyter Project Jupyter 是一个开源项目,诞生于 2014 年 IPython 项目,因为它发展到支持跨所有编程语言交互式数据科学和科学计算。...➎ 标准输出为一个长字符串。在这里,我将它拆分到每个换行符计算pattern出现次数。 这个命令行工具用法如下: $ ....➏ 将所有的计数相加得到最终计数。注意,元素首先需要从字符串转换成整数。 ➐ 将上述步骤组合成一个单一命令。...如果您想在管道中使用定制命令行工具,那么您需要确保它存在于集群中所有节点(称为执行器)。一种方法是在使用spark-submit提交 Spark 应用时,用--files选项指定文件名。

1.1K20

【知识图谱】知识推理

概念:一个领域子集, 学生:{x|student(x)} 关系:该领域二元关系(笛卡尔积), 朋友:{|friend(x,y)} 个体:一个领域内实例, 小明:{Ming} TBox...Datalog语言为中间语言,首先重写SPARQL语言为Datalog,再将Datalog重写为SQL查询; 基于产生式规则方法:可以按照一定机制执行规则从而达到某些目标,与一阶逻辑类似,也有区别;...一阶查询具有一阶逻辑形式语言 原因:Datalog是数据库一种查询语言,同时具有一阶逻辑形式。...==》针对本体基于一阶查询进行重写 可以 Datalog 为中间语言,首先重写 SPARQL 语言为 Datalog ,再将 Datalog 重写为 SQL。...RDF4J RDF4J 是一个处理 RDF 数据开源框架, 支持语义数据解析、存储、推理和查询。 能够关联几乎所有RDF存储系统,能够用于访问远程RDF存储。

2.8K21

7 个最佳 Linux 电子书阅读器

最近,随着人们发现在手持设备、Kindle 或者 PC 阅读更加舒适,对电子图书需求有所增加。至于 Linux 用户,也有各种电子书应用满足你阅读和整理电子书需求。...老实说,这不仅仅是一个简单电子书阅读器。它是一个完整电子书解决方案。你甚至能通过 Calibre 创建专业电子书。 通过强大电子书管理和易用界面,它提供了创建和编辑电子书功能。...支持所有主流电子书格式:Calibre 支持所有主流电子书格式并兼容多种电子阅读器。 文件转换:在转换时,你能通过改变电子书风格,创建内容表和调整边距选项来转换任何一种电子书格式到另一种。...sudo apt-get install fbreader 或者你能从这里抓取一个 .deb 包,并在你基于 Debian 发行版系统安装它。 3....拥有 PDF 阅读器所有基本特性,Buka 允许你通过箭头键导航,具有缩放选项,并且能并排查看两页。 你可以创建单独 PDF 文件列表并轻松地在它们之间切换。

4.8K21

查询语言指南

friend . } 此查询使用 PREFIX 声明来定义 FOAF(朋友朋友)词汇表命名空间,然后匹配模式查找“Alice”所有朋友。...SELECT 查询检索特定数据,而 CONSTRUCT 查询根据查询结果创建 RDF 图。ASK 查询返回一个布尔值,指示模式是否存在,而 DESCRIBE 查询返回描述资源 RDF 数据。...为了开发统一查询语言标准,目前已有一些工作在进行。目标是创建一个可在不同图数据库中使用通用语言,减少开发者学习曲线,并推动更广泛地采用图技术。...请务必参考图数据库供应商提供文档,因为它将针对您正在学习语言特定功能和能力进行定制。 提示:查看 Dgraph Cloud 文档 获取全面的指南和教程。...了解图查询语言不仅使您更加多才多艺,而且还使您成为竞争激烈就业市场中一项宝贵资产。 使用世界最先进、性能最高具有原生 GraphQL 图数据库,立即开始构建。

11610

知识推理

、跨平台、基于内存  RDF三元组存储系统   支持并行Datalog推理、SPARQL查询   使用举例  创建本体与存储  OWLOntologyManager manager = OWLManager.createOWLOntologyManager... 重写方法关联起了不同查询语言   一阶查询  q(x) ← worksFor( x, y ),Project( y )   具有一阶逻辑形式查询语言   Datalog是数据库一种查询语言...,同时具有一阶逻辑形式   针对本体基于一阶查询进行重写   Datalog语言为中间语言,首先重写SPARQL语言为Datalog,再将Datalog重写为SQL查询    查询重写举例  给定如下本体...,查询所有研究人员及其所从事项目? ...  步骤一:重写为Datalog查询   步骤二:将数据库关系表达式映射成Datalog原子   步骤三:将从SPARQL以及数据库重写过来Datalog规则整合进行查询   相关工具介绍   Ontop

1.4K00

图数据库查询语言Cypher、Gremlin和SPARQL

我既然能有机会在这里扯淡至少我个人是相信这一点肯定会有所改进——文本信息抽取工具逐渐成熟和维基百科为基础知识库(Freebase/DBPedia等)相继出现,会对存储及查询提出更多要求,也会有更多的人投入到改善查询和存储效率...SQL/Gremlin/Sparql简单对比 很多人会问一个问题是图查询能不能用SQL做,首先可以肯定这个是能做,如果效率也非常高的话也就没有必要再多做探讨。...这篇文章只讨论查询模式差异,并且对每一种查询给出相应例子,学习学习基本语法、做做对比即可。...x ex:isInContinent ex:Africa . } 就是获取非洲国家所有直接关联信息(所有出边,不包括入边)。...你要是觉得写查询不累、构造查询不麻烦,其实都行。抽象到像SPARQL/Gremlin这种级别的查询还是需要一些工作,本身未必很难,但是得做。

4K50

《数据密集型应用系统设计》读书笔记(二)

三元存储」模型( Datomic、AllegroGraph 为代表),并介绍三种声明式图查询语言:Cypher、SPARQL 和 Datalog。...每一个顶点都需指定一个像 USA 或 Idaho 这样符号名称,同时指明其类型(这里类型应该是预先定义好,且对于 Person 类其可以直接关联到 type 属性),查询可以使用这些名称创建顶点之间边...当谓语表示边时,客体是另一个顶点, _:idaho :within _:usa;而当谓语表示一个属性时,客体是一个字符串, _:usa :name "United States"。...3.4.3 SPARQL 查询语言 「SPARQL」 是一种采用 RDF 数据模型三元存储查询语言,其是 SPARQL Protocol and RDF Query Language 缩写(好一个套娃...在规则中,大写字母开头单词是变量,谓词匹配则与 Cypher 和 SPARQL 一样。如果系统可以在操作符 :- 右侧找到与所有谓词匹配项,则规则适用。

1.4K30

《101 Windows Phone 7 Apps》读书笔记-BOOK READER

字体来自Gutenberg项目(www.gutenberg.org),由于其版权已经过期,因此它为美国人民提供了免费电子书。...如果你打算发布一个包含Gutenberg项目的应用程序,确认你已经理解了Gutenberg项目的许可证。详见www.gutenberg.org。    ...刚开始可能不那么明显,但是实现本应用程序最大挑战是编页,即在字体设置基础为整本书内容分页。当然,我们可以将整本书内容放置在具有滚动条页面中,但这并不能够带来好用户体验。...The Main Page     图25.1显示了应用程序栏展开后主页面,应用程序栏具有回退一页按钮、跳转到任何章节或者页码按钮和改变设置按钮。...文件名称为1342.txt,与Project Gutenberg网站上下载来文档一致。

1.2K60
领券