首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >如何在特定的知识图中为TransE算法构造自己的数据集

如何在特定的知识图中为TransE算法构造自己的数据集
EN

Stack Overflow用户
提问于 2019-07-10 11:42:36
回答 1查看 87关注 0票数 0

现在我正在构建一个中国股票的知识图谱,并想要构建一个新闻推荐系统。并且我想使用TransE算法来实现实体嵌入和关系嵌入。​但是我没有数据集,并且不清楚如何使用我自己的知识图谱构建数据集?

EN

回答 1

Stack Overflow用户

发布于 2019-10-02 01:50:46

一个开始就是使用维基数据中的数据。它有一些关于中国公司的信息(我想你指的是在中国证券交易所上市的公司)。例如,https://www.wikidata.org/wiki/Q831445显示有关中石化的信息。

来自维基数据的数据可以从API、https://dumps.wikimedia.org/wikidatawiki/上的大型转储文件或https://query.wikidata.org/上的SPARQL端点下载。

您可以使用SPARQL查询获取在深圳证券交易所上市的公司列表:

代码语言:javascript
运行
复制
SELECT 
  ?company ?companyLabel
  ?industry ?industryLabel
{
  ?company wdt:P414 wd:Q517750 .
  OPTIONAL { ?company wdt:P452 ?industry }
  SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en,zh". }
}

这个结果也可以在https://w.wiki/9DM上找到。这个结果可以通过修改查询来扩展,并且可以以各种格式下载。使用DESCRIBE SPARQL关键字,您可以获得可能对TransE算法有用的三重格式,例如,结果为https://w.wiki/9DNDESCRIBE wd:Q831445

可以处理大型转储文件,并使用Gensim的Word2Vec生成嵌入的知识图,请参阅https://arxiv.org/abs/1710.04099上的"Wembedder:维基数据实体嵌入web服务“。您可以使用Wembedder webapp探索这种方法的一个结果,例如,https://tools.wmflabs.org/wembedder/most-similar/Q51747在嵌入了中国国际航空公司的知识图谱中显示“最相似”查询的结果

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/56963129

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档