我下载了Freebase Easy dataset (3.3 the )。我想通过输入一些实体来研究这个数据集。例如:德语(freebase中的类型:位置、国家、土地.)。
如何将这三个文件连接在一起以获得完整的数据集?
发布于 2020-04-23 02:54:25
这些文件(facts.txt freebase-links.txt scores.txt)都采用相同的格式,因此可以简单地将它们连接起来。在类Unix系统上,您可以使用以下命令:
cat facts.txt freebase-links.txt scores.txt > all.txt
或者,您可以通过执行以下操作来压缩所有内容
unzip -ca freebase-easy-latest.zip \*.txt | gzip > freebase-easy-all.txt.gz
示例条目将如下所示
$ unzip -ca freebase-easy-latest.zip \*.txt | grep $"^B\t"
B prominence-score 1758.0 .
B freebase-entity <http://rdf.freebase.com/ns/m.0560cf> .
B Transit System New York City Subway .
B is-a Topic .
B is-a Transit Line .
B kg/object_profile/prominent_type Transit Line .
其中第一行来自scores.txt
,第二行来自freebase-links.txt
,其余行来自facts.txt
。
https://stackoverflow.com/questions/61351320
复制相似问题