如何在特定的知识图中为TransE算法构建我自己的数据集

Question

现在我正在建立中国股票的知识图，并希望建立新闻推荐系统。我想将TransE算法用于实体嵌入和关系嵌入。。但是我没有数据集，也不知道如何使用我自己的知识图构建数据集？

Answer 1

首先是使用Wikidata中的数据。它包含有关中国公司的一些信息（我想您是指在中国证券交易所上市的公司）。例如，https://www.wikidata.org/wiki/Q831445显示有关中国石化的信息。

可以从API下载Wikidata中的数据，在https://dumps.wikimedia.org/wikidatawiki/处下载大型转储文件，或在https://query.wikidata.org/处下载SPARQL端点。

您可以通过SPARQL查询获得在深圳证券交易所上市的公司的列表：

SELECT 
  ?company ?companyLabel
  ?industry ?industryLabel
{
  ?company wdt:P414 wd:Q517750 .
  OPTIONAL { ?company wdt:P452 ?industry }
  SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en,zh". }
}

结果也可通过https://w.wiki/9DM获得。可以通过修改查询来扩展此结果，并且可以以各种格式下载该结果。使用DESCRIBE SPARQL关键字，您可以获得可能对TransE算法有用的三重格式，例如DESCRIBE wd:Q831445，结果为https://w.wiki/9DN。

可以处理大型转储文件，并使用Gensim的Word2Vec嵌入知识图，请参见[W0]中的“ Wembedder：Wikidata实体嵌入Web服务”。您可以使用Wembedder Web应用程序探索这种方法的一个结果，例如https://arxiv.org/abs/1710.04099在嵌入国航的知识图中显示“最相似”查询的结果

如何在特定的知识图中为TransE算法构建我自己的数据集

问题描述投票：0回答：1

1个回答

最新问题

如何在特定的知识图中为TransE算法构建我自己的数据集

问题描述 投票：0回答：1

1个回答

最新问题

问题描述投票：0回答：1