[323]}
doc2author 从每个文档的作者映射表,author2doc 倒转
2.3 案例中spacy的使用
下面的案例是官网的案例,所以英文中使用spacy进行分词和清洗,使用的时候需要额外加载一些...参考spacy官方Link:https://spacy.io/usage/models#download-pip
第一种方式:
python -m spacy download en # 如果没有访问外国网站会很慢...author2doc,作者到每个文档ID的映射表,author2doc
doc2author,author2doc的反向表征,从每个文档的作者映射表
最简训练模式:
model = AuthorTopicModel...其中top_topics 返回的针对主题的,10个主题 * 2(每个主题重要词概率+一致性指标):
[([(0.0081142522, 'gaussian'), (0.0029860872, '....
# doc_ids,list+str,第几届NIPS+'_'+第几篇,'07_713',用来准备author2doc的材料
docs = []
doc_ids = []
for yr_dir in