前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >文本相似度计算

文本相似度计算

原创
作者头像
用户7532413
修改2021-07-09 17:49:40
1.7K0
修改2021-07-09 17:49:40
举报
文章被收录于专栏:NLP的相关学习

最近在处理文本多分类时,需要用到文本相似度计算,在github上找到了一个很不错的Python 第三方包。叫相识(Xiangshi)

具体的安装 方法为:

$ pip3 install xiangshi

$ pip3 install -i https://pypi.tuna.tsinghua.edu.cn/simple xiangshi

demo:

计算文本相似度:

余弦相似度计算:

import xiangshi as xs

xs.cossim(Input1, Input2)

其中input1和input2要以列表的形式作为传入参数。

更多的方法请参阅:kiwirafe/xiangshi: 中文文本相似度计算器 (github.com)

国内上不了github.com的小伙伴可以参阅:xiangshi: 中文文本相似度计算器 (gitee.com)

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • $ pip3 install xiangshi
  • $ pip3 install -i https://pypi.tuna.tsinghua.edu.cn/simple xiangshi
  • demo:
    • 计算文本相似度:
      • 余弦相似度计算:
相关产品与服务
NLP 服务
NLP 服务(Natural Language Process,NLP)深度整合了腾讯内部的 NLP 技术,提供多项智能文本处理和文本生成能力,包括词法分析、相似词召回、词相似度、句子相似度、文本润色、句子纠错、文本补全、句子生成等。满足各行业的文本智能需求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档