首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >文本相似度计算

文本相似度计算

原创
作者头像
用户7532413
修改2021-07-09 17:49:40
修改2021-07-09 17:49:40
1.8K0
举报
文章被收录于专栏:NLP的相关学习NLP的相关学习

最近在处理文本多分类时,需要用到文本相似度计算,在github上找到了一个很不错的Python 第三方包。叫相识(Xiangshi)

具体的安装 方法为:

$ pip3 install xiangshi

$ pip3 install -i https://pypi.tuna.tsinghua.edu.cn/simple xiangshi

demo:

计算文本相似度:

余弦相似度计算:

import xiangshi as xs

xs.cossim(Input1, Input2)

其中input1和input2要以列表的形式作为传入参数。

更多的方法请参阅:kiwirafe/xiangshi: 中文文本相似度计算器 (github.com)

国内上不了github.com的小伙伴可以参阅:xiangshi: 中文文本相似度计算器 (gitee.com)

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • $ pip3 install xiangshi
  • $ pip3 install -i https://pypi.tuna.tsinghua.edu.cn/simple xiangshi
  • demo:
    • 计算文本相似度:
      • 余弦相似度计算:
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档