前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >python语言转换库snowballstemmer

python语言转换库snowballstemmer

作者头像
周小董
发布2019-03-25 09:57:46
1.7K0
发布2019-03-25 09:57:46
举报
文章被收录于专栏:python前行者

安装

代码语言:javascript
复制
pip install snowballstemmer

这是一款非常瘦小的语言转换库,支持15种语言。

代码语言:javascript
复制
    'danish': 丹麦语,
    'dutch': 荷兰语,
    'english': 英语,
    'finnish': 芬兰语,
    'french':  法语,
    'german': 德语,
    'hungarian': 匈牙利语,
    'italian': 意大利语,
    'norwegian': 挪威语,
    'porter': 波特语,
    'portuguese': 葡萄牙语,
    'romanian': 罗马尼亚语,
    'russian': 俄语,
    'spanish': 西班牙语,
    'swedish': 瑞典语,
    'turkish': 土耳其语,

snowballstemmer模块有两个功能

snowballstemmer.algorithms函数报道查看一个可用的算法名称“字符串列表。

代码语言:javascript
复制
import snowballstemmer
>>> snowballstemmer.algorithms()
['danish', 'dutch', 'english', 'finnish', 'french', 'german', 'hungarian', 'italian', 'norwegian', 'porter', 'portuguese', 'romanian', 'russian', 'spanish', 'swedish', 'turkish']

该snowballstemmer.stemmer函数接受算法名称并报道查看Stemmer对象。

Stemmer有对象Stemmer.stemWord(word)方法状语从句:Stemmer.stemWords(word[])方法。

代码语言:javascript
复制
import snowballstemmer

stemmer = snowballstemmer.stemmer('english');
print(stemmer.stemWords("We are the world".split()));
['We', 'are', 'the', 'world']
代码语言:javascript
复制
from snowballstemmer import EnglishStemmer, SpanishStemmer
EnglishStemmer().stemWord("Gregory")
# Gregori
SpanishStemmer().stemWord("amarillo")
# amaril

参考:https://pypi.org/project/snowballstemmer/ https://github.com/shibukawa/snowball_py

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2019年03月14日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档