python分词软件_python 分词_python分词 - 腾讯云开发者社区

、、

我已经安装了solr及其中文分词软件包。它在中工作得很好。solr分析工具可以很好地与中文分词软件包配合使用。我的问题是，如何将分词请求传递给solr，以及如何获得良好的响应？

浏览 1提问于2011-12-22得票数 0

1回答

英语转换软件

有什么软件可以做以下工作吗？这样的软件存在吗？

浏览 3提问于2010-06-20得票数 5

1回答

从命令行向HTML添加软胸腺码

、、

2)在使用不同的字典/规则进行分词时，有哪些选项？除了英语以外，还有其他语言的规则吗？我知道有些软件，包括LibreOffice，比如自动分号软件中的decribed，可以选择将连字符应用到文档中，但是我正在寻找在现有的HTML文档中不使用文字处理软件的方法。

浏览 0提问于2013-10-07得票数 2

1回答

ntlk:如何获得词的变化

、、

我有一个单词列表，将近5000个英语单词，每个单词我都需要这些屈折的形式：动词:不定式，现在简单，现在简单第三人称，过去简单，现在分词(形式)，过去分词副词如何通过python从ntlk中的给定单词(例如帮助)中提取这些信息？

浏览 1提问于2016-05-05得票数 2

回答已采纳

1回答

text2vec包可以拆分中文句子吗？

、、

目前已有的中文分词软件包有:解霸等，但我想用text2vec做文本聚类和线性回归模型。此外，如何进行文本聚类？J(train_ids)]#文档向量化#代表词语划分到什么程度#步骤1.设置分词迭代器 it_train=itoken(train$review, preproces

浏览 10提问于2017-05-04得票数 0

1回答

使用NLTK为中文运行StanfordPOSTagger时的意外格式

、、、、

我安装了Python3.6.0，NLTK3.2.4，并下载了Stanford标签3.8.0。#!/usr/bin/env python3 print(st.tag('这是斯坦福中文分词器测试'.split()))[('

浏览 6提问于2017-08-07得票数 2

回答已采纳

1回答

python中的逐个分词(分词术语a term en python )

hello all，需要定义一个函数，该函数可以按术语矩阵或在最坏的情况下，在列表数组之间划分，以便在第三个矩阵中得到结果，

浏览 2提问于2009-11-23得票数 3

回答已采纳

5回答

如何避免重复加载大文件？

、、、、

我正在尝试从python中调用一个Java程序(斯坦福中文分词程序)。Java程序需要加载一个大的(100M)字典文件(帮助分词的单词列表)，这需要12+秒。我想知道是否有可能加快加载过程，更重要的是，当我需要多次调用python脚本时，如何避免重复加载它？

浏览 4提问于2012-01-28得票数 4

回答已采纳

1回答

斯坦福POS标签不标注中文文本

、、、

我第一次使用Stanford标签(这是第一次)，虽然它正确地标记了英语，但即使在更改模型参数时，它似乎也不识别(简体)中文。我忽略了什么吗？然后，我将示例文本输入到“sam-input.txt”中。从模型/中文阅读POS标签模型.完成3.5秒。這是

浏览 0提问于2013-04-18得票数 5

回答已采纳

1回答

我们在公共汽车和火车上部署了服务器，连接了互联网。这些服务器定期执行git拉，以更新部署在它们上的代码基。现在，由于互联网的损耗和碎片性质从这些线头，git拉经常被放弃时，正在进行中，这导致我们的地方回购腐败。我们经常会陷入这样一种状态: git开始抱怨松散的git对象，这些东西很难治愈。看来git拉力并不是很能抵抗失败。只是想知道是否有人建议我们如何做一个git拉，是失败的抵抗，类似于所有或没有。

浏览 0提问于2015-11-03得票数 0

1回答

关键词间余弦相似度

、、、、

我刚开始记录python中的相似之处，我对如何处理一些数据感到困惑。基本上，我想得到包含关键字的分词之间的余弦相似性。{'keyword': tfidf_score} 我所要做的就是得到这两个分词之间的余弦相似性，用tfidf分数加权。从网上看，当涉及到文档相似性时，我被所有不同的python库/模块淹没了。

浏览 1提问于2018-12-13得票数 1

回答已采纳

2回答

Ubuntu 15比Mint 17比Zorin 9比初级操作系统

、、

什么是最好的选择，在权力，快速，更多的软件可用和安全？它应该安装在d？

浏览 0提问于2015-07-07得票数 0

1回答

神经标记器是如何工作的？

、

我一直在尝试构建一个NN标记器，其中输入将是字符和输出，令牌。我发现做类似事情的源代码要么是旧的，要么不是简单易学的。你能描述这种模型的输入和输出的形状和意义吗？如果输出是一个热的，那么它是不是太重了，因为令牌的总数大约是100到100万(可能的英语单词数)？您是否推荐使用keras/tensorflow (希望2.0)训练令牌器的教程或示例？

浏览 0提问于2020-10-15得票数 -1

2回答

Python中的分词

、、

我正在尝试在python中使用re.split。我想删除所有像" , ; < > { } [ ] / \ ? ! .I这样的角色 re.split("[, \_!?

浏览 4提问于2015-11-28得票数 0

回答已采纳

1回答

斯坦福汉语分词器在Python中如何不用标点符号返回结果

、、、

我试图用Python中的斯坦福分词来分割一个中文句子，但是目前的结果中有标点符号。我想返回没有标点符号的结果，只返回单词。做这件事的最好方法是什么？我试着在谷歌上搜索答案，但什么也没找到。

浏览 1提问于2015-03-06得票数 2

回答已采纳

2回答

简单语音识别方法

、、

分词的能力(离散的语言很好)会很好，但不是必需的。该软件将取决于用户(即，供我使用)。我不是在寻找现有的软件，而是寻找一个很好的方法来做这件事。我知道Windows已经有语音识别软件了，但我想自己来做一个学习练习。命令很简单，比如"Open“或"Mute”。我所想到的(不确定这是否是一个好主意)是一些命令是复合的。但是，我不确定用这种方式寻找前缀/分词是否会比处理越来越多的单个命令产生更好的结果。

浏览 5提问于2011-12-11得票数 4

回答已采纳

1回答

python:基于字典的分词

、

我有一本字典：和一个字符串输入：我想展示所有可能的词可以根据这样的字典： [('x', 'as', 's', 'h', 'a', 'rest'), ('x', 'as', 'share', 's', 't'), (

浏览 1提问于2017-09-20得票数 4

2回答

在Python中缩进是语义上有意义的还是语法上有意义的？

、、、

我偶然发现了这个句子，我不太明白“语义上有意义”是什么意思。此外，由于缩进用于分隔Python中分词表达式的if块和else块，难道它们不被认为是语言语法的一部分，因此“语法上有意义”吗？(我在中找不到条件表达式中提到它们。)

浏览 7提问于2022-06-13得票数 0

回答已采纳

2回答

python 3.5 nltk Stanford segmenter windows 10

、

path_to_sihan_corpora_dict=corporadict,path_to_model=modelpath,path_to_dict=dictpath)但是Python给出了以下错误。data/data_processed/ugctext/test_stanford.py", line 19, in <module> res = segmenter.segment(u"这是斯坦福中

浏览 16提问于2017-06-28得票数 0

回答已采纳

2回答