腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
从solr分析服务请求
分词
、
、
我已经安装了solr及其中文
分词
软件
包。它在中工作得很好。solr分析工具可以很好地与中文
分词
软件
包配合使用。 我的问题是,如何将
分词
请求传递给solr,以及如何获得良好的响应?
浏览 1
提问于2011-12-22
得票数 0
1
回答
英语转换
软件
有什么
软件
可以做以下工作吗?这样的
软件
存在吗?
浏览 3
提问于2010-06-20
得票数 5
1
回答
从命令行向HTML添加软胸腺码
、
、
2)在使用不同的字典/规则进行
分词
时,有哪些选项?除了英语以外,还有其他语言的规则吗?我知道有些
软件
,包括LibreOffice,比如自动分号
软件
中的decribed,可以选择将连字符应用到文档中,但是我正在寻找在现有的HTML文档中不使用文字处理
软件
的方法。
浏览 0
提问于2013-10-07
得票数 2
1
回答
ntlk:如何获得词的变化
、
、
我有一个单词列表,将近5000个英语单词,每个单词我都需要这些屈折的形式:动词:不定式,现在简单,现在简单第三人称,过去简单,现在
分词
(形式),过去
分词
副词如何通过
python
从ntlk中的给定单词(例如帮助)中提取这些信息?
浏览 1
提问于2016-05-05
得票数 2
回答已采纳
1
回答
text2vec包可以拆分中文句子吗?
、
、
目前已有的中文
分词
软件
包有:解霸等,但我想用text2vec做文本聚类和线性回归模型。此外,如何进行文本聚类?J(train_ids)]#文档向量化#代表词语划分到什么程度#步骤1.设置
分词
迭代器 it_train=itoken(train$review, preproces
浏览 10
提问于2017-05-04
得票数 0
1
回答
使用NLTK为中文运行StanfordPOSTagger时的意外格式
、
、
、
、
我安装了
Python
3.6.0,NLTK3.2.4,并下载了Stanford标签3.8.0。#!/usr/bin/env
python
3 print(st.tag('这 是 斯坦福 中文
分词
器 测试'.split()))[('
浏览 6
提问于2017-08-07
得票数 2
回答已采纳
1
回答
python
中的逐个
分词
(
分词
术语a term en
python
)
hello all,需要定义一个函数,该函数可以按术语矩阵或在最坏的情况下,在列表数组之间划分,以便在第三个矩阵中得到结果,
浏览 2
提问于2009-11-23
得票数 3
回答已采纳
5
回答
如何避免重复加载大文件?
、
、
、
、
我正在尝试从
python
中调用一个Java程序(斯坦福中文
分词
程序)。Java程序需要加载一个大的(100M)字典文件(帮助
分词
的单词列表),这需要12+秒。我想知道是否有可能加快加载过程,更重要的是,当我需要多次调用
python
脚本时,如何避免重复加载它?
浏览 4
提问于2012-01-28
得票数 4
回答已采纳
1
回答
斯坦福POS标签不标注中文文本
、
、
、
我第一次使用Stanford标签(这是第一次),虽然它正确地标记了英语,但即使在更改模型参数时,它似乎也不识别(简体)中文。我忽略了什么吗?然后,我将示例文本输入到“sam-input.txt”中。 从模型/中文阅读POS标签模型.完成3.5秒。 這是
浏览 0
提问于2013-04-18
得票数 5
回答已采纳
1
回答
抗失效的git拉在有损耗的片状连接上
我们在公共汽车和火车上部署了服务器,连接了互联网。这些服务器定期执行git拉,以更新部署在它们上的代码基。现在,由于互联网的损耗和碎片性质从这些线头,git拉经常被放弃时,正在进行中,这导致我们的地方回购腐败。我们经常会陷入这样一种状态: git开始抱怨松散的git对象,这些东西很难治愈。 看来git拉力并不是很能抵抗失败。只是想知道是否有人建议我们如何做一个git拉,是失败的抵抗,类似于所有或没有。
浏览 0
提问于2015-11-03
得票数 0
1
回答
关键词间余弦相似度
、
、
、
、
我刚开始记录
python
中的相似之处,我对如何处理一些数据感到困惑。基本上,我想得到包含关键字的
分词
之间的余弦相似性。{'keyword': tfidf_score} 我所要做的就是得到这两个
分词
之间的余弦相似性,用tfidf分数加权。从网上看,当涉及到文档相似性时,我被所有不同的
python
库/模块淹没了。
浏览 1
提问于2018-12-13
得票数 1
回答已采纳
2
回答
Ubuntu 15比Mint 17比Zorin 9比初级操作系统
、
、
什么是最好的选择,在权力,快速,更多的
软件
可用和安全?它应该安装在d?
浏览 0
提问于2015-07-07
得票数 0
1
回答
神经标记器是如何工作的?
、
我一直在尝试构建一个NN标记器,其中输入将是字符和输出,令牌。我发现做类似事情的源代码要么是旧的,要么不是简单易学的。你能描述这种模型的输入和输出的形状和意义吗?如果输出是一个热的,那么它是不是太重了,因为令牌的总数大约是100到100万(可能的英语单词数)? 您是否推荐使用keras/tensorflow (希望2.0)训练令牌器的教程或示例?
浏览 0
提问于2020-10-15
得票数 -1
2
回答
Python
中的
分词
、
、
我正在尝试在
python
中使用re.split。我想删除所有像" , ; < > { } [ ] / \ ? ! .I这样的角色 re.split("[, \_!?
浏览 4
提问于2015-11-28
得票数 0
回答已采纳
1
回答
斯坦福汉语
分词
器在
Python
中如何不用标点符号返回结果
、
、
、
我试图用
Python
中的斯坦福
分词
来分割一个中文句子,但是目前的结果中有标点符号。我想返回没有标点符号的结果,只返回单词。做这件事的最好方法是什么?我试着在谷歌上搜索答案,但什么也没找到。
浏览 1
提问于2015-03-06
得票数 2
回答已采纳
2
回答
简单语音识别方法
、
、
分词
的能力(离散的语言很好)会很好,但不是必需的。该
软件
将取决于用户(即,供我使用)。我不是在寻找现有的
软件
,而是寻找一个很好的方法来做这件事。我知道Windows已经有语音识别
软件
了,但我想自己来做一个学习练习。命令很简单,比如"Open“或"Mute”。我所想到的(不确定这是否是一个好主意)是一些命令是复合的。但是,我不确定用这种方式寻找前缀/
分词
是否会比处理越来越多的单个命令产生更好的结果。
浏览 5
提问于2011-12-11
得票数 4
回答已采纳
1
回答
python
:基于字典的
分词
、
我有一本字典:和一个字符串输入:我想展示所有可能的词可以根据这样的字典: [('x', 'as', 's', 'h', 'a', 'rest'), ('x', 'as', 'share', 's', 't'), (
浏览 1
提问于2017-09-20
得票数 4
2
回答
在
Python
中缩进是语义上有意义的还是语法上有意义的?
、
、
、
我偶然发现了这个句子, 我不太明白“语义上有意义”是什么意思。此外,由于缩进用于分隔
Python
中
分词
表达式的if块和else块,难道它们不被认为是语言语法的一部分,因此“语法上有意义”吗?(我在中找不到条件表达式中提到它们。)
浏览 7
提问于2022-06-13
得票数 0
回答已采纳
2
回答
python
3.5 nltk Stanford segmenter windows 10
、
path_to_sihan_corpora_dict=corporadict,path_to_model=modelpath,path_to_dict=dictpath)但是
Python
给出了以下错误。data/data_processed/ugctext/test_stanford.py", line 19, in <module> res = segmenter.segment(u"这是斯坦福中
浏览 16
提问于2017-06-28
得票数 0
回答已采纳
2
回答
为什么
分词
和文件名扩展不适用于`[.]]‘中的条件表达式?
来自Bash参考手册shell扫描参数展开、命令替换和算术扩展的结果,这些结果没有出现在双引号内,用于
分词
。来自Filename展开部分的规则:没有设置-f选项。为什么文件名扩展也不适
浏览 0
提问于2016-03-16
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python R 分词处理
Python实现jieba分词
python结巴分词学习
“结巴”中文分词:做最好的 Python 中文分词组件
死磕Python(5):结巴分词
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
即时通信 IM
活动推荐
运营活动
广告
关闭
领券