腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
使用ICU
进行
分词
、
、
、
、
我想知道是否有可能在ICU中
进行
分词
,根据一些
分词
标准将中文文本分割成一系列的单词。所以下面的文本可能没有任何意义,但它应该说明我对哪种输出感兴趣):说ICU50能够
分词
想知道你们中是否有人在ICU中使用过
分词
,或者知道如何
进行
分词
,或者是否有关于如何
进行
分词
的好链接。
浏览 3
提问于2012-11-21
得票数 0
回答已采纳
1
回答
ntlk:如何获得词的变化
、
、
我有一个单词列表,将近5000个英语单词,每个单词我都需要这些屈折的形式:动词:不定式,现在简单,现在简单第三人称,过去简单,现在
分词
(形式),过去
分词
副词如何通过
python
从ntlk中的给定单词(例如帮助)中提取这些信息?
浏览 1
提问于2016-05-05
得票数 2
回答已采纳
2
回答
为什么
分词
和文件名扩展不适用于`[.]]‘中的条件表达式?
来自Bash参考手册shell扫描参数展开、命令替换和算术扩展的结果,这些结果没有出现在双引号内,用于
分词
。来自Filename展开部分的规则:没有设置-f选项。为什
浏览 0
提问于2016-03-16
得票数 0
1
回答
nanoc支持嵌套的偏导函数吗?
、
、
换句话说,我可以在
分词
中包含
分词
吗? 当我对此
进行
测试时,站点
进行
了编译,但嵌套的partial没有显示。
浏览 1
提问于2014-01-24
得票数 2
1
回答
使用NLTK为中文运行StanfordPOSTagger时的意外格式
、
、
、
、
我安装了
Python
3.6.0,NLTK3.2.4,并下载了Stanford标签3.8.0。#!/usr/bin/env
python
3 print(st.tag('这 是 斯坦福 中文
分词
器 测试'.split()))[('
浏览 6
提问于2017-08-07
得票数 2
回答已采纳
1
回答
在json对象的字符串化列表上使用ply.lex
、
我有一个json对象的字符串化的
python
列表,我已经对其
进行
了部
分词
法分析。
浏览 1
提问于2012-10-27
得票数 1
1
回答
SQLite3、FTS3和停用词
、
在构建虚拟FTS3表的过程中,如何防止SQLite3不索引某些关键字或“停用字”?
浏览 1
提问于2011-06-11
得票数 3
回答已采纳
1
回答
python
中的逐个
分词
(
分词
术语a term en
python
)
hello all,需要定义一个函数,该函数可以按术语矩阵或在最坏的情况下,在列表数组之间划分,以便在第三个矩阵中得到结果,
浏览 2
提问于2009-11-23
得票数 3
回答已采纳
1
回答
使用GCE自动标度和负载均衡器的永久实例
、
、
谷歌云自动
分词
器中是否有任何选项可以将某些实例标记为永久实例,而这些实例不应该被自动
分词
器销毁? 在我的用例中,我需要一直运行一些实例(这也为关键数据提供服务),并且只需要在流量增加/减少时
进行
缩放。
浏览 0
提问于2018-04-10
得票数 0
1
回答
如何在
Python
中将不同的进程绑定到单个cpu核心
、
我正在编写一个
Python
程序,它将从文本文件中加载一个单词列表,然后尝试用每个单词解压缩一个归档文件。如果它没有使用所有的cpu核心,那么它不会很严重。由于GIL的存在,如果我没记错的话,在
Python
中
进行
线程处理不是一个很好的选择。所以我想要得到cpu_cores的数量,拆
分词
表,并使用multiprocessing.process模块在不同的进程中处理词表的不同部分。 但是,每个进程都会自动固定到一个cpu核心吗?
浏览 0
提问于2017-04-21
得票数 1
2
回答
AttributeError:'_io.TextIOWrapper‘对象没有属性'decode’
我正在尝试读取多个文本文件,
进行
分词
(使用jieba),然后将结果分别保存到CSV文件中。
python
代码是:import csv list_of_files = glob.glob('C:/Users/user/Desktop/speech
浏览 4
提问于2017-07-27
得票数 0
1
回答
使用opencv
进行
分词
、
、
我正在处理一些扫描的文本图像,我需要突出显示图像中的所有单词。我知道这个问题等同于查找周围有额外空格的子图像。我试着阅读了阈值和分割的知识,我只是想找个人给我一些相关的资料。
浏览 3
提问于2012-10-07
得票数 9
回答已采纳
1
回答
将IFS设置为非空白字符的Bash中的分字
、
、
、
、
这个名为"args“的脚本有助于演示
分词
示例:printf "%d args:" $#echo$ .但是,当我用非空白字符(比如: )替换IFS时,如果我直接将字符串作为参数传递,脚本就不会执行
分词
操作。1 args: <one:two:three> 但是,如果我(1)将字符串分配给一个变量,然
浏览 1
提问于2017-04-01
得票数 8
回答已采纳
5
回答
如何避免重复加载大文件?
、
、
、
、
我正在尝试从
python
中调用一个Java程序(斯坦福中文
分词
程序)。Java程序需要加载一个大的(100M)字典文件(帮助
分词
的单词列表),这需要12+秒。我想知道是否有可能加快加载过程,更重要的是,当我需要多次调用
python
脚本时,如何避免重复加载它?
浏览 4
提问于2012-01-28
得票数 4
回答已采纳
3
回答
Bash字分裂机制
、
、
我是新来的巴什,我看到有自动
分词
,由巴什:如果我重复echo $a的"a“,我就得到了1 2 3 4,它已经隐式地
进行
了
分词
。我还从上读到 shell扫描参数展开、命令替换和算术扩展的结果,这些结果没有出现在双引号内,用于
分词
。
浏览 9
提问于2013-08-28
得票数 3
回答已采纳
1
回答
如何在
python
中使用正则表达式将单个拆分字符组合在一起?
、
、
对于
分词
器,我的目标是拆分一个术语,以便只获得单词(长度> 1)。现在为了涵盖单个字符,我想将紧跟在一起的所有单个字符拉在一起,如下所示:我使用
python
进行
如下匹配: pattern = re.compile(r"(?
浏览 1
提问于2016-04-22
得票数 0
1
回答
无法
进行
分词
:用于中文和日语的
分词
css
我必须将以下CSS属性应用于HTML标签
分词
: break-word它在诸如英语、德语和法语等罗马文字的情况下工作得很好,但在中文、日语和韩语等语言中它却失败了。我有什么方法可以做到这一点吗?
浏览 0
提问于2019-11-22
得票数 0
2
回答
使用多个IFS
进行
分词
、
、
、
作为shell脚本的新手,我对bash中的引用和拆分概念不是很清楚。在下面的代码片段中:echo ${#array1[@]} dodone在IFS为:-的情况下,我认为结果是:Italy-country正
浏览 2
提问于2014-11-15
得票数 1
1
回答
关键词间余弦相似度
、
、
、
、
我刚开始记录
python
中的相似之处,我对如何处理一些数据感到困惑。基本上,我想得到包含关键字的
分词
之间的余弦相似性。{'keyword': tfidf_score} 我所要做的就是得到这两个
分词
之间的余弦相似性,用tfidf分数加权。从网上看,当涉及到文档相似性时,我被所有不同的
python
库/模块淹没了。
浏览 1
提问于2018-12-13
得票数 1
回答已采纳
1
回答
神经标记器是如何工作的?
、
我一直在尝试构建一个NN标记器,其中输入将是字符和输出,令牌。我发现做类似事情的源代码要么是旧的,要么不是简单易学的。你能描述这种模型的输入和输出的形状和意义吗?如果输出是一个热的,那么它是不是太重了,因为令牌的总数大约是100到100万(可能的英语单词数)? 您是否推荐使用keras/tensorflow (希望2.0)训练令牌器的教程或示例?
浏览 0
提问于2020-10-15
得票数 -1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python实现jieba分词
Python R 分词处理
如何在 Python 中进行分词并展示词云
python结巴分词学习
“结巴”中文分词:做最好的 Python 中文分词组件
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
云直播
活动推荐
运营活动
广告
关闭
领券