腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
用
python
中
的
搭配
字典
替换
文本文件
中
的
所有
搭配
、
、
、
、
我尝试使用
python
将
文本文件
corpus.txt
中
的
子字符串
替换
为其他一些子字符串。
python
代码(由于corpus和sub
的
大小而使用多处理) import sysimport time from multiprocessing import Pool和sub变量(在上面的代码片段
中
),以显示代码是如何工作
的
。在实际设置
中
,corpus.txt和sub.txt都包含数百万行(分别
浏览 20
提问于2020-06-27
得票数 2
回答已采纳
1
回答
RegEx:如何找到一个
搭配
的
所有
实例?
、
我正在尝试用
python
编写一个脚本来查找文本
中
的
单词
搭配
。词
的
搭配
是在不同
的
文本中经常出现
的
一对词。例如,在
搭配
"lemon zest“
中
,lemon和zest这两个词经常同时出现,因此它是一个
搭配
。现在,我想使用re.findall查找给定
搭配
的
所有
匹配项。与"lemon zest“不同
的
是,有些
浏览 0
提问于2014-03-17
得票数 0
1
回答
从Lucene索引中提取
搭配
词
、
、
我有一个存储在Lucene
中
的
文档索引。我需要从索引中提取
所有
搭配
词及其频率。我知道有各种算法可以检测给定文档
中
的
搭配
,但我不知道有什么现成
的
库可以专门
用
Lucene来完成这项任务。我知道如何从lucene索引
中
仅提取二元语法,但并不是
所有
的二元语法都是
搭配
词。
浏览 1
提问于2014-02-06
得票数 0
3
回答
在Java
中
查找单词
搭配
、
我正在尝试在Java
中
查找。我查看了OpenNLP和GATE,但它们似乎没有
搭配
查找器。 有谁知道
用
Java实现
的
免费开源
搭配
查找器?
浏览 1
提问于2011-10-16
得票数 4
回答已采纳
1
回答
R
中
的
文本挖掘
搭配
包
、
嗨,R中有一个包可以帮助查找与
python
pakage.Like
中
的
搭配
相似的词
的
同现,给出一个语料库列表中
所有
的同现词对。
浏览 4
提问于2015-04-26
得票数 0
1
回答
学习:不要使用一些单词作为一个词
的
特征,而是在
搭配
中使用。
、
、
我正在使用
Python
和scikit进行文本分类--学习。 现在,我使用TfidfVectorizer作为向量器(用于将原始文本转换为特征向量),使用MultinomialNB作为分类器。经过分类和测试,我
的
算法在测试集和简历集,我想提高准确性。我看到了信息最丰富
的
特性(由于问题)。我看到,在集信息最多
的
特性
中
,我有单词( ngram=1),它对分类没有影响,但是在bigram (单词
搭配
)
中
,它们会产生很大
的
影响。所以,我不能使用stop_words
浏览 3
提问于2014-07-22
得票数 1
回答已采纳
1
回答
如何在MxNet中计算n-克?
、
我想在MxNet中用N表示一组字符串.当然,我也会做一些类似的事情,但即使是一个简单
的
N克,只要有计数和功能限制,也是可以
的
。有内置
的
功能吗?什么是最好
的
方法?目前,我正在用
Python
计算它, tf = {} for
浏览 3
提问于2017-10-02
得票数 0
回答已采纳
1
回答
Nltk模块找不到正确
的
英语单词
python
、
、
我下载了用于
python
的
"NLTK“库
的
”word“和"wordnet”:from nltk.corpus import wordsnltk.download('words')检查列表
中
的
单词是否为英语。这是我
的
剧本: samplewords=['accident scene&
浏览 1
提问于2019-09-08
得票数 0
回答已采纳
2
回答
如何用jijna2获取for循环的当前索引?
、
假设我有这样
的
代码: <p>We are in item: {{ x }}</>我希望获得for循环的当前索引,以运行if循环,类似于</p> <p>We are in item: {{ x }}</>{% endfor %} 如何在jijna2
中
实现?(我
用
Python
与烧瓶
搭配
)。
浏览 2
提问于2015-06-27
得票数 5
回答已采纳
1
回答
用
Python
中
的
NLTK从bigram
的
listo
中
应用
搭配
、
、
我必须在几个句子中找到并“应用”
搭配
。句子存储在一个字符串列表
中
。让我们现在只关注一个句子。下面是一个例子:我最后想要
的
是:我正在使用
Python
来查找
搭配
,并且我能够创建一个集合,其中包含了我
所有
句子
的
<e
浏览 2
提问于2017-04-23
得票数 0
回答已采纳
1
回答
现在移除
的
模块'nltk.model.NGramModel‘有替代模块吗?
、
、
我已经连续两天试图寻找替代方案,但找不到任何相关
的
东西。我基本上是在尝试获得合成句子
的
概率分数(通过
替换
从语料库
中
挑选
的
原始句子
中
的
一些单词来合成)。 我尝试了
搭配
,但我得到
的
分数并不是很有帮助。所以我试着使用语言模型
的
概念,结果发现看似有用
的
模块' model‘已经因为一些bug从NLTK
中
删除了。如果有人能让我知道
用
python
实现
浏览 1
提问于2014-10-19
得票数 12
2
回答
为什么在使用
Python
的
wordcloud库时,停止单词不被排除在单词云之外?
、
、
、
我不想在我
的
文字云中显示'The‘、’它们‘和' my’。我正在使用
python
库' wordcloud‘如下所示,并使用这三个额外
的
停止词更新stopwords列表,但wordcloud仍然包括它们。我需要修改什么才能把这三个词排除在外?我尝试在以下位置向STOPWORDS集添加元素,但是,即使成功地添加了单词,wordcloud仍然显示了我添加到STOPWORDS集合
中
的
三个单词:STOPWO
浏览 13
提问于2020-05-22
得票数 3
回答已采纳
1
回答
如何使用
Python
识别单个字符之间
的
搭配
?
、
、
、
、
我想用NLTK来识别日语汉字和汉语汉字之间
的
搭配
。与词语
搭配
一样,一些汉字序列比其他序列更容易出现。例:汉语和日语
中
的
许多单词都是两个字符
的
双字形-A和B(例如:A和B)。(3) A字和B字一起出现在句子
中
的
可能性有多大,即使它们不并排出现? 相关地:如果我有一个汉字/汉字
的
频率列表,我可以强迫NLTK
搭配
模块只检查我列表
中
的
汉字/汉字之间
的
关
浏览 2
提问于2017-04-23
得票数 7
2
回答
计算列表
中
的
共现次数
、
我有一个由一组字符串列表组成
的
数组(可以假设每个字符串都是一个单词)。 在
Python
中
,我想要一种有效
的
方法来计算这个数组
中
的
单词对。它不是
搭配
或双字母组合,因为该对
中
的
每个单词都可以在列表
中
的
任何位置。
浏览 0
提问于2013-05-13
得票数 0
3
回答
带有频率
的
Ngram
的
Python
列表
、
、
我需要从文本
中
获取最流行
的
ngram。Ngram长度必须介于1到5个单词之间。但WordNGramAnalyzer现在已被弃
用
。我
的
问题是:我如何从我
的
文本
中
获得N个最佳
的
单词
搭配
,
搭配
长度从1到5。我还需要获得这个
搭配
/ngram
的
浏览 85
提问于2012-08-02
得票数 16
回答已采纳
1
回答
text2vec单词嵌入:复合一些标记,但不是全部
、
、
、
我正在使用{text2vec}单词嵌入来构建与某个语义类别相关
的
相似术语
的
字典
。 是否可以在语料库
中
合成一些标记,但不是全部?例如,我想计算类似于“未来一代”或“正在崛起
的
一代”
的
术语,但这些
搭配
在原始语料库
中
当然是作为单独
的
术语出现
的
。我想知道,如果gsub是“正在崛起
的
一代”--> "rising_generation",而没有将
所有
其他频繁出现<em
浏览 13
提问于2020-10-04
得票数 1
回答已采纳
1
回答
如何在nltk-collocation-finder
的
单词列表中转换pandas数据帧?
、
、
、
作为一名语言学家和
python
初学者,我希望在我自己
的
(德语)tweet语料库中找到单词
搭配
。如何将pandas dataframe (只有一列= tweet)
中
的
tweet转换为单词列表,以便能够使用nltk-collocation-finder?我
的
版本(如下)创建了一个字母列表,而不是单词列表,只给出了字母
搭配
。任何建议都是很棒
的
!这就是我到目前为止所知道
的
:data = pd.read
浏览 2
提问于2021-04-04
得票数 2
1
回答
Apache使用亲和键读取
所有
键值
、
我是Apache
的
新手,我计划在我
的
一个应用程序中使用Ignite。但是,我被困在一个
用
例(可能是非常基本
的
)。
用
例:我有两个实体雇员和组织。使用
搭配
,我可以在一个节点上存储属于一个Oganisation
的
员工。但我如何解读
所有
员工都属于一个组织,使用组织密钥?我不想将查询发送到集群
中
的
所有
节点进行读取。
浏览 2
提问于2020-02-27
得票数 1
回答已采纳
3
回答
允许特定字符串
的
字符之间留出空间
的
Regex
、
、
我想要创建一个正则表达式,以允许特定字符串
的
字符之间有空格。奥巴马将与“奥巴马”、“奥巴马”等
搭配
。谢谢。
浏览 11
提问于2015-07-03
得票数 1
回答已采纳
1
回答
如何从大量
的
文章(维基百科)
中
训练短语模型?
、
、
、
我想为法语创建一个很大
的
gensim
字典
,尝试在主题检测、文本之间
的
相似性和其他类似的事情上获得更好
的
结果。因此,我计划使用维基百科转储,并按以下方式处理: 在文章上训练短语模型以检测
搭配
。在每一篇文章
中
停止产生
的
标记。向
字典
提供新
的<
浏览 0
提问于2019-01-23
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python中的字典
Python 中的字典—Python 基础
Python中的字典介绍
继续说说Python中的字典
python3中的字典1
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券