腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(4789)
视频
沙龙
1
回答
在
逻辑
条件下
包括
更多
停
用词
列表
,
以
过滤
单词
、
、
、
我需要在清洗数据中添加
更多
的条件,
包括
删除停
用词
,星期几和月份。对于星期几和月份,我创建了一个单独的
列表
(我不知道python中是否有一些已经内置的包来包含它们)。
浏览 20
提问于2020-10-11
得票数 0
回答已采纳
4
回答
使用Python但忽略停
用词
的文本中的词频
、
、
、
这给了我一个文本中
单词
的频率:这也给了我一些无用的词,比如"the“"an”"a“ 我的问题是,python中是否有一个停
用词
库可以删除所有这些常
用词
浏览 1
提问于2010-07-04
得票数 4
回答已采纳
6
回答
高级Python
列表
理解
、
给出两个
列表
:words = ['abc', 'bca', 'dac', 'dbc', 'cba']
在
以下
条件下
,如何使用
列表
理解来生成words的
过滤
列表
:假设每个
单词
的长度都是n,chars的长度也是n,那么
过滤
的
列表</em
浏览 3
提问于2010-03-26
得票数 10
回答已采纳
1
回答
在
搜索单个字母时,SQL 2012全文搜索有时会产生意外的结果
、
请考虑以下内容:它将与包含“毛绒布丁”的条目完全匹配。select * from cats where contains(catname, '"A B C"')现在考虑以下内容: select * from cats where contains(catname, '"A B C Fu
浏览 1
提问于2013-06-13
得票数 2
回答已采纳
1
回答
布尔搜索MySQL对某些
单词
无效
、
、
我有一个布尔搜索的问题,首先我认为这是我的数据库/表有问题,但然后我尝试创建以下样本表与1列和样本值和结果是相同的,它成功地运行了一些
单词
和其他失败,有什么想法吗?MODE)>0 ) 但是,当我尝试对
单词
浏览 3
提问于2012-10-15
得票数 2
回答已采纳
2
回答
如何在文本挖掘任务中处理文档中的拼写错误的
单词
?
、
、
问题是,文档中有相当数量的拼写错误的
单词
。大多数都是故意的,比如缩写和当地的行话,比如‘’juz‘->’'just','alr‘->’->‘。由于不同作者独特的写作风格,存在着一些这样的变体。
在
将它们提供给MALLET之后,我有点困扰,因为生成的其中一个主题实际上是一组拼写错误的停
用词
。我相信这些词主要是
在
同一作者的一小部分文档中使用的,因此MALLET采用了它。我的问题是,在对这些拼写错误的
单词
进行进一步的任务之前,我是否应该检查和更正这些拼写错误的<em
浏览 6
提问于2010-11-25
得票数 1
回答已采纳
1
回答
如何训练word2vec模式,使其更好地产生形容词的同义词?
、
、
、
、
所以我的问题是:
在
generate_batch()函数中有什么需要重新设计的吗?我曾经认为,4-7大小的跳过窗口会捕捉到语义含义(如果我不理解我学错了什么),并将形容词与其他类型的
单词
区分开来,但这不是我所得到的。
浏览 1
提问于2017-10-31
得票数 0
回答已采纳
2
回答
MySQL:添加非索引字表
如何将自己的非索引字表添加到MySQL 5?
浏览 0
提问于2010-03-11
得票数 0
回答已采纳
1
回答
Java Regex,筛选标志词和停
用词
列表
的文档
、
、
、
但通常情况下,十进制数
在
该字符串中经常出现(或至少出现一次)...我还有一个停
用词
列表
,我的想法是,删除所有停
用词
后面的
单词
或句子,
以
减少可能匹配的候选数量,直到“。来(这句话结束了)。|hausnummer|email|e-mail|veröffentlichu
浏览 1
提问于2019-05-22
得票数 1
1
回答
在
Python中
过滤
文本数据
然后,它使用re.split()方法拆分整个
单词
的字符串,返回一个字符串
列表
(
单词
)。
浏览 2
提问于2011-06-30
得票数 1
回答已采纳
3
回答
如何为文件编制索引以进行快速搜索?
、
、
现在,微软和谷歌将为你硬盘上的文件建立索引,这样你就可以快速搜索它们的内容。
浏览 3
提问于2009-05-09
得票数 7
回答已采纳
3
回答
自动检测文本中的标签
、
、
、
、
是否有任何库或算法可以自动检测文本中的标签(忽略所选语言的常用
单词
)?
浏览 0
提问于2012-03-16
得票数 0
回答已采纳
2
回答
使用linux命令行从文本语料库中删除停
用词
、
我有大约200MB的文本文件(rawtext.txt),并且
在
文本文件(stopwords.txt)中有一个停
用词
列表
。我想删除文本语料库中的停
用词
。但是怎么做呢?什么是最快最简单的方法?我更喜欢像sed或tr这样的命令行。不想使用python或NLTK。 有人能帮帮忙吗?我使用的是Mac OSX (不是linux)
浏览 2
提问于2015-10-10
得票数 1
1
回答
为什么SQL Server 2012要应用我们的自定义非索引字表中没有的停
用词
?
我们使用SQL Server2012 CONTAINSTABLE全文搜索查询,我们希望找到某些
单词
:'noord','oost','zuid','west‘。例如,找不到'noord‘,因为这是荷兰语系统非索引字表中的一个
单词
。这是可以理解的。因此,我们从系统非索引字
列表
创建了一个自定义非索引字
列表
,并删除了令人不快的停
用词
:
在
本例中为'noord‘、'west’和'zuid‘。
浏览 3
提问于2015-12-06
得票数 1
2
回答
在
布尔模式下选择匹配对象不能正常工作
、
、
我
在
'name_song‘中有一个全文索引。
浏览 5
提问于2019-09-27
得票数 0
3
回答
过滤
文本文件中的外来停
用词
、
我有一个英文和几种外语的电影名称
列表
,编译成一个文本文件,每个名称打印
在
一个新的行中:Kein Platz f¸r GeroldLa Prison De Saint-ClothaireLa P·jara我已经编辑了一个简短的非英语停
用词
列表
,我想从文本文件中
过滤
掉。我可以做些什么来读取我的文本,
过滤
单词</em
浏览 0
提问于2014-08-27
得票数 0
6
回答
Solr查询结果使用*
因此*似乎是1或
更多
,而不是0或
更多
……我如何才能做到这一点?我
在
Solr中的部分匹配是不是都错了?谢谢。
浏览 2
提问于2010-04-08
得票数 3
回答已采纳
6
回答
我在哪里可以找到希伯来语停
用词
的
列表
?
、
我在哪里可以找到希伯来语停
用词
的
列表
?
浏览 0
提问于2009-09-02
得票数 9
回答已采纳
2
回答
使用OpenNLP从解析的内容中删除停
用词
、
、
、
VP (VBZ is) (NP (DT a) (ADJP (RB very) (JJ huge) (CC and) (JJ useful)) (NN website))))) 从这里我只想提取有意义的
单词
,这意味着我想删除所有停用的
单词
,因为我想基于这些有意义的
单词
进一步进行分类。你能建议我如何从解析的输出中删除停
用词
吗?因为我的主要目标是解析文档并仅获取有意义的
单词
。
浏览 2
提问于2013-07-19
得票数 5
2
回答
如何禁止来自Solr的搜索字符串中特定关键字的结果
、
我需要一种方法来阻止搜索字符串的结果,如果关键字集中的一个关键字将匹配。
浏览 0
提问于2014-05-30
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券