腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
如何
使用
R
准确
地
使用
法语
中
的
停
用词
、
、
、
我正试着用古腾堡图书馆检索一本书,然后删除
法语
停
用词
。通过这样做,我已经能够用英语
准确
地
做到这一点: twistEN <- gutenberg_download(730)twistEN= c("word")) count(word, sort=TRUE) top.fr <- countsFR[1:20,] 我确实根据我在网上找到
的</e
浏览 32
提问于2019-09-21
得票数 4
2
回答
检查和调整给定
的
分析器?
、
、
、
我在用
法语
分析器。 在检查了这个分析器
的
输出后,我对一些停
用词
有点不满意(例如,表达式‘ayant-’出现为'caus',因为'ayant‘是一个停
用词
:)。我
如何
着手检查这些停
用词
,然后对它们进行调整?我必须在现有的
法语
分析器
的
基础上创建一个自定义分析器吗?或者我可以直接调整
法语
版本?注意:我正在
使用
Python 模块(“瘦客户端”),但在REST命令方面的答案将是很好
的</e
浏览 5
提问于2021-02-16
得票数 0
1
回答
tm_map:可以将删除词函数与我自己注册为txt文件
的
停止词一起
使用
吗?
、
、
我
使用
R
tm包对facebook
的
一个群组进行文本分析,发现removewords功能对我不起作用。我试着把
法语
停
用词
和我自己
的
停
用词
结合起来,但它们仍然在出现。因此,我
使用
自己
的
列表创建了一个名为"french.txt“
的
文件,如以下命令所示:my_stop_words<
浏览 25
提问于2019-10-29
得票数 1
回答已采纳
1
回答
Javascript:
使用
字典从字符串
中
过滤单词?
我需要从一个字符串
中
过滤出几百个“
停
”字。因为有很多“停止”
的
词,我不认为这样做是个好主意:我
如何
创建类似哈希图
的
东西来存储停用
的
单词?在这个映射中,键本身就是一个停
用词
,值并不重要。则过滤将导致检查该单词是否不存在于停
用词
映射中。
使用
什么数据结构来构建这样
的
地图?
浏览 0
提问于2012-02-23
得票数 0
1
回答
在Solr中
使用
不同语言
的
停
用词
、
Solr在托管模式
中
为不同
的
语言提供了一些开箱即用
的
数据类型,如英语、
法语
、日语等。我们
使用
公共数据类型"text_general“进行字段声明,并
使用
stopwards.txt进行停用字过滤。filter class="solr.LowerCaseFilterFactory"/> </fieldType> 在将数据同步到Solr核心时,我们在字段中导入不同语言<
浏览 20
提问于2021-02-11
得票数 1
0
回答
Azure Speech API语言
、
、
、
我已经
使用
Azure Speech API在网页上实现了聊天,可以
使用
语音转文本。它工作得很好,但我不知道在哪里可以设置API所理解
的
语言。我希望它能理解
法语
,但当我用
法语
说话时,它会用熟悉
的
发音转录成英语单词。
如何
/在何处设置语言?我
准确
地
说,我不是在Azure仪表板上设置服务的人。
浏览 7
提问于2018-07-12
得票数 0
回答已采纳
1
回答
有没有一种方法可以将维达复合分数划分为情绪级别/类别?
、
、
我一直在努力寻找一种尺度或分类指标,以赋予维德情绪分析某种程度
的
情感,而不仅仅是积极、消极或中立。如果有人能分享他们
的
观点或资源来帮助对VADER复合得分进行分类,我将不胜感激:-0.5 to -0.74 - Frustrated -0.25 to
浏览 0
提问于2019-07-09
得票数 1
3
回答
Stop Word Library For Sentiment Analysis工具
、
、
、
我正在构建一个
使用
谷歌预测API
的
情绪分析工具。我有一些标记
的
训练数据,我将
使用
它们来训练模型。由于这是从社交媒体收集
的
数据,句子
中
的
大多数单词都是停
用词
,所以我想在训练模型之前删除它,这是否有助于提高
准确
性?在java中有没有什么库可以用来删除这些停
用词
,而不是构建我自己
的
停
用词
集。
浏览 7
提问于2015-02-12
得票数 0
1
回答
Solr多语言搜索
、
、
我想知道我应该
如何
配置Solr来进行多语言搜索。我有一个网站有Solr搜索。这是为英语工作,我想为所有语言工作。 </fields> 当我看到日志文件Solr正在索引不同语言
的
URL时,我不知道
如何
显示搜索结果。我
的
网站正在
浏览 0
提问于2011-05-27
得票数 1
2
回答
Lucene分析仪
的
比较
、
有人能解释一下Lucene
中
不同分析器之间
的
区别吗?我得到了一个maxClauseCount异常,我知道我可以通过
使用
KeywordAnalyzer来避免这种情况,但我不想在不了解围绕分析器
的
问题
的
情况下更改StandardAnalyzer。
浏览 0
提问于2011-03-30
得票数 109
回答已采纳
18
回答
用c实现时延
、
、
、
、
我不知道
如何
准确
地
用词
来搜索这个..所以我没有找到任何幸运
的
东西..:S例如,我想做一些事情,然后等待,比如说1分钟,然后继续做事情。 这有意义吗?有人能帮我吗?
浏览 2
提问于2010-10-14
得票数 32
回答已采纳
2
回答
未登录词和已知词
的
词性
、
、
有没有什么工具可以预测单词
的
词性标注..
浏览 4
提问于2013-05-20
得票数 0
1
回答
不
使用词
表为tesseract 3.03生成eng.traineddata
、
我要做
的
是从图像中提取文本,我实际上是在windows上
使用
python包装器为tesseract 3.03,我已经下载了许多语言(英语,
法语
,...)
的
.traineddata文件。.the问题是我在某处读到tesseract在检测到分隔字符后尝试
使用
单词列表文件来检测单词。我
的
问题是
如何
在不
使用词
表
的
情况下生成.traineddata文件,因为我希望tesseract返回检测到
的
句子而不验证单词
浏览 2
提问于2017-05-04
得票数 0
2
回答
WIDCOMM和Android:怎么做?
、
、
免责声明:蓝牙新手面前
的
问题。我不是想用不
准确
或不恰当
的
用词
来威胁你。 我正在
使用
一个
使用
WIDCOMM堆栈进行通信
的
蓝牙设备。在Android
中
,我看到通信是
使用
完成
的
,所以我假设
使用
RFCOMM堆栈。
如何
允许
使用
RFCOMM堆栈
的
Android应用程序从
使用
WIDCOMM堆栈
的
设备接收数据?
浏览 3
提问于2011-08-08
得票数 0
回答已采纳
1
回答
Silverlight + RIA服务和自定义用户/密码存储
、
、
使用
Silverlight业务应用程序模板在VS2010
中
使用
Silverlight项目和ASP.NET项目创建一个很好
的
默认解决方案。它还自动提供一些很好
的
身份验证,似乎可以将新注册用户
的
用户名/密码/etc存储到本地Server数据库
中
。 是否可以自定义存储机制?我已经在其他地方有一个数据存储,并希望自己处理添加/删除等细节。
浏览 2
提问于2009-12-22
得票数 1
回答已采纳
2
回答
如何
获得本地化
的
NSError
、
、
我想
使用
NSError
的
系统本地化(在我
的
例子中用
法语
)plist
中
的
: CFBundleDevelopmentRegion = fr_FR当我调用属性"localizedDescription“时,我总是得
浏览 5
提问于2015-04-10
得票数 2
2
回答
从字符串
中
删除字符向量
中
的
特征词
我在
R
中有一个停
用词
的
字符向量: "able" , "above" ,"you've" , "zero")str <- c("I have zero a accor
浏览 1
提问于2016-03-04
得票数 16
回答已采纳
1
回答
如何
在
R
中
准确
地
使用
epi.kappa()函数?
、
我试图对我创建
的
两个索引执行kappa统计测试。我发现
R
中有多个包具有函数,并试图比较两个函数: epiR包
中
的
epiR()函数和来自心理包
的
cohen.kappa()函数。我能够在数据
中
成功
地
使用
cohen.kappa()函数,但是,在
使用
epi.kappa()函数时,我仍然会遇到错误。我
的
代码如下kap.dat = matrix(c(275,78,305,154),nrow=2,by
浏览 2
提问于2022-07-19
得票数 0
回答已采纳
1
回答
Bigram包含weka
中
的
Stopword?
、
我正在处理weka
中
的
一个分类问题,并
使用
smart 524停
用词
列表。我在weka中
使用
NGram标记器。它正确
地
从unigram
中
过滤停
用词
,但二元语法
中
包含停
用词
,例如"the east","the window“。我之前假设weka可能会首先过滤文本文档
中
的
所有停
用词
,然后将它们转换为单字和双字,但这并不是发生在那里
的
浏览 0
提问于2014-01-25
得票数 2
2
回答
计算虚词频率
、
、
、
、
我想在Python/NLTK中计算
的
频率。我看到了两种方法: 我更喜欢第一个,而不是第二个或任何其他
的
例子,这会使我得到更
准确</em
浏览 0
提问于2011-04-28
得票数 2
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
如何优雅地使用Python中的代码注释
如何在Python中优雅地使用进度条?
如何使用 Java 调取 Python、R 的训练模型?
如何使用Safari的TabOverview更好地浏览Mac?
如何使用Swing中的按钮控件?
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券