腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
CMUSphinx --使用CMUSphinx实现无语法(克)文件的语音文本
java
、
speech-to-text
、
cmusphinx
我对狮身人面像很陌生。我想使用Sphinx进行语音到文本的转换。我试着用谷歌搜索。狮身人面像使用克文件来匹配单词。但这样就限制了词的可能性。我想和你一起工作,或者把每个单词都转换成文字。怎么做?如果你能发个例子,那就太好了。谢谢!
浏览 4
提问于2014-06-16
得票数 0
回答已采纳
1
回答
潜在dirichlet分配如何处理不在词汇表中的单词
c++
、
text-mining
对于潜在的dirichlet分配,由于它假设了一个固定的词汇袋(我是通过tf-idf方法获得的),我们如何处理不在词袋中的单词,即那些停用的单词?谢谢!
浏览 2
提问于2014-11-23
得票数 0
1
回答
使用** layers[0].get_weights()[0]**的嵌入
keras
、
embedding
我用一个例子来研究嵌入网络,其中一个单词大小= 200,训练样本包含大约20个不同的单词。单词的大小是200,这意味着单词的数量是200。但实际上,我只使用了20个单词(培训样本中的单词):让我们对word19说句话吧。因此,在嵌入后,向量对应于word等。但是vector20..。矢量30…他们匹配什么?我没有word20或word30。
浏览 5
提问于2019-10-17
得票数 0
回答已采纳
4
回答
Android的离线
英语
-德语词典
gratis
、
android
、
offline
、
translation
、
dictionary
必须:免费提供很高兴有:两种语言(带/带/带&带/) 容易添加其他词典&希望能在它们之间进行翻译&
英语
和/或德语(请注意,如果我们加上法语和西班牙语,我们希望在这些词典和
英语
/德语之间进行翻译,但如果你明白我的意思,法语/西班牙语就不需要翻译了)
浏览 0
提问于2016-06-27
得票数 0
回答已采纳
2
回答
词汇量
与复杂性的关系
nlp
、
corpus
、
linguistics
除了语言的复杂性,还有什么能影响语料库的
词汇量
呢?
浏览 4
提问于2022-02-16
得票数 1
回答已采纳
3
回答
使用python或javascript从文本中提取困难的
英语
单词,以建立词汇表
javascript
、
python
、
text
我想从网上的
英语
文本中获取困难的单词,比如来自古腾堡的,用于使用python或javascript建立
词汇量
。我不习惯得到简单的单词,而是独特的词汇,如帝王般的,杜撰的..etc。
浏览 2
提问于2019-02-15
得票数 1
2
回答
如何找到spaCy模型的词汇表大小?
nlp
、
documentation
、
spacy
、
vocabulary
我试图找出大型
英语
模型的
词汇量
,即en_core_web_lg,并找到三个不同的信息来源: nlp.vocab.
浏览 7
提问于2019-12-28
得票数 4
回答已采纳
1
回答
机器翻译变压器输出-“未知”令牌?
python
、
transformer-model
、
machine-translation
、
opennmt
在对基本变压器模型(Vaswani et )进行训练后,在解码/翻译
测试
数据集时。我有时会在输出中看到这个标记“灌篮”。 这里的“灌篮”指的是一个未知的符号,但我的问题是,这背后的理由是什么?基于,这是否意味着我为训练集构建的词汇表不包含
测试
集中的单词?作为参考,我使用Spacy en_core_web_sm和de_core_news_sm构建了一个德语到
英语
翻译任务的en_core_web_sm。
浏览 10
提问于2021-10-16
得票数 0
回答已采纳
1
回答
BoW
词汇量
指南
text-mining
由于我对所有这些都很陌生,我想知道是否存在关于这样一个
词汇量
平均应该有多大的指导方针,甚至可能取决于起始字段。
浏览 0
提问于2019-01-18
得票数 1
回答已采纳
1
回答
听写使用哪种语言模型?
speech-recognition
、
cmusphinx
、
sphinx4
我的申请将有一个非常大的
词汇量
,即它可以使用所有的
英语
单词,我不知道将是哪些短语将被说。那么,我应该使用哪种模型语言呢?对于这些情况,Sphinx4有什么特定的语言模型吗?
浏览 0
提问于2014-02-18
得票数 0
回答已采纳
1
回答
什么时候NCE是比softmax更好的选择(训练RNN LM)?
python
、
tensorflow
、
recurrent-neural-network
因此,我使用4损失函数在4配置上运行了一个基准
测试
(我特别想
测试
softmax vs NCE)。结果显示为。我不知道该怎么想: NCE在非常大的地方更强吗?
浏览 1
提问于2016-11-24
得票数 0
1
回答
词汇表构建浏览器扩展
web-browser
、
educational
、
language
、
translation
如果以后有可能用增加的单词进行
测试
,那就更好了。
浏览 0
提问于2017-04-20
得票数 2
1
回答
训练声学模型需要多长时间?
cmusphinx
我想在中国为14岁以下的儿童建立一个
英语
声学模型,使用cmusphinx,
词汇量
约800个单词。
浏览 3
提问于2013-10-30
得票数 0
回答已采纳
1
回答
我可以用标记化输入文件和高棉语的自定义词汇表文件从头开始对BERT模型进行预培训吗?
python
、
nlp
、
tokenize
、
bert-language-model
造成这一问题的主要原因是高棉语的切分/标记化与
英语
不同。脚本修改 我的输入文件不是普通的纯文本,而是来自我的自定义高棉标记化输出,然后我将它变成一个列表格式,模仿我在运行示例
英语
文本时得到的输出。
浏览 2
提问于2019-11-27
得票数 2
1
回答
搜索标准的自然语言.日期范围
c#
、
search
、
natural-language-processing
考虑一个应用程序,它存储一组记录,其中包含:成本我希望能够允许用户使用自然语言搜索数据集。蓝色从上个月开始还不到20美元_db.Widgets.Where(w => w.Description.Contains('blue') && w.PurchaseDate >= DateTime.Now.AddMonths(-1) && w.Cost < 20) 我很难找到一个起点。任何资源,以使我朝着正确的方向,将不胜感激(我在.NET工作
浏览 0
提问于2014-04-22
得票数 0
1
回答
Keras CNN预测误差
keras
我有一个简单的Convolution1D模型,我已经成功地训练过它model.add(Embedding(input_dim=vocabsize, output_dim=32, model.add(Dropout(0.2)) model.add(Dropout(0.2))
浏览 2
提问于2017-05-25
得票数 0
2
回答
android中可以脱机工作的语音识别
java
、
android
我正在开发一个android应用程序。我需要在我的应用程序中使用语音识别。是否有可以脱机工作的语音识别库?或是否有可能使识别器脱机工作?
浏览 4
提问于2013-10-08
得票数 1
回答已采纳
2
回答
寻找“现代”词汇语料库
python
、
nltk
、
corpus
在我的程序的第一阶段,作为清理数据的一部分,我删除了所有的非
英语
单词。为此,我使用nltk.corpus.words.words()语料库。这个语料库的问题是,它删除了“现代”
英语
单词,如Facebook、Instagram等。有没有人知道另一个,更现代的语料库,我可以用现在的语料库来替换或合并?
浏览 2
提问于2017-06-14
得票数 0
1
回答
如何查询嵌套字段并返回路径?
json
、
sql-server
、
sql-server-2016
、
sql-server-json
很抱歉,我的
英语
很差,
词汇量
也很低。如何用"Properties.Searchable" = "true"过滤掉所有字段?这些字段可以是另一个字段的子字段。
浏览 23
提问于2020-06-22
得票数 0
回答已采纳
1
回答
文本分类中SVM分类器
测试
中的错误
python
、
svm
、
scikit-learn
我已经阅读了学习文档,编写了训练SVM分类器的代码,并对其进行了
测试
。然而,在最后一步,我得到了一个错误,我无法理解。
浏览 5
提问于2014-01-16
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
英语自测神器,用python爬虫打造专属英文词汇量测试脚本!
在线翻译英语,有那些软件可以在线翻译
非常适合新手的一个Python爬虫项目:打造一个英文词汇量测试脚本
在线青少儿英语教育市场研究报告
英语在线转换语音,3种方法教你轻松转换
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券