腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(1365)
视频
沙龙
1
回答
快速
文本
监督
学习
模型
的
背后
发
生了
什么
?
、
、
、
我们可以使用以下命令在
快速
文本
中训练
监督
模型
import fasttext model = fasttext.train_supervised(input="cooking.train") 我
的
问题是,它如何表示特征(词包或tf/idf或词嵌入),以及它使用
什么
算法进行
文本
分类?
浏览 26
提问于2020-08-14
得票数 0
回答已采纳
1
回答
如何在无
监督
学习
模型
的
快速
文本
中获得最近
的
邻居(cbow,skipgram)?
、
、
、
快速
文本
官方网站(fasttext.cc)上
的
例子(与单词表示相关)表明,可以计算使用cbow (或skip-gram
模型
)(简而言之,无
监督
学习
模型
)导出
的
向量上
的
最近邻居。据称,这可以使用
模型
(model.get_nearest_neighbors)上
的
get_nearest_neighbors函数来完成。然而,当我尝试使用Python (3.7.)它向我显示了一条消息,即该函数不存在于无专家<
浏览 31
提问于2019-09-12
得票数 4
1
回答
Fasttext -颜色名称分类-获取“</s>”作为model.words
、
我目前正在工作
的
翻译层,以翻译许多独特
的
颜色名称为一个共同
的
颜色名称。例如,金属红色将是红色,海军蓝色将是蓝色。我有一个颜色列表,从一个来源,我试图翻译和一组基本
的
颜色名称,我希望他们被识别为。当前,当构建一个
模型
时,不管是
监督
的
还是非
监督
的
,我都会得到model.words作为'‘,不管我是否给这些线条贴上标签。我试着删除单词中
的
所有特殊字符等。我正在使用
快速
文本
库 我
浏览 2
提问于2019-10-26
得票数 0
回答已采纳
1
回答
生成字典,使用NLTK将tweet分类为预定义
的
类别。
、
、
、
、
我有一个推特用户(screen_names)
的
名单,我需要将他们归类为7个预定义
的
类别-教育,艺术,体育,商业,政治,汽车,技术,基于他们
的
兴趣领域。我在Python中提取了用户
的
最后100个tweet,并在清除了tweet之后为每个用户创建了一个语料库。我试图在每个类别下生成普通单词
的
字典,以便我可以使用它进行分类。最高
的
价值将给我们最有可能
的
类别的推特。 但由于分类是基于这些预先生成
的
字典,我正在寻找一种方法,以自动生成他们
浏览 5
提问于2020-02-23
得票数 8
1
回答
CNN节目的后期融合
、
、
、
、
我正致力于CNN早期和晚期
的
融合。我从CNN
的
多个层面拍摄了一些特写。对于早期
的
融合,我已经捕获了三个不同层
的
特性,然后水平地将它们连接在一起,F= [F1' F2' F3'];用于后期融合,我正在阅读这个。他们曾两次提到要进行
监督
学习
。但不明白怎么走。例如,这是从上面提到
的
文件中获取
的
图像。第一幅图像有三个不同
的
特征,对于第一次
监督
学习
,标签可以说是1/4类
浏览 1
提问于2018-03-22
得票数 3
回答已采纳
1
回答
如何在python脚本中更改
快速
文本
api
的
参数
、
、
、
我们要在命令提示符中运行 .我可以训练和获取所需
的
输出。对于python脚本中
的
编程,我安装了
快速
文本
库,并尝试如下
模型
经过训练fasttext.supervised(input =
浏览 2
提问于2018-04-12
得票数 0
回答已采纳
2
回答
下一个词预测引擎-人工智能
的
哪个分支?
、
、
、
、
下一代预测或短语预测引擎使用在移动和平板电脑
的
现代键盘,如
快速
键和XT9,它预测下一个词
的
用户将根据一些预定义或动态语料库,基于n-克(最后键入2-3个单词
的
最大频率加上当前单词)
的
语言
模型
(马尔可夫
模型
我认为这些引擎/algos是AI/NLP
的
一部分。但我不确定他们属于AI/NLP
的
哪个分支。是机器
学习
吗?是数据科学吗?是大数据吗?是电脑情报吗?这是决策吗?是数据挖掘吗?还是统计模式识
浏览 2
提问于2013-11-26
得票数 0
回答已采纳
2
回答
在windows中测试时,带有fasttext api
的
监督
分类返回空数组
、
、
、
我正在尝试使用
快速
文本
API构建一个有
监督
的
分类器。我
的
数据是'output.txt‘,有15000行,2列(性别和姓名)和2个类m/f。thread=8) print(labels)[[],[],[],[]] 我不明白我
的
错误在哪里我遵循了中
的
代码行。当相同
的
代码能够在Linux中运行时,在wi
浏览 3
提问于2018-03-30
得票数 3
1
回答
NLP中随机词丢失
的
意义
、
、
我一直在读早期
的
关于NLP (https://arxiv.org/abs/1511.01432)预培训
的
论文,我不明白随意
的
单词丢失意味着
什么
。作者完全忽略了对这种方法
的
解释,就好像它是一个标准
的
东西一样。有人能解释一下他们到底做了
什么
,目的是
什么
吗?
浏览 0
提问于2020-02-24
得票数 1
1
回答
如何使
快速
文本
的
get_sentence_vector矢量更大?
、
、
、
我用非
监督
的
方式训练了
快速
文本
模型
,现在我使用get_sentence_vector()函数来获取句子
的
向量。但是它输出长度为100
的
矢量。我如何使这些向量(300个值)更长?有
什么
超参数吗?
浏览 3
提问于2022-05-17
得票数 1
回答已采纳
1
回答
topic中word
的
“增强”(主题建模)
、
、
假设我们有包含聊天消息
的
数据集,我们希望对其进行主题建模(例如,很少有主题)。让我们假设,主题A可能(而且应该)用几个词来表示,但我知道(让我们从某个外部来源说),所有包含单词word_to_boost
的
消息都应该被预测为A-归属。所有的预处理和文字袋都完成了。有没有可能以某种方式“提振”word_to_boost这个词,向
模型
建议将该词中
的
所有信息都放入A主题中?如果是,是否建议这样做?我以为这可能是围绕着TF-以色列国防军做
的
,但也许有一种不同
的
方法? 提前感谢!
浏览 1
提问于2020-12-16
得票数 0
1
回答
无/少标签
文本
数据
的
主题分类
、
、
、
、
我想将
文本
输入分类为预定义
的
类别。据我所知,如果我
的
目标标签在预先培训过
的
模型
中非常罕见,那么无
监督
的
方法是不可行
的
(我有关于特定工业过程
的
标签)。这是真的吗?否则,我可以尝试一种方法,例如,使用所有不同
的
标签标记1000个输入
文本
,并使用有
监督
的
方法,很少有标记
的
数据。这对
学习
过程有帮助吗?在这种情况下我能用
什么</e
浏览 0
提问于2023-02-09
得票数 1
回答已采纳
1
回答
快速
文本
无
监督
模型
丢失
、
我想为1GB大小
的
文本
数据创建一个无
监督
的
fastText
模型
。我正在使用fastText命令行工具来实现
模型
培训过程。以上是我用来创建单词表示
的
几个参数,我看到了这个avg.loss,
学习
速率已经从默认
的
(0.5)降到了0.001。我真的不明白,这
浏览 1
提问于2021-07-21
得票数 1
回答已采纳
2
回答
聚类与分类
、
、
我对此有点陌生,但我只是简单地问了一个关于聚类和分类
的
问题。我有一堆要分类
的
文字。目前我有4门课,但课文可以属于多个班级。到目前为止,我看到
的
是进行4种二进制分类,但我想知道是否有一种分类算法,可以实现属于多个类
的
文本
。或者,我可以通过具有重叠簇
的
集群来实现这一点吗? 我试着用Python来做这件事。
浏览 0
提问于2020-07-16
得票数 0
1
回答
机器
学习
实体评分(非识别)
、
、
、
、
我正试图理解谷歌
背后
的
机器
学习
部分。本文对它们
的
generate candidate entities
模型
作了如下说明。首先将给定
的
输入
文本
拆分为单词(基于空格分隔),然后生成所有可能
的
最大长度单词子序列(在本例中为15个单词),并根据每个候选
文本
是否代表有效实体,为每个候选对象分配一个值(介于0到1之间): 如果我
的
理解正确,
模型
会尝试句子中
的
每一个单词,以及这个单词<e
浏览 2
提问于2020-02-26
得票数 5
回答已采纳
4
回答
什么
是弱
监督
学习
(引导)?
、
我理解
监督
学习
和非
监督
学习
的
区别:无
监督
学习
允许分类器“自主
学习
”,例如使用聚类。 但是
什么
是“弱
监督
学习
”呢?它如何分类它
的
例子?
浏览 1
提问于2013-09-22
得票数 29
回答已采纳
1
回答
向现有Doc2vec
模型
添加新词汇表
、
、
我已经有了一个Doc2Vec
模型
。我用我
的
训练数据对其进行了训练。这是我
的
模型
: model = model.load('my_model.Doc2vec')
浏览 2
提问于2018-02-16
得票数 0
1
回答
如何在考虑上下文
的
文本
中找到关键字?
、
通过连接维基百科,我搜索所有的关键字,寻找每一条记录,并试图找出这些关键词是否在记录传记
的
第一段中传递。 下面你看到
的
输出,我得到,这是不完全正确
的
。('http://en.wikipedia.org
浏览 3
提问于2020-10-17
得票数 1
1
回答
字数最大长度与上下文窗口大小
的
差异
、
、
在用于训练受
监督
模型
的
python
的
快速
文本
库
的
描述中,有不同
的
论点,其中除其他外,说明如下: wordNgrams:字数
的
最大长度。如果我理解得对,他们两人都有责任考虑到单词周围
的
词汇,但两者之间有
什么
明显
的
区别呢?
浏览 2
提问于2019-08-15
得票数 2
回答已采纳
2
回答
用于情感分析
的
亚马逊机器
学习
、
、
、
、
亚马逊机器
学习
平台在情感分析和
文本
分析方面有多大
的
灵活性或支持性?
浏览 7
提问于2015-06-10
得票数 4
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
文本嵌入模型包含偏差?Google详解为什么这是机器学习的重要问题
机器学习自动文本分类
中劢AI:多模态智能 开启未来无限可能
当前,怎样理解 ChatGPT 技术先进性?
T5,一个探索迁移学习边界的模型
热门
标签
更多标签
云服务器
ICP备案
对象存储
云直播
实时音视频
活动推荐
运营活动
广告
关闭
领券