腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(195)
视频
沙龙
1
回答
NLP
CNN
嵌入
,
从
Twitter
文本
预测
5个
值
、
、
、
、
我有一堆
twitter
文本
(大约70K),大约有10K个单词。有些更少,有些更多。我已经创建了一个Keras架构来
预测
每个
Twitter
文本
的5个
值
,我已经在这70K上进行了训练。然而,准确率(其定义如下:当所有相应的5个
值
都相差不超过10时发生pred1和pred2的匹配)是21% (21%的测试数据符合上述条件)。return predictions 在本例中,X只是一个字符串数组(
文本
)。它们可能有1000个单词,但大多数都在10K左右。y是我提
浏览 31
提问于2021-07-26
得票数 0
1
回答
多层密层叠加LSTM
、
、
Andrew通过相互叠加递归层来讨论深度RNN体系结构。然而,他指出,由于结构中已经复杂的时间依赖计算,这些通常限制在2或3个递归层。但他补充说,人们通常会在这些递归层(如从a3<1>延伸出来的蓝色框)后面添加“一堆没有水平连接的深层层”。我想知道他是简单地说要把稠密的层堆在层叠的层层之上,还是更复杂呢?在Keras中是这样的:model.add(keras.layers.LSTM(100, return_sequences=True, batch_input_shape=(32, 1, input_shape), statef
浏览 0
提问于2019-07-30
得票数 1
4
回答
文本
处理的支持向量机还是人工神经网络?
、
、
对于一些
文本
处理项目,我们需要在支持向量机和快速人工神经网络之间做出选择。哪种方法是正确的?
浏览 1
提问于2010-03-13
得票数 14
回答已采纳
1
回答
数据集上的
NLP
分类
、
我正在努力学习
NLP
。我理解
从
文本
预处理到td-以色列国防军和字
嵌入
的基本概念.我如何应用这一学习?我有两个列的数据集:答案和性别。我想用
NLP
将答案列转换成向量,然后使用监督机器学习来训练一个模型,
预测
某一类型的答案是由男性还是女性给出的。我不知道如何处理后,我Pre_processed
文本
。
浏览 3
提问于2022-02-04
得票数 0
1
回答
spaCy的(v3.0) `
nlp
.make_doc(
文本
)`和``
nlp
(
文本
)`之间的区别?为什么要在训练时使用`
nlp
.make_doc(
文本
)`?
、
、
我知道我们应该创建Example对象并将其传递给
nlp
.update()方法。()方法的source code,似乎我们只是对输入
文本
进行标记,然后对标记进行注释。但是Example对象应该有引用/“黄金标准”和
预测
值
。当我们调用
nlp
.make_doc()时,文档中的信息是如何结束的 此外,当尝试
从
Example对象获取
预测
的实体标记(使用经过训练的
nlp
管道)时,我没有得到任何实体(尽管如果我使用
nlp
(text)如果我
浏览 38
提问于2021-02-08
得票数 1
回答已采纳
1
回答
NLP
文本
自动编码器,在诗意表中生成
文本
、
、
我想要创建一个
NLP
自动编码器,它碰巧只生成符合诗意韵律的
文本
,例如,'iambic五音步‘。也就是说,输出应该是10个音节长的一系列从句,并以“duh-DUH DUH”的动词重音大声朗读。我能想到的唯一方法就是收集这种格式的
文本
行,然后在这些文件上训练一个自动编码器。由于网络在训练时只发出五步音符,所以在
预测
时也要发出五步音。如果有一个足够大的语料库,这看起来应该是可行的。为了将其他
文本
重写为IP,培训需要包括IP中
文本
的变化和训练(而不是IP语句)以发出(IP语句)。产生这
浏览 0
提问于2019-02-03
得票数 2
1
回答
如何处理像luv,kool和brb这样的推文中的俚语和简短形式?
、
现在,我只能想到有一个巨大的Hashmap,其中的关键字是单词,而实际的单词或扩展是
值
。还有其他更好的方法来使用
NLP
来解决这个问题吗? 注意:我知道问题似乎太模糊了。但请不要报告。PS :是否有一个格式良好的
文本
列表,我可以下载和使用?放下来的链接是好的,但是当我复制和粘贴它时,它们不是一个容易解析的格式。
浏览 1
提问于2015-02-27
得票数 4
回答已采纳
1
回答
在文档分类培训期间,单词
嵌入
是否进一步更新?
、
、
、
对于在
NLP
任务中使用word
嵌入
这一领域,我还是比较陌生的。
从
大量的文档集中,我训练了word2vec词
嵌入
向量,然后结合基于RNN的分类器(LSTM,GRU)进行文档分类,这是目前比较成熟的一种标准分类方法。有一个问题:我们应该在文档分类培训期间更新单词
嵌入
。 在过去,我已经习惯了像图像分类/目标检测这样的任务。你得到一个图像输入,
从
该图像中提取的卷积特征在
CNN
的数值优化过程中被更新。如何处理
文本
文档世界中的
嵌入
向量?
浏览 0
提问于2018-09-10
得票数 5
1
回答
基本编解码结构
、
、
、
基本的
CNN
或RNN和编码器解码器有什么区别?编码器和解码器是否需要满足某些特性?据我所知,编码器对另一个维度中的输入进行编码,并创建上下文向量。随后,该上下文向量被解码器解码。我是否应该在编码器中使用像word2vect这样的预定义词
嵌入
(如果我有
文本
作为输入)?
浏览 0
提问于2018-03-09
得票数 3
1
回答
NLP
回归的标记数据集
、
、
我正在寻找一个数据集,在那里我可以使用
NLP
技术来使用回归来估计目标值。例如,我可以给出一些描述事故的句子,目标值是事故的成本。Kaggle拥有相当多的
NLP
数据集,但据我所见,它们都用于分类。
浏览 0
提问于2020-08-18
得票数 0
1
回答
深度学习网络中短句的最佳实践
、
在深度学习网络(
CNN
或RNN)中,我们可以使用单词
嵌入
(如FastText、Glove等)来表示输入
文本
。我的问题是:📷 有时我有几个长度大于150的句子,其余句子的平均长度是48。这里,我在一些在线实现中注意到,它们用" pad“字填充短句,以增加它们的大小,以达到最大句子的长度(图片中的红色空格),其中这个衬垫字充满了一个随机
值
。这样做是否一个好做法?如果我的数据集包含5000条tw
浏览 0
提问于2018-11-04
得票数 0
2
回答
在对文档进行聚类之前,如何使用所有可能的文档拼写更正?
、
我有一种算法,可以
预测
拼写错误的单词可能是正确的。我可以使用所有可能的正确单词
预测
正确的拼写在单词向量,以执行聚类对这些数据?
浏览 0
提问于2019-06-14
得票数 1
2
回答
如何使用
文本
作为神经网络回归问题的输入?一篇文章会得到多少赞/拍手?
、
、
、
我正试图
预测
一篇文章或一篇文章将使用NN的数量。以下是我迄今所做的工作: 文字清理:删除html标签,停止词,标点符号等.在大多数
NLP
问题中,我注意到人们使用单词
嵌入
,但据我所理解,这是一种尝试
预测
文本
中下一个单词的方法。学习单词
嵌入
浏览 0
提问于2020-08-02
得票数 1
1
回答
如何看待spacy
值
?
、
、
、
我试图
从
spacy模型中获得每个输出类的softmax
预测
值
。当我在下面的代码中放置一个断点'preds‘并跳过管道,直到在NER模型管道组件上调用
预测
方法时,我可以看到
从
self._func(self, X, is_train=False)[0]
nlp
= spacy.load('en_core_web_smdoc =
nlp
('Apple is l
浏览 1
提问于2022-07-05
得票数 2
回答已采纳
2
回答
预测
邮件收件人的正确解决方案是什么?
、
、
、
我正在研究各种
NLP
算法和工具来解决以下问题;这里是
NLP
新手,如果它太基础了,请原谅我的问题。 比方说,我有一个消息应用程序,用户可以向一个或多个人发送
文本
消息。如果用户"A“向用户"B”发送了大量关于“猫”的
文本
消息,向用户"C“发送了一些消息,并且向用户"D”发送了许多关于“政治”的消息,那么下次用户键入关于“猫”的消息时,应用程序应该建议"B“和"C”而不是所以我正在做一些关于主题建模和词
嵌入
的研究,发现LDA和Word2Vec是我可以使
浏览 1
提问于2017-10-20
得票数 1
2
回答
如何将输入转换为NN的输入单元?
、
、
、
我对机器学习和神经网络非常陌生。我用下面的模型来分析短文的情感。我通常理解信号是如何计算的,一直到输出层。现在我不明白的是输入是如何被找到的。当模型对一个单词进行分类时,如何将该单词转换为512输入单元?模型评估了这个词的哪些特征,这是如何决定的? model.add(Dense(512, input_shape=(max_words,), activation='relu')) model.add(Dense(256, activation='sigmoid
浏览 2
提问于2020-11-14
得票数 1
回答已采纳
2
回答
如何阻止
文本
分类模型仅依赖于输入
文本
中的两个单词而不是整个句子?
、
、
、
、
我有一个
文本
分类深度学习模型,它接收一个
文本
并输出一个softmax概率。我使用手套
嵌入
来表示DL模型的数字形式的输入
文本
。训练结束后,当我用看不见的文字做
预测
时,我会意识到只有一个关键词在
预测
中有着巨大的重要性。为了确保这种情况,我改变了输入
文本
,只包括那些关键字和软件概率或多或少相同。那么,我在我的模型中做了哪些改变,
从
嵌入
技术到
浏览 0
提问于2021-11-02
得票数 2
回答已采纳
1
回答
如何将一次热编码
值
计算成实数向量?
、
、
、
在Word2Vec中,我了解到CBOW和Skip-gram都会产生一个单热编码
值
来创建向量(cmiiw),我想知道如何计算一个单热编码
值
或将其表示为实数向量,例如(来源:): 请帮帮忙,我正在努力寻找这些信息
浏览 2
提问于2017-08-06
得票数 2
回答已采纳
1
回答
如何最好地绕过Tensorflow 2.0
嵌入
层,显然需要从0或1开始编码数据的局限性?
、
、
它没有文档化,但很明显,下面的
嵌入
查找失败是因为TensorFlow错误地假设我的数据
从
0或1开始,但实际上它从1997年开始。我预计会有几个解决办法,但没有一个是很好的。还需要额外的代码来查找原始的有意义的
值
,这样您就可以理解正在查看的编码。 只需使用input_size=max(列)+1。这会导致太多的权重而无法毫无理由地进行训练,从而降低了
预测
性能并增加了训练时间。对于广泛使用分类
嵌入
的appli9cations来说,这可能是内存和时间的挑战,也是糟糕的
预测
性能。可悲的是,我发
浏览 1
提问于2019-12-09
得票数 0
1
回答
IBM沃森个性洞察使用的机器学习算法是什么?
、
、
我试着用个性洞察力来
预测
性格特征。在阅读API文档时,对API中的科学细节没有清楚地说明。
从
文件中的个性洞察力API。
浏览 2
提问于2020-09-19
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
嵌入向量能否理解数字?BERT竟不如ELMo?
使用CNN和Deep Learning Studio进行自然语言处理
深度学习、机器学习与NLP的前世今生
从语言学到深度学习NLP,一文概述自然语言处理
CMU 邢波教授团队再出新成果:利用深度学习技术预测出院用药
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券