腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(6298)
视频
沙龙
4
回答
情绪
分析
-当正面和负面单词列表的长度不同时,
我
应该对它们进行标准化吗?
、
我
正在
实现
一个
简单的情感
分析
算法,其中论文的作者有
一个
正面和负面单词的单词列表,
并
简单地计算每个单词在
分析
的文档中出现的次数,
并
使用以下内容对文档进行情感评分:这是通过文档长度对情感评分进行归一化,但是负面单词的语料库比
积极
单词语料库(大约300个
积极
单词和
浏览 0
提问于2015-02-19
得票数 1
1
回答
Doc2Vec通用情感
分析
数据集
、
、
、
、
我
试图建立doc2vec模型,使用gensim + sklearn对短句子(如评论、推特、评论等)进行情感
分析
。然后将其归纳为
积极
、消极和
中立
三大类。
并
利用sklearn模型对
我
的测试数据进行了预测,从上述三组数据中分别得到了约10%的数据。 不幸的是,结果并不像我预期的那样好。大部分的教程似乎只专注于
一个
特定的任务,‘只分类亚马逊评论’
或
'twitter
情绪
‘,
我
无法找
浏览 1
提问于2018-10-16
得票数 0
回答已采纳
2
回答
回顾数据
情绪
分析
,专注于提取负面
情绪
?
、
、
、
我
正在
尝试
对
一个
评论数据集进行情感
分析
。由于我更关心在评论中识别(提取)负面
情绪
(现在没有标记,但我
尝试
手动标记数百条
或
使用Alchemy API),如果评论总体上是
中立
的
或
正
面的
,但部分评论有负面
情绪
,
我
希望
我
的模型更倾向于将其视为负面评论
我
正在
考虑将bag of words/word2vect与有
浏览 1
提问于2015-12-08
得票数 0
1
回答
Logistic回归支持向量机在Mahout中的实现
、
、
、
、
目前,
我
正在
为一家电信公司的数据对twitter数据进行多愁善感的
分析
,
我
正在
将这些数据加载到HDFS中,
并
使用Mahout的朴素Bayes分类器将
情绪
预测为
积极
、消极
或
中立
。,这是
我
正在
做的, 利用mahout库通过计算文本的tf-idf(Inverse文档频率)
生成
特征向量。new_m
浏览 4
提问于2014-01-28
得票数 3
2
回答
用于情感
分析
的Mahout
、
、
使用mahout,
我
能够对数据的情感进行分类。但是
我
被困在了
一个
混乱的矩阵中。 'positive','i love my i phone' 'pos
浏览 1
提问于2013-03-07
得票数 6
回答已采纳
2
回答
在NLP分类过程中,Parse树通常使用哪些特征?
、
、
、
我
正在
探索不同类型的
解析
树结构。这两个广为人知的
解析
树结构是:( a)基于选区的
解析
树和( b)基于依赖的
解析
树结构。例如,如果
我
想做情感
分析
,
并
想将文本分类为正类和负面类,那么
我
可以从
解析
树结构中派生出哪些特性来完成分
浏览 0
提问于2014-08-24
得票数 13
1
回答
如何利用POS标签作为NaiveBayesClassifier的有用特性进行情感
分析
?
、
、
、
我
正在
推特数据集(问题链接)上做
情绪
分析
。
我
从tweet中提取了POS标签,并从POS标签中创建了tfidf载体,并将它们作为
一个
特征(准确率为65%)。但是
我
认为,我们可以用POS标签实现更多的目标,因为它们有助于区分
一个
词是如何在短语范围内使用的。
我
正在
培训的模型是MultnomialNB()。
我
想要解决的问题是找出像
积极
、消极
或
中立
这样的推
浏览 0
提问于2020-07-23
得票数 0
2
回答
机器学习分类器与NLTK Vader相结合的情感
分析
、
、
、
、
作为
我
大学项目的一部分,
我
正在
研究/开发
一个
情感
分析
模型,在该模型中,
我
尝试
将NLTK (SentimentIntensityAnalyzer)结果与机器学习训练的分类器结合起来,用于预测Twitter详细描述-清除数据(Niek Sand
浏览 0
提问于2017-08-15
得票数 7
1
回答
根据文章中句子的情感值,总结一段文字的情感价值的最佳方法是什么?
、
所以我在
我
的项目中使用了斯坦福大学的CoreNLP。
我
有数据,其中包括在论坛上的产品评论。
我
需要能够分配
一个
情感价值给
一个
给定的审查。CoreNLP允许您预测给定句子的情感类。这个班从0-非常
负
到4-非常正。如何将句子的情感价值组合成
一个
最终的价值,给出整个评价的情感。 加权平均是正确的方法吗?指数加权平均是一种选择吗?或者还有其他方法,比如平均法,它提供了一种更全
面的
方法来总结预测的类列表?
浏览 0
提问于2017-06-28
得票数 0
1
回答
不正确的文本分类,但精确的模型。是否对数据集执行手动文本分类?
、
、
、
、
我
目前
正在
使用谷歌的BERT预培训
情绪
分析
模型,该模型是在IMDb pos/neg审查数据集上进行培训的。
我
用这个模型来预测推特是正
面的
(看涨的)还是负
面的
(看跌的)。当插入
我
自己的测试数据时,该模型是准确的(F1评分在86%之间),但分类本身并不准确。无疑是
积极
的/看涨的,而且没有被归类为
积极
的推特。或许这是因为投资领域的语言与电影评论不同--电影评论使用的是公认的
积极
浏览 0
提问于2019-06-08
得票数 1
1
回答
创建基于字典的文本分类时如何创建字典?如何确定值的准确性?
、
我
试图对
我
从Twitter上收集到的大约100万条twits进行情感
分析
。
我
发现了很多与文本分类有关的字典。
我
发现的字典被评为-4到+4之间的单词。球迷3愤怒-2复仇-2坏-3平静2庆祝3
我
想知道的是,数字是如何赋予文字的。
我
如何确定数字是有效的?词典是如何创建的?
浏览 0
提问于2018-12-16
得票数 -1
2
回答
训练LUIS理解“
我
感兴趣”和“
我
不感兴趣”之间的区别
、
、
我
有
一个
场景,
我
必须训练LUIS模型来理解“
我
感兴趣”和“
我
不感兴趣”之间的区别。如何在不直接提及意图中的话语的情况下实现它。
浏览 0
提问于2017-04-10
得票数 0
1
回答
在CoreNLP情感中加快注释时间
、
、
、
、
在
我
的数据集中,
我
有10万个文本文件,
我
正在
尝试
用CoreNLP来处理它们。期望的结果是100,000个完整的文本文件结果,它将每个句子归类为有
积极
的、消极的
或
中立
的
情绪
。为了从
一个
文本文件中获取数据以骚扰文本文件,
我
使用了CoreNLP jar文件,该文件来自下
面的
命令行。java -cp "*" -mx5g edu.stanford.nlp.sentimen
浏览 0
提问于2018-03-27
得票数 1
回答已采纳
7
回答
无监督情感
分析
、
、
我
读了很多文章,解释了在
情绪
分析
系统真正工作之前,需要一组初始的文本,这些文本要么被归类为‘正面’,要么被归类为‘负面’。
我
的问题是:有没有人
尝试
过对“
积极
的”形容词和“消极的”形容词进行基本的检查,考虑到任何简单的否定词,以避免将“不快乐”归类为
积极
的?如果是这样的话,有没有文章讨论为什么这个策略不现实呢?
浏览 0
提问于2010-10-13
得票数 48
回答已采纳
2
回答
nltk NaiveBayesClassifier博客情感
分析
训练
、
我
删除了关于特定主题的不同博客帖子中的文本。
我
读到的大多数关于sentimenet
分析
的主题都是基于训练分类器,以确定它是否是pos/neg答案,如本所示。
我
的问题是,
我
在哪里可以找到字典的单词,以及他们的
情绪
。例如:Nice: Positive , bad: negative。
浏览 4
提问于2014-11-22
得票数 1
1
回答
解析
文档以获得主观情感
、
、
我
正在
做
一个
关于机器阅读理解的项目。 例如,考虑到投入:“杰克逊高地应该看到房地产的增长,而其他地区的经纪公司应该看到
一个
急剧下降”。给定标记:“杰克逊高地”应该返回
一个
表示
积极
情绪
的分数:例如,.72给出了标记:“布鲁克林”应该返回
一个
得分,表示负面
情绪
: e.g -.72
我
试着用几种不同的方法
浏览 0
提问于2021-02-02
得票数 0
2
回答
twitter情感
分析
中表情符号极性的确定
、
、
、
我
正在
尝试
对twitter数据进行
情绪
分析
,
并
希望将表情符号考虑在内。假设
我
有
一个
表情符号的unicode (在本例中是U+1F600)。
我
想得到一些
积极
的,消极的
或
中性的极性分数。
我
做了一些研究,但一直未能找到
一个
现有的词汇,
我
可以使用。基本上,
我
想使用
一个
现有的词汇,如果有可用的,而不是遍历所有的表情符号手
浏览 5
提问于2017-12-06
得票数 2
回答已采纳
3
回答
为什么word2vec的表现要比CountVectorizer和TfidfVectorizer差得多?[文本分类]
、
、
、
我
遵循这个指南,
尝试
使用上
面的
指南中所示的MeanEmbeddingVectorizer和TfidfEmbeddingVectorizer作为输入来创建二进制分类器和多标签分类器。在完成这一步之后,
我
尝试
将这些嵌入向量器作为输入输入到几个模型中,比如OneVsRestClassifier、RandomForestClassifier和ExtraTreesClassifier。因此,就指南中显示的内容而言,所有模型的表现都超出了
我
的预期。
我
不确定
我
做错了
浏览 0
提问于2017-05-24
得票数 1
2
回答
医院候诊时间的情感
分析
、
、
、
我
一直在
尝试
从患者在医院的评论中推断出
一个
及时性分数(基于患者等待时间的分数)。可用的数据是患者的评论和他们对整体体验的评分。问题是,
我
没有为患者的及时性评分贴标签,而是对整个经历进行了评级。像“
我
已经等待了很长时间,但这段经历是值得的”这样的评论具有良好的背景和良好的评分,应该会返回
一个
有点糟糕的及时性分数,同样的,“等待时间很短,但这并不能证明糟糕的服务是合理的”。
我
清理了评论,提取了与等待时间相关的句子部分(如果存在),
并
使用TextBlob<e
浏览 1
提问于2019-12-05
得票数 0
2
回答
火花情感
分析
的
中立
性
、
、
、
当然,
我
已经构建了
一个
非常基本的朴素贝叶斯,它是基于
并
使用mllib的。但我要澄清一下
中立
到底意味着什么。1)在上述数据集中对数据集进行
中立
处理--如果
浏览 4
提问于2016-12-27
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
如何在网络文学IP中找到AI落脚点?(下)
公共政策调整时应做到舆情数据、风险预判与危机传播
R语言文本挖掘、情感分析和可视化哈利波特小说文本数据
七大武器之长生剑——个性化语音人机交互设计
【创星记】上网心态容易崩?你可能需要这家初创企业的发明
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券