腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(78)
视频
沙龙
3
回答
如何在
垃圾邮件
-非
垃圾邮件
分类器中获得突出的单词?
、
假设我有一个
垃圾邮件
-非
垃圾邮件
分类器。如果一封新的电子邮件已经被分类为
垃圾邮件
,如何确定邮件中的单词主要负责分类器将其分类为
垃圾邮件
。将邮件归类为
垃圾邮件
的主要单词是“免费10000美元”。
浏览 0
提问于2016-07-06
得票数 0
1
回答
用于
垃圾邮件
过滤的贝叶斯网络
、
我想使用贝叶斯网络机制来过滤
垃圾邮件
。您认为网络的适当拓扑应该是什么样子的?
朴素
贝叶斯模型呢?(
朴素
贝叶斯模型有时称为
贝叶斯分类器
)
浏览 5
提问于2009-03-26
得票数 1
1
回答
朴素
贝叶斯分类器
不起作用
,
首选
垃圾邮件
、
我是Python的新手,我一直在尝试构建一个
朴素
的
贝叶斯分类器
,但它似乎优先考虑
垃圾邮件
而不是
垃圾邮件
。我知道这要求很多,但我希望熟悉
朴素
贝叶斯的人能指出我做错了什么。顺便说一句:我跳过了
朴素
贝叶斯方程的分母部分;一个共同的分母不应该有什么不同,对吧?
浏览 15
提问于2019-02-28
得票数 0
3
回答
Java如何表示非常小的小数?
、
我开发了一个应用程序来检测
垃圾邮件
,使用
朴素
贝叶斯分类器
。变量被声明为浮点数。
浏览 2
提问于2014-02-07
得票数 0
回答已采纳
1
回答
我可以对枚举数据使用
朴素
贝叶斯分类器
吗?
、
我正在学习使用机器学习技术进行
垃圾邮件
检测,我在上找到的一篇文章建议我从
朴素
的
贝叶斯分类器
开始。 我的问题是:如果我正在测量的属性是谨慎的,而不是连续的,那么应该如何合并它?你还能使用
朴素
的
贝叶斯分类器
吗?基本上,如果我的值是身高、体重、脚码和最喜欢的运动,我还能使用
朴素
的
贝叶斯分类器
吗?
浏览 1
提问于2014-11-15
得票数 0
1
回答
为什么支持向量机回归(SMOreg)在weka中会变灰?
、
、
、
训练数据集将一些文档分类为
垃圾邮件
/火腿。我需要使用一个模型,以便每个测试文档得到一个介于0-1 (0是
垃圾邮件
,1是火腿)之间的值。我使用了
朴素
的
贝叶斯分类器
,它给出了属于火腿或
垃圾邮件
的每个测试实例的概率。但支持向量机回归(weka中的SMOreg)往往是灰色的。
浏览 0
提问于2014-03-30
得票数 0
5
回答
蟒蛇中有
朴素
的
贝叶斯分类器
吗?
、
、
我尝试过用于
朴素
贝叶斯分类的Orange框架。
浏览 2
提问于2010-04-05
得票数 22
1
回答
如何改变NLTK中
朴素
贝叶斯分类器
的平滑方法?
、
、
、
、
我已经使用NLTK
朴素
贝叶斯方法训练了一个
垃圾邮件
分类器。
垃圾邮件
集和非
垃圾邮件
集在训练中都有20,000个单词实例。我注意到,当遇到未知功能时,classifier会给出
垃圾邮件
的0.5概率: >>> print classifier.prob_classify({'unkown_words':True}).prob但是,我想将的
垃圾邮件
概率设置为0.4,因为未知功能更可能来自普通用户。我如何用NLTK实现它?
浏览 1
提问于2013-05-27
得票数 3
回答已采纳
1
回答
检测低质量、用户创建的文本内容。
我想自动排除或标记,提交的文本内容是“
垃圾邮件
”或“低质量”(主观的,我知道)。显然,我想检测的内容是攻击性或经典的
垃圾邮件
。我还想检测那些毫无意义或毫无意义的内容。我尝试过AWS理解,没有任何定制的培训,可以准确地检测文本的情感,它似乎没有检测到低质量或
垃圾邮件
出框。它支持自定义分类器的培训,您只需提供包含类/文档对的csv。
浏览 0
提问于2020-04-13
得票数 2
3
回答
什么是好的机器学习编程练习?
、
理想情况下,它们将具有以下特点:
浏览 6
提问于2010-11-17
得票数 26
回答已采纳
1
回答
如何在
垃圾邮件
过滤中嵌入带有
朴素
贝叶斯分类器
的聚合规则?
、
、
、
实际上,我正在研究用于过滤邮件的
朴素
贝叶斯分类器
。在
垃圾邮件
检测和HAM检测中,我的准确率分别达到了95%和94 %,但我相信通过关联规则挖掘可以进一步改进它。我正在计算训练数据集中邮件中单词的可能性和先验概率,并将测试邮件映射到
垃圾邮件
或HAM类,如下所示,哪里, p(f1,f2,f3.fn/ c )表示单词f1,f2...fn在c类中的可能性。例如,在
垃圾邮
浏览 0
提问于2017-02-14
得票数 1
2
回答
文本分类问题的探讨
、
这里的很多词汇对我来说都是新的,所以如果我说错了,请原谅我。房屋:有几堵墙、一些窗户和一个屋顶的建筑我们有一个第三方描述了他们:给这些松散的自然语言描述什么将“我的房子”归类为“房子”的好方法。一个简单的单词计数方法是否适用,也许可以使用某种类型的字典{"the“、"a”等等。有其他算法需要考虑吗?
浏览 0
提问于2016-10-19
得票数 0
3
回答
我如何分类文本考虑语序,而不是仅仅使用一个包-字的方法?
我制作了一个
朴素
的
贝叶斯分类器
,它使用单词袋技术对留言板上的
垃圾邮件
进行分类。这是可行的,但我认为,如果我的模型考虑的词顺序和短语,我可以得到更好的结果。(例如:“女孩”和“生活”可能不会引发高
垃圾邮件
评分,尽管“活女孩”最有可能是
垃圾邮件
)。我如何建立一个考虑词序的模型?
浏览 0
提问于2014-10-02
得票数 11
2
回答
如何通过机器准确地区分蟒蛇和蛇的文章?
、
我试着创建一个像planet这样的python语言新闻聚合网站,我从G+和twitter等社交媒体上抓取了python新闻,并通过一些python关键字提供了一些python feed。有没有更好的方法来做到这一点? for dic in snack_dic: i
浏览 0
提问于2012-02-15
得票数 1
4
回答
当前最佳
垃圾邮件
过滤算法
、
目前检测
垃圾邮件
最好的方法是什么?尤其是在移动文本消息上。是否有任何资源或比较分析?
浏览 5
提问于2010-12-23
得票数 5
回答已采纳
1
回答
从文档中提取文本中的“噪声”检测
、
、
字符分布随机Hmax组织c) (指物种之上的字符)BB+++B 4+熵(物种的性状多样性 我的问题是:我如何识别这种“噪音”,并将其与正常的文本块区分开来?有什么现有的算法吗?我在Ruby中工作
浏览 1
提问于2012-06-08
得票数 1
回答已采纳
1
回答
如何从
朴素
贝叶斯分类器
中正确计算
垃圾邮件
分数作为固定特征和概率的组合?
我正在构建一个学习
垃圾邮件
/火腿电子邮件分类器作为一项任务。它不应该是一个很好的通用分类器,而是一个可以在一小组标记的用户电子邮件上学习的分类器(大约)。(假设
垃圾邮件
/火腿和个人特性的分发仍然大致相同,则对其余的信息进行分类。我首先实现了一个简单的带有日志概率的
朴素
贝叶斯,其基础是:https://www.cs.rhodes.edu/~kirlinp/courses/ai/f18/projects/proj3/naive-baye
浏览 0
提问于2022-12-20
得票数 1
1
回答
我可以将StringDocument <Type>还原为字符串吗?(TextAnalysis.jl)
、
我正在使用Julia TextAnalysis.jl包中的
朴素
贝叶斯分类器
模型制作
垃圾邮件
分类器。 文本预处理functions (如remove_corrupt_utf8!
浏览 12
提问于2020-01-27
得票数 3
回答已采纳
1
回答
确定带宽数据中的“噪声”
、
、
我有带宽数据,可以按吨位和小时识别协议的使用情况。根据协议,您可以分辨出某个特定协议在该小时内正在连接的内容与实际使用的内容(1000比特与百万或数十亿比特)。问题是,当查看每个协议时,它们都严重地向右倾斜。其中80%的记录都是刚刚连接的或者我称之为“噪音。 我的任务是分离出这些噪音,并只关注协议实际使用时的情况。我的同学们都是手工操作,并以较低的门槛删除。我希望有一种方法可以自动化这一点,并使用统计数据,而不仅仅是选择一个“看起来很好”的阈值。我们有大约30个不同的协议,每个协议都有不同的比特量,这将代表“噪声”,即一个下载原型可能有1000个比特,而一个消息传递应用程序可能有75个比特,当
浏览 17
提问于2019-03-27
得票数 0
1
回答
基于“词袋”方法的
朴素
贝叶斯主题检测
、
、
、
我正在尝试实现一种
朴素
的贝叶斯方法来查找给定文档或词流的主题。有没有
朴素
的贝叶斯方法,我可以查一下? 此外,我还在努力改进我的字典。最初,我有一堆单词映射到一个主题(硬编码)。
浏览 4
提问于2010-05-06
得票数 12
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
对象存储
云直播
腾讯会议
活动推荐
运营活动
广告
关闭
领券