首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

【机器学习笔记之八】使用朴素贝叶斯进行文本的分类

使用朴素贝叶斯进行文本的分类 引言 朴素贝叶斯由贝叶斯定理延伸而来的简单而强大的概率模型,它根据每个特征的概率确定一个对象属于某一类别的概率。该方法基于一个假设,所有特征需要相互独立,即任一特征的值和其他特征的值没有关联关系。 虽然这种条件独立的假设在许多应用领域未必能很好满足,甚至是不成立的。但这种简化的贝叶斯分类器在许多实际应用中还是得到了较好的分类精度。训练模型的过程可以看作是对相关条件概率的计算,它可以用统计对应某一类别的特征的频率来估计。 朴素贝叶斯最成功的一个应用是自然语言处理领域,自然语言处理

06

一个基于序列的弱监督视觉信息抽取学习框架

视觉信息提取(VIE)近年来受到了越来越多的关注。现有的方法通常首先将光学字符识别(OCR)结果组织成纯文本,然后利用标记级实体注释作为监督来训练序列标记模型。但是,它花费大量的注释成本,可能导致标签混淆,OCR错误也会显著影响最终性能。在本文中,作者提出了一个统一的弱监督学习框架,称为TCPN(标签、复制或预测网络),它引入了1)一种有效的编码器,可以同时对二维OCR结果中的语义和布局信息进行建模;2)仅利用关键信息序列作为监督的弱监督训练策略;和3)一个灵活和可转换的解码器,其中包含两种推理模式:一种(复制或预测模式)是通过复制输入或预测一个标记来输出不同类别的关键信息序列,另一种(标记模式)是直接标记输入序列。本方法在几个公共基准上显示了最新的性能,充分证明了其有效性。

03

借助亚马逊S3和RapidMiner将机器学习应用到文本挖掘

本挖掘典型地运用了机器学习技术,例如聚类,分类,关联规则,和预测建模。这些技术揭示潜在内容中的意义和关系。文本发掘应用于诸如竞争情报,生命科学,客户呼声,媒体和出版,法律和税收,法律实施,情感分析和趋势识别。 在本篇博客帖中,你将会学习到如何将机器学习技术应用到文本挖掘中。我将会向你展示如何使用RapidMiner(一款流行的预测分析开源工具)和亚马逊S3业务来创建一个文件挖掘应用。亚马逊S3业务是一项易用的存储服务,可使组织在网页上的任何地方存储和检索任意数量的数据。 掘模型产生的结果可以得到持续的推导并

03

Integrated Multiscale Domain Adaptive YOLO

领域自适应领域在解决许多深度学习应用程序遇到的领域转移问题方面发挥了重要作用。这个问题是由于用于训练的源数据的分布与实际测试场景中使用的目标数据之间的差异而产生的。在本文中,我们介绍了一种新的多尺度域自适应YOLO(MS-DAYOLO)框架,该框架在YOLOv4目标检测器的不同尺度上采用了多个域自适应路径和相应的域分类器。在我们的基线多尺度DAYOLO框架的基础上,我们为生成领域不变特征的领域自适应网络(DAN)引入了三种新的深度学习架构。特别地,我们提出了一种渐进特征约简(PFR)、一种无人分类器(UC)和一种集成架构。我们使用流行的数据集与YOLOv4一起训练和测试我们提出的DAN架构。我们的实验表明,当使用所提出的MS-DAYOLO架构训练YOLOv4时,以及当在自动驾驶应用的目标数据上进行测试时,物体检测性能显著提高。此外,相对于更快的R-CNN解决方案,MS-DAYOLO框架实现了数量级的实时速度改进,同时提供了可比的目标检测性能。

02
领券