腾讯云开发者社区-腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

机器学习算法与Python学习

专栏作者

1142

文章

1308712

阅读量

186

订阅数

【特征提取+分类模型】4种常见的NLP实践思路

数据挖掘编程算法深度学习机器学习神经网络

越来越多的人选择参加算法赛事，为了提升项目实践能力，同时也希望能拿到好的成绩增加履历的丰富度。期望如此美好，现实却是：看完赛题，一点思路都木有。那么，当我们拿到一个算法赛题后，如何破题，如何找到可能的解题思路呢。

2020-08-28

2.7K0

2020 AAAI Fellow名单出炉！深度学习先驱Bengio和LeCun双双入选

机器学习神经网络人工智能机器人数据挖掘

日前，国际人工智能学会AAAI在其官方推特上宣布，全球有 10 位学者当选为 Fellow，以表彰他们对AI的广泛贡献，包括规划、CSP、Mult-Agent系统、语义网、NLP、视觉、深度学习和HRI。这些新成员将在纽约的AAAI2020大会上亮相。

2020-01-16

5110

【强烈推荐】：关于系统学习数据挖掘（Data Mining）的一些建议！！

数据挖掘机器学习编程算法 python 数据分析

关键字全网搜索最新排名【机器学习算法】：排名第一【机器学习】：排名第一【Python】：排名第三【算法】：排名第四关于数据挖掘提到收据挖掘（Data Mining， DM），很多想学习的同学大多数都会问我：什么是数据挖掘？怎么培养数据分析的能力？如何成为一名数据科学家？（简称数据挖掘工程师为DMer）我认为，在学习DM之前你至少需要明白以下几点：数据初期的准备通常占整个数据挖掘项目工作量的70%左右；数据挖掘本身融合了统计学、数据库和机器学习等学科，并不是新的技术；数据挖掘技术更

2018-04-08

3.9K0

干货 | 数据挖掘中的十大实用方法，可能你并不一定都熟悉！

关键字全网搜索最新排名【机器学习算法】：排名第一【机器学习】：排名第二【Python】：排名第三【算法】：排名第四目录基于历史的MBR分析购物篮分析决策树遗传算法聚类分析连接分析 OLAP分析神经网络判别分析逻辑回归分析 1.基于历史的MBR分析基于历史（Memory-Based Reasoning）的MBR分析方法最主要的概念是用已知的案例（case）来预测未来案例的一些属性（attribute），通常找寻最相似的案例来做比较。 MBR中有两个主要的要素

2018-04-08

8570

干货 | TF-IDF的大用处

机器学习编程算法 python 数据挖掘

关键字全网搜索最新排名【机器学习算法】：排名第一【机器学习】：排名第二【Python】：排名第三【算法】：排名第四有一篇很长的文章，我要用计算机提取它的关键词（Automatic Keyphrase extraction），完全不加以人工干预，请问怎样才能正确做到？这个问题涉及到数据挖掘、文本处理、信息检索等很多计算机前沿领域，但是出乎意料的是，有一个非常简单的经典算法，可以给出令人相当满意的结果。它简单到都不需要高等数学，普通人只用10分钟就可以理解，这就是我今天想要介绍的TF-IDF算法。

2018-04-08

1.2K0

干货 | 数据挖掘知识点整理

关键字全网搜索最新排名【机器学习算法】：排名第一【机器学习】：排名第二【Python】：排名第三【算法】：排名第四 1. 数据、信息和知识是广义数据表现的不同形式。 2. 主要知识模式类型有：广义知识，关联知识，类知识，预测型知识，特异型知识 3. web挖掘研究的主要流派有：Web结构挖掘、Web使用挖掘、Web内容挖掘 4. 一般地说，KDD是一个多步骤的处理过程，一般分为问题定义、数据抽取、数据预处理、.数据挖掘以及模式评估等基本阶段。 5. 数据库中的知识发现处理过程模型有：阶梯处

2018-04-08

1.1K0

Python做文本挖掘的情感极性分析（基于情感词典的方法）

python 数据挖掘

关键字全网搜索最新排名【机器学习算法】：排名第一【机器学习】：排名第二【Python】：排名第三【算法】：排名第四我们会再接再厉成为全网优质的技术类公众号「情感极性分析」是对带有感情色彩的主观性文本进行分析、处理、归纳和推理的过程。按照处理文本的类别不同，可分为基于新闻评论的情感分析和基于产品评论的情感分析。其中，前者多用于舆情监控和信息预测，后者可帮助用户了解某一产品在大众心目中的口碑。目前常见的情感极性分析方法主要是两种：基于情感词典的方法（本次内容）和基于机器学习的方法（下次内容）。 1

2018-04-08

4.1K0

python数据挖掘你准备好了吗？

python 数据挖掘机器学习

彩蛋~~~~文末有python进行数据挖掘的详细路径规划图。经常有人问我怎么才能快速入门python数据挖掘，这个问题怎么说呢？那些经典的书籍可以让你对python这门语言有较好的理解，但是缺少实战性。之前推荐过一本名为《python科学计算》(Python科学计算(书籍推荐))得书籍，并给出了书中的详细的源码。但是要想系统的学习python数据挖掘还是需要高人指导是最好的，现在机会来啦~！ python机器学习与网络爬虫研修班开班了，不管你是各高校相关专业负责人和骨干老师、高年级本科生及研究生，还是银行

2018-04-08

6450

Machine Learning -- 主动学习(AL)

机器学习模式识别数据挖掘

参考论文：Survey on active learning algorithms. Computer Engineering and Applications 主动学习算法作为构造有效训练集的方法，其目标是通过迭代抽样，寻找有利于提升分类效果的样本，进而减少分类训练集的大小，在有限的时间和资源的前提下，提高分类算法的效率。主动学习已成为模式识别、机器学习和数据挖掘领域的研究热点问题。介绍了主动学习的基本思想，一些最新研究成果及其算法分析，并提出和分析了有待进一步研究的问题。 1 引言监督学习模型，例如：

2018-04-04

2.5K0

Machine learning -- C4.5算法详解及Python实现

编程算法 python 机器学习数据挖掘

程序实现部分转自 Wsine的博客小站地址：http://www.cnblogs.com/wsine/p/5180315.html C4.5是一系列用在机器学习和数据挖掘的分类问题中的算法。它的目标是监督学习：给定一个数据集，其中的每一个元组都能用一组属性值来描述，每一个元组属于一个互斥的类别中的某一类。C4.5的目标是通过学习，找到一个从属性值到类别的映射关系，并且这个映射能用于对新的类别未知的实体进行分类。 C4.5由J.Ross Quinlan在ID3的基础上提出的。ID3算法用来构造决策

2018-04-04

2.4K0

距离和相似性度量在机器学习中的使用统计

机器学习 html 数据挖掘数据分析

作者：daniel-D 来源：http://www.cnblogs.com/daniel-D/p/3244718.html 在机器学习和数据挖掘中，我们经常需要知道个体间差异的大小，进而评价个体的相似性和类别。最常见的是数据分析中的相关分析，数据挖掘中的分类和聚类算法，如 K 最近邻（KNN）和 K 均值（K-Means）等等。根据数据特性的不同，可以采用不同的度量方法。一般而言，定义一个距离函数 d(x,y), 需要满足下面几个准则： 1) d(x,x) = 0

2018-04-04

2.5K0

机器学习(32)之典型相关性分析(CCA)详解【文末有福利......】

机器学习数据挖掘编程算法

关键字全网搜索最新排名【机器学习算法】：排名第一【机器学习】：排名第一【Python】：排名第三【算法】：排名第四人工智能与Python公开课限时免费文末领取前言典型关联分析(Canonical Correlation Analysis，简称CCA)是最常用的挖掘数据关联关系的算法之一。比如我们拿到两组数据，第一组是人身高和体重的数据，第二组是对应的跑步能力和跳远能力的数据。那么我们能不能说这两组数据是相关的呢？CCA可以帮助我们分析这个问题。 CCA概述在数理统计里面，都知道相关系数这

2018-04-04

5.7K0

没有更多了

社区活动

腾讯技术创作狂欢月

“码”上创作 21 天，分 10000 元奖品池！

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态