首页
学习
活动
专区
工具
TVP
发布

机器学习算法与Python学习

专栏作者
1142
文章
1308712
阅读量
186
订阅数
【特征提取+分类模型】4种常见的NLP实践思路
越来越多的人选择参加算法赛事,为了提升项目实践能力,同时也希望能拿到好的成绩增加履历的丰富度。期望如此美好,现实却是:看完赛题,一点思路都木有。那么,当我们拿到一个算法赛题后,如何破题,如何找到可能的解题思路呢。
昱良
2020-08-28
2.7K0
2020 AAAI Fellow名单出炉!深度学习先驱Bengio和LeCun双双入选
日前,国际人工智能学会AAAI在其官方推特上宣布,全球有 10 位学者当选为 Fellow,以表彰他们对AI的广泛贡献,包括规划、CSP、Mult-Agent系统、语义网、NLP、视觉、深度学习和HRI。这些新成员将在纽约的AAAI2020大会上亮相。
昱良
2020-01-16
5110
【强烈推荐】:关于系统学习数据挖掘(Data Mining)的一些建议!!
关键字全网搜索最新排名 【机器学习算法】:排名第一 【机器学习】:排名第一 【Python】:排名第三 【算法】:排名第四 关于数据挖掘 提到收据挖掘(Data Mining, DM),很多想学习的同学大多数都会问我: 什么是数据挖掘? 怎么培养数据分析的能力? 如何成为一名数据科学家? (简称数据挖掘工程师为DMer) 我认为,在学习DM之前你至少需要明白以下几点: 数据初期的准备通常占整个数据挖掘项目工作量的70%左右; 数据挖掘本身融合了统计学、数据库和机器学习等学科,并不是新的技术; 数据挖掘技术更
昱良
2018-04-08
3.9K0
干货 | 数据挖掘中的十大实用方法,可能你并不一定都熟悉!
关键字全网搜索最新排名 【机器学习算法】:排名第一 【机器学习】:排名第二 【Python】:排名第三 【算法】:排名第四 目录 基于历史的MBR分析 购物篮分析 决策树 遗传算法 聚类分析 连接分析 OLAP分析 神经网络 判别分析 逻辑回归分析 1.基于历史的MBR分析 基于历史(Memory-Based Reasoning)的MBR分析方法最主要的概念是用已知的案例(case)来预测未来案例的一些属性(attribute),通常找寻最相似的案例来做比较。 MBR中有两个主要的要素
昱良
2018-04-08
8570
干货 | TF-IDF的大用处
关键字全网搜索最新排名 【机器学习算法】:排名第一 【机器学习】:排名第二 【Python】:排名第三 【算法】:排名第四 有一篇很长的文章,我要用计算机提取它的关键词(Automatic Keyphrase extraction),完全不加以人工干预,请问怎样才能正确做到? 这个问题涉及到数据挖掘、文本处理、信息检索等很多计算机前沿领域,但是出乎意料的是,有一个非常简单的经典算法,可以给出令人相当满意的结果。它简单到都不需要高等数学,普通人只用10分钟就可以理解,这就是我今天想要介绍的TF-IDF算法。
昱良
2018-04-08
1.2K0
干货 | 数据挖掘知识点整理
关键字全网搜索最新排名 【机器学习算法】:排名第一 【机器学习】:排名第二 【Python】:排名第三 【算法】:排名第四 1. 数据、信息和知识是广义数据表现的不同形式。 2. 主要知识模式类型有:广义知识,关联知识,类知识,预测型知识,特异型知识 3. web挖掘研究的主要流派有:Web结构挖掘、Web使用挖掘、Web内容挖掘 4. 一般地说,KDD是一个多步骤的处理过程,一般分为问题定义、数据抽取、数据预处理、.数据挖掘以及模式评估等基本阶段。 5. 数据库中的知识发现处理过程模型有:阶梯处
昱良
2018-04-08
1.1K0
Python做文本挖掘的情感极性分析(基于情感词典的方法)
关键字全网搜索最新排名 【机器学习算法】:排名第一 【机器学习】:排名第二 【Python】:排名第三 【算法】:排名第四 我们会再接再厉 成为全网优质的技术类公众号 「情感极性分析」是对带有感情色彩的主观性文本进行分析、处理、归纳和推理的过程。按照处理文本的类别不同,可分为基于新闻评论的情感分析和基于产品评论的情感分析。其中,前者多用于舆情监控和信息预测,后者可帮助用户了解某一产品在大众心目中的口碑。目前常见的情感极性分析方法主要是两种:基于情感词典的方法(本次内容)和基于机器学习的方法(下次内容)。 1
昱良
2018-04-08
4.1K0
python数据挖掘你准备好了吗?
彩蛋~~~~文末有python进行数据挖掘的详细路径规划图。 经常有人问我怎么才能快速入门python数据挖掘,这个问题怎么说呢?那些经典的书籍可以让你对python这门语言有较好的理解,但是缺少实战性。之前推荐过一本名为《python科学计算》(Python科学计算(书籍推荐))得书籍,并给出了书中的详细的源码。但是要想系统的学习python数据挖掘还是需要高人指导是最好的,现在机会来啦~! python机器学习与网络爬虫研修班开班了,不管你是各高校相关专业负责人和骨干老师、高年级本科生及研究生,还是银行
昱良
2018-04-08
6450
Machine Learning -- 主动学习(AL)
参考论文:Survey on active learning algorithms. Computer Engineering and Applications 主动学习算法作为构造有效训练集的方法,其目标是通过迭代抽样,寻找有利于提升分类效果的样本,进而减少分类训练集的大小,在有限的时间和资源的前提下,提高分类算法的效率。主动学习已成为模式识别、机器学习和数据挖掘领域的研究热点问题。介绍了主动学习的基本思想,一些最新研究成果及其算法分析,并提出和分析了有待进一步研究的问题。 1 引言 监督学习模型,例如:
昱良
2018-04-04
2.5K0
Machine learning -- C4.5算法详解及Python实现
程序实现部分转自 Wsine的博客小站 地址:http://www.cnblogs.com/wsine/p/5180315.html C4.5是一系列用在机器学习和数据挖掘的分类问题中的算法。它的目标是监督学习:给定一个数据集,其中的每一个元组都能用一组属性值来描述,每一个元组属于一个互斥的类别中的某一类。C4.5的目标是通过学习,找到一个从属性值到类别的映射关系,并且这个映射能用于对新的类别未知的实体进行分类。 C4.5由J.Ross Quinlan在ID3的基础上提出的。ID3算法用来构造决策
昱良
2018-04-04
2.4K0
距离和相似性度量在机器学习中的使用统计
作者:daniel-D 来源:http://www.cnblogs.com/daniel-D/p/3244718.html 在机器学习和数据挖掘中,我们经常需要知道个体间差异的大小,进而评价个体的相似性和类别。最常见的是数据分析中的相关分析,数据挖掘中的分类和聚类算法,如 K 最近邻(KNN)和 K 均值(K-Means)等等。根据数据特性的不同,可以采用不同的度量方法。一般而言,定义一个距离函数 d(x,y), 需要满足下面几个准则: 1) d(x,x) = 0
昱良
2018-04-04
2.5K0
机器学习(32)之典型相关性分析(CCA)详解 【文末有福利......】
关键字全网搜索最新排名 【机器学习算法】:排名第一 【机器学习】:排名第一 【Python】:排名第三 【算法】:排名第四 人工智能与Python公开课 限时免费 文末领取 前言 典型关联分析(Canonical Correlation Analysis,简称CCA)是最常用的挖掘数据关联关系的算法之一。比如我们拿到两组数据,第一组是人身高和体重的数据,第二组是对应的跑步能力和跳远能力的数据。那么我们能不能说这两组数据是相关的呢?CCA可以帮助我们分析这个问题。 CCA概述 在数理统计里面,都知道相关系数这
昱良
2018-04-04
5.7K0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档