首页
学习
活动
专区
工具
TVP
发布

数据科学与人工智能

专栏作者
811
文章
1010656
阅读量
170
订阅数
R语言做数据挖掘4本电子书
曾几何时,我在一次面试中,面试官问,“数据挖掘和机器学习有什么区别?”,朋友们也可以思考下这个问题。
陆勤_数据人网
2020-03-25
5310
【应用】信用评分卡:简介
这次事件发生在2009年左右的一个朋友聚会上,这是该地球长期以来最严重的金融危机。街上的乔意识到抵押支持证券(MBS),次级贷款和信贷危机等因素是他困境原因。 回到我们的聚会上,我遇到了一位知情和富有同情心的老年妇女,经过几分钟的闲聊之后,这个话题出现在我的生活中。 那时,我正在为孟买一家领先的抵押贷款机构开发一个信用记分卡项目。 当我开始解释我的工作细节时,她的表情从好奇转变为焦虑和痛苦。 最终,她打断了我的话 - 你为什么要这样做? 这不是所有混乱的原因吗? 我习惯了这种反应,必须纠正她的错误观念。
陆勤_数据人网
2018-08-20
7750
【算法】TF-IDF算法及应用
有一篇很长的文章,我要用计算机提取它的关键词(Automatic Keyphrase extraction),完全不加以人工干预,请问怎样才能正确做到?
陆勤_数据人网
2018-07-30
9400
【算法】相似度计算方法原理及实现
小编邀请您,先思考: 1 相似度如何计算? 2 相似度有什么应用? 温馨提示:加入圈子或者商务合作,请加微信:luqin360 在数据分析和数据挖掘以及搜索引擎中,我们经常需要知道个体间差异的大小,进而评价个体的相似性和类别。常见的比如数据分析中比如相关分析,数据挖掘中的分类聚类(K-Means等)算法,搜索引擎进行物品推荐时。 相似度就是比较两个事物的相似性。一般通过计算事物的特征之间的距离,如果距离小,那么相似度大;如果距离大,那么相似度小。比如两种水果,将从颜色,大小,维生素含量等特征进行比较相似性。
陆勤_数据人网
2018-04-18
2K0
【经验】数据挖掘的九个经验
1 您如何做数据挖掘? 数据挖掘是利用业务知识从数据中发现和解释知识(或称为模式)的过程,这种知识是以自然或者人工形式创造的新知识。 当前的数据挖掘形式,是在20世纪90年代实践领域诞生的,是在集成数据挖掘算法平台发展的支撑下适合商业分析的一种形式。也许是因为数据挖掘源于 实践而非理论,在其过程的理解上不太引人注意。20世纪90年代晚期发展的CRISP-DM,逐渐成为数据挖掘过程的一种标准化过程,被越来越多的数据挖 掘实践者成功运用和遵循。 虽然CRISP-DM能够指导如何实施数据挖掘,但是它不能解释数据挖
陆勤_数据人网
2018-03-20
1.1K0
【知识】统计学和数据挖掘的区别
小编邀请您,先思考: 1 统计学是什么?为什么用统计学? 2 数据挖掘是什么?为什么用数据挖掘? 1. 简介 统计学和数据挖掘有着共同的目标:发现数据中的结构。事实上,由于它们的目标相似,一些人(尤其
陆勤_数据人网
2018-02-28
7320
【书籍】数据科学经典书籍
数据问题需要数据科学来解决! 什么是数据科学?没有一个统一的定义。简而言之,数据科学就是研究和解决数据问题。 不管你是数据挖掘工程师,还是数据分析师,还是算法工程师,还是数据科学家,归根结底,你每天需要面对和解决一系列有价值的数据问题,通过解决好这些数据问题以创造商业价值。 花时间掌握数据科学,这是值得的投资。 如何掌握和应用数据科学呢?本文介绍两本具有实用性的数据科学经典书籍。所谓实用性,就是您通过阅读它们掌握的数据科学知识,就可以直接应用到您的手头工作(解决您手上的数据问题) 第一本书籍:《Python
陆勤_数据人网
2018-02-28
2.5K0
【机器学习】机器学习面试考察点
从事数据挖掘工作,尤其是在互联网行业,主要需要三个方面的能力,即机器学习和数据挖掘的理论知识、编程开发与数据结构算法的基础和业务理解与沟通表达的能力。 上面的图里列出了这个行业不同类型的从业者机器特点
陆勤_数据人网
2018-02-28
6360
【金融数据】挖掘数据价值,打造智能银行
今天移动互联网正狂飙突进、网上购物平台和网上社交平台也方兴未艾,包括结构化数据、半结构化数据、非结构化数据的大数据爆炸式增长。早在2012年,大数据已经登上美国《纽约时报》的专栏封面,专栏称:“大数据时代已经降临,在商业、经济及其他领域中,决策将日益基于数据和分析,而非基于经验和直觉。”目前银行业在开展业务过程中积累了海量高价值数据,很多银行的数据量级已经超过100TB,其中非结构化正以加速度形式积累。因此,不管传统银行业是拥抱还是抗拒,大数据时代已经呼啸而来。 深刻理解大数据的特征 转变观念,重视大数据的
陆勤_数据人网
2018-02-27
1.1K0
【数据挖掘】用文本挖掘和机器学习洞悉数据
文本挖掘是对包含于自然语言文本中数据的分析。它可以帮组一个组织从基于文本的内容中获得潜在的有价值的业务洞察力,比如Word文档,邮件和社交媒体流中发布的帖子,如Facebook,Twitter,和LinkedIn。对于机器学习技术中信息检索和自然语言处理的应用而言,文本挖掘已经成为一个重要的研究领域。在某种意义上,它被定义为在无处不在的文本中发现知识的方式,而这些文本可以在网络上轻易获取。 文本挖掘是一个包含几个步骤的过程。 第一步:适合应用的文档一般是确定的大量文本数据。文档聚类方法经常用语解决“大量”这
陆勤_数据人网
2018-02-27
7200
【数据挖掘】聚类算法总结
一、层次聚类 1、层次聚类的原理及分类 1)层次法(Hierarchicalmethods)先计算样本之间的距离。每次将距离最近的点合并到同一个类。然后,再计算类与类之间的距离,将距离最近的类合并为一个大类。不停的合并,直到合成了一个类。其中类与类的距离的计算方法有:最短距离法,最长距离法,中间距离法,类平均法等。比如最短距离法,将类与类的距离定义为类与类之间样本的最短距离。 层次聚类算法根据层次分解的顺序分为:自下底向上和自上向下,即凝聚的层次聚类算法和分裂的层次聚类算法(agglomerative和di
陆勤_数据人网
2018-02-27
2.5K0
【数据挖掘】模型、工具、统计、挖掘与展现
1. 数据分析多层模型介绍 这个金字塔图像是数据分析的多层模型,从下往上一共有六层: 底下第一层称为Data Sources 元数据层。 比如说在生产线上,在生产的数据库里面,各种各样的数据,可能是银
陆勤_数据人网
2018-02-27
1.6K0
【深度学习】Yelp是如何使用深度学习对商业照片进行分类的
Yelp是美国最大点评网站,拥有世界各地的Yelper上传的成千上万的照片。各种各样的照片给进入当地的商业提供了一个丰富的窗口。通过开发一个照片理解系统使Yelp能够创建有关个人照片的语义数据。跟Yelp第一次在基于内容的照片多样化方面所做的尝试一样,由系统生成的数据正在增强Yelp近期推出的封面照片多样化、标签式照片浏览等服务。 构建一个照片分类器 对于理解照片中的模棱两可的目标,其实有许多不同的方式。一开始,为了帮助简化Yelp的问题,Yelp只专注于将照片分类为几个预定义的类。之后,Yelp又只专注于
陆勤_数据人网
2018-02-27
1.3K0
【数据挖掘】金融行业的数据挖掘之道
工商银行文本挖掘技术应用探索分享 工商银行在大家传统的印象当中是一个体形非常庞大但是稳步前行的形象,但是近些年来在大数据的挑战下工商银行积极应对外界变化,做一些转型。其中一个举措就是通过数据应用驱动业务变革。今天我所分享的主题就是和银行的客户服务相关的,如何应用文本挖掘技术洞察客户的心声。 工商银行每天都在面临着来自各方的海量的客户心声,最近我们的95588接到这样一个来电,李先生做了一笔跨行汇款操作,对方还没有收到,他来询问什么时候可以到帐,这是一个典型的咨询。客户王先生是一个贵宾客户,他来电反映说在机场
陆勤_数据人网
2018-02-27
1.1K0
【数据挖掘】常用的数据挖掘方法
数据挖掘又称数据库中的知识发现,是目前人工智能和数据库领域研究的热点问题,所谓数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程 利用数据挖掘进行数据分析常用的方法主要有分类、回归分析、聚类、关联规则、特征、变化和偏差分析、Web页挖掘等, 它们分别从不同的角度对数据进行挖掘。 ① 分类。分类是找出数据库中一组数据对象的共同特点并按照分类模式将其划分为不同的类,其目的是通过分类模型,将数据库中的数据项映射到某个给定的类别。 它可以应用到客户的分类、客户的属性和特征分析、客
陆勤_数据人网
2018-02-27
2.7K0
【数据挖掘】从拉勾网“数据挖掘”招聘数据透视中国大数据产业【案例】
自问自答的问题,缘起是因为数据挖掘入行不久,一直上拉勾网看各种公司的招聘JD,人工看一方面是时间很消耗,更严重的是抓不住重点,最近刚好入手python爬虫,试图简化这部分工作。另一方面学习爬虫之后,发现自己整天上网手动翻网页找信息这个动作很low,所以花了两天的时间连爬取带写文档。文档中同时附上github代码,各位想上手python的童鞋可以下载玩一下,(自知代码粗浅,大牛求放过~) 工具:windows7,python3.4,IDE PyCharm 4.5 Python代码: 抓取 https://
陆勤_数据人网
2018-02-27
6660
【Python环境】python的Orange包实现机器学习与数据挖掘的分类问题
Orange是Python语言中一个强大的机器学习包,主要用于实现数据挖掘和有监督的机器学习,包括分类,回归等等。在Orange的使用过程中并不需要用户像使用Sklearn那样记性复杂的参数设置,甚至进行必要的参数优化(尽管我们必须承认这些功能有时候是很有用,而且在Sklearn中是相当强大的),但是对于一些初学者尤其是没有编程基础的生物学专业的用户来说,一种简单有效,且适用性强的数据挖掘方法才是真正被需要的。因此今天我们就以Orange为例,为大家介绍一下如何通过Orange来解决数据分类预测的问题。 第
陆勤_数据人网
2018-02-27
2.5K0
【数据挖掘】互联网和金融,在数据挖掘上究竟存在什么样的区别?
---- 在银行做了两年的数据分析和挖掘工作,较少接触互联网的应用场景,因此,一直都在思考一个问题,“互联网和金融,在数据挖掘上,究竟存在什么样的区别”。在对这个问题的摸索和理解过程中,发现数据挖掘本
陆勤_数据人网
2018-02-27
5540
【大数据分析】大数据分析方法 及 相关工具
要知道,大数据已不再是数据大,最重要的现实就是对大数据进行分析,只有通过分析才能获取很多智能的,深入的,有价值的信息。 越来越多的应用涉及到大数据,这些大数据的属性,包括数量,速度,多样性等等都是呈现
陆勤_数据人网
2018-02-27
3.6K0
【数据挖掘】图数据挖掘
互联网发展至今,数据规模越来越大,数据结构越来越复杂,而且对系统的需求越来越高。如果学习过数据结构,那么都知道图是放在最后一个结构,当你学习了图,那么应该感知到前面的链表,队列,树都是在图上面加了一些约束而派生出来的结构。所以图是一个一般性的结构,可以适应于任何结构类型的数据。那么图数据挖掘是干什么的呢?难道是开着挖掘机来进行挖掘?还是扛着锄头?下面讲讲什么是图数据挖掘。 一、什么是图数据挖掘 这个话题感觉比较沉重,以至于我敲打每个字都要犹豫半天,这里我说说我对图数据挖掘的理解。数据是一个不可数名字,那么说
陆勤_数据人网
2018-02-27
2.4K0
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档