首页
学习
活动
专区
工具
TVP
发布

华章科技

专栏成员
2207
文章
2438172
阅读量
126
订阅数
详解数据科学与数理统计的基本概念
随着计算机技术的发展和有用数据的快速增多,数据科学应运而生。数据科学的总体目标是在已有数据集的基础上,通过特定的算法提取信息,并将其转化为可理解的知识以辅助做决策。
IT阅读排行榜
2022-03-11
5390
终于有人把数据挖掘讲明白了
导读:数据挖掘是一种发现知识的手段。数据挖掘要求数据分析师通过合理的方法,从数据中获取与挖掘项目相关的知识。
IT阅读排行榜
2021-11-25
8780
手把手教你用Python进行帕累托分析(二八定律)
导读:本文带你用Python进行贡献度分析。贡献度分析又称帕累托分析,它的原理是帕累托法则,又称20/80定律。
IT阅读排行榜
2020-11-16
1.6K0
手把手教你用直方图、饼图和条形图做数据分析(Python代码)
对于定量数据,要想了解其分布形式是对称的还是非对称的、发现某些特大或特小的可疑值,可做出频率分布表、绘制频率分布直方图、绘制茎叶图进行直观分析;对于定性数据,可用饼图和条形图直观地显示其分布情况。
IT阅读排行榜
2020-06-18
1.8K0
什么是脏数据?怎样用箱形图分析异常值?终于有人讲明白了
导读:数据质量分析是数据挖掘中数据准备过程的重要一环,是数据预处理的前提,也是数据挖掘分析结论有效性和准确性的基础。没有可信的数据,数据挖掘构建的模型将是空中楼阁。
IT阅读排行榜
2020-06-01
6K0
世界一流大学的计算机专业,在用哪些书当教材?
清华、北大、MIT、CMU、斯坦福的学霸们在新学期里要学什么?数据叔决定盘点一下那些世界名校计算机专业采用的教材。不用多说,每本都是经典的烧脑技术书,建议配合防脱发产品一起食用。
IT阅读排行榜
2020-05-21
3.3K0
大数据杀熟又来了?千人千面的个性化推荐,你喜欢吗?
大数据、人工智能等技术的进步让千人千面的得以实现——个性化的商品推荐,甚至是个性化的价格。
IT阅读排行榜
2020-03-17
8680
学霸们宅家偷偷看的硬核神书,你读过几本?
春暖花开的日子就要来了,珍惜你的宅家时光吧。趁现在,还来得及认真啃下一本有技术含量的“瑰宝”级神书。开启你的烧脑之旅吧~
IT阅读排行榜
2020-03-11
5350
一文看懂数据预处理最重要的3种思想和方法
导读:本文我们考虑应当采用哪些预处理步骤,让数据更加适合挖掘。数据预处理是一个广泛的领域,包含大量以复杂的方式相关联的不同策略和技术。我们将讨论一些最重要的思想和方法,并试图指出它们之间的相互联系。
IT阅读排行榜
2020-02-24
1.2K0
百亿身家中年男子告别房地产转行学Python,我们推荐他读这6本书
导读:几天前,数据叔在界面新闻看到这样一个标题:《【深度】潘石屹张欣彻底告别房地产》。数据叔当时还纳闷,潘老板告别房地产之后要去做什么呢?如今终于有了答案:
IT阅读排行榜
2019-11-18
7200
分析周杰伦75775字歌词后,我们用他最爱的词重写了《说好不哭》
有人觉得,听着这首歌,仿佛自己的青春岁月回来了,说好不哭,可还是哭了下来,那个周杰伦又回来了!
IT阅读排行榜
2019-10-15
6620
身高2m,体重2kg,这样的数据“看上去很好”?
导读:数据挖掘算法通常用于为其他目的收集的数据,或者在收集时未明确其目的。因此,数据挖掘常常不能“在数据源头控制质量”。相比之下,统计学的实验设计或调查中,其数据质量往往都达到了一定的要求。由于无法避免数据质量问题,因此数据挖掘着眼于两个方面:
IT阅读排行榜
2019-09-02
5280
漫话:如何给女朋友解释什么是"大案牍术"?
导读:听说最近《长安十二时辰》比较火,于是趁着一个周末赶紧补一补剧。相信很多人都对其中的"大案牍术"比较感兴趣。
IT阅读排行榜
2019-07-30
1.1K0
「最有用」的特殊大数据:一文看懂文本信息系统的概念框架及功能
目前,我们正处在一个以大数据与人工智能技术为核心的新的工业革命时代,其主要特征是大量各种可利用的数据可以视为一种特殊的生产资料,经过高效的智能数据分析与挖掘以及机器学习等人工智能技术处理后,这些数据可以产生巨大价值,创造智能。
IT阅读排行榜
2019-07-17
8550
爬取吴亦凡微博102118条转发数据,扒一扒流量的真假
导读:“你看这个面它又长又宽,就像这个碗它又大又圆”。一直被网友们调侃的freestyle梗,没想到真的被说唱导师吴亦凡写成了自黑的歌——《大碗宽面》。由于时间点也挺凑巧,刚好赶在蔡徐坤发律师函给哔哩哔哩之后,不禁让大家对他们进行一番对比。
IT阅读排行榜
2019-05-13
7570
手把手教你挖掘数据:怎样创造一个“尿布与啤酒”的都市传奇?
也有很多人对这个“传奇”的真实性表示怀疑,但如今看来,这个传奇已经并不神奇,它只是通过频繁项集进行数据挖掘的一个典型案例而已。
IT阅读排行榜
2019-05-13
5680
什么是机器学习?有哪些算法和分类?又有哪些应用?看完你就懂了
导读:本文从大数据的概念讲起,主要介绍机器学习的基础概念,以及机器学习的发展过程,用一个形象的例子讲解大数据生态中的机器学习,并按照传统机器学习(包括分类、聚类、回归、关联规则、协同过滤、数据降维等)、深度学习,以及其他机器学习(迁移学习、主动学习、演化学习)进行算法讲解。
IT阅读排行榜
2019-04-24
12.9K0
ScholarRanking中国高校计算机学科排名:第2名你绝对想不到
导读:由中国人民大学孟小峰团队开发的ScholarSpace(C-DBLP)系统上线十年以来,一直致力于中文论文的数据融合,目前已达25个学科上百万论文。本次参考MIT计算机学科排名计算方法和发布结果,结合ScholarSpace计算机学科中文十一大期刊给出国内计算机十个领域的排名ScholarRanking,供大家参考。
IT阅读排行榜
2019-03-12
5320
灵魂画手一图解读:成为数据分析师的必备能力项
上周末晚上,我的学妹突然约我出来喝咖啡,我觉得这件事情不简单,果然一到她就递给我手机,开口就问:
IT阅读排行榜
2018-10-25
5780
终于有人把数据、信息、算法、统计、概率和数据挖掘都讲明白了!
导读:数据与数据应用中的许多概念彼此有着千丝万缕的联系,同时也有着概念上的偏重与区别,那我们可以先从数据应用领域中的常见概念先聊起。
IT阅读排行榜
2018-09-29
6820
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档