首页
学习
活动
专区
工具
TVP
发布

PPV课数据科学社区

专栏作者
2119
文章
2435785
阅读量
187
订阅数
连载 | 概率论与数理统计(2) – 随机变量概述
作者:Belter。专注于生物方向的数据分析,一位编程爱好者。关注Python, R和大数据。
小莹莹
2018-07-24
7510
一文总结学习 Python 的 14 张思维导图
本文主要涵盖了 Python 编程的核心知识(暂不包括标准库及第三方库,后续会发布相应专题的文章)。
小莹莹
2018-07-24
4850
[职业]数据科学领域的职位划分以及职责技能
随着数据科学领域的招聘信息越来越多,范围也越来越广.Datacamp根据最新的数据科学相关招聘信息,全面的了解各个行业之间数据科学领域每个职位角色之间的差异,以及所赋予的工作职责。 最主要分为以下几
小莹莹
2018-04-25
1K0
[工具]7个应知的Python库
在我多年的Python编程生涯中,以及在GitHub上探索漫游,我碰到了一些库,用起来特别愉快,这篇文章,就是来扩散这方面的知识。我决定排除很优秀的几个库,像 requests,SQLAlchemy,Flask,fabric等等。因为我认为它们已经相当流行。你可能正在使用这些库在做你的事情。下面列表中的几个库,我认为应当被大家知道,但还没有。 1、pyquery(with lxml) pip install pyquery 在Python中解析HTML,Beautiful Soup经常被推荐,而且它的确
小莹莹
2018-04-25
6370
数据加学堂:大熊学python3爬虫–scrapy浅探(三)
在新手上路(三)贴过一段代码,就是爬取问吧里面的question 问题,answer回答,topic话题标签,source问题来自哪个板块。 有一种有一种感觉就是被折腾的不要不要的,DataFrame
小莹莹
2018-04-25
5880
大熊学python3爬虫–scrapy浅探(一)
在介绍scrapy之前,我觉得简单介绍下python的class很有必要。 class cainiao: def __init__(self,course,study): # 亲 左右均两个_
小莹莹
2018-04-25
5160
数据咖学堂:大熊学python3爬虫–scrapy浅探(二)
尽管介绍scrapy的博文什么的都比较多,然而基本千篇一律,确实不好找到自己想要的,摸索了一天摸出了些头绪,下面我会把遇到的问题贴出来,并简单摸索下常见错误。 scrapy 安装完之后,有个bug大家
小莹莹
2018-04-25
6560
您知道 ”学习 Python 的三种境界“是什么吗?看~这里有答案!
前言 王国维在《人间词话》中将读书分为了三种境界:“古今之成大事业、大学问者,必经过三种之境界:‘昨夜西风凋碧树,独上高楼,望尽天涯路’。此第一境也。‘衣带渐宽终不悔,为伊消得人憔悴。’此第二境也。‘众里寻他千百度,蓦然回首,那人却在灯火阑珊处’。此第三境也。我从入门Python到现在也没有多少时间,所以写如此大的一个题目必定会引发各种批判,当然我没有想造一个大新闻,只是想根据自己的学习历程做一个简单的总结,同时将这三个阶段对应的一些好的书籍简单介绍介绍。 正文 Python的用途十分广泛,不同的程序员将其
小莹莹
2018-04-25
9610
【技术】Python开源爬虫项目代码:抓取淘宝、京东、QQ、知网数据
scrapy_jingdong[9]- 京东爬虫。基于scrapy的京东网站爬虫,保存格式为csv。[9]: https://github.com/taizilongxu/scrapy_jingdong QQ-Groups-Spider[10]- QQ 群爬虫。批量抓取 QQ 群信息,包括群名称、群号、群人数、群主、群简介等内容,最终生成 XLS(X) / CSV 结果文件。[10]: https://github.com/caspartse/QQ-Groups-Spider wooyun_public
小莹莹
2018-04-24
2.5K0
撩图 | 数据科学最受欢迎的工具
编者按: 1)并不是所有工具都要学习,一般入门熟练掌握1个,进阶掌握2-3个即可; 2)下图是不是知识的学习顺序,而是从薪酬待遇进阶方面考虑的;你也不必要从第一个工具开始。 最受欢迎的工具 调查显示,最受欢迎的工具是Excel和SQL(69%),接下来是R(57%)以及Python(54%)。超过90%的被调查者表示会花时间在编码上,80%至少会Python、R以及Java中的一种,8%的人会使用全部三种语言。上述的常见工具在模型中都转化为了独立系数,Python、JavaScript、Excel的系数分别
小莹莹
2018-04-24
7250
【工具】深入对比数据科学工具箱:Python和R之争
文章目录 概述 应用场景对比 应用Python的场景 应用R的场景 数据流编程对比 参数传递 数据传输与解析 基本数据结构 MapReduce 矩阵操作 数据框操作 数据流编程对比的示例 数据可视化对
小莹莹
2018-04-24
1.3K0
AI时代就业指南:数据分析师成长之路
本文分享文档是2017年4月23日在南山云谷举行的《未来已来:AI时代就业指南》沙龙活动嘉宾陈丹奕的《数据分析的成长之路》,查看活动回顾。 今日来分享数据分析的意义,职业规划以及数据分析的方法论和能力
小莹莹
2018-04-24
8400
技术 | R vs Python:R是现在最好的数据科学语言吗?
导读 Sharp Sight Labs 近日在 r-bloggers 上发表了一篇文章,论述了为什么当今的数据科学工作者应该学习 R 语言的原因。为了给大家提供一个明晰的对比,我们在后面补充了 2016 年初的一篇文章:R vs.Python。 在前一段时间的博客中,我解释了为什么你应该掌握 R 语言(即便它最终可能过时)。我写这篇文章是为了向那些声称掌握 R 语言浪费时间的人致辞。(因为它最终会变得过时)。 但是当我认为 R 语言最终会变得过时时,这似乎引起了恐惧——仿佛 R 语言已经过时了。 我想要消除
小莹莹
2018-04-24
1.1K0
Apriori算法介绍(Python实现)
导读: 随着大数据概念的火热,啤酒与尿布的故事广为人知。我们如何发现买啤酒的人往往也会买尿布这一规律?数据挖掘中的用于挖掘频繁项集和关联规则的Apriori算法可以告诉我们。本文首先对Apriori算法进行简介,而后进一步介绍相关的基本概念,之后详细的介绍Apriori算法的具体策略和步骤,最后给出Python实现代码。 1.Apriori算法简介 Apriori算法是经典的挖掘频繁项集和关联规则的数据挖掘算法。A priori在拉丁语中指”来自以前”。当定义问题时,通常会使用先验知识或者假设,这被称作
小莹莹
2018-04-24
1.8K0
工具 | 15个排名最佳的数据科学Python包
排名 Python 和 R 语言是数据科学中最常见、最受欢迎的工具之一。而且因为 Python 的简单易用,相对其他语言,我们可以使用更少的代码就能表达大多数概念。 这也就正是为什么我们希望通过给出最
小莹莹
2018-04-24
1.1K0
编程 | 用python获取天气数据,并作定时播报
思路 1.调用和风天气的API,获取天气数据 2.用百度语音API,将天气数据合成语音 3.用树莓派每天早上定时播报天气(定时任务crontab + Python脚本 + mpg123播放器) Pyt
小莹莹
2018-04-24
1.7K0
python文本相似度计算
步骤 分词、去停用词 词袋模型向量化文本 TF-IDF模型向量化文本 LSI模型向量化文本 计算相似度 理论知识 两篇中文文本,如何计算相似度?相似度是数学上的概念,自然语言肯定无法完成,所有要把文本转化为向量。两个向量计算相似度就很简单了,欧式距离、余弦相似度等等各种方法,只需要中学水平的数学知识。 那么如何将文本表示成向量呢? 词袋模型 最简单的表示方法是词袋模型。把一篇文本想象成一个个词构成的,所有词放入一个袋子里,没有先后顺序、没有语义。
小莹莹
2018-04-24
2.6K0
只需七步就能掌握Python数据准备
摘要: 本文主要讲述了如何在python中用七步就能完成中数据准备。 上图为CRISP-DM模型中的数据准备   下面七个步骤涵盖了数据准备的概念,个别任务以及从Python生态系统中处理整个任务过程的不同方法。 维基百科将数据清洗定义为:   它是从记录集、表或者数据库检测和更正(或删除)损坏或不正确的记录的过程。指的是识别数据的不完整、不正确、不准确或不相关的部分,然后替换、修改或删除它们。数据清洗(data cleaning)可以与数据整理(data wrangling)的工具交互执行,也
小莹莹
2018-04-24
1.6K0
进阶篇:从 0 到 1 掌握 Python 机器学习(附资源)
进阶篇 机器学习算法 本篇是使用 Python 掌握机器学习的 7 个步骤系列文章的下篇,如果你已经学习了该系列的上篇基础篇:从 0 到 1 掌握 Python 机器学习(附资源),那么应该达到了令人
小莹莹
2018-04-24
8710
基础篇:从 0 到 1 掌握 Python 机器学习(附资源)
Python 可以说是现在最流行的机器学习语言,而且你也能在网上找到大量的资源。你现在也在考虑从 Python 入门机器学习吗?本教程或许能帮你成功上手,从 0 到 1 掌握 Python 机器学习,至于后面再从 1 到 100 变成机器学习专家,就要看你自己的努力了。本教程原文分为两个部分,机器之心在本文中将其进行了整合,原文可参阅:http://suo.im/KUWgl 和 http://suo.im/96wD3。本教程的作者为 KDnuggets 副主编兼数据科学家 Matthew Mayo。 「开始
小莹莹
2018-04-24
7780
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档