腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
PPV课数据科学社区
专栏成员
举报
2119
文章
2529150
阅读量
188
订阅数
订阅专栏
申请加入专栏
全部文章(999+)
大数据(882)
数据分析(506)
其他(333)
数据挖掘(193)
机器学习(184)
编程算法(167)
人工智能(159)
python(130)
数据库(116)
r 语言(101)
数据可视化(81)
存储(72)
深度学习(66)
hadoop(66)
安全(59)
数据处理(42)
游戏(39)
微信(36)
sas(33)
开源(31)
java(27)
神经网络(27)
sql(25)
NLP 服务(22)
apache(22)
爬虫(22)
自动化(20)
机器人(20)
物联网(20)
spark(19)
搜索引擎(18)
分布式(17)
数据结构(17)
推荐系统(16)
线性回归(16)
tensorflow(15)
决策树(14)
ios(12)
云数据库 SQL Server(11)
nosql(11)
php(10)
android(10)
hbase(10)
互联网金融(9)
区块链(7)
mapreduce(7)
电商(7)
黑客(7)
https(7)
人脸识别(6)
matlab(6)
图像识别(6)
卷积神经网络(6)
hive(6)
监督学习(6)
比特币(5)
git(5)
erp(5)
numpy(5)
互联网(5)
自动驾驶(4)
oracle(4)
github(4)
api(4)
企业(4)
运维(4)
scrapy(4)
nat(4)
it(4)
javascript(3)
.net(3)
postgresql(3)
mongodb(3)
图像处理(3)
网站(3)
无人驾驶(3)
gui(3)
sql server(3)
seo(3)
keras(3)
迁移学习(3)
windows(3)
云计算(3)
excel(3)
程序员(3)
数据科学(3)
iphone(2)
ruby(2)
react(2)
json(2)
access(2)
TDSQL MySQL 版(2)
知识图谱(2)
o2o(2)
http(2)
互联网医疗(2)
网络安全(2)
强化学习(2)
pytorch(2)
scikit-learn(2)
模式识别(2)
无监督学习(2)
facebook(2)
架构师(2)
快捷键(2)
数学(2)
图表(2)
数字货币(1)
swift(1)
c++(1)
perl(1)
lua(1)
node.js(1)
html(1)
ajax(1)
嵌入式(1)
mvc(1)
打包(1)
ide(1)
sphinx(1)
linux(1)
unix(1)
云直播(1)
腾讯云测试服务(1)
es 2(1)
DevOps 解决方案(1)
金融(1)
出行(1)
大数据解决方案(1)
智能硬件(1)
工业物联(1)
express(1)
sass(1)
缓存(1)
shell(1)
html5(1)
jvm(1)
正则表达式(1)
面向对象编程(1)
dns(1)
hashmap(1)
openstack(1)
二叉树(1)
flash(1)
敏捷开发(1)
ntp(1)
anaconda(1)
系统架构(1)
架构设计(1)
信息流(1)
虚拟化(1)
特征工程(1)
学习方法(1)
验证码(1)
智能推荐平台(1)
汽车(1)
教育(1)
anova(1)
app(1)
aws(1)
bat(1)
dt(1)
export(1)
logic(1)
offset(1)
point(1)
project(1)
prompt(1)
shift(1)
stackoverflow(1)
t4(1)
ui(1)
whatsapp(1)
wifi(1)
word(1)
x11(1)
xls(1)
编程(1)
翻译(1)
行业(1)
流量(1)
软件开发(1)
手机(1)
数据(1)
腾讯(1)
搜索文章
搜索
搜索
关闭
连载 | 概率论与数理统计(2) – 随机变量概述
数据分析
python
大数据
作者:Belter。专注于生物方向的数据分析,一位编程爱好者。关注Python, R和大数据。
小莹莹
2018-07-24
806
0
一文总结学习 Python 的 14 张思维导图
python
面向对象编程
本文主要涵盖了 Python 编程的核心知识(暂不包括标准库及第三方库,后续会发布相应专题的文章)。
小莹莹
2018-07-24
501
0
[职业]数据科学领域的职位划分以及职责技能
python
sas
数据分析
随着数据科学领域的招聘信息越来越多,范围也越来越广.Datacamp根据最新的数据科学相关招聘信息,全面的了解各个行业之间数据科学领域每个职位角色之间的差异,以及所赋予的工作职责。 最主要分为以下几
小莹莹
2018-04-25
1.1K
0
[工具]7个应知的Python库
python
在我多年的Python编程生涯中,以及在GitHub上探索漫游,我碰到了一些库,用起来特别愉快,这篇文章,就是来扩散这方面的知识。我决定排除很优秀的几个库,像 requests,SQLAlchemy,Flask,fabric等等。因为我认为它们已经相当流行。你可能正在使用这些库在做你的事情。下面列表中的几个库,我认为应当被大家知道,但还没有。 1、pyquery(with lxml) pip install pyquery 在Python中解析HTML,Beautiful Soup经常被推荐,而且它的确
小莹莹
2018-04-25
656
0
数据加学堂:大熊学python3爬虫–scrapy浅探(三)
python
爬虫
scrapy
在新手上路(三)贴过一段代码,就是爬取问吧里面的question 问题,answer回答,topic话题标签,source问题来自哪个板块。 有一种有一种感觉就是被折腾的不要不要的,DataFrame
小莹莹
2018-04-25
599
0
大熊学python3爬虫–scrapy浅探(一)
python
爬虫
scrapy
人工智能
linux
在介绍scrapy之前,我觉得简单介绍下python的class很有必要。 class cainiao: def __init__(self,course,study): # 亲 左右均两个_
小莹莹
2018-04-25
534
0
数据咖学堂:大熊学python3爬虫–scrapy浅探(二)
python
尽管介绍scrapy的博文什么的都比较多,然而基本千篇一律,确实不好找到自己想要的,摸索了一天摸出了些头绪,下面我会把遇到的问题贴出来,并简单摸索下常见错误。 scrapy 安装完之后,有个bug大家
小莹莹
2018-04-25
671
0
您知道 ”学习 Python 的三种境界“是什么吗?看~这里有答案!
python
前言 王国维在《人间词话》中将读书分为了三种境界:“古今之成大事业、大学问者,必经过三种之境界:‘昨夜西风凋碧树,独上高楼,望尽天涯路’。此第一境也。‘衣带渐宽终不悔,为伊消得人憔悴。’此第二境也。‘众里寻他千百度,蓦然回首,那人却在灯火阑珊处’。此第三境也。我从入门Python到现在也没有多少时间,所以写如此大的一个题目必定会引发各种批判,当然我没有想造一个大新闻,只是想根据自己的学习历程做一个简单的总结,同时将这三个阶段对应的一些好的书籍简单介绍介绍。 正文 Python的用途十分广泛,不同的程序员将其
小莹莹
2018-04-25
977
0
【技术】Python开源爬虫项目代码:抓取淘宝、京东、QQ、知网数据
python
开源
爬虫
scrapy_jingdong[9]- 京东爬虫。基于scrapy的京东网站爬虫,保存格式为csv。[9]: https://github.com/taizilongxu/scrapy_jingdong QQ-Groups-Spider[10]- QQ 群爬虫。批量抓取 QQ 群信息,包括群名称、群号、群人数、群主、群简介等内容,最终生成 XLS(X) / CSV 结果文件。[10]: https://github.com/caspartse/QQ-Groups-Spider wooyun_public
小莹莹
2018-04-24
2.5K
0
撩图 | 数据科学最受欢迎的工具
python
java
编者按: 1)并不是所有工具都要学习,一般入门熟练掌握1个,进阶掌握2-3个即可; 2)下图是不是知识的学习顺序,而是从薪酬待遇进阶方面考虑的;你也不必要从第一个工具开始。 最受欢迎的工具 调查显示,最受欢迎的工具是Excel和SQL(69%),接下来是R(57%)以及Python(54%)。超过90%的被调查者表示会花时间在编码上,80%至少会Python、R以及Java中的一种,8%的人会使用全部三种语言。上述的常见工具在模型中都转化为了独立系数,Python、JavaScript、Excel的系数分别
小莹莹
2018-04-24
738
0
【工具】深入对比数据科学工具箱:Python和R之争
python
r 语言
文章目录 概述 应用场景对比 应用Python的场景 应用R的场景 数据流编程对比 参数传递 数据传输与解析 基本数据结构 MapReduce 矩阵操作 数据框操作 数据流编程对比的示例 数据可视化对
小莹莹
2018-04-24
1.4K
0
AI时代就业指南:数据分析师成长之路
人工智能
数据分析
python
本文分享文档是2017年4月23日在南山云谷举行的《未来已来:AI时代就业指南》沙龙活动嘉宾陈丹奕的《数据分析的成长之路》,查看活动回顾。 今日来分享数据分析的意义,职业规划以及数据分析的方法论和能力
小莹莹
2018-04-24
853
0
技术 | R vs Python:R是现在最好的数据科学语言吗?
python
r 语言
导读 Sharp Sight Labs 近日在 r-bloggers 上发表了一篇文章,论述了为什么当今的数据科学工作者应该学习 R 语言的原因。为了给大家提供一个明晰的对比,我们在后面补充了 2016 年初的一篇文章:R vs.Python。 在前一段时间的博客中,我解释了为什么你应该掌握 R 语言(即便它最终可能过时)。我写这篇文章是为了向那些声称掌握 R 语言浪费时间的人致辞。(因为它最终会变得过时)。 但是当我认为 R 语言最终会变得过时时,这似乎引起了恐惧——仿佛 R 语言已经过时了。 我想要消除
小莹莹
2018-04-24
1.1K
0
Apriori算法介绍(Python实现)
python
大数据
数据挖掘
编程算法
导读: 随着大数据概念的火热,啤酒与尿布的故事广为人知。我们如何发现买啤酒的人往往也会买尿布这一规律?数据挖掘中的用于挖掘频繁项集和关联规则的Apriori算法可以告诉我们。本文首先对Apriori算法进行简介,而后进一步介绍相关的基本概念,之后详细的介绍Apriori算法的具体策略和步骤,最后给出Python实现代码。 1.Apriori算法简介 Apriori算法是经典的挖掘频繁项集和关联规则的数据挖掘算法。A priori在拉丁语中指”来自以前”。当定义问题时,通常会使用先验知识或者假设,这被称作
小莹莹
2018-04-24
1.8K
0
工具 | 15个排名最佳的数据科学Python包
python
r 语言
排名 Python 和 R 语言是数据科学中最常见、最受欢迎的工具之一。而且因为 Python 的简单易用,相对其他语言,我们可以使用更少的代码就能表达大多数概念。 这也就正是为什么我们希望通过给出最
小莹莹
2018-04-24
1.2K
0
编程 | 用python获取天气数据,并作定时播报
python
数据分析
思路 1.调用和风天气的API,获取天气数据 2.用百度语音API,将天气数据合成语音 3.用树莓派每天早上定时播报天气(定时任务crontab + Python脚本 + mpg123播放器) Pyt
小莹莹
2018-04-24
1.7K
0
python文本相似度计算
python
步骤 分词、去停用词 词袋模型向量化文本 TF-IDF模型向量化文本 LSI模型向量化文本 计算相似度 理论知识 两篇中文文本,如何计算相似度?相似度是数学上的概念,自然语言肯定无法完成,所有要把文本转化为向量。两个向量计算相似度就很简单了,欧式距离、余弦相似度等等各种方法,只需要中学水平的数学知识。 那么如何将文本表示成向量呢? 词袋模型 最简单的表示方法是词袋模型。把一篇文本想象成一个个词构成的,所有词放入一个袋子里,没有先后顺序、没有语义。
小莹莹
2018-04-24
2.6K
0
只需七步就能掌握Python数据准备
python
数据库
自动化
数据可视化
摘要: 本文主要讲述了如何在python中用七步就能完成中数据准备。 上图为CRISP-DM模型中的数据准备 下面七个步骤涵盖了数据准备的概念,个别任务以及从Python生态系统中处理整个任务过程的不同方法。 维基百科将数据清洗定义为: 它是从记录集、表或者数据库检测和更正(或删除)损坏或不正确的记录的过程。指的是识别数据的不完整、不正确、不准确或不相关的部分,然后替换、修改或删除它们。数据清洗(data cleaning)可以与数据整理(data wrangling)的工具交互执行,也
小莹莹
2018-04-24
1.6K
0
进阶篇:从 0 到 1 掌握 Python 机器学习(附资源)
python
机器学习
编程算法
安全
进阶篇 机器学习算法 本篇是使用 Python 掌握机器学习的 7 个步骤系列文章的下篇,如果你已经学习了该系列的上篇基础篇:从 0 到 1 掌握 Python 机器学习(附资源),那么应该达到了令人
小莹莹
2018-04-24
903
0
基础篇:从 0 到 1 掌握 Python 机器学习(附资源)
python
机器学习
数据分析
Python 可以说是现在最流行的机器学习语言,而且你也能在网上找到大量的资源。你现在也在考虑从 Python 入门机器学习吗?本教程或许能帮你成功上手,从 0 到 1 掌握 Python 机器学习,至于后面再从 1 到 100 变成机器学习专家,就要看你自己的努力了。本教程原文分为两个部分,机器之心在本文中将其进行了整合,原文可参阅:http://suo.im/KUWgl 和 http://suo.im/96wD3。本教程的作者为 KDnuggets 副主编兼数据科学家 Matthew Mayo。 「开始
小莹莹
2018-04-24
808
0
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
立即查看
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档