首页
学习
活动
专区
工具
TVP
发布

数说工作室

专栏作者
214
文章
365837
阅读量
70
订阅数
AAAI 2019 争议事件、互联网大佬悼念金庸、谷歌放出 BERT代码... | 段郎一周盘点
本周 AAAI 2019 的录取结果出炉了,投稿量有惊人的7745篇,比去年翻了一倍。16.2%的录取率可以说是创造历史新低(2018年及之前基本都是在24%左右)。
数说君
2018-12-11
6920
计算机大会360高管怒摔话筒、第四范式拒offer事件...... | 段郎一周盘点
本周 Github 上了两次热点,一次是微软官宣完成75亿美元对它的收购,注意这次宣布的是 “完成” 收购,因为这一收购早在6月份就已经开始了。
数说君
2018-12-05
8180
3行代码实现 Python 并行处理,速度提高6倍!
原标题:Here’s how you can get a 2–6x speed-up on your data pre-processing with Python
数说君
2018-10-23
2.1K0
海量文本用 Simhash, 2小时变4秒! | 文本分析:大规模文本处理(2)
这是一个相似匹配的问题(文本相似匹配基础→ 词频与余弦相似度)。但是,亿级数据库,用传统的相似度计算方法太慢了,我们需要一个文本查询方法,可以快速的把一段文本的相似文本查出来。
数说君
2018-08-17
9.1K64
通过逐笔数据计算主力资金流数据 |【量化小讲堂】
1)涉及到的金融学知识 正文对一些概念的解释已经很清楚了,但是对于没有操作过股票的人来说,一些最基本的可能会不太明白,比如市价单、限价单(一个是按实时价格交易,一个是按限定价格交易),还比如五档盘口(长按这里:http://jingyan.baidu.com/article/3aed632e6c0d9d7010809137.html) 2)涉及到的Pandas的一些函数 主要是前几集用到的一些函数,大家可以复习一下前几集。 文前话说完,还没关掉页面的都是真爱,么么哒 ---- 【量化小讲堂-Pyth
数说君
2018-04-08
2.2K0
创业板、市盈率、Python!|【量化小讲堂】计算创业板平均市盈率
数说君的文前话 本文开始正式进入python的金融数据学习,为更好的学习,数说君为大家准备了一些基础知识。 → 如果对python完全不了解,点击这里: 统计师的Python日记【第1天:谁来给我讲讲Python?】 统计师的Python日记【第2天:再接着介绍一下Python呗】 → 本集涉及到的一些知识(您可以先看看,也可以看完原文再回过来按需索取): 1)遍历一个文件夹里的数据文件(如很多csv文件),用 os.walk import os for root, dirs, files in os
数说君
2018-04-08
1K0
什么是维数灾难?
SVM第一话(回复 SVM1 查看)里提到了“维数灾难”,什么是维数灾难呢? 维数灾难(英语:curseof dimensionality,又名维度的诅咒)是一个最早由理查德·贝尔曼(Richard E. Bellman)在考虑动态优化问题时首次提出来的术语,用来描述当(数学)空间维度增加时,分析和组织高维空间(通常有成百上千维),因体积指数增加而遇到各种问题场景。这样的难题在低维空间中不会遇到,如物理空间通常只用三维来建模。 数据的维数越高,会引发灾难,首先是计算量巨大,不用多说。其次,对于已知样本数目,
数说君
2018-04-08
2.8K0
【分类战车SVM】第五话:核函数(哦,这实在太神奇了!)
分类战车SVM (第四话:拉格朗日对偶问题) 转载请注明来源 微信公众号:数说工作室 新浪微博:数说工作室网站 前段时间热映的《星际穿越》想必大家都看过,在这部烧脑大片中,主角库珀进入到了高维度空间
数说君
2018-04-08
7440
这是一份开光的课程 |《神经网络》中文字幕版(1.3 & 1.4)
《Neutral Network for Machine Learning》(机器学习中的神经网络)系列课程,是深度学习大神 Geoffrey Hinton 毕生所学之作,也是他目前唯一一门的公开课。 Hinton 何许人?之前介绍过,他是深度学习的开山祖师,三大巨头(另2位巨头是 Yann LeCun 和 Yoshua Bengio,其中 Yann LeCun 是Facebook的人工智能研究总监,CNN(卷积神经网络)之父,同时也是 Hinton 的学生!)。 金庸小说里常见的桥段是,主角偶然的机
数说君
2018-04-08
6190
这是一份开光的课程 |《神经网络》中文字幕版(2.1 RNN & 2.2 感知机)
《Neutral Network for Machine Learning》(机器学习中的神经网络)系列课程,是深度学习大神 Geoffrey Hinton 毕生所学之作,也是他目前唯一一门的公开课。 Hinton 何许人?之前介绍过,他是深度学习的开山祖师,三大巨头(另2位巨头是 Yann LeCun 和 Yoshua Bengio,其中 Yann LeCun 是Facebook的人工智能研究总监,CNN(卷积神经网络)之父,同时也是 Hinton 的学生!)。 金庸小说里常见的桥段是,主角偶然的机会,
数说君
2018-04-08
6150
【分类战车SVM】附录:用Python做SVM模型
本集目录为: 一、简化版SMO算法 二、LIBSVM包 1.简介 2.数据格式 3.安装 4.简单的使用方法 三、题外话 上一集介绍了SMO的算法原理,本集是《分类战车SVM》系列的最后一个,介绍如何用代码实现,给出了简化版的SMO代码,以及LIBSVM的使用方法。 前面6集可以在微信公众号“数说工作室”(搜不到就搜微信号“shushuojun”)中回复“SVM1”(开题话)、“SVM2”(线性分类)、“SVM3”(最大间隔分类器)、“SVM4”(拉格朗日对偶问题)、“SVM5”(核函数)
数说君
2018-04-08
1K0
用【机器学习】来研究【机器学习】:SVM为最热门研究主题,Python超越SAS和R
前几天BAT齐聚深圳,机器学习、人工智能成了热门话题。有人问我,机器学习这么逆天,怎么不用来学习学习“自己”(指机器学习本身)呢? 别急,今天介绍两个研究,都是分析“自己”的: 一个是对招聘网站上数据分析工具出现的数量进行统计分析,得出数据分析软件的热门排名; 一个是对54000篇关于机器学习的论文的摘要进行文本分析,得出机器学习领域中排名前10 的研究主题 1. Python的热度已经远超R和SAS 《R for SAS and SPSS Users》的作者Bob Muenchun,近日在他的个人
数说君
2018-04-08
7550
7个技巧,讲数据故事 | 数说 · 精选
数据分析师,不仅在于“数据”,更在于“分析”,用数据讲故事的能力非常重要。 英国著名物理学家法拉第,他发现了电磁感应现象,提出电磁学说的基本理论,奠定了现代电工学的基础。可惜,他不善表达,文字晦涩、又缺乏数学说明,因此他的一系列重大发现在当时并没有吸引太多注意,直到麦克斯韦用流畅的语言和数学公式加以概括总结之后,电磁学说才得到世界的公认。 U&*(^&*^&*sjdadjal...... 数说君想说的是,讲故事的技巧,对一个数据分析师来说多么重要! 本文用一个同一个例子,展示7种不同的叙述技巧,一起来学习
数说君
2018-04-08
5670
学习Python 的7个理由
原文:7 Reasons You Should Learn Python Now (https://dzone.com/articles/7-reasons-you-should-learn-python-now) 译者:Leoxu 来源:https://www.oschina.net/translate/7-reasons-you-should-learn-python-now ---- Python 是一门更注重可读性和效率的语言,尤其是相较于 Java,PHP 以及 C++ 这样的语言,它的这两个优势
数说君
2018-04-04
5960
统计师的Python日记【第十天:数据聚合】
本文是【统计师的Python日记】第10天的日记 回顾一下: 第1天学习了Python的基本页面、操作,以及几种主要的容器类型。 第2天学习了python的函数、循环和条件、类。 第3天了解了Numpy这个工具库。 第4、5两天掌握了Pandas这个库的基本用法。 第6天学习了数据的合并堆叠。 第7天开始学习数据清洗,着手学会了重复值删除、异常值处理、替换、创建哑变量等技能。 第8天接着学习数据清洗,一些常见的数据处理技巧,如分列、去除空白等被我一一攻破 第9天学习了正则表达式处理文本数据 原文复习(点击
数说君
2018-04-04
2.8K0
统计师的Python日记【第九天:正则表达式】
本文是【统计师的Python日记】第9天的日记 回顾一下: 第1天学习了Python的基本页面、操作,以及几种主要的容器类型。 第2天学习了python的函数、循环和条件、类。 第3天了解了Numpy这个工具库。 第4、5两天掌握了Pandas这个库的基本用法。 第6天学习了数据的合并堆叠。 第7天开始学习数据清洗,着手学会了重复值删除、异常值处理、替换、创建哑变量等技能。 第8天接着学习数据清洗,一些常见的数据处理技巧,如分列、去除空白等被我一一攻破 原文复习(点击查看): 第1天:谁来给我讲讲Pyt
数说君
2018-04-04
1.8K0
统计师的Python日记【第七天:数据清洗(1)】
本文是【统计师的Python日记】第7天的日记 回顾一下: 第1天学习了Python的基本页面、操作,以及几种主要的容器类型。 第2天学习了python的函数、循环和条件、类。 第3天了解了Numpy这个工具库。 第4、5两天掌握了Pandas这个库的基本用法。 第6天学习了数据的合并堆叠。 原文复习(点击查看): 第1天:谁来给我讲讲Python? 第2天:再接着介绍一下Python呗 【第3天:Numpy你好】 【第4天:欢迎光临Pandas】 【第四天的补充】 【第5天:Pandas,露两手】 【
数说君
2018-04-04
1.6K0
统计师的Python日记【第6天:数据合并】
本文是【统计师的Python日记】第6天的日记 回顾一下: 第1天学习了Python的基本页面、操作,以及几种主要的容器类型。 第2天学习了python的函数、循环和条件、类。 第3天了解了Numpy这个工具库。 第4、5两天掌握了Pandas这个库的基本用法。 原文复习(点击查看): 第1天:谁来给我讲讲Python? 第2天:再接着介绍一下Python呗 【第3天:Numpy你好】 【第4天:欢迎光临Pandas】 【第四天的补充】 【第5天:Pandas,露两手】 今天将带来第5天的学习日记。
数说君
2018-04-04
1.4K0
统计师的Python日记【第5天:Pandas,露两手】
本文是【统计师的Python日记】第5天的日记 回顾一下: 第1天学习了Python的基本页面、操作,以及几种主要的容器类型; 第2天学习了python的函数、循环和条件、类。 第3天了解了Numpy这个工具库。 第4天初步了解了Pandas这个库 原文复习(点击查看): 第1天:谁来给我讲讲Python? 第2天:再接着介绍一下Python呗 【第3天:Numpy你好】 【第4天:欢迎光临Pandas】 【第四天的补充】 今天将带来第5天的学习日记。 目录如下: 前言 一、描述性统计 1. 加总 2
数说君
2018-04-04
3K0
统计师的Python日记【第4天:欢迎光临Pandas】
本文是【统计师的Python日记】第4天的日记 回顾一下: 第1天学习了Python的基本页面、操作,以及几种主要的容器类型; 第2天学习了python的函数、循环和条件、类。 第3天了解了Numpy这个工具库。 原文复习(点击查看): 第1天:谁来给我讲讲Python? 第2天:再接着介绍一下Python呗 【第3天:Numpy你好】 今天将带来第4天的学习日记。 目录如下: 前言 一、Series 二、Dataframe 1. 数据结构 2. 基本操作 (1)改变索引名 (2)增加一列 (3)
数说君
2018-04-04
9670
点击加载更多
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战,赢鹅厂证书、公仔好礼!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档