首页
学习
活动
专区
工具
TVP
发布

数说工作室

专栏作者
214
文章
363639
阅读量
70
订阅数
邮件安全:从 安全网关 到 基于图建模的数据运营
对企业安全建设来说,人是最大的安全威胁因素,系统再牢固、资产再收缩,也架不住内部员工被社工、被骗后轻而易举的进行破坏。
数说君
2023-01-04
8360
数据分析师扩展技能之「ELK」技术栈
其中,第2步是每天的主要工作,有时候你会是 Sql boy,有时候又变身 TF boy (TensorFlow)。其他步骤都是傻瓜式操作。
数说君
2020-02-25
1.4K0
Python5个数据可视化工具
如果您了解并使用上面提到的库,那么您就处于进化的正确轨道上。它们可以帮助生成一些令人拍案的可视化效果,语法也不难。一般来说,我更喜欢Plotly+Cufflinks和 D3.js. 以下详细道来:
数说君
2019-05-29
4.3K0
一把 sklearn 走天下 | 统计师的Python日记 第12天
今天将带来第12天的学习日记,开始学习Python的机器学习库:Scikit-learn(这个系列会不断连载,建议关注哦~)。本文会先认识一下 sklearn 这个库,再根据建模流程,学习一下 sklearn 的各个模块的使用。
数说君
2019-03-07
1.5K0
文本相似比较
大家好,我是数说君,这篇文章是想跟大家讨教一下。 如果有两段简单文本,如何比较它们的相似度?这里我们就假设是英文,不存在中文的分词问题,文本就类似于: text1 = 'hello, I am shushuo jun' text2 = 'hi, wo ye shi shushuo jun' 目前比较容易实现的,是计算出每个文本的词向量,然后将两列词向量进行比较,计算出相似度,实现比较简单,就不上code了。我在python中,计算出上面的text1和text2的相似度是51%。 但问题是: 这样的比较是以词
数说君
2018-04-08
1.1K0
循环、分支...都可以在Python中用函数实现! | 函数式编程,打开另一个世界的大门
编程界有一位传奇人物——王垠,介绍一下他的退学经历,对,你没听错,退!学!经!历!: 2006年,从清华大学计算机系退学,在水木社区BLOG上发表了《清华梦的粉碎--写给清华大学的退学申请》一文,此时离博士毕业还差一年; 2008年,从美国康奈尔大学计算机系退学,在网上发表《Cornell 感受》; 2012年,从印第安纳大学伯明顿分校计算机系退学,以一篇文章《对博士学位说永别》,彻底告别了学生生涯。 这里插一句,就在我写这篇文章的时候(写的时间有点久...),王垠的博客又更新了一篇文章《微软的秘
数说君
2018-04-08
1.5K0
logistic回归:从生产到使用【下:生产篇】
logistic回归:从生产到使用【下:生产篇】 上篇介绍了logistic模型的原理,如果你只是想使用它,而不需要知道它的生产过程,即拟合方法及编程实现,那么上篇就足够了。如果你想知道它的上游生产,那么请继续。 本篇着重剖析logistic模型的内部生产流程、以及每一个流程的工作原理,暴力拆解。 上下两篇的大纲如下: 【上篇:使用篇】 1. Logistic回归模型的基本形式 2. logistic回归的意义 (1)优势 (2)优势比 (3)预测意义 3. 多分类变量的logistic回归 (1)
数说君
2018-04-08
1.3K0
Python &R 代码 对照速查表
推荐一篇文章,文中将常用机器学习算法的Python和R代码对照整理成一个表,方便查找和对比学习,原文还有PDF的下载。 (版权归原作者所有,点击文末阅读原文查看)
数说君
2018-04-04
1.4K0
Python 2 要退休了!
不要急,Python 2 退休不是今天也不是这个月,而是在4年后的2020年4月12日,Python 2将不会被进行任何维护。根据Python发布的倒计时网站http://pythonclock.or
数说君
2018-04-04
5580
我该选择谁? | SAS R Python的比较
前几天(上周日),我在分答上回答了一个问题,问题是: Python,R,SPSS,SQL这类软件哪个最适合初学者入门以及进阶学习的顺序(以就业为导向) 语音中我从“职能方向”和“行业方向”聊了一下自己
数说君
2018-04-04
4.7K0
Python 验证 | 巴菲特推崇的“指数定投”到底如何?
股神巴菲特在面对公众的时候,第一常干的事情是喝可乐卖萌。 第二常干的事情,就是部不断的教导大家: “对于个人投资者而言,最好的投资方式就是指数定投!” 一、什么是指数定投? 所谓指数定投,就是不管股市
数说君
2018-04-04
1.3K0
家养爬虫的Python技术 | 资料总结
之前有一个讨论: 文本分析怎么整? 文本分析,一个很重要的环节就是网络的数据爬取。爬虫是获取数据的一个重要手段,很多时候我们没有精力也没有资金去采集专业的数据,自己动手去爬数据是可行也是唯一的办法了。所以,本文对如何“家养”爬虫的技术资料进行了系统的总结。 因为Python提供了一批很不错的网页爬虫工具框架,既能爬取数据,也能获取和清洗数据,因此本文总结的资料主要是关于Python的,适用于零基础的同学。 1. Python 如果完全没有Python的基础,建议看下面的教程如个门: 【统计师的Pytho
数说君
2018-04-04
9320
class 类—老司机的必修课 | 统计师的Python日记 第11课
本文是【统计师的Python日记】第11天的日记 回顾一下: 第1天学习了Python的基本页面、操作,以及几种主要的容器类型。 第2天学习了python的函数、循环和条件、类。 第3天了解了Numpy这个工具库。 第4、5两天掌握了Pandas这个库的基本用法。 第6天学习了数据的合并堆叠。 第7天开始学习数据清洗,着手学会了重复值删除、异常值处理、替换、创建哑变量等技能。 第8天接着学习数据清洗,一些常见的数据处理技巧,如分列、去除空白等被我一一攻破 第9天学习了正则表达式处理文本数据 第10天学习了
数说君
2018-04-04
7700
统计师的Python日记【第八天:数据清洗(2)文本处理】
本文是【统计师的Python日记】第8天的日记 回顾一下: 第1天学习了Python的基本页面、操作,以及几种主要的容器类型。 第2天学习了python的函数、循环和条件、类。 第3天了解了Numpy这个工具库。 第4、5两天掌握了Pandas这个库的基本用法。 第6天学习了数据的合并堆叠。 第7天开始学习数据清洗,着手学会了重复值删除、异常值处理、替换、创建哑变量等技能。 原文复习(点击查看): 第1天:谁来给我讲讲Python? 第2天:再接着介绍一下Python呗 【第3天:Numpy你好】 【第
数说君
2018-04-04
2K0
统计师的Python日记:第四天的补充
【第4天:欢迎光临Pandas】 第四天学习了Pandas,感受了Pandas数据的DataFrame数据格式的魅力: 看起来就像excel一样清爽! 但是后来我遇到了两个问题: 1)之前只学习了用
数说君
2018-04-04
8580
统计师的Python日记【第3天:Numpy你好】
本文是【统计师的Python日记】第3天的日记 回顾一下,第1天学习了Python的基本页面、操作,以及几种主要的容器类型;第2天学习了python的函数、循环和条件、类。 复习大纲: 一、为什么学Python? 二、安装与熟悉 三、容器 四、函数 五、循环与条件 六、类 日记小结 原文复习(点击查看): 第1天:谁来给我讲讲Python? 第2天:再接着介绍一下Python呗 今天将带来第三天的学习日记。 细(tiāo)心(cì)的朋友会发现,第二天的日记写成日期是14年9月,也就是说“第2天”到“第3
数说君
2018-04-04
1.1K0
绘制人口热点地图的N种方法 | 数友讨论
前天发了一个数友的求助 想做一个区域的特征人口热点地图。什么软件或者平台,可以自行导入数据,做一个类似人口热点的地图。 由于留言过48小时不能再回复,猜测应该类似这样的: 在原文评论区里,收到了各位专
数说君
2018-04-04
3K0
换个姿势学量化!|【量化小讲堂】使用python计算各类移动平均线
作者:邢不行 原文链接: http://bbs.pinggu.org/thread-3631776-1-1.html (本文已获作者授权转载,如需转载请与原作者联系) ---- 【量化小讲堂-pyth
数说君
2018-04-04
1.5K0
跟你说个事儿
大家好! 数说君最近在做一个生物大数据的项目汇报,忙成狗了。 因此这段时间更新比较少, 预计下周恢复。 将继续为大家带来: SAS正则表达式、python、我自己常用的一些linux命令汇总...等方面的一些干货。 分享coursera最近推送的一个十大最优价值课程 “Top 10 most valuable career skills of 2015” (每个给出链接,手机可以长按复制,建议先保存,然后在电脑上打开) ---- 1. 数字时代有效(Digital Marketing) Skills: St
数说君
2018-03-28
5430
数说工作室 2017年干货总结
盘点2017年优质文章,并给出传送链接,方便大家取阅回顾。文末有福利~! 1、Python & R 代码对照速查表 文中将常用机器学习算法的Python和R代码对照整理成一个表,方便查找和对比学习 Python & R 代码 对照速查表 2、文本系列 余弦相似度思想 词频与余弦相似度 TF-IDF 常用距离/相似度 一览 哈希函数的套路 3、什么是 TPU TPU 是专门用来做机器学习的处理器,全称Tensor Processing Unit 张量处理器,与CPU和GPU有什么区别? 懂点硬件 | Al
数说君
2018-03-28
9100
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档