数说工作室

204 篇文章
60 人订阅

全部文章

数说君

数据工程师需要掌握的18个python库

Selenium是一个Web测试自动化框架,最初是为软件测试人员创建的。它提供了Web驱动程序API,供浏览器与用户操作交互并返回响应。它运行时会直接实例化出一...

7510
数说君

数据分析师扩展技能之「ELK」技术栈

其中,第2步是每天的主要工作,有时候你会是 Sql boy,有时候又变身 TF boy (TensorFlow)。其他步骤都是傻瓜式操作。

12920
数说君

Adam作者大革新, 联合Hinton等人推出全新优化方法Lookahead

最优化方法一直主导着模型的学习过程,没有最优化器模型也就没了灵魂。好的最优化方法一直是 ML 社区在积极探索的,它几乎对任何机器学习任务都会有极大的帮助。

12120
数说君

GitHub超9千星:一个API调用27个NLP预训练模型:BERT、GPT-2全囊括

只需一个API,就能调用BERT、XLM等多种语言模型,逆天的GPT-2也一样轻松到碗里来,这样的模型库你是否期待?

29620
数说君

主流CTR预估模型的演化及对比

学习和预测用户的反馈对于个性化推荐、信息检索和在线广告等领域都有着极其重要的作用。在这些领域,用户的反馈行为包括点击、收藏、购买等。本文以点击率(CTR)预估为...

25340
数说君

复旦大学提出中文分词新方法,Transformer连有歧义的分词也能学

本文经机器之心(微信公众号:almosthuman2014)授权转载,禁二次转载

14320
数说君

从 one-hot 到 BERT,带你一步步理解 BERT

NLP:自然语言处理(NLP)是信息时代最重要的技术之一。理解复杂的语言也是人工智能的重要组成部分。而自google在2018年10月底公布BERT在11项nl...

31710
数说君

不做中台会死吗?

2010年的中国(深圳)IT领袖峰会上,BAT三家的当家人发表了对于云计算的看法:

50610
数说君

TensorFlow 速成 | 统计师的Python日记 第13天

今天将带来第13天的学习日记,开始学习 TensorFlow,介绍的版本是1.X。本文先认识一下 TensorFlow 的建模流程,学习搭建一个 logisti...

21720
数说君

Python5个数据可视化工具

如果您了解并使用上面提到的库,那么您就处于进化的正确轨道上。它们可以帮助生成一些令人拍案的可视化效果,语法也不难。一般来说,我更喜欢Plotly+Cufflin...

42721
数说君

用 NumPy 写一个RNN、LSTM

尽管 NumPy 不能利用 GPU 的并行计算能力,但利用它可以清晰了解底层的数值计算过程,这也许就是为什么 CS231n 等课程最开始都要求使用 NumPy手...

37310
数说君

轻量级深度学习端侧推理引擎 MNN,阿里开源!

数说君导读:MNN,Mobile Neural Network,用于在智能手机、IoT设备等端侧加载深度神经网络模型,进行推理预测。支持 Tensorflow、...

40740
数说君

一把 sklearn 走天下 | 统计师的Python日记 第12天

今天将带来第12天的学习日记,开始学习Python的机器学习库:Scikit-learn(这个系列会不断连载,建议关注哦~)。本文会先认识一下 sklearn ...

63840
数说君

AAAI 2019 争议事件、互联网大佬悼念金庸、谷歌放出 BERT代码... | 段郎一周盘点

本周 AAAI 2019 的录取结果出炉了,投稿量有惊人的7745篇,比去年翻了一倍。16.2%的录取率可以说是创造历史新低(2018年及之前基本都是在24%左...

29130
数说君

计算机大会360高管怒摔话筒、第四范式拒offer事件...... | 段郎一周盘点

本周 Github 上了两次热点,一次是微软官宣完成75亿美元对它的收购,注意这次宣布的是 “完成” 收购,因为这一收购早在6月份就已经开始了。

30020
数说君

3行代码实现 Python 并行处理,速度提高6倍!

原标题:Here’s how you can get a 2–6x speed-up on your data pre-processing with Pyth...

90950
数说君

支付宝有多安全?看 ATEC 大会上这项技术就明白了

在刚刚过去的 ATEC 科技大会上,蚂蚁金服副总裁芮雄文展示了一项风控技术——识别手机丢失风险。

23420
数说君

海量文本用 Simhash, 2小时变4秒! | 文本分析:大规模文本处理(2)

这是一个相似匹配的问题(文本相似匹配基础→ 词频与余弦相似度)。但是,亿级数据库,用传统的相似度计算方法太慢了,我们需要一个文本查询方法,可以快速的把一段文本的...

1.7K41
数说君

【温故】P值之死

100年前的今天(1918年7月8日),有位叫 Ronald Fisher 的人向外界宣读了一篇论文《Thecorrelation between relati...

15420
数说君

你的每一次点击行为,是如何变成数据的?| 聊一聊互联网公司的内部数据采集

数据是怎么来的? 在很多行业,数据都是人工收集来的,比如医学疾病数据、环境数据、经济数据等。数据的更新周期也比较长,比如年度、月度。 但互联网行业不一样,这个...

80970

扫码关注云+社区

领取腾讯云代金券