首页
学习
活动
专区
工具
TVP
发布

数说工作室

专栏作者
214
文章
362255
阅读量
70
订阅数
你的每一次点击行为,是如何变成数据的?| 聊一聊互联网公司的内部数据采集
数据是怎么来的? 在很多行业,数据都是人工收集来的,比如医学疾病数据、环境数据、经济数据等。数据的更新周期也比较长,比如年度、月度。 但互联网行业不一样,这个天然的流量行业,数据量巨大,更新周期按天就算长了,通常有小时级、分钟级、实时秒级,甚至来不及落入表中,直接对实时流数据就进行计算。 最后说的这种「流式计算」,之前介绍过:什么是流式计算 | 另一个世界系列,对数据流实时进行计算,不需要存储到表里,主要为了满足一些实时级的需求,比如实时监控、实时个性化推荐等。 不管是「流式计算」还是存储到表里再计算
数说君
2018-04-08
1.6K0
量化投资之动量反转
量化投资投资之动量反转 微博:@数说工作室网站 微信公众号:数说工作室 那一年,你在我的有效市场里随机游走,不经意间毁灭了我的理性人假设。从此,维持与你相爱的动量效应,成为我人生唯一的投资策略。 ——送给她 一. 行为金融学 1. 行为金融学的发展 20世纪80年代,股票市场一系列经验研究发现了与有效市场不符现象,如股权溢价之谜、动量效应与反转效应、期权微笑等。到20世纪90年代,该领域涌现了大量高质量的理论和实证文献,形成最具活力的行为金融学派。 2002年,诺贝尔经济学奖授予了美国行为经
数说君
2018-04-08
2.3K0
文本相似度 | 余弦相似度思想
我一直觉得,在数据分析领域,只有文本分析是最“接地气儿”的,“接地气儿”不是指最简单,而是我们普通大众的使用它最多。 我们每天使用互联网,但不一定每个人都炒股,不一定都做行业研究,也不一定都搞科研,因此那些高大上的模型对大部分人来说都是飘忽在天上的,只有文本分析,他的产出结果是直接惠及到几乎全部人。 比如,你总得打字,会使用到输入法的模糊匹配;你总得网购,刷新页面的时候就会看到某宝给你推荐的产品;你总得看新闻,APP会根据你以往的输入给你推荐文章...... 文本分析最基本的可以看正则表达式,我曾经写过S
数说君
2018-04-08
2.7K0
什么是流式计算 | 另一个世界系列
另一个世界系列,从另一个角度看数据分析的方法、应用。 循环、分支...都可以在Python中用函数实现! | 函数式编程,打开另一个世界的大门 本文结构: 1、数据的时效性 2、流式计算与批量计算 3、总结与相关产品 (1) 流式计算流程 (2) 流式计算特点 (3) 相关产品 ---- 1、数据的时效性 日常工作中,我们一般会先把数据储存在一张表中,然后对这张表的数据进行加工、分析。既然数据要储存在表中,就有时效性这个概念。 如果我们处理的是年级别的数据,比如人口分析、宏观经济分析
数说君
2018-04-08
1.5K0
警惕数据应用中的“幸存者偏差”| 分析师说
最近一段时间,小D的内心几乎是崩溃的。小D在一家银行做数据应用,刚刚试点上线了一套精准交叉销售方案,看起来高大上,用起来却然并卵,成功率甚至比随机实验还低。 说起来,这套精准交叉销售方案,主要是基于
数说君
2018-04-08
1.2K0
移形换影 | 【SAS Says · 扩展篇】
【SAS Says·扩展篇】移形换影 | 5. call PRXCHANGE() 0. 前集回顾 1. 新的问题 2. 初识 PRXCHANGE() 3. 问题解决 ---- 0. 前集回顾: 前面说到,小王刚刚毕业,来到数说国际零售公司任数据分析师,帮助产品部的妹子解决了一个问题,下面是一份产品名单,有的行是产品的名字,有的行是产品的编号,现在只想将编号保留下来(即红色字体的部分),并且把括号里的数字再单独提出来(括号里的数字代表了产品的类别)、把有PD(代表过期产品)的标识也提取出来: (01)1872
数说君
2018-04-08
8910
Micro-targeting:大数据分析在政治领域的应用
美国总统大选已经进入了白热化阶段,各竞选团队为了给候选人拉票可谓绞尽脑汁,使出浑身解数。今天为大家介绍的这个“micro-targeting”,是数据分析在政治选举中的一个投影,政治家们通过各种途径构建自己的数据库,利用数据分析设计自己的竞选活动。 有人会说,川普此人个性鲜明、口无遮拦,居然赢得共和党初选走入巅峰对决,怎么解释? 先往下看吧~! ---- Micro-targeting,是在美国选举中一个常用的竞选策略,中文名可能叫“微目标”。 Micro-targeting是什么? 根据维基百科的定义:
数说君
2018-04-08
2.4K0
讨论 | 数据分析的价值
相信很多数据分析师的脑海中都无数次冒出过这个念头:出去开一个数据分析公司吧,喏,就像他们: 房地产数据分析师 · 张先生:我要创业!开一家数据分析的公司,什么万科、万达、万通、万维网....都是我的客户!喂,什么?哦不好意思我不买房,等一下,那个...请问您需要数据分析吗?我们专注房地产数据分析,聚类分析、回归分析、决策...喂?喂? 零售业数据分析师 · 小王:老子不干了!老子要自己接活做,给楼下小卖部做数据分析! 互联网数据分析师 · 强强:我辞职了,开了一家公司,我们公司做流量分析、推荐系统,构建
数说君
2018-04-04
8680
1. PRXMATCH () | 提取文本数据,分析师小王初上手!
【SAS Says·扩展篇】分析师小王初上手! | 1. PRXMATCH () 本集目录: 0. 小王初上手 1. 初始PRXMATCH() 2. metacharater 2.1 什么是metacharater? 2.2 例子 2.3 metacharater总结 3. 问题解决 3.1 问题重述 3.2 问题理解 3.3 解决代码 ---- 0. 小王初上手 小王毕业了,才刚刚入职,公司为他做了张名片,名片上写着: “小王 - 数说国际零售公司 - 数据分析部 - 初级数据分析师” 刚刚毕业
数说君
2018-04-04
3.4K0
数据分析师在物联网的哪个环节?
2005年,国际电信联盟的一份报告中描绘了“物联网”时代的图景:当司机出现操作失误时汽车会自动报警;公文包会提醒主人忘带了什么东西;衣服会“告诉”洗衣机对颜色和水温的要求等等。 这么美好的图景里面,我们——学过统计、用R用SAS跑模型、努力学习Python(【统计师的Python日记】已经更新到第6天了→第6天:数据合并)、平凡又伟大、美丽又善良的数据分析师,主要参与哪个环节? 不是部署报警器,也不是研发智能洗衣机,本质上就是跟你白天刚刚做的工作:整理、分析、建模、预测。本着学习的态度,数说君收集了一些资料
数说君
2018-04-04
1.2K0
十日大数据参考
我们将过去10天里播报的大数据新闻,浓缩成12条精选资讯,了解下这个行业的动向吧~ 1. 数说× “各行各业都在装备大数据” 2. 数说内参 ”大数据行业内的【技术、人才、资本】最新动向“ 3.数说笔记 ”算法、模型、学科、语言“ ---- 十日大数据精选 | 20160109-20160119 一、数说× “各行各业都在装备大数据” 1. 2016年精准医学领域展望 精准医学是大数据一个非常重要的应用,奥巴马在2015年初推出精准医学的倡议,成为关注焦点,本文对2016年的精准医学领域进行了展望。 原文
数说君
2018-04-04
5640
【风·析】第一文:风险管理与数据分析
我有一个风一样的名字, 我写风险管理, 也写数据分析, 他们都叫我, 风析人。 本系列是关于风险管理, 也是关于数据分析的。 【风·析】第一文:风险管理与数据分析 1 风险管理和数据分析 风险管理,是金融各领域中与数据分析关系很大的一个方向。风险本身可看做是一种波动,损失的发生又依赖一定的概率,这就意味着,统计学里的分布、大数定律、期望、方差,在风险管理中都会派上用场,而这些东西的载体又是数据。 尤其是近年来大数据技术的发展,我们常常能听到大数据用于欺诈检测、风险预警、信用评级,这些都与数据有
数说君
2018-04-04
1.6K0
【温故】量化投资之资本资产定价模型(CAPM)
最近股灾,有人说,这将开启中国对冲基金的黄金时代,有人说,单炒股已经是死路,宏观对冲、大类资产配置才能立于不败之地,这是宏观对冲基金最好的时代,还有人说,量化投资的时代真正到来了。。。 为纪念这次股灾,为未来更好的应对风险,数说君重发量化投资系列,跟大家一起学习交流。 资本资产定价模型(CAPM),被称为现代金融学的基石——做量化投资,不得不从这里开始。 量化投资之资本资产定价模型 (CAPM) 目录 一、前言 二、CAPM模型 1. 切点组合、分离定理与市场组合 2. 资本市场线
数说君
2018-04-04
1.9K0
量化投资之资本资产定价模型(CAPM)
量化投资之资本资产定价模型 (CAPM) 目录 一、前言 二、CAPM模型 1. 切点组合、分离定理与市场组合 2. 资本市场线 3. 证券市场线(资本资产定价模型) 4. 超额收益形式的CAPM模型 三、后记:quant的未来 附:量化投资系列 一、前言 数说君在《量化投资之动量反转》中曾经介绍过(微信公众号“数说工作室”中回复dlfz),现代金融学的两大基石是有效市场假说(EMH)和资本资产定价模型(CAPM)。有效市场假说是为了方便研究金融市场而对经济世界做的一
数说君
2018-04-04
2.4K0
【数说商学院】Farmeron:农场主的数据分析工具
数说商学院每周为大家介绍一家大数据创业公司,拓宽视野、汲取灵感、勾搭合作。最近的关注重点在于农业大数据,上周我们为大家介绍了国内的一家农业大数据公司,点击查看 【数说•大数据公司】德强农场 本周介绍一家国外的农业大数据公司,该公司创立于克罗地亚,现在总部在美国。 ---- Farmeron:农场主的数据分析工具 【简要介绍】 Farmeron 是一家农业数据跟踪分析服务公司,利用该公司发开的分析工具包,农民可以记录和跟踪自己饲养的动物的情况。 Farmeron 帮你把支离破碎的农业生产记录整理到一起,用先进
数说君
2018-03-28
6420
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档