首页
学习
活动
专区
工具
TVP
发布

PPV课数据科学社区

专栏成员
2119
文章
2531369
阅读量
188
订阅数
一个资深数据人对数据挖掘解读
在银行做了两年的数据分析和挖掘工作,较少接触互联网的应用场景,因此,一直都在思考一个问题,“互联网和金融,在数据挖掘上,究竟存在什么样的区别”。在对这个问题的摸索和理解过程中,发现数据挖掘本身包含很多
小莹莹
2018-04-25
6430
[职业]数据科学领域的职位划分以及职责技能
随着数据科学领域的招聘信息越来越多,范围也越来越广.Datacamp根据最新的数据科学相关招聘信息,全面的了解各个行业之间数据科学领域每个职位角色之间的差异,以及所赋予的工作职责。 最主要分为以下几
小莹莹
2018-04-25
1.1K0
【探讨】你仅仅是个数据工具使用者吗?
有时候会听到有人说:「我终于学会用R了」,「我终于学会用SAS了」...... 高兴之余,我不免要说,这可能有点伪命题的意思。R、SAS、Excel等等都只是工具,使用工具是为了解决某种问题,而问题本身有往往有不同的场景(不可穷举),有可能你会用工具解决这个问题,却不会用工具解决另一个问题,所有前面说的「学会」,往往有伪命题的意味在里面。 更大的伪命题是——以为学会了数据工具的基本操作,就等于搞定了数据问题,可以高枕无忧了。其实,有可能有的人仅仅是个「数据工具使用者」。比如,很多企业里可能有这样的场景:不同
小莹莹
2018-04-24
4960
读懂了这个小故事,你就读懂SAS分析师了
  她说   我读初中的时候,很喜欢一个男生,有一天,他不知道为什么就被人打了,被打后他一个人坐在操场上很可怜的样子。   我买了一堆云南白药什么的去帮他擦伤口,就这样默默的,大家都没有说话……   后来,他成了我的男朋友。   但是,他永远不会知道,是我叫人去打他的。   他说   我读初中的时候很喜欢一个女生,有一天,我突然就被人打了,被打后我一个人坐在操场上装出很可怜的样子。   她去买了一堆云南白药什么的来帮我擦伤口,就这样默默的,大家都没有说话……   后来,她成了我的女朋友。   她一直
小莹莹
2018-04-23
5680
为何入坑数据科学首先要从R语言开始
很多时候,当和人们讨论怎么开始学习数据科学,一个疑惑总是出现在我们面前: 我不知道应该学什么编程语言。 不仅仅是编程语言,这还包括软件系统,例如TABLEAU,SPSS等,这是个更加广阔范畴的工具和编程语言的集合,让人非常难清楚该如何选择。 我很明白。数年前,我刚开始把目光集中于数据科学的时候,我浏览了所有流行的编程语言:PYTHON,R,SAS,D3,并不包括那些虽然触手可及,但是实在是在数据分析方面没有优势的语言,例如perl,BASH和JAVA。即使在今天,我也只是从别处得到建议(从一个非常出名的数据
小莹莹
2018-04-23
7060
【V课堂】数据挖掘知识脉络与资源整理(四)–spss
简介 SPSS(Statistical Product and Service Solutions),"统计产品与服务解决方案"软件。最初软件全称为"社会科学统计软件包"(SolutionsStatistical Package for the Social Sciences),但是随着SPSS产品服务领域的扩大和服务深度的增加,SPSS公司已于2000年正式将英文全称更改为"统计产品与服务解决方案",这标志着SPSS的战略方向正在做出重大调整。SPSS为IBM公司推出的一系列用于统计学分析运算、数
小莹莹
2018-04-23
9080
【V课堂】数据挖掘知识脉络与资源整理(三)—SAS
简介: SAS(全称STATISTICAL ANALYSIS SYSTEM,简称SAS)是全球最大的软件公司之一,是由美国NORTH CAROLINA州立大学1966年开发的统计分析软件。 它由数十个专用模块构成,功能包括数据访问、数据储存及管理、应用开发、图形处理、数据分析、报告编制、运筹学方法、计量经济学与预测等等。 基本部分是BASE SAS模块。BASE SAS模块是SAS系统的核心,承担着主要的数据管理任务,并管理用户使用环境,进行用户语言的处理,调用其他SAS模块和产品。也就是说,SA
小莹莹
2018-04-23
6900
【译文】如何开始你的商业分析生涯
每一次参与商业分析论坛或者和学生互动的时候,他们经常问这样两个典型而且被多次解释的问题: 我是一个本科生(或者别的学历),而我很希望能从事分析行业,而我应该怎么做呢? 或者 我想在分析行业干一番大事或打算转行到分析行业,那我又该怎么办呢? 而且,我在我的邮箱或社交媒体上收到的留言也是问同样的问题。为了能给这些人一个最好的答案,我认为最好还是写一篇文章然后给每个人一个入门的平台。 这门学科本身的研究范围就比较广,所以我会给大家提供一份能够执行且关注特殊子主题的概要,然后在后面的文章会提到。 在探讨如何构建你的
小莹莹
2018-04-20
8460
笑喷了!20条关于数学及数据分析的冷笑话【爆笑星期天】
1、“我是搞数据分析的, 学会了如何从DW中用SQL对数据ETL并建立了Cube。然后算啊算啊算,得出结论:今年2月份营业收入远远小于其它月份。我试图用spss、sas中 的数据挖掘模型找出原因但至今无果。扫地阿姨弱弱的说"2月份是春节,几乎所有的公司半个月无人上班…"我勒个去…..! 2、一朋友是IT程序员,单身,过年被家人安排去相亲,几经交谈后还是觉得不合适。后来家人问为什么不适合,那哥们随口答了一句:目测这妹纸没C++ 3、晚上去朋友公司随便在楼道抽烟,结果走过来一位阿姨说:你们是做互
小莹莹
2018-04-20
1.6K0
【学习】数据挖掘典型应用:如何做好关联分析?
在电商数据运营中,对于客户而言,有两个很重要的指标对于扩大销售规模是很重要的:第一,提高顾客重复购买次数;第二,提高客户订单中的Basket size(即购物篮件数)。而第二个指标提高Basket size,就是让客户从以前只购买一件产品的转换到现在购买多件产品,从而提高整个购物篮的销售金额,最大限度地实现销售增长。 但是如何挑出那些产品之间有关联销售的机会,从而形成相应的组合优惠套装呢?去过零售商场的人都知道,经常看到不少组合的套装打包在一起优惠销售,例如P&G的产品:飘柔洗发水+玉兰油沐浴露、海飞丝洗发
小莹莹
2018-04-20
7330
【大数据问答】R语言如何导入其他统计软件中的数据?
R语言如何导入其他统计软件中的数据? R导入SAS数据集可以使用 foreign 包中的 read.ssd() 和 Hmisc 包中的 sas.get() 。 【说明】如果使用的是SAS的较新版本(SAS 9.1或更高版本) ,你很可能会发 现这些函数并不能正常工作,可以采用如下解决方案。 在SAS中使用 PROC EXPORT 将SAS数据集保存为一个逗号分隔的文本文件,使用从.csv格式的文件中导入数据,使用read.csv()函数或者read.table()函数。 或者 一款名为Stat/Trans
小莹莹
2018-04-20
1.8K0
【CDA峰会】——商业数据分析的过往与现状(附PDF)
常国珍,CDA数据分析师SAS讲师。会计学博士、社会学硕士,毕业于北京大学人口所,目前就读于北大光华管理学院,SAS公司数据挖掘与统计分析课程讲师。曾就职于方正国际金融事业部和长江商学院投资者研究中心。主持过商业银行数据挖掘平台建设、商业银行信用评分模型的构建与固化等商业项目。参与构建的股票量化投资模型被某大型基金公司采纳,并于2013年九月正式发行。 查看阅读原文点击下载常国珍-数据分析的过往与现状-白皮书发布 1、回复“数据分析师”查看数
小莹莹
2018-04-20
9690
如何用大数据来优化定价决策
制定合适的价格很重要,再怎么夸大都不过分。价格提高1%意味着经营利润平均可以增长8.7%(当然,假设销量没有损失)。不过我们估计,在许多公司每年制定的成千上万个定价决策中,多达30%未能给出最合适的价格——这意味着收入大量流失。而且考虑到如今海量数据为公司提供了难得的机会,可以做出合理得多的定价决策,这种现状尤其令人不安。对那些能够井然有序地应对复杂的大数据的公司而言,这蕴含着巨大价值。 我们倒不是说制定合适的价格很容易:由于数字化促使多渠道越来越复杂,客户接触点的数量不断激增。不过,价位需要跟上来。由于许
小莹莹
2018-04-20
1.1K0
干货分享 | 千人专家朱晓天:大数据与人工智能在金融领域的应用
12月9日,以“数智金融-大数据的创新与应用”为主题的第二届中欧大数据金融论坛在深圳举行,国家千人计划金融领域特聘专家、北京大学汇丰商学院金融实验室主任朱晓天教授,国家千人计划金融领域特聘专家、平安科
小莹莹
2018-04-20
1.7K0
【学习】安装SAS千百遍,仍待SAS如初恋?
转自:StatsThinking 做人呢,最重要的就是开心。学SAS呢,最重要的就是亲自动手搞定SAS的安装。都曾有过被那个笨重臃肿的安装文件惨虐的经历吧?今天这篇文章,也许能澄清您的一些疑问,让您少
小莹莹
2018-04-20
4.5K0
[SAS代码模板]抽样_surveyselect
SAS抽样代码模板 黄色部分为套用部分,红色部分为可选部分 ——————————模板—————————— proc surveyselect data=总体数据 out=样本数据 method=抽样方法 n=抽取样本; strata 分层变量; run; ———————————————————— method指定抽样方法: l srs:简单无重复随机抽样,可以用n=指定需要抽取的样本数,也可以用samprate=指定要抽取的样本占总体的比例。 l sys:系统抽样,需要指定样本(用语句sampsiz
小莹莹
2018-04-20
1.5K0
【学习】七天搞定SAS(一):数据的导入、数据结构
标题有些噱头,不过这里的重点是: speak SAS in 7days。也就是说,知识是现成的,我这里只是要学会如何讲这门语言,而不是如何边学SAS边学模型。顺便发现我最近喜欢写连载了,自从西藏回来后..... 之所以下定决定学SAS,是因为周围的人都在用SAS。为了和同事的沟通更有效率,还是多学一门语言吧。R再灵活,毕竟还是只有少数人能直接读懂。理论上语言是不应该成为障碍的~就像外语一样,多学一点总是好的,至少出门不发怵是不是? 最后一根稻草则是施老师传给我的一个link:http://blog.so
小莹莹
2018-04-19
1.9K0
【学习】七天搞定SAS(二):基本操作(判断、运算、基本函数)
SAS生成新变量 SAS支持基本的加减乘除,值得一提的是它的**代表指数,而不是^。 * Modify homegarden data set with assignment statements; DATA homegarden; INFILE 'c:\MyRawData\Garden.dat'; INPUT Name $ 1-7 Tomato Zucchini Peas Grapes; Zone = 14; Type = 'home'; Zucchini = Zucchini * 10; Total
小莹莹
2018-04-19
3.1K0
【工具】为什么有些公司在机器学习业务方面倾向使用 R + Hadoop 方案?
引言:众所周知,R在解决统计学问题方面无与伦比。但是R在数据量达到2G以上速度就很慢了,于是就催生出了与Hadoop相结合跑分布式算法这种解决方案,但是,python+Hadoop这样的解决方案有没有团队在使用?R这样起源于统计学的计算机包与Hadoop相结合会不会出问题? 来自知乎王Frank的回答 因为他们在不懂R和Hadoop的特征应用场景的情况下,恰好抓到了一根免费,开源的稻草。 R R的应用场景不在于无与伦比的统计学习能力,而在于 结构化数据 下无与伦比的单位代码产出量。神经网络,决策树
小莹莹
2018-04-19
6590
【工具】SAS 基于失业率的分析预测
失业率(UnemploymentRate)是指失业人口占劳动人口的比率(一定时期全部就业人口中有工作意愿而仍未有工作的劳动力数字),旨在衡量闲置中的劳动产能,是反映一个国家或地区失业状况的主要指标。通过对历年各国和地区的失业率数据行分析,我们可以对全世界在这几十年的经济波动情况有个大致的了解,同时我们对世界几个大国的失业情况进行了模型拟合,最后我们还探究了中国从改革开放到2010年这30年的失业率的波动与通胀率的关系。 PART ONE——聚类分析 代码如下: libname ep ‘e:\saslx’
小莹莹
2018-04-19
7410
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档