首页
学习
活动
专区
工具
TVP
发布

数说工作室

专栏作者
214
文章
365950
阅读量
70
订阅数
【SAS Says】基础篇:描述性分析(上)
特别说明:本节【SAS Says】基础篇:描述性分析(上),用的是数说君学习《The little SAS book》时的中文笔记,我们认为这是打基础的最好选择。 转载请在文章开头注明微信号:shushuojun,谢谢! 复习: 前面四节 【SAS Says】基础篇:SAS软件入门(上) 【SAS Says】基础篇:SAS软件入门(下) 【SAS Says】基础篇:读取数据(上) 【SAS Says】基础篇:读取数据(中) 【SAS Says】基础篇:读取数据(下) 【SAS Says】基础篇:开发数据 在
数说君
2018-04-08
2.7K0
文本相似度 | 余弦相似度思想
我一直觉得,在数据分析领域,只有文本分析是最“接地气儿”的,“接地气儿”不是指最简单,而是我们普通大众的使用它最多。 我们每天使用互联网,但不一定每个人都炒股,不一定都做行业研究,也不一定都搞科研,因此那些高大上的模型对大部分人来说都是飘忽在天上的,只有文本分析,他的产出结果是直接惠及到几乎全部人。 比如,你总得打字,会使用到输入法的模糊匹配;你总得网购,刷新页面的时候就会看到某宝给你推荐的产品;你总得看新闻,APP会根据你以往的输入给你推荐文章...... 文本分析最基本的可以看正则表达式,我曾经写过S
数说君
2018-04-08
2.7K0
5分钟懂模块 | 【SAS Says·扩展篇】IML:4.模块
【SAS Says · 扩展篇】IML:创建模块 这是“CIR模型利率期限结构拟合”中的一段代码,出自《金融计算与建模》(朱世武,367页): 注意用红色框框圈住的代码,是IML的模块功能,创建一个模
数说君
2018-04-08
6760
移形换影 | 【SAS Says · 扩展篇】
【SAS Says·扩展篇】移形换影 | 5. call PRXCHANGE() 0. 前集回顾 1. 新的问题 2. 初识 PRXCHANGE() 3. 问题解决 ---- 0. 前集回顾: 前面说到,小王刚刚毕业,来到数说国际零售公司任数据分析师,帮助产品部的妹子解决了一个问题,下面是一份产品名单,有的行是产品的名字,有的行是产品的编号,现在只想将编号保留下来(即红色字体的部分),并且把括号里的数字再单独提出来(括号里的数字代表了产品的类别)、把有PD(代表过期产品)的标识也提取出来: (01)1872
数说君
2018-04-08
8970
logistic回归:从生产到使用【下:生产篇】
logistic回归:从生产到使用【下:生产篇】 上篇介绍了logistic模型的原理,如果你只是想使用它,而不需要知道它的生产过程,即拟合方法及编程实现,那么上篇就足够了。如果你想知道它的上游生产,那么请继续。 本篇着重剖析logistic模型的内部生产流程、以及每一个流程的工作原理,暴力拆解。 上下两篇的大纲如下: 【上篇:使用篇】 1. Logistic回归模型的基本形式 2. logistic回归的意义 (1)优势 (2)优势比 (3)预测意义 3. 多分类变量的logistic回归 (1)
数说君
2018-04-08
1.3K0
【SAS Says】基础篇:4. ODS的使用
你不可能总是在SAS上查看结果,如果结果很多你要一一的讲结果复制到word中去,有ODS就好啦!它可以把SAS的结果直接输出到word、PDF等文件中。 并且,你还要在这些文件中定制字体、背景、颜色... 4.1 ODC的概念 4.2 追踪选择过程的输出 4.3 从过程输出中创建SAS数据集 4.4 使用ODS语句创建HTML输出 4.5 使用ODS语句创建RTF输出 4.6 使用ODS语句创建printer输出 4.7 定制标题和注脚 4.8 用style=option定制proc print输出 4.
数说君
2018-04-08
4.3K0
函数玩一玩 | 【SAS Says·扩展篇】IML:2.函数
【SAS Says·扩展篇】IML 分6集,回复【SASIML】查看全部: 入门 | SAS里的平行世界 函数 | 函数玩一玩 编程 | IML的条件与循环 模块 | 5分钟懂模块 穿越 | 矩阵与数据集的穿越 作业 | 编一个SAS回归软件 ---- 本节目录: 1. 元素函数 2. 矩阵函数 (1)矩阵查询函数 (2)矩阵生成函数 ---- 【SAS Says · 扩展篇】IML:函数玩一玩 精彩内容 第一部分介绍元素函数,它针对矩阵内元素进行操作,如将矩阵里的数据取绝对值、取余等等;第二部
数说君
2018-04-08
1.1K0
【SAS Says】基础篇:7. SAS宏初步
宏用来处理重复工作最好,比如你需要跑10个回归,用proc reg...,这10个回归其他都一样,就是因变量y每次需要换。那么将回归程序写成一个宏,每次用的时候换参数就可以了。 总之,宏可以降低重复性工作的任务量,使程序模块化。 本节目录: 7.1 宏概述 7.2 用宏变量提交文本 7.3 用宏创建一个模块化的代码 7.4 给宏增加参数 7.5 使用条件逻辑写宏 7.6 用call symput编写数据驱动程序 7.7 排除宏错误的bug ---- 【SAS Says】基础篇:7. SAS宏初步 7.1 宏
数说君
2018-04-08
3K0
【SAS Says】基础篇:1. SAS软件入门
本系列【基础篇】已经完全完结了,方便大家阅读学习,我们合并在成一个专辑,目录如下: 1. SAS软件入门 2. 读取数据 3. 描述数据 4. ODS的使用 5. 开发数据(一) 6. 开发数据(二) 7. SAS宏初步 8. 相关、回归等基本统计 ---- 前言·数说君的话 在统计软件里,SAS算是一哥了,虽然R免费开源有各种统计函数、python功能多各方面比较平衡,但是、但是——SAS贵啊!正版的SAS一年要上百万,不是土豪用不起啊! 大家可以在前程无忧上分别搜索一下SAS、R和Python,对比一
数说君
2018-04-08
4.8K0
在SAS里玩穿越 | 【SAS Says·扩展篇】IML:穿越 | 数说·语言
一直以来,大众了解的SAS都是数据集操作,使用的方法是数据步和过程步。但其实,SAS这个庞大的系统中还隐藏了另一个平行世界——IML,在这个世界里,你需要一个像操作MATLAB一样的矩阵思维。 今天我们将介绍如何在SAS里玩穿越,将数据从矩阵变成SAS数据集,从SAS数据集再变成矩阵。它将大大方便我们的使用。 ---- 在SAS里玩穿越 | 【SAS Says·扩展篇】IML:穿越 本文要解决三个问题: 第一个问题:如何把SAS数据集转换为矩阵来处理? 把数据集转换成矩阵来,在很多情况下处理起来会
数说君
2018-04-08
2.3K0
我该选择谁? | SAS R Python的比较
前几天(上周日),我在分答上回答了一个问题,问题是: Python,R,SPSS,SQL这类软件哪个最适合初学者入门以及进阶学习的顺序(以就业为导向) 语音中我从“职能方向”和“行业方向”聊了一下自己
数说君
2018-04-04
4.7K0
4. call PRXPOSN() | 撕数据!
【SAS Says·扩展篇】撕数据! | 4. call PRXPOSN() 0. 前集回顾 1. 新的问题 2. 初识 PRXPOSN() 3. 问题解决 ---- 0. 前集回顾: 小王刚刚毕业,来到数说国际零售公司任数据分析师,产品部的妹子求助他,希望可以帮忙做这么一件事:下面是一份产品名单,有的行是产品的名字,有的行是产品的编号,现在只想将编号保留下来(即红色字体的部分),尤其是最后一行,这一行只要一部分。 (01)1872-8756 Body shop P1 Book B13 (05)9212-0
数说君
2018-04-04
8800
1. PRXMATCH () | 提取文本数据,分析师小王初上手!
【SAS Says·扩展篇】分析师小王初上手! | 1. PRXMATCH () 本集目录: 0. 小王初上手 1. 初始PRXMATCH() 2. metacharater 2.1 什么是metacharater? 2.2 例子 2.3 metacharater总结 3. 问题解决 3.1 问题重述 3.2 问题理解 3.3 解决代码 ---- 0. 小王初上手 小王毕业了,才刚刚入职,公司为他做了张名片,名片上写着: “小王 - 数说国际零售公司 - 数据分析部 - 初级数据分析师” 刚刚毕业
数说君
2018-04-04
3.4K0
导语:SAS正则表达式,统计师入门文本分析的捷径
文本分析很有用,数说君自己也玩过,炒鸡有意思,从论坛、网页上爬取网友的舆情数据,然后整理、统计、画图,就可以知道舆论的风暴是什么,可以知道网友最热议的话题、最想去的旅游景点、最喜欢的饮料等等,也可以从这些舆情数据中挖掘出两个话题之间的关联性等等。 统计领域比较流行的软件主要就是SPSS、R、SAS等,因为用它们来做统计模型/数据分析,实在太方便了,但是一旦遇到了文本形式的数据,就常常不知道该怎么办。比如下面这列杂乱无章的文本数据: (01)1872-8756 Body shop P1 Book B13 (0
数说君
2018-04-04
1K0
【SAS Says】扩展篇:IML(3):条件与循环
这是一段“资产收益率情景到评级情景的映射”的SAS程序,出自《金融计算与建模》(朱世武,282页): 代码中既用到了循环语句(do .. to ..),也用到了条件语句(if then),本文我们就
数说君
2018-04-04
1.3K0
十日大数据参考
我们将过去10天里播报的大数据新闻,浓缩成12条精选资讯,了解下这个行业的动向吧~ 1. 数说× “各行各业都在装备大数据” 2. 数说内参 ”大数据行业内的【技术、人才、资本】最新动向“ 3.数说笔记 ”算法、模型、学科、语言“ ---- 十日大数据精选 | 20160109-20160119 一、数说× “各行各业都在装备大数据” 1. 2016年精准医学领域展望 精准医学是大数据一个非常重要的应用,奥巴马在2015年初推出精准医学的倡议,成为关注焦点,本文对2016年的精准医学领域进行了展望。 原文
数说君
2018-04-04
5710
【SAS Says】基础篇:SAS宏初步
特别说明:本节【SAS Says】基础篇:SAS宏初步,用的是数说君学习《The little SAS book》时的中文笔记,我们认为这是打基础的最好选择。 转载请在文章开头注明微信号:shushuojun,谢谢! 宏用来处理重复工作最好,比如你需要跑10个回归,用proc reg...,这10个回归其他都一样,就是因变量y每次需要换。那么将回归程序写成一个宏,每次用的时候换参数就可以了。 总之,宏可以降低重复性工作的任务量,使程序模块化。 本节目录: 1. 宏概述 2. 用宏变量提交文本 3. 用宏创建
数说君
2018-04-04
3K0
在SAS里玩穿越 | 【SAS Says·扩展篇】IML:5.穿越
【SAS Says·扩展篇】IML 分6集,回复【SASIML】查看全部: 入门 | SAS里的平行世界 函数 | 函数玩一玩 编程 | IML的条件与循环 模块 | 5分钟懂模块 穿越 | 矩阵与数据集的穿越 作业 | 编一个SAS回归软件 ---- 一直以来,大众了解的SAS都是数据集操作,使用的方法是数据步和过程步。但其实,SAS这个庞大的系统中还隐藏了另一个平行世界——IML,在这个世界里,你需要一个像操作MATLAB一样的矩阵思维。 今天我们将介绍如何在SAS里玩穿越,将数据从矩阵变成S
数说君
2018-04-04
1.7K0
IML的条件与循环 | 【SAS Says·扩展篇】IML:3.编程
【SAS Says·扩展篇】IML 分6集,回复【SASIML】查看全部: 入门 | SAS里的平行世界 函数 | 函数玩一玩 编程 | IML的条件与循环 模块 | 5分钟懂模块 穿越 | 矩
数说君
2018-04-04
1.4K0
【SAS Says】高级篇:IML(1)
开篇话: 前段时间数说君征原创稿,果真得到了不少牛人的赐稿,比如本文的作者Ansta,作为数说工作室的特约撰稿人,将会承担下“【SAS Says】高级篇” 的写作。 SAS基础篇中,我们介绍了一些入门的东西。在进阶篇中,我们将介绍一些统计方面的SAS应用,包括主成分分析、判别分析、非参数检验、logistic模型等等。进阶篇要稍晚些与大家见面,我们首先邀请Ansta为大家带来高级篇,高级篇将介绍SAS的IML模块、SQL模块、宏语句以及贝叶斯(插一句,如果大家觉得好,求打赏,1元不嫌少,5元不嫌多;如果大
数说君
2018-04-04
2K0
点击加载更多
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档