首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

2018编读往来(2)

元旦快乐!

我会在每年元旦梳理一些与大伙的互动。当然,2018年的交流互动不止本期展示的内容,有些互动,由于我忘记及时收藏后台消息,没有保存下来。

我把这些问答稍稍做了语言上的改动。

2019,一路同行!

点击阅读:2017编读往来

点击阅读:2018编读往来(上半年)

问:为什么删除稀疏矩阵?

点击阅读:从网页采集到文本分析:R完全教程

答:稀疏矩阵对于分类预测的系统效率和预测准确率有着负面的影响,因此需要对该词频矩阵进行降维处理,删除稀疏词条。

问:事件史数据就是面板数据吗?两者在数据结构上有无区别?

点击阅读:事件史分析:概述及Stata操作

答:事件史数据与平衡面板数据有两点区别,以文中的职业晋升数据为例:当晋升事件发生(由0变为1)以后,如id为3的个体第二期记录以后,就不再记录;如果你手上有的是平衡面板数据,需要通过stset命令转换数据结构。该命令的一种语法结构为 stset timevar, failure(failvar) id(idvar),其中,timevar表示测量时间;failvar表示观测是1或0的虚拟变量;idvar表示案例识别码。执行该命令后,会生成新变量_d表示新的结局变量(failvar是原有的结局变量),再将_d为缺失值的观察值删掉即可drop if _d==.

问:加入更多变量,有时显著性会下降,为什么?

点击阅读:线下活动│回归分析ppt

答:一种解释是,变量的显著性是由t值决定的,而t值等于回归系数的估计值除以其标准误。加入更多的变量对标准误有两方面影响:一是可能增加变量间共线性,导致标准误增加;二是减少扰动项的方差,导致标准误减少。一般来说,加入更多变量会使显著性下降,主要是由多重共性导致标准误增加导致的。

问:“回归”的当代含义还是最初起源时的意义吗?

点击阅读:线下活动│回归分析ppt

答:在高尔顿的父代身高与子代身高的例子当中,产生回归均值现象的根本原因在于,特别高个父母的身高相当于在概率分布的最右尾取了极端值,而子代再难取到如此大的极端值。在当代,回归分析主要是指用概率统计方法来估计与检验变量之间的关系,在这个意义上,“回归”已不再仅是最初的概念,但是作为术语,回归这个词儿沿用下来。

问:面向对象编程和面向过程编程的区别?

点击阅读:对象与类:以R为例

答:

面向对象和面向过程的区别:

面向过程编程在思考问题时,首先思考怎么按步骤实现?例如,怎么把大象装进冰箱?实现步骤:1. 打开冰箱门;2. 把大象塞进去;3. 关上门

面向对象编程首先思考怎么设计这个东西?例如,依然是把大象装进冰箱,就会先思考冰箱是怎么设计的?面向对象思考造冰箱,发现冰箱由如下对象组成:1. 冰箱门(打得开);2. 储物空间(装得下);3. 制冷系统

因此,面向对象可以帮助我们从宏观上把握、从整体上分析整个系统。但是,具体到实现部分的微观操作,仍然需要面向过程的思路去处理。

面向对象和面向过程的总结:

都是解决问题的思维方式,都是代码组织的方式。

解决简单问题可以使用面向过程

解决复杂问题:宏观上使用面向对象把握,微观处理上仍然是面向过程。

面向对象思考方式:遇到复杂问题,先从问题中找名词,然后确立这些名词哪些可以作为类,再根据问题需求确定的类的属性和方法,确定类之间的关系。

面向对象编程的语言的三大特征:

封装(encapsulation)

封装指的就是将对象的属性和方法封装起来,不需要外界知道内部的细节,实现方便的调用。如:我们使用Ipad,只需要直接触屏使用即可,不需要知道Ipad内部的细节。

继承(extend)

继承让我们更加容易实现类的扩展。如:我们定义了人类;再定义Boy类就只需要扩展人类即可。实现了代码的重用,让我们不再重新发明轮子(don’t reinvent wheels)。

多态(polymorphism)

多态指的是同一个方法调用,由于对象不同可能会有不同的行为。现实生活中,同一个方法,具体实现会完全不同。如:同样是调用人的“休息”方法。 有人是睡觉,有人是旅游,有人是敲段代码。

问:中国家庭追踪调查CFPS的网址打不开?

点击阅读:10个全国性调查数据库

答:新网址:http://opendata.pku.edu.cn/dataset.xhtml?persistentId=doi:10.18170/DVN/45LCSO

问:验证性因子分析就是结构方程模型吗?

点击阅读:Amos结构方程模型必知必会基础

答:简单来说,结构方程模型由两部分组成:结构模型+测量模型。结构模型是潜变量之间的关系,即路径分析;测量模型是潜变量与外显变量的关系,即验证性因子分析。文中的软件演示部分,我只是拿验证性因子分析做了个例子。

阿虎定量笔记

数据分析方法

软件使用技巧

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190101G0YSOQ00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券