在不破坏数据的情况下在Stata中重新编码分类变量的级别 - 腾讯云开发者社区

echo $VAR 有没有一种方法可以通过只执行 export.bash 而不 source 它获取 $VAR？答：不可以。但是有几种可能的解决办法。...在调用 shell 的上下文中执行脚本: $ cat set-vars1.sh export FOO=BAR $ . set-vars1.sh $ echo $FOO BAR 另一种方法是在脚本中打印设置环境变量的命令.../set-vars2.sh)" $ echo "$FOO" BAR 在终端上执行 help export 可以查看 Bash 内置命令 export 的帮助文档： # help export export...-f 指 shell 函数 -n 从每个(变量)名称中删除 export 属性 -p 显示所有导出变量和函数的列表 ---- 参考： stackoverflow question 16618071...help eval 相关阅读：用和不用export定义变量的区别在shell编程中$(cmd) 和 `cmd` 之间有什么区别 ----

1802 0

Stata常用数据预处理问题 – 学金融的文史哲小生

，前三行是stata编码的三部曲 auto示例数据.xlsx是需要导入的文件名，具体以自己的文件名为准 firstrow参数是将Excel的第一行作为Stata变量名 clear参数是将目前Stata内存中的数据清楚...”Excel电子表格“ 在接下来的界面中，选择”浏览“找到你”存放Excel的目录“选择”工作表“选择”单元格范围“勾选”将第一行作为变量名“点击”确定“ 此时数据已经导入Stata的数据管理器中，我们可以在右侧的...变量窗口##中看到导入的数据变量名（Excel表的第一行）如果需要查看每一个变量名所对应的具体数值，我们可以点击Stata上方的数据编辑器数据类型、数据结构辨析 [-] Stata的常用数据类型...str --- 字符串类型（在Stata 17的数据管理器中显示为黄色） byte --- 字节类型（在Stata 17的数据管理器中显示为白色） int --- 整形类型...（在Stata 17的数据管理器中显示为白色） double --- 数值类型（在Stata 17的数据管理器中显示为蓝色）认识基本的数据类型有助于后期在数据预处理过程中如merge、append

3K3 0

您找到你想要的搜索结果了吗？

是的

没有找到

北大数据分析老鸟写给学弟们一封信

以下是我在近三年做各类计量和统计分析过程中感受最深的东西，或能对大家有所帮助。当然，它不是ABC的教程，也不是细致的数据分析方法介绍，它只是“总结”和“体会”。...因变量为分类变量，自变量全部为分类变量，进行交叉表分析和卡方检验；因变量在某个闭区间内分布，并且有较多样本落在闭区间的边界上，使用Tobit模型；因变量不唯一，如多产出问题，进行数据包络分析（DEA...模型（针对分类因变量数据）。...关于拟合优度、变量选择原则及估计值绝对大小的意义在人人的“数据分析”小站中，某同学提出这样一个问题：“多元回归分析中，怎么选择自变量和因变量，可以使R方达到80%以上？”...一定要控制其他可能对因变量产生影响的因素，并认识到对回归系数和偏相关分析结果的解释都是建立在“其他条件不变”的情况之下。

1.7K4 0

bug 导致 77 TB数据被删光，HPE 称 100% 负责：在执行过程中重新加载修改后的shell脚本，从而导致未定义的变量

据京都大学声称，来自其中四个研究小组的数据无法通过备份系统来恢复。 HPE发表了一份日文声明，声称对文件丢失“承担100%的责任”。...然而，负责备份日本惠普公司制造的这个超级计算机系统的存储的程序出现了一个缺陷，导致脚本运行失灵。HPE表示，其结果是无意中删除了这个大容量备份磁盘存储的一些数据。...HPE补充道：“这导致了在执行过程中重新加载修改后的shell脚本，从而导致未定义的变量。结果，「大容量备份磁盘存储」中的原始日志文件被删除，而原本应该删除保存在日志目录中的文件。”...京都大学已暂停了受影响的备份流程，但计划在解决程序中的问题后在本月底之前恢复。它建议用户将重要文件备份到另一个系统。京都学校和HPE都声称，他们将采取措施防止此类事件再次发生。 ...相关阅读 · 未备份、数据丢失，工程师被开除：法院判合理合法

1.9K2 0

北大老鸟三年数据分析深刻总结——致学弟学妹们

我对非实验数据分析工具的选择原则如下：因变量为连续变量，自变量至少有一个连续变量，进行多元线性回归；因变量为连续变量，自变量全部为分类变量，进行方差分析；因变量为分类变量，自变量至少有一个连续变量...，使用Logit模型或Probit模型；因变量为分类变量，自变量全部为分类变量，进行交叉表分析和卡方检验；因变量在某个闭区间内分布，并且有较多样本落在闭区间的边界上，使用Tobit模型；因变量不唯一...模型（针对分类因变量数据）。...关于拟合优度、变量选择原则及估计值绝对大小的意义在人人的“数据分析”小站中，某同学提出这样一个问题：“多元回归分析中，怎么选择自变量和因变量，可以使R方达到80%以上？”...一定要控制其他可能对因变量产生影响的因素，并认识到对回归系数和偏相关分析结果的解释都是建立在“其他条件不变”的情况之下。

3.1K6 0

北大数据分析老鸟写给学弟们一封信

以下是我在近三年做各类计量和统计分析过程中感受最深的东西，或能对大家有所帮助。当然，它不是ABC的教程，也不是细致的数据分析方法介绍，它只是“总结”和“体会”。...因变量为分类变量，自变量全部为分类变量，进行交叉表分析和卡方检验；因变量在某个闭区间内分布，并且有较多样本落在闭区间的边界上，使用Tobit模型；因变量不唯一，如多产出问题，进行数据包络分析（DEA...模型（针对分类因变量数据）。...关于拟合优度、变量选择原则及估计值绝对大小的意义。在人人的“数据分析”小站中，某同学提出这样一个问题：“多元回归分析中，怎么选择自变量和因变量，可以使R方达到80%以上？”...一定要控制其他可能对因变量产生影响的因素，并认识到对回归系数和偏相关分析结果的解释都是建立在“其他条件不变”的情况之下。

1.6K10 0

稳健性检验！稳健性检验！

，考虑到董事长或总经理升任集团层面的董事长或总经理，或者升任集团层面的党委或党组书记时，国企高管的行政级别也得到了提升，因此在稳健性检验部分借鉴王曾等 (2014) 的测量方法，将高管职位变更去向出现以下情况时均视为晋升...分样本回归法由于不同的样本对于所得的结果具有不同的敏感性，因为在稳健性检验时，也常常进行分样本回归，常见的分类方法用按照人口规模分类，按照地理位置分类，按照城乡分类，按照性别不同分类等等。...年的企业数据，虽然该文对某些缺失的数据根据相关的会计准则进行了补齐处理，为避免处理后的数据干扰实证结果，作者将样本调整为1998-2007年，并重新进行RD 估计。...9.3 更换新的数据源何兴强 (2019) 在探讨房价收入比对家庭消费房产财富效应的影响时，为了增强研究结论的稳健性，分别使用了调查数据、宏观数据、和不同的家庭调查数据重新估计本文的主要回归。...专题：数据处理 Stata：变量非重复值统计-distinct Stata结果重现：dependencies命令-外部命令的版本控制 Stata数据处理：统计组内非重复值个数专题：结果输出 Stata

3K3 0

stata 命令 songbl 使用手册

输出标题中包含 [变量] 关键词，并且是来自爬虫俱乐部的推文超链接 . songbl 变量,auth(爬虫俱乐部) 10....post(5)表示仅检索有5条以上跟帖回复的贴子 page(int) 实时打印 The Stata Forums 的帖子情况。...范围为1-1437，默认值为1，即打印首页内容 sort(string) 根据排序情况实时打印The Stata Forums 的帖子情况，包括 sort(title), sort(last), sort...输入：songbl paper 浏览已有论文分类 cls 清屏后显示结果 nocat 不输出推文分类信息 time 输出检索所耗时间 gap 在输出的推文结果之间进行空格一行 line 搜索推文的另一种输出风格...例如 file(do) 表示在 stata 打开以 .do 结尾的 do 文档推文操作实例 1. 输出《金融研究》的论文超链接与数据 . songbl 金融研究,paper 2.

3.4K4 0

Stata与Python等效操作与调用

Python 中没有类似 Stata 的变量标签 (value label) 。 Series 是 Python 中另外一种数据结构，Series 可以理解为 DataFrame 中其中一列。...常规的数据整理包括变量增、删和改、重命名和排序等操作。处理过程中，针对数值型和字符型不同的数据类型，有不同的处理方法。数值型变量主要是简单的计算，生成新的变量。...长宽转换与 merge 一样，在 Python 中 DataFrame 的 reshape 方式也有所不同，因为 Stata 的数据是“内存中唯一数据表”，而 DtataFrame 在 Python...请注意，这些列现在具有多个级别，就像以前的索引一样。这是标记索引和列的另一个理由。如果要访问这些列中的任何一列，则可以照常执行操作，使用元组在两个级别之间进行区分。...在 Stata 中，内存中的 “DataFrame” 始终具有观察行号，由 Stata 内置变量 _n 表示。

10K5 1

SAS，Stata，HLM，R，SPSS和Mplus分层线性模型HLM分析学生受欢迎程度数据|附代码数据

在本文档中的Stata示例中，我们告诉Stata使用REML以便将输出与其他四个程序进行比较。类内相关系数我们还报告了每种模型的类内相关系数（ICC）ρ。...Stata结果当我们向Stata中的模型添加预测变量时，我们添加了cov（un）选项，指定了非结构化协方差矩阵。...Stata结果 HLM结果 SPSS结果 Mplus结果这次我们在WITHIN语句中包括一个潜在的斜率变量，以将Extrav指定为随机因子，该变量告诉Mplus不要在数据集中寻找“ randoms1...Stata结果 Stata无法自动识别变量之间的交互项，因此我们必须为两个跨级别的交互手动创建变量（请参见上面的代码中的gen语句）。...但是，当我们添加2级预测变量时，ICC会大大降低，甚至比无条件模型更低。这是由于在类级别添加了预测变量时，无法解释的Level-2变异（随机截距项）减少了。

1.5K1 0

SAS，Stata，HLM，R，SPSS和Mplus分层线性模型HLM分析学生受欢迎程度数据

下面介绍的六个模型都是两级分层模型的变体，也称为多级模型，这是混合模型的特殊情况。此比较仅对完全嵌套的数据有效（不适用于交叉或其他设计的数据，可以使用混合模型进行分析）。...在本文档中的Stata示例中，我们告诉Stata使用REML以便将输出与其他四个程序进行比较。类内相关系数我们还报告了每种模型的类内相关系数（ICC）ρ。...Stata结果 HLM结果 SPSS结果 Mplus结果这次我们在WITHIN语句中包括一个潜在的斜率变量，以将Extrav指定为随机因子，该变量告诉Mplus不要在数据集中寻找“ randoms1...Stata结果 Stata无法自动识别变量之间的交互项，因此我们必须为两个跨级别的交互手动创建变量（请参见上面的代码中的gen语句）。...但是，当我们添加2级预测变量时，ICC会大大降低，甚至比无条件模型更低。这是由于在类级别添加了预测变量时，无法解释的Level-2变异（随机截距项）减少了。

2.5K1 0

使用SAS，Stata，HLM，R，SPSS和Mplus的分层线性模型HLM

下面介绍的六个模型都是两级分层模型的变体，也称为多级模型，这是混合模型的特殊情况。此比较仅对完全嵌套的数据有效（不适用于交叉或其他设计的数据，可以使用混合模型进行分析）。...在本文档中的Stata示例中，我们告诉Stata使用REML以便将输出与其他四个程序进行比较。类内相关系数我们还报告了每种模型的类内相关系数（ICC）ρ。...Stata结果当我们向Stata中的模型添加预测变量时，我们添加了cov（un）选项，指定了非结构化协方差矩阵。...Stata结果 HLM结果 SPSS结果 Mplus结果这次我们在WITHIN语句中包括一个潜在的斜率变量，以将Extrav指定为随机因子，该变量告诉Mplus不要在数据集中寻找“ randoms1...Stata结果 Stata无法自动识别变量之间的交互项，因此我们必须为两个跨级别的交互手动创建变量（请参见上面的代码中的gen语句）。

3.1K2 0

SAS，Stata，HLM，R，SPSS和Mplus分层线性模型HLM分析学生受欢迎程度数据|附代码数据

1.8K2 0

6个步骤搞定金融数据挖掘预处理

导读：预处理是数据挖掘过程和机器学习的重要步骤。它被用来表示 "废料进，废品出"。在机器学习和数据挖掘中，数据采集方法往往控制松散，导致值超出范围、不可能的数据组合、缺失值等问题。...对于标准化变量，每种情况下的值在标准化变量上的值都表明它与原始变量的均值（或原始变量的标准偏差）的差值。...在一个简单的示例中，将图像的灰度从0-255光谱转换为0-1光谱就是二值化。...One Hot Encoding 独热编码[4]是将分类变量转换为可以提供给ML算法以更好地进行预测的形式的过程。...class 'numpy.float64'>, handle_unknown='error', n_values=None, sparse=True) Label Encoding 标签编码适用于具有分类变量并将数据转换为数字的数据

1.5K3 0

Stata特别篇（下）——多变量图表汇总！

今天跟大家分享Stata特别篇的下篇——多变量图表汇总！在多变量图表中，增加的变量仅仅限于定距变量，也可以是定类变量。...打开数据集： use "D:\Stata12.0\auto.dta", clear ? ?...该图在输出图表的同时会输出一个汇总结果： ? graph box price,over(foreign) #箱线图（分类变量） ?...这个就是之前推送过的那个相关系数图矩阵以下图表需要用到两个及以上分类变量，所以这里我换了一个数据集： use "F:\数据可视化\数据分析\计量经济学\计量经济学导论第四版(伍德里奇)\stata伍德里奇...以上是自己整理的Stata多变量图表的笔记，有一些我们会经常用到，也有一些过于复杂或者没有实际意义的，可以根据自己需要，忽略其他无关紧要的图表。

10.8K7 2

在 Stata 中基于世界银行开放数据库 API 开展跨国比较分析：wbopendata 命令详解

幸运的是，世行的开发人员为我们提供了一个能够在 Stata 中通过连接“世行公开数据库API”的方式实现数据调用的第三方命令，即 wbopendata。...不仅如此，通过便捷的选项设定，利用该命令获取的指定数据集正是在 Stata 中开展面板数据分析时需要的数据呈现形式。..., topics(2 - Aid Effectiveness) clear long 可以注意到，在各种情况的组合中，没有“全部国家（或地区）、全部变量”的情形。...通过下面的命令，我们可以获得最新的指标来源和主题分类信息，这些信息以帮助文档的形式存储在本地，实际使用中可以随时调用查询，从而方便我们在庞大的数据库中迅速定位感兴趣的变量。...在 Stata 中调用数据后，我们既可以对获得的截面数据或面板数据进行描述性统计分析，亦可开展更为深入的推断统计分析。

2.5K22 1

Pandas 2.2 中文官方教程和指南（十·二）

保持连接打开的副作用可能包括锁定数据库或其他破坏性行为。写入数据框假设以下数据存储在一个DataFrame data中，我们可以使用to_sql()将其插入到数据库中。...此外，Stata 保留某些值来表示缺失数据。导出特定数据类型的非缺失值超出 Stata 允许范围的值将重新定义变量为下一个更大的大小。...例如，在 Stata 中，int8 值限制在 -127 和 100 之间，因此值大于 100 的变量将触发转换为 int16。...在导出时，Stata没有明确的等价Categorical，并且关于变量是否有序的信息会丢失。警告 Stata仅支持字符串值标签，因此在导出数据时会调用str。...注意在导入分类数据时，Stata 数据文件中的变量值不会被保留，因为Categorical变量始终使用介于-1和n-1之间的整数数据类型，其中n是类别数。

3510 0

一份SPSS回归分析与数据预处理的心得体会

我个人有几个看法：数据样本量足够大，在删除缺失值样本的情况下不影响估计总体情况，可考虑删除缺失值；二是数据样本量本身不大的情况下，可从以下两点考虑：1是采用缺失值替换，SPSS中具体操作为“转换”菜单下的...若原始数据中还有0，取对数ln(0)没意义，我就取ln(x+1)处理；（2）是样本量足够大删除异常值样本；（3）是从stata里学到的，对数据做结尾或者缩尾处理。...这里的结尾处理其实就是同第二个方法，在样本量足够大的情况下删除首尾1%-5%的样本。缩尾指的是人为改变异常值大小。...心得2：不建议采用后向步进法处理变量多重共线性。记得张文彤老师说过他有个同学做过一个研究，即采用后向步进法剔除变量的方式去做回归，得到的结果犯错的几率比较大。张老师也不建议用这个方法处理多重共线性。...因变量分了5类，有一类个数比较多，达到300多，有1-2类个案比较少，只有30左右。专家提到了要做稳健性检验。这个用stata软件编程加一个robust即可解决问题。不知道在SPSS里面怎么做。

3.3K5 0

xarray | 序列化及输入输出

但有两点要注意：为了简化序列化操作， xarray 在 dumping 对象之前会将数组中的所有值加载到内存中。因此这种方式不适用于大数据集。...写入编码数据你也可以自定义 xarray 如何为 netCDF 文件中的每个数据集变量提供编码信息。encoding 参数接收包含编码信息的键值对字典。...这些信息会保存为 netCDF 变量的编码信息，从而使得 xarray 能够更准确的读取编码数据。注意：是否使用编码选项是可选的。...如果不指定编码信息的话，xarray 会使用默认的编码属性信息；如果指定的话，这会更有利于额外的处理操作，尤其是压缩操作。当存储文件时，这些属性信息会保存为每一个变量的属性。...默认情况下，对于包含浮点值的变量在存储时 _FillValue 为 Nan。

6.5K2 2

图像识别——MNIST

自动编码器通过使用与训练实例和目标标签相同的未标记输入来训练。去噪自动编码器是通过随机破坏自编码器的输入矩阵来训练的。...由于自动编码器不使用训练样本标签作为目标，而是使用训练样本本身，所以它们被分类为半监督学习技术。本文使用NEURAL程序来介绍一下在SAS里如何实现图像识别。...训练集 (training set) 由来自 250 个不同人手写的0-9的数字构成，正确地识别这些手写数字是机器学习研究中的一个经典问题。...01将数据下载解压并导入SAS 把训练数据集导入后，得到一个SAS数据集有60,000条观测，785个变量。...02模型训练过程:采用SAS中的神经网络过程步： ***自编码识别******************* 03结果展示最后，来看一下原始数据和模型训练结果的对比效果: 10个 MNIST 数据集的原始数字

5.2K4 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

我可以在不source脚本的情况下将变量从Bash脚本导出到环境中吗

Stata常用数据预处理问题 – 学金融的文史哲小生

北大数据分析老鸟写给学弟们一封信

bug 导致 77 TB数据被删光，HPE 称 100% 负责：在执行过程中重新加载修改后的shell脚本，从而导致未定义的变量

北大老鸟三年数据分析深刻总结——致学弟学妹们

北大数据分析老鸟写给学弟们一封信

稳健性检验！稳健性检验！

stata 命令 songbl 使用手册

Stata与Python等效操作与调用

SAS，Stata，HLM，R，SPSS和Mplus分层线性模型HLM分析学生受欢迎程度数据|附代码数据

SAS，Stata，HLM，R，SPSS和Mplus分层线性模型HLM分析学生受欢迎程度数据

使用SAS，Stata，HLM，R，SPSS和Mplus的分层线性模型HLM

SAS，Stata，HLM，R，SPSS和Mplus分层线性模型HLM分析学生受欢迎程度数据|附代码数据

6个步骤搞定金融数据挖掘预处理

Stata特别篇（下）——多变量图表汇总！

在 Stata 中基于世界银行开放数据库 API 开展跨国比较分析：wbopendata 命令详解

Pandas 2.2 中文官方教程和指南（十·二）

一份SPSS回归分析与数据预处理的心得体会

xarray | 序列化及输入输出

图像识别——MNIST

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐