我正试图在dataset中创建一个新变量,该变量存储一个数字,该数字是从来自同一个观察的另一个数字的计算中派生出来的。
* Here is what my dataset looks like:
SubjectID Score MyNewScore
1001 5442822 0
1002 6406134 0
1003 16 0
现在,变量Score是多达23个不同数字的总和(我称之为“响应”),范围从1到8,388,608。
/* Example of response values
1st response
我一直试图将最初从merge导入的三个Stata文件与6个字符串ID代码(例如n5fpeb)合并,但没有成功。它们作为str6变量存储在Stata数据文件中。
我还记录了一些其他变量,这些变量也识别了每个观察结果--一个数字参与者ID和一个学校ID编号,因为每个参与者都是学生。我的主数据集是堆叠格式的,因为我的数据是纵向的。当我尝试1:m合并(即merge 1:m id using "C:\Users ... May.dta", generate(_merge1))时,Stata返回以下错误消息:variable id does not uniquely identify ob
我试图merge超过10个dta文件,在Stata中具有相同的唯一标识符id。我试过使用以下代码,但它显示了错误_merge already defined r(110)。我认为这是因为在前两个文件合并之后创建了变量_merge。是否有一个更好的工作,并使所有文件一次合并?
local files : dir "E:\Research\stata12" files "*.dta"
foreach file in `files' {
merge 1:1 id using `file'
}
我正在尝试为Stata中的一个变量生成频率,条件是另一个变量的类别。
另一个分类变量对我感兴趣的类别有大约79万个观察值。
Stata对单向表和双向表分别有12,000行和1,200行的限制,这使得这是不可能的。
每次运行tab x if y==<category of interest>时,我都会得到以下错误:
too many values
r(134);
我安装了bigtab包,虽然它提供了表,但它不能与by一起使用,也不能运行统计测试。
有没有解决这个问题的办法?
当SAS甚至SPSS都可以毫无问题地运行完全相同的操作时,Stata竟然会有这个任意的限制,这似乎很愚蠢。
我在Stata中运行一个回归,我希望对它使用cluster2 ()。
我遇到了以下问题。Stata报道factor variables and time-series operators not allowed。我正在使用大量的控件向量,广泛应用Stata为交互提供的方法。
例如:state##c.wind_speed##L.c.relative_humidity。cluster2和其他Stata包不允许将此类表达式作为自变量包含在内。是否有一种有效的方法,如何自己创建如此长的交互变量向量?
我有一个字符串列,它遵循以下模式:
yariyada up to a maximum of (number)% yariyada
比如,就像这样。
will be granted up to a maximum of 75.5% If less, then nothing
我想要创建另一个列,它提取介于“最大值”和"%“之间的数字。
到目前为止,我只能使用.contains方法检测字符串列是否包含该模式。
如果这是说明的话,在Stata (我是stata用户)中,我将使用regexm将字符串分解为部分,并使用regexs撤回部分。我想知道Pandas是否有类似的或者更好的功能。
谢谢你
我在Stata中生成一个方法表,并试图在以某种方式格式化它之后,将它导出为一个TeX文件。我正在使用社区贡献的estout系列命令来完成这个任务,而且我非常接近于获得我想要的结果。
但是,我不知道如何在生成的输出中插入一些额外的行和标签。
我尝试了以下代码:
eststo clear
eststo, title("Mean"): estpost sum Male Female Race1 Race2 Age1-Age6 Education1-Education6
esttab using "${outdir}\Demographic.tex", label m
如何通过将变量除以IQR来创建变量?我已经做了很长一段路如下。
示例数据和代码如下:
use http://www.ats.ucla.edu/stat/stata/notes/hsb2, clear
foreach var of varlist read-socst {
egen `var'75 = pctile(`var'), p(75)
egen `var'25 = pctile(`var'), p(25)
gen `var'q =`var'75 - `var'25
drop `var'75 `var
我使用自定义代码来获取值的总和!textbox1.value,因为我知道在没有自定义代码的情况下无法使用它,因为出现了错误“聚合函数只能用于页眉和页脚中包含的报表项”。我在一个列表中使用一个表,列表组为'list1_Details_ group‘。我使用下面的代码成功地获得了总和,但它没有给出每个'list1_Details_Group‘的总和。我想要的是每个'list1_Details_Group‘的值的总和,我的代码是:
Public sum_of_crew As Integer = 0
Public Function SumUp(ByVal value
我正在开发SSRS报表生成器,它使用一个调用SQL Server2000数据库的数据集。
该查询将获取几个不同字段的总和,并提取与该客户编号有关的所有记录。我想要得到和的总和,但由于细节行的原因,它已经结束了。基本上,我想要的是不同sum列值的总和。
=Sum(Fields!tot.Value, "table1_Group3")
我看到您可以通过组来获得总和,我尝试了上面的表达式,但返回了一个错误:
The Value expression for the textbox 'tot' has a scope parameter that is not
我正在创建两个方法-一个递归地计算数字中数字的总和,另一个迭代计算数字的总和。
我已经创建了递归方法,并且在很大程度上我理解了求数字和的概念,但我不确定如何将其正确地放入迭代方法中。我的代码没有给出正确的输出。
public static int iterativeDigitSum(long n) {
if(n < 0){
String err = "n must be positive. n = " + n;
throw new IllegalArgumentException(err);
}