我正在分析来自实验的响应时间(RT)数据。在这些实验中,每个人都要完成一定数量的各种试验类型的试验。仅使用来自正确试验的RT数据;因此,每个受试者每个试验类型要分析的RT数量不同。我正在尝试创建一个异常值函数,该函数应用依赖于要分析的试验数量的标准差截止值(Van Selst & Jolicoeur,1994)。例如,如果第一个受试者有100个试验类型为A的试验,我想计算该受试者的A试验的平均值和标准差,然后应用标准差截止值(例如,大于平均值的绝对值加上或减去所指示的标准差数量的试验得分为0)。
下面列出了我想使用的标准差截止值:
#n = # of trials
if n <
作为论文的一部分,我做了一些实验,得到了合理数量的时间序列数据(动作捕捉+眼动)。我有一种存储和组织所有这些数据的方法,但这让我怀疑是否有最佳实践来完成这类任务。
我将描述我所得到的,也许这将有助于提供一些建议。因此,我有一个实验,要求受试者使用他们的视觉和移动他们的身体来完成一项任务。每项任务是一项试验,每一名受试者执行多项试验来完成实验。在一次试验中,我记录运动和眼睛跟踪器(~200通道)在定期取样的时间点(~100 at )。我将这些存储在一个CSV文件中(每次测试一个文件),每个时间点有一行,每个变量有一列(例如,左指尖-x,左指尖-y,左指尖-z,等等),左眼-x,左眼-y表示眼睛)
对于使用长格式数据的非纵向分析,当受试者有多次访问或记录时,我通常会使用bysort ID在每个受试者中查找一条记录,并设置一个临时变量来保存我找到的整数或实际值,然后设置egen max()以找到找到的所有记录的最大值,然后在record _n==1 for that subject中设置一个最终值。这是为了让我可以将不同访问的值渗透到每个主题的单个记录中。每个受试者的每一条记录将在分析过程中使用(但不是纵向的,可能是横截面或回归,方差分析等)。 假设我想要试验第三年的最高胆固醇(ldl)值,所有受试者的ldl都是每季度(每3个月)测量一次,这可以使用以下代码来完成: cap drop l
我正在尝试验证数据传输过程是否正常工作。我在一个数据库中有源表,在另一个数据库中有目标表。我想验证特定键值的数据传输。
最终,我希望以以下格式返回结果:
Table Column Matches
----------------------------
Company Name Y
Company Address Y
Company Phone N
我需要保持列的列表是动态的,这样当一列被添加到其中一个表中时,代码就不会改变。表的列表是已知的。
现在我使用的是游标。一个用于遍历需要比较的表的列表,另一个用于遍历返回列列表的查询的每个表。它