SEER数据库挖掘(五)SEER.stat数据提取方法(2)

前 言

上期我们对SEER.stat做了介绍,这期主要讲如何用SEER.stat的Case Listing Session模块提取我们想要的数据。

操作流程

这是在登陆SEER.stat之后,选择Case Listing Session模块所显示的界面.

首先是Data的选择,一般选择第一个选项,因为我用的是放化疗的账号登陆,因此,也可以选择第二个选项,包含additional treatment,也就是放化疗的数据。今天我们用第二个选项进行演示。

选择第二个选项后,点击selection选项,如下图所示。

Select only内的选项为默认即可,然后点击edit,出现筛选界面框。

在这个界面所选的内容相当于一个限定条件,比如说下图,选择Age at diagnosis 的Value为10-29岁,那么最后输出文件里的患者就只是10-29岁这个年龄阶段的。

注意事项

首先必须要选择positive histology来确保诊断上的正确。

在survival month flag里必须要选择有完整生存时间的数据。

随访必须保证有效性。

病例来源必须要除去尸检获取的和只有死亡报告上的病例。

生存时间要去除unknown的数据。

除了这些必须选择的项目外,其他选项就可以根据需求自行发挥了。

接着,点击第三个选项table,即把你想要在表格中显示的选项选出来,比如说,我只想在表格中看到患者诊断时的年龄,就选择age at diagnosis选项,然后点击column,如下图所示。

再点击上节课所说的闪电符号即开始筛选数据。如下图。

最后就会得到如下图的输出表格,这个表格就可以直接复制到excel里面进行进一步的处理啦。

期待您的精彩分享

  • 发表于:
  • 原文链接:https://kuaibao.qq.com/s/20180626G0BVLL00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。

扫码关注云+社区

领取腾讯云代金券