使用商业来源的居住历史用于癌症研究的工具

如何使用NCI的SAS居住历史生成程序

作为国家癌症研究所居民历史试点项目的一部分, 韦斯特创建了“ResHistGen”,这是一套开源的SAS程序,将帮助研究人员和其他人协调来自商业供应商的数据,并生成研究参与者的居住历史.

有关居住历史研究和SAS计划发展的更多信息,请参见 NCI/SEER住宅历史计划[1544 kb PDF]该研究的技术报告.

使用ResHistGen程序创建研究对象的居住历史的步骤可以由癌症登记处的工作人员执行, 研究小组成员, 或者是第三方承包商的员工. 要访问这些程序以及如何使用它们的信息,请访问 GitHub库.

  • 这个过程需要个人患者标识符. 研究人员必须遵循既定程序来保护人类受试者的隐私.
  • 向供应商提交相关案例的主题名称和标识符.
  • 对从商业供应商收到的地址进行地理编码. 所有的你.S. 癌症登记处可以访问北美中央癌症登记处协会(NAACCR)地理编码器, 但是任何批处理地理编码器都可以使用.
  • 运行第一个SAS程序(01_MatchAddresses1).sas (12kb文本文件])来匹配公共地址. 对于一个只有少量研究对象的研究, 可以通过两个步骤手动审查可能的匹配项. 对于有大量受试者的研究,这可以在一个步骤中自动完成.
  • 如果需要手动检查,请编辑“LN_matchcombos_review”.通过删除不匹配的行,由第一个程序创建Xlsx”. 这项检讨可参照NCI SEER手册地址比较指引[31kb Word文件]
  • 运行第二个SAS程序(02_MatchAddresses2).sas (16kb文本文件])添加任何人工审查的结果,并将匹配的地址合并.
  • 运行第三个SAS程序(03_buildrehistory).sas (13kb文本文件])来协调地址并生成派生的居住历史.

这些程序的当前版本是第2版.1. 有关自上一个版本以来更改的摘要,请参阅版本2.1的变化.txt (3kb文本文件].

在ResHistGen程序中, 本地文件位置在每个程序的前几行中指定,以促进可移植性. The programs have been written to avoid any data conversion or divide-by-zero warning messages; if these occur, 有一个错误. 有针对意外情况的测试, 如果遇到任何意外情况,将生成带有三个星号(“***”)的消息.

ResHistGen程序是在 GNU通用公共许可证[34kb文本文件]. 如有疑问,可通过电子邮件获得有限的支持 NCI.ResidentialHistory@ngskmc-eis.net; enhancements may also be shared via this email address and if found to be beneficial, 它们将包含在未来的版本中. 根据许可条款, 您可以自己发布您的更改,只要您包含了您修改了原始版本的显著通知.

如果你发布基于这些程序的结果, 请包括以下引用:ResHistGen住宅历史生成程序, 版本2.1 – October 2020; Surveillance Research Program, National Cancer Institute.

我们能帮什么忙??

我们欢迎来自求职者、合作者、潜在客户和合作伙伴的信息.

保持联系

想和我们一起工作?

你会有很棒的同伴.

探索职业
回到顶部