还不会从数据库中检索变量?一文讲清NHANES数据下载步骤!

摘要:近来郑老师新上线了NHANES自动化数据下载与加权分析平台,使用起来十分的简单便利,但是有些学员由于对NHANES数据库不是很了解,因此在第一步就遇到了大问题!

详情请点击右方:郑老师团队指导 | 重复测量资料的数据分析一对一高级学习班,掌握SPSS、R语言分析技巧

近来郑老师新上线了NHANES自动化数据下载与加权分析平台,使用起来十分的简单便利,但是有些学员由于对NHANES数据库不是很了解,因此在第一步就遇到了大问题!

怎样通过平台找到我想要的数据?

关键词搜索出来变量有那么多,我应该选择哪个?

今天我们就结合NHANES官网与平台为大家讲解一下数据下载的步骤!

NHANES数据提取模块:

这里为大家简单录制了从NHANES官网下载数据的简单操作流程(无声版),从文献确认变量名——官网查找变量——根据变量找到对应数据集逐个下载!一套流程走下来!

NHANES官网的数据是以数据集形式下载。不同变量,不同年份,完成一篇研究,多则几十个数据集,再进行变量提取与整合,过程比较繁琐,对数据处理能力要求比较高!

平台数据下载介绍

平台的操作流程会更贴合我们的分析习惯,直接选择下载变量,整合为数据集,操作简单易上手!

首先简单介绍一下我们的变量搜索框,一共有5个,可以对我们的检索结果进行限制!

根据大家平时的使用习惯,我们逐个进行介绍:

第一,变量描述。可以说是大部分人的第一选择。如果你对研究具体变量不了解,只有大概的方向,可以在变量描述中输入,像是家庭贫困比睡眠抑郁......在已经检索出的变量标签中挑选自己感兴趣的勾选下载。

第二,年份周期。一个研究查找变量的顺序建议是结局→关键变量→其他常见变量,之所以这样,是因为一些数据并不是每一周期都有,结局变量与关键变量就决定了我们的研究在哪几个周期开展(取交集)

例如下面的示例变量仅有2013-2020年存在,像是年龄、性别等常见变量就不必每个周期都下载纳入,避免数据集冗杂。

第三,数据集。这个大家平常基本不会用到,从NHANES数据官网下载数据(见前文视频)就是直接下载数据集,再从数据集中对应变量。而我们的平台另辟蹊径,直接下载变量,从数据整合处理上大大减少了工作量。

第四,调查类型。NHANES公开可用的数据包含五个类别,以及平台专有的联合指标数据,将需要多个单一指标计算的变量直接整合为一,选中直接使用!

Demographics (人口统计学)

Dietary (饮食)

Examination (检查)

Laboratory (实验室)

Questionnaire (问卷)

第五,调查类型。这是最重要的!通过变量名查找的数据更唯一,避免了关键词太泛,搜索结果不够精准的问题!变量名通过查找相关文献,都能找到对应的说明。在后期的写作中,有文献支撑,也更权威有依据。

例如,下方图片中,是一篇文献通过"RH1074"问题“你是否尝试了1年没有怀孕”对"不孕症"进行定义,NHANES官网并没有对不孕症的直接问题。

注:一定要确认文献的研究周期与变量名哦!部分变量的变量名并不是每周期都相同,可能存在个别字符的区别,因此,多参考几篇文献以保万无一失!

数据下载步骤总结

综合我们以上经验,建议大家在使用平台下载数据时按照以下流程进行:

通过浏览文献,找到感兴趣的NHANES分析主题

综合多篇文献中对变量的定义,找到结局、关键变量的变量名

使用平台检索变量名,确定研究的年份周期

根据年份周期限制,选择其他常见变量(如性别、年龄等)

之后通过数据整合、数据纳排、平台自动指定权重等,得到我们完整的数据集!

以上就是根据学员近期的使用反馈,提出的数据下载指导说明!当然目前平台还不够智能,我们后续会持续更新优化,希望对各位都能一定程度上的帮助。

NHANES数据提取模块:

加权分析模块:

助教二维码,联系咨询(或搜索vx:aq566665)

来源:纵览全局

相关推荐