健康管理师基础知识--第五章《流行病学和医学统计学基本知识》重点

2020年07月31日健康管理师

最近瘦瘦好忙，两个娃娃把我看的死死的，这一章总结的时间就更久了，在总结过程中，发现了原来的好多错别字。由于目的是方便随时查阅，所以原来仅仅是标题的内容，也被我又充实了，其实在做的过程中，我发现很多东西需要再整体上通过图表提炼，只能期待后面有时间再弄了，这一版本就先这样吧。一个人学习固然有些苦闷，但至少有我在这里陪着你，为了自己、父母、亲戚、朋友、全国人民的健康，大家一起加油、努力啊！:muscle:

一、基本概念

1 流行病学的定义

流行病学是研究疾病、健康状态和事件在人群中的分布、影响和决定因素，用以预防和控制疾病,促进健康的学科。 该定义的基本内涵有四点：

①它的研究对象是人群，是研究所关注的具有某种特征的人群。 ②它不仅研究各种疾病，而且研究健康状态和事件。 ③它的重点是研究疾病、健康状态和事件的分布、影响和决定因素。 ④最重要的是，它的落脚点是为预防和控制疾病，促进健康提供科学的决策依据。

2 流行病学的任务：

流行病学的任务大体上可以分为三个阶段， 第一阶段的任务是“揭示现象”，即揭示流行(主要是传染病)或分布(其他疾病、伤害与健康)的现象。 第二阶段为“找出原因、影响或决定因素”，即从分析现象入手找出流行与分布的规律，原因或影响因素。 第三阶段为“提供措施”，即合理利用前两阶段的结果，找出预防或干预的策略与措施。
依序完成上述三个阶段的任务，才算完整的流行病学工作。结合健康管理的实际，流行病学第一、二和三阶段的任务对应的就是“健康信息收集”、“健康风险评估”、“健康指导和健康危险因素干预”。

3 流行病学的研究方法：

常见的流行病学方法及分类见图

二、常用指标：

①率和比 ②发病指标 ③死亡指标 ④相对危险度 ⑤归因危险度(人群公共卫生意义)**

1 率和比(proportion)

(1)比例：是表示同一事物局部与总体之间数量上的比值，分子和分母单位相同，且分子包含于分母之中，

常用 P=a/(a+b) 来表示比例有两类，包括构成比例和发生频率比例。

①构成比例，反映事物静止状态内部构成成分占全体的比重，它是可以反映某种概率的数值。 ②发生频率比例，与动态的发生变化概率密切相关，反应一定时间内，发生某种变化者占全体的比例。

(2)率(rate)：表示在一定的条件下某现象实际发生的例数与可能发生该现象的总例数之比，来说明单位时间内某现象发生的频率或强度。一般用百分率、千分率、万分率或10万分率表示。

率必须包括受累人群数量(可以是某病的临床症状、死亡、残疾、实验室异常等)、被观察到的受累人群所处的总体数量和规定的时间三方面内容才能构成率。

2 发病指标

(1)发病率(incidence rate)的概念: 是指一定时期内特定人群中某病新病例出现的频率。

计算发病率时,可以根据研究的病种及研究的问题特点来选择时间单位,一般多以年为时间单位，常用10万分率来表示。

①发病率分子：为新发病例数，是指观察期间发生某病的患者，有时一个人在观察期间内可能多次发生同种疾病，可分别计算为几个新病例。 ②发病率分母所规定的暴露人口：也称危险人口，是指在观察期间内观察地区的人群中有可能发生所要观察疾病的人，才能作为分母。对于那些不可能患该病的人，不应该包括在分母中【比如研究传染病发病率时已获得免疫者不能包括在分母之中】在实际工作中暴露人口数不易获得，一般使用年平均人口数。 ③发病率指标的用途：发病率是一个重要和常用指标,对于传染病以及死亡率极低或不致死的疾病尤为重要,反应患该病的风险。常用来描述疾病的分布、探讨发病因素，提出病因假设和评价防治措施的效果。 ④发病率指标注意事项：发病率的准确性受到多种因素影响，如报告制度不健全、漏报、诊断水平不高等，在比较不同地区人群发病率时，应考虑年龄、性别构成不同，进行发病率的标化。

(2)患病率的定义(prevalence rate)：

亦称现患率，流行率。是指在特定时间点一定人群中某病新病例和旧病例的人数总共所占的比例。

①患病率的影响因素: 影响患病率的因素很多,但患病率主要受发病率和病程的影响,当某地某病的发病率和病程在相当长的时间内保特稳定时,则患病率(P)、发病率(I)和疗程(D)三者之间存在下述关系:

因而可以根据患病率和发病率计算出平均病程。

②患病率指标的用途: 患病率对于病程短的疾病价值不大,而对于病程长的一些慢性病的流行状况能提供有价值的信息,可反映某地区人群疾病的分布以及某疾病的疾病负担程度。可依据患病率来合理地计划卫生设施、人力物力及卫生资源的需要，研究疾病流行因素，监测慢性病的控制效果。 ③患病率与发病率的区别

A 患病率的分子为特定时间点所调查人群中某病新旧病例数,而不管这些病例的发病时间;发病率的分子为一定时期暴露人群中新发生的病例数: B 患病率是由横断面调查获得的疾病频率,衡量疾病的存在或流行情况,是一种静态指标,其本质上是一种比例,不是一种真正的率。而发病率是由发病报告或队列研究获得的单位时间内的疾病频率和强度,为动态指标,是一种真正的率。

3 死亡指标

(1)死亡率(mortality rate):是指某人群在单位时间内死于所有原因的人数在该人群中所占的比例。

死亡率是测量人群死亡危险最常用的指标。常以年为单位时间。

死于所有原因的死亡率是一种未经调整的死亡率，称为 粗死亡率(crude death rate)。 按疾病的种类、年龄、性别、职业、种族等分类计算的死亡率称为死亡专率(specific death rate)。

(2)病死率(fatality rate/case fatality)：表示一定时期内患某病的全部患者中因该病而死亡的比例.

病死率与死亡率不同，病死率并非真正的率，只是一个比值。

A 不同场合下，病死率的分母是不同的，如计算住院患者中某病的病死率，分母为该病患者的住院人数;如计算某种急性传染病的病死率，其分母为该病流行时的发病人数。 B 如果某病的死亡专率与发病专率处于比较稳定的状态，病死率也可由死亡专率与发病专率推算而得。

C 病死率通常用于病程短的急性病，如各种急性传染病，脑卒中，心肌梗死及肿瘤等，衡量疾病对生命威胁程度。

（3）生存率(survival rate)：又称存活率,是指患某种病的人(或接受某种治疗措施的患者，)经 n 年随访,到随访结束时仍存活的病例数占观察病例数的比例。

A 生存率常用于评价某些慢性病如恶性肿瘤、心血管病等病程长、病情较重、致死性强的疾病的远期疗效。 B 应用该指标时，应确定随访开始日期和截止时间。开始日期一般为①确诊日期、②出院日期或③手术日期。 C 截止时间可以是1年、3年、5年、10年，即计算1年、3年、5年或10年的生存率。

4 相对危险度

(1)相对危险度的概念：相对危险度(relative risk,RR)或率比(rate ratio) ，是指暴露组发病率 Ie,与非暴露组发病率 Io,之比,它反映了暴露与疾病的关联强度。

计算公式: RR=Ie/Io ， ∈[0，∞） RR 的意义：说明暴露组发病是非暴露组的多少倍, RR=1，表明暴露于疾病无联系。 RR<1,表明存在负联系(提示暴露是保护因子) RR>1，表示两者存在正联系(提示暴露是危险因子) 。比值越大,联系越强。例如：Doll和Hill调查了英国35岁以上男性医生吸烟习惯与肺癌死亡率的关系。不吸烟人群的肺癌死亡率Io为0.07%o 中度吸烟者(15-24支/日)的肺癌死亡率Ie为1.39%o,其RR=Ie/Io=1.39/0.07=19.9，说明吸烟者死于肺癌的危险性是不吸烟者的19.9倍。

(2)比值比(odds ratio，OR)的概念：又称优势比、交叉乘积比。指病例组中暴露人数与非暴露人数的比值除以对照组中暴露人数与非暴露人数的比值。

与RR相同，OR反映暴露者患某种疾病的危险性较无暴露者高的程度。

OR接近甚至等于RR值的条件： ①所研究疾病的发生率(死亡率)很低 ②所选择的研究对象代表性好

例如，小王的社区横断面调查发现，吸烟者致男性间歇性跛行(周围血管疾病)的比值比为2.22，而女性的比值比是1.92，可以认为男性中，吸烟者发生间歇性跛行的危险性是不吸烟者的2.22倍，在女性中，吸烟者发生间歇性跛行的危险性是不吸烟者的1.92倍。

5 归因危险度(人群公共卫生意义)

（1）归因危险度(attributable risk，AR)：又叫率差(rate difference，RD),指暴露组发病率与非暴露组发病率之差, 它反映发病归因于暴露因素的程度.

计算公式：AR=Ie-Io=Io(RR-1) AR意义:表示暴露者中,完全由某种暴露因素所致的发病率或死亡率

仍使用Doll和Hill的医生数据计算，AR=1.39%O-0.07%O=1.32%O,表示在吸烟者当中由于吸烟所致肺癌死亡率为1.32%O

（2）归因危险度百分比（AR%）：是指暴露人群总由暴露因素引起的发病在所有发病中所占的百分比。

计算公式：AR%=[(Ie-Io)/Ie]*100%

按上例计算数据AR%=(1.39-0.07)/1.39=94.96%，表示每日吸15-24支香烟者中有94.96%的肺癌是由吸烟所致。

（3）人群归因危险度百分比（PAR%）：表示全人群中由暴露引起的发病在全部发病中的比例

计算公式：PAR%=[(It-Io)/It]*100%，式中It为全人群发病率。或 PAR%={Po(RR-1)/[Po(RR-1)+1]}*100%，式中Po为某因素在人群中的暴露率。

当男性人群吸烟率为60%时，PAR%=91.85%,表示男性医生中91.85%的肺癌是由吸烟所致。

优点：PAR%不仅考虑了暴露因素RR，而且与某因素在人群中的暴露率Po有关。 公共卫生学意义：完全控制改暴露因素后人群中某病发病（或死亡）率可能下降的程度。

三、常用的研究方法：

①现况调查②队列研究③病例对照研究④实验性研究⑤诊断试验的评价研究⑥筛检试验的评价研究

1 现况调查：是描述性流行病学最常用的研究方法，在病因研究中作用有限。

描述性流行病学研究，是指利用已有的资料或特殊调查的资料(包括实验室检查结果)，描述疾病或健康状况在不同时间、地点和人群中的分布特征，为进一步开展分析流行病学研究提供病因或流行因素的线索。 （1）现况调查的概念：是指在某一人群中应用普查或抽样调查等方法收集特定时间内有关变量,疾病,或健康状况的资料,以描述目前疾病或健康状况的分布及某因素与疾病的关联。又称横断面研究。 （2）现况调查的目的：

①描述疾病或健康状况的分布 ②发现病因线索 ③适用于疾病的二级预防 ④评价疾病的防治效果 ⑤疾病监测 ⑥其他：用于衡量一个国家或地区的卫生水平和健康状况、卫生服务需求的研究、社区卫生规划的制定与评估和有关卫生或检验标准的制定，为卫生行政部门的科学决策提供依据。

（3）现况调查的方法及种类:

①普查（census）：即全面调查。普查的优点是不存在抽样误差，但不适用于患病率低且无简便易行诊断手段的疾病。

②抽样调查(sampling survey):是通过抽样的方法，对特定时间、特定范围内的人群的一个代表性样本进行调查，以样本的统计量来估计总体参数所在范围。抽样可以分为：非随机抽样,随机抽样(单纯随机抽样、系统抽样、分层抽样、整群抽样、多阶段抽样) 抽样的优点是节省时间、人力和物力资源，但设计实施复杂，且不适用于变异较大的研究对象或需要普查普治的疾病。

（4）现况调查的优点:

①采用抽样调查,研究结果具有较强的推广意义，以样本估计总体的可信度较高。 ②有来自同一群体的自然形成的同期对照组，使结果具有可比性。 ③一次调查可同时观察多种因素，是疾病病因探索过程中不可缺少的基础性工作之一。

(5)现况调查的缺点

①调查时疾病与暴露因素一般同时存在，难以确定先因后果的时相关系。 ②得到的是某一时点是否患病情况，无法获得发病率资料 ③若研究对象一些人正处在潜伏期或临床前期，则会被误以为正常，有可能低估该研究群体的患病水平

2 队列研究(群组研究)

队列研究是分析性流行病学方法，常用于验证病因假设。 （1）队列研究(cohort study)的概念：亦称群组研究，是将特定的人群按其是否暴露于某因素或按不同暴露水平分 n 个群组或队列,追踪观察一段时间,比较两组或各组发病率或死亡率的差异,以检验该因素与某疾病有无因果联系及联系强度大小的一种观察性研究方法。 （2）队列研究的目的：

①检验病因假设、 ②评价预防效果和 ③研究疾病自然史。

（3）队列研究的类型：

①前瞻性队列研究：研究对象的确定与分组由研究开始时是否暴露来决定，需随访观察一段时间才能得到研究结局 ②历史性队列研究：研究工作现在开始，研究对象是过去某个时间进入队列的。 ③双向性队列研究：又称混合性队列研究，是以上两个方法的结合。

（4）队列研究的特点：

①时序上由前向后,在疾病之前开始进行,属于前瞻性研究 ②属于观察性对比研究，暴露与否是自然存在于研究人群,不是认为给予的, ③研究对象按暴露与否分组,不是随机分 ④是由因到果的研究 ⑤追踪观察的是两组间的发病率或死亡率差异，如 RR=[a/(a+b)]/[c/(c+d)]

（5）队列研究的优点:

①在疾病发生前按是否暴露于某因素分组，所获资料完整,无回忆偏倚 ②可计算暴露组和非暴露组的发病率，能测量两组间的特异危险度和相对危险度 ③一次调查可观察多种结果，并能了解疾病的自然史 ④能直接估计暴露因素与发病的联系强度，且先因后果，时间关系明确，所得联系比较确实可靠 ⑤暴露因素的作用可分等级，便于计算剂量-效应关系 ⑥样本量大结果稳定 ⑦在有完整资料记录的条件下，可做回顾性历史队列研究。

（6）队列研究的局限性:

①观察时间长,费人力、费钱,不能在较短时间内得到结果;
②准备工作繁重,设计的科学性要求高,实施难度大, ③暴露人年计算工作量较为繁重
④研究罕见病时需要大量研究对象，因而不易收集到完整可靠的资料，故不适用于罕见病的研究。

3 病例对照研究：省时、省力，比队列研究更为广泛

（1）病例对照研究（case-control study）的概念：为选择一组患所研究疾病的患者与一组无此病的对照组,调查其发病前对某个(些)因素的暴露状况, 比较两组中暴露率和暴露水平的差异,以研究该疾病与这个(些)因素的关系。 **病例对照研究的原理 **：调查方向是由现在-到过去 （2）病例对照研究的特点:

①在疾病发生后进行,研究开始时已有一批可供选择的病例 ②研究对象按照发病与否分成病例组与对照组 ③被研究因素的暴露状况是通过回顾调查或信息收集获得的。 ④由果及因的推理顺序 ⑤经两组暴露率或暴露水平比较,分析暴露与疾病的联系。如OR=ad/bc

（3）病例对照研究优点:

①所需样本量小，病例易获取，工作量相对小，所需物力、人力较少，易于进行，结果快。 ②可以同时对一种疾病的多种病因进行研究 ③适合对于病因复杂、发病率低、潜伏期长的疾病进行研究 ④在某些情况下，还可以对治疗措施的治疗与副作用作初步评价。

（4）病例对照研究缺点:

①受回忆偏倚的影响，选择合理的对照又较困难，因此结果的可靠性不如队列研究。 ②不能计算暴露与无暴露人群的发病率及相对危险度(RR)，只能计算比值比(OR)

4 实验性研究(干预研究): (1)临床试验、(2)社区试验

A 实验性研究的基本性质：是研究者在一定程度上掌握着实验的条件，主动给予研究对象某种干预措施。 B 实验性研究的类型：主要研究类型有

①临床试验 ②现场试验 ③社区试验 ④类试验

C 实验研究的基本特点:

①属于前瞻性研究：必须是干预在前，效应在后 ②随机分组 ：如果条件受限不能采用随机分组方法，两组基本特征应该均衡可比。 ③设立对照组：因受实际条件所限，不能随机分组或设立平行的对照组，称为类实验或准实验 ④有干预措施：这是与观察性研究的一个根本的不同之处。由于干预措施是研究者为了实现研究目的而施加于研究对象，因此容易产生伦理学问题。

(1)临床试验（clincical trial）

①临床试验的概念：是在临床上评价新药、新疗法疗效的一种试验,是临床治疗措施在正式应用之前的最后人体应用试验。它是运用随机分配的原则将试验对象(者)分为试验组和对照组,给前者某种治疗措施,不给后者这种措施或给予安慰剂,经过一段时间后评价该措施的效果与价值的一种前瞻性研究。 ②临床试验的目的:是观察和论证某个或某些研究因素对研究对象产生的效应或影响。

(2) 社区试验（community trial）

①社区试验的概念： 也称生活方式干预试验，是以尚未患所研究疾病的人群作为整体进行试验研究观察,常用于对某种预防措施或方法进行考核或评价。 ②社区试验接受干预的基本单位:是整个社区，有时也可以是某一人群的各个亚群，如某学校的班级。如果某种疾病的危险因子分布广泛，不易确定高危人群时，也需要采用社区试验。 ③ 社区实验的使用方法：社区试验时所选择的两个社区,在各个方而应尽量相似,按随机原则选择一个社区作为实验组进行干预,另一个社区作为对照组不进行干预。干预结束后,对两个社区进行随访调查,监测疾病的发病率和可疑危险因素的暴露情况。最终两个社区疾病和可疑危险因素暴露水平的差异就是干预的结果

5 诊断试验的评价研究

(1)诊断试验(diagnostic test)的定义: 是对疾病进行诊断的试验方法。它包括①各种实验室检查、病史体检所获得的临床资料，②X线、超声诊断等各种公认的诊断标准，③并且利用这些资料和技术标准对疾病和健康状况得出确切的结论。

(2)诊断试验的诊断指标：可分为三类：

①客观指标，即能用客观仪器测定的指标，如体温计测定体温，用X线片观察肺部或骨骼病变等 ②主观指标，即完全根据被诊断者的主诉来决定，如疼痛、乏力、食欲缺乏等 ③半客观指标：即根据诊断者的主观感知判断，如肿物的硬度、大小等。

(3)诊断试验的诊断标准：

①作用：确定一个诊断标准(诊断界值)用以区别正常与异常 ②确定诊断标准的方法：有

A 生物统计学方法、 B 临床判断法、 C ROC曲线法，适宜诊断标准的确定，是要求达到最小的误诊率和漏诊率。 ③诊断标准选择时应遵守的原则： A 对于严重疾病，应选择敏感度较高指标，保证所有患者都被诊断出来。 B 对于治疗效果不理想的疾病，且确诊治疗费用昂贵时，可选择特异度较高的诊断标准 C 当假阳性和假阴性重要性相等时，可把诊断标准定在特异度=灵敏度的分界线处。

(4)诊断试验的评价指标：真实性、可靠性、收益

①真实性：又称有效性，是指筛检试验或诊断试验所获得的测量值与实际情况的符合程度。评价真实性指标方法有

A 灵敏度：也称真阳性率,即实际有病且按该诊断试验被正确地判为有病的概率, >灵敏度只与病例组有关,理想的灵敏度为100%。 B 特异度：也称真阴性率,即实际无病按诊断试验被正确地判为无病的概率。 >特异度只与非病例组有关,理想的试验特异度为100%。 C 假阴性率：也称漏诊率或第二类错误β,即实际有病但根据该诊断试验被定为非病者的概率。灵敏度越高，漏诊越少，理想的假阴性率应为0。 D 假阳性率：也称误诊率或第一类错误α,即实际无病但根据该诊断试验被认定为有病的概率。特异度越高，误诊越少，理想的试验假阳性率应为0。 E 确诊断指数：系指灵敏度和特异度之和减去1，正确诊断指数可用于两个诊断方法比较。理想的正确诊断指数为100%。\

②可靠性：又称信度，指相同条件下，同一试验对相同人群重复试验获得相同结果的稳定程度。可靠性高，说明试验结果受随机误差的影响不大。其评价指标有以下几种:

A 变异系数(CV) :当试验做定量测定时,用此表示可靠性。即所测平均数的标准差与测定的均数之比,比值越小,可靠性越好。 B 符合率：又称准确度,当做定性测定时,同一批研究对象两次诊断结果均为阳性与均为阴性的人数之和占所有进行诊断实验人数比率。 C 诊断试验的一致性分析：若要衡量临床医生的诊断水平，他们之间对同一人群诊断结果是否存在差异，可采用kappa分析。

Kappa分析所得值，是评价不同地点或不同操作者对同一试验结果一致性的指标，该值考虑了机遇因素对一致性的影响并加以校正，从而提高了判断的有效性。 ③收益：诊断试验的收益评价可通过计算预测值这个更为客观的指标来完成。它是反应诊断试验结果与实际符合的概率，包括阳性预测值和阴性预测值。

A 阳性预测值(+PV)：是指试验阳性结果中真正患者的比例。患病率相同时，特异度越高，阳性预测值越好，临床医生越有理由判断阳性结果为患者。 B 阴性预测值(-PV)：是指试验阴性结果中真正未患病比例。患病率相同时，诊断试验的灵敏度越高，则阴性预测值越好，临床医生更有把握判断阴性结果为非患者。

(5)诊断试验的评价标准：

①同金标准诊断方法进行同步盲法比较：

A 在对一项新的诊断试验进行研究和评价时，只有以金标准为基础进行考核，才能获得准确的结果。 B 在实际工作中金标准选择困难时，可用目前公认的、最好的临床诊断试验作为金标准。

②研究对象的代表性：所选择的病例组和非病例组最好是目标人群的一个随机样本。对象的选择具有统一的临床诊断标准和纳入研究的标准。 ③要有足够的样本量 ④诊断界值的确定要合理：既要考虑该试验检验的目的，也要兼顾灵敏度和特异度 ⑤不仅评价真实性，也评价可靠性 ⑥试验的方法和步骤要具体，有可操作性。

(6)提高诊断质量的方法：

①联合试验： 为提高诊断效率，医生可应用多个试验对同一疾病作出诊断。通常采用2个或2个以上的诊断试验，根据每个试验的结果来综合判断最后的结果。

A 平行(并联)试验：几个实验中只要有一个试验呈阳性，即诊断为阳性。【优点灵敏度高，漏诊率低，缺点特异度降低，误诊率高】
B 系列(串联)试验：几个实验中有一个阴性即诊断为阴性，全阳才能判为阳【优点特异度增高，误诊率降低，缺点是灵敏度降低，漏诊率增高】

②选择患病率高的人群：

A 一方面可使新发现的病例数增加， B 另一方面可使阳性预测值升高，试验成本下降，使试验效率提高。

6 筛检试验的评价研究

(1)筛检试验概念：筛检试验(screen test)通过快速的检验、检查或其他措施，将可能有病但表面上健康的人，同那些可能无病的人区分开来。筛检试验不是诊断试验，是一种初步检查。对筛检试验阳性者或可疑阳性者，必须进一步确诊，以便对确诊患者采取必要的措施。筛检项目：在目标人群中实施有计划、有目的的筛检工作时。 筛间实验与诊断试验的区别：

①筛检试验是把患者及可疑有该病的人与健康人区别开来。 ②诊断试验是进一步把患者与可疑有病但实际无病者区别开来。

因此，筛检第一步，诊断第二步，治疗第三步。 筛检要求：筛检方法应简单易行、敏感、廉价、有效、应用广泛。

（2）筛检的主要用途：

①筛检最初用于早期发现那些处于临床前期或临床初期的可疑患者，以进行早诊断和早治疗，提高治愈率或延缓疾病的发展，改善预后。如检查空腹血糖筛检糖尿病，对空腹血糖升高者进一步确诊检查，达到早诊断、早治疗糖尿病的目的。 ②筛检试验越来越多地应用于发现某些疾病的高危个体，以预防疾病的发生。如筛检高血压以预防脑卒中，筛检高胆固醇血症以预防冠心病等。 ③开展流行病学监测，了解疾病的患病率及其趋势，为公共卫生决策提供科学依据。 ④了解疾病的自然史。通过对人群疾病的筛检，可以了解疾病处于不同病理生理变化及不同临床时期的状态变化，了解疾病发生，发展的过程。如糖尿病患者在发生糖尿病之前，一般都要经过空腹血糖损害或糖耐量减低的时期，在此时期进行正确的行为干预和(或)药物治疗，可以延缓糖尿病的发生。 ⑤在健康管理过程中,筛查的目的主要是早期发现患者,发现高危人群。 若是对集体单位人群的健康管理，筛检的目的还包括了解人群某病患病情况的变化等，以制定应对策略，进行集体干预。

（3）筛检试验的评价指标：真实性评价指标：灵敏度和特异度

（4）筛检试验的类型：按筛检对象的范围分类，可分为群体筛检和选择性筛检。

①群体筛检：是指当疾病的患病率较高时，需开展普遍筛检，筛检对象可以是一定范围的整个人群。 ②选择性筛检：是将工作重点集中在高危人群组，例如在40岁以上的超重肥胖人群中筛检糖尿病。

（5）筛检的方法：

①单项筛检：用一种筛检试验，检查某一种疾病。如阴道细胞学涂片查宫颈癌。【多项检一病】 ②多项筛检：多种筛检方法，联合使用。如同时进行胸透、查血沉、痰中结核菌发现可疑肺结核，再进一步检查作明确诊断【多项筛检一病】

（6）筛检的应用原则： ①合适的疾病 ：筛检的疾病应是当地当前对公众危害大的疾病或缺陷，如发病率或死亡率高，易致残的疾病

A 筛检疾病应具有可识别潜伏期或早期症状 B 对疾病自然史，包括潜伏期发展到临床期、疾病结局的过程应有足够的了解 C 对被筛检和诊断出来的病例应有效且易被群众接受的治疗方法。

②合适的筛检试验 ：筛检试验的方法必须，快速、简单、经济、有效，乐于被群众所接受。 ③合适的筛检计划：

A 筛检计划应是一个连续的过程，对筛选试验阴性者，还应定期检查。 B 要考虑筛检、诊断治疗整个过程的成本-效益问题

根据以上原则，建议目前筛检慢性病，主要考虑高血压、糖尿病、超重和肥胖、慢性阻塞性肺疾病，以及宫颈癌、乳腺癌、大肠癌、肝癌、鼻咽癌等筛检方法比较成熟，早期发现治疗效果好的肿瘤。

一、基本概念

1 医学统计学定义：根据统计学的原理和方法，研究医学数据收集、表达和分析的一门应用学科。 2 医学统计学研究对象：是具有不确定性的医学数据。 3 医学统计学的基本研究方法：通过收集大量资料，通常是人、动物或生物材料的测量值，发现其中统计学规律 4 医学统计学的主要内容：

①统计设计：包括调查设计和实验设计，统计设计是保证统计描述和推断正确的基础。 ②统计描述：对原始数据进行归纳整理，用相应的统计指标，如率，均数等，表示出研究对象最鲜明的数量特征，必要时选择统计表或统计图。 ③统计推断：在统计描述的基础上，对统计指标的差别和关联性进行分析和推断。

5 医学统计资料的类型： 在医学研究中，试验或观察结果常按分组因素和反应变量分别记录。 分组因素：研究者根据实验目的施加的干预如不同药物,研究者感兴趣的因素如年龄,在流行病学中,又称危险因素 反应变量：是指施加干预后的研究对象的生物反应，如是否死亡，血压值等。统计资料类型通常是针对反应变量而言。在计算统计指标时，各反应变量又可进一步划分为：

①计量资料：也称数值变量，为定量测量的结果，通常用专用仪器测量，并有计量单位，有连续性特点，如身高。 ②计数资料：是定性观察的结果，有二分类和多分类两种情况。 ③等级资料：介于定量测量和定性观察之间的半定性观察结果，通常有两个以上等级。如阴性、阳性、强阳性等。

等级资料与计数资料统称为分类变量。区别在于等级资料各类别间存在大小或程度差别。许多实际资料可能有多个反应变量，且包括多种资料类型。如收缩压、舒张压属于计量资料；有无药物不良反应属于计数资料；服药依从性属于等级资料（规律、间断、不服药）。 6 医学统计工作的基本步骤：（1）研究设计（2）收集资料（3）整理资料（4）分析资料 （1）研究设计：按研究者是否对观察对象施加干预，分为调查设计和实验设计两大类。

①调查设计(不加干预)：主要是了解客观实际情况的现场工作。 ②实验设计(加干预)：根据研究对象不同，分为动物实验、临床试验(或现场试验)，

这两类均包括专业设计和统计学设计两个方面，两者应相互结合，缺一不可。

（2）收集资料：任务是取得准确可靠的原始数据 统计资料来源：

①经常性资料（医疗原始记录） ②一时性资料（临时设计的调查表或调查问卷）

统计资料要求：

①资料必须完整、正确、及时 ②要有足够的数量 ③资料的代表性和可比性。

（3）整理资料：任务是整理原始数据，使其系统化、条理化、以便进一步计算指标和分析。 ①原始数据的检查与核对：对原始记录的检查核对，应在调查现场完成；整理资料的过程应从不同角度、用不同方法进一步净化数据。包括： A 统计数据的常规检查 B 数据的取值范围检错 C 数据间的逻辑关系检错 ②数据的分组设计和归纳汇总：按资料的性质和数量特征分组，以反映事物的特点。常用分组方法有： A 质量分组：按事物的性质和类型分组，此方法适用于分类变量资料或等级资料。 B 数量分组：按观察值的大小进行分组，此方法适用于数值变量的资料。 （4）分析资料：任务是按研究设计要求，结合资料类型计算有关指标，阐明事务内在联系和规律。包括：

①用一些统计指标、统计图表等方式，表达和描述资料的数量特征和分布规律，不涉及由样本推论总体的问题。 ②对样本统计指标作参数估计和假设检验，并结合专业知识解释分析结果，目的是用样本信息推断总体特征。

7 统计学的几个重要概念 ①同质：研究对象具有相同的背景、条件、属性称为同质。变异：同一性质的事物，其个体观察值(变量值)之间的差异，在统计学上称为变异。统计学所研究的对象是以同质为基础，并具有变异的事物或现象。 ②总体：根据研究目的确定的同质观察单位全体，即同质的所有观察单位某种变量值的集合。 有限总体：总体在确定的同质基础上明确了一定时间一定空间的有限个观察单位。 无限总体：有时总体是抽象的，观察单位是无限的，该总体称为无限总体。个体：观察单位即个体，是统计学中最基本的单位。样本：从总体中随机抽取有代表性的一部分观察单位,其测量值(或观察值)的集合称为样本。抽样研究的目的是用样本信息推论总体特征 ③参数：指总体指标，如总体均数，总体率、总体标准差等。 统计量：指样本指标，如样本均数，样本率、样本标准差等。参数是未知的，需要用统计量去估计。用统计量推论参数的方法，统计学上称为参数估计和参数检验。 ④误差：医学科学研究中的误差，通常指测量值与真实值之差,包括系统误差和随机测量误差,以及样本指标与总体指标之差,即抽样误差。 系统误差：应该通过周密的研究设计和调查(或测量)过程中的严格质量控制措施予以解决。随机测量误差和抽样误差都属于随机误差，其中随机测量误差是不可避免的，但应尽量小，而抽样误差是抽样机遇所致，是客观存在，不可避免的。可通过统计方法估计，也可通过增大样本含量使其减小。 ⑤概率：对总体而言。指某随机事件发生的可能性大小的数值，0≤P≤1, P≤0.05或P≤0.01称为小概率事件，表示某事件发生的可能性很小。频率：对样本而言。一次实验结果计算得到的样本率。

二、统计描述

1 数值变量资料的统计描述：

（1）频数表：将所有观察结果的频数(相同观察结果出现的次数)按一定顺序排列在一起便是频数表。 编制频数表目的：

①简化数据 ②便于考察观察结果的分布特征

组段通常取10个左右，组段长度(组距)的选择以方便阅读为原则。 （2）频数分布图(直方图)：它能直观反映连续变量各种取值出现的机会。 （3）描述集中趋势指标： ①算数均数(均数)：当资料服从对称分布时，统计中常用算数均数描述其平均水平(或集中趋势)。 ②中位数：指一组由小到大顺序排列的观测值中位次居中的那个观测值。对于对称分布的资料，理论上中位数和均数计算结果一致。对于不对称资料(或称偏态资料)，采用中位数描述资料的平均水平比均数更合适。 ③几何均数：是描述偏态分布资料集中趋势的另一种重要指标。特别适合于：

A 等比资料，如医学上血清抗体滴度、人口几何增长资料等 B 对数正态分布资料：如正常成人血铅值或某些疾病的潜伏期等。

（4）描述离散趋势的指标： ①方差与标准差：是描述对称分布资料离散趋势的重要指标。方差与标准差的数值越大,说明观测值的变异度越大,即离散程度越大,此时的数据就会越分散,均值的代表性越差 ②极差：亦称全距，是一组观察值中最大值与最小值之差，用于反映观察值变异的范围大小，极差大，变异度大。缺点是：

A 除最大值和最小值外，不能反映组内其他数据的变异度，因此它描述的离散趋势是粗略的。 B 易受个别特大值、特小值的影响，即不够稳定。

③百分位数：是一个位置指标。将由小到大顺序排列的观察值分成100等份，对应于第x%位的观察值即为第x百分位数。P50百分位数就是中位数，中位数是一个特定的百分位数。常用于描述偏态分布资料在某百分位置上的水平及确定偏态分布资料医学参考值范围。
④变异系数：用CV表示，即标准差与均数之比，用百分数表示。

2 分类资料的统计描述：

（1）频数表：二分类、多分类
（2）相对数：比例、率

三、统计表和统计图

1 统计表：

（1）统计表定义：是以表格形式，表达被研究对象的特征、内部构成及研究项目分组之间的数量关系。 （2）统计表的结构：包括标题、标目、线条、数字等部分,有些统计表还有备注。

标目包括横标目和竖标， 横标目说明横行数字的属性，位于表格左侧； 纵标目说明每一列数字的属性，位于表格的第一横行。

（3）统计表制表原则：

①重点突出、简单明了：一张表只有一个中心内容，明确显示需要说明的问题。 ②主谓分明，层次清楚：合理安排横纵目标，使人一目了然。

（4）统计表制表的基本要求： ①标题:概括说明表的内容,位于表的上方,内容简洁扼要。 ②标目:用以指明表内数字含义,横标目为主语,表示被研究事物,位于表格左侧;纵表目为谓语,表示被研究事物各项统计指标。 ③线条: 除必须的顶线、底线、标目线以外,应尽量减少其他不必要的线条,不使用竖线、斜线。 ④数字:一律使用阿拉伯数字,应准确无误；同一指标的数字的小数位应一致,位次对齐。

2 统计图：

（1）统计图定义：是通过点的位置,线段的升降,直条的长短和面积的大小来表现事物的数量关系。特点是直观、形象，利于对比等。 （2）统计图制图的基本要求

①根据资料的性质和分析目的,选择合适的图形. ②统计图要有标题,位于图体下方的中央位置. ③绘制有坐标轴的图形,纵,横轴要有标目,标注原点,尺度,单位等,纵横轴比例以 5:7 为宜。 ④同一张图内比较不同事物时,需用不同颜色或样式的线条区别表示,并附图例说明。

（3）常用统计图的类型： A 描述计量资料的有：直方图、折线图、误差条图、箱式图、散点图
B 描述计数资料的有：直条图、圆图、百分条图

①直方图 ：用于表示连续变量的频数分布情况。直条连续排布，各直条宽度代表各组段组距，高代表相应频数或频率 ②折线图 ：用于描述一个变量随另一个变量的变化而变化的趋势和幅度,通常是变量随时间的变化情况，横轴和纵轴的刻度可不从0开始，用短直线依次连接相邻各点，不应将折线绘制成光滑曲线。【看波动】 ③误差条图 :用于比较多组连续变量的均值和标准差(或可信区间)。直条高度表示均值，直条顶端用T型图标或工型图标表示标准差的大小（或可信区间范围）。 ④箱式图 ：当连续变量为偏态分布时，可比较多组间平均水平和变异程度。由中部箱体，和两端T型图标构成。箱体的上下端分别表示上下四分位数(P75和P25)，箱体高度为四分位数间距，箱体中的横线表示中位数所在位置，箱体两端的T型图标的短横线位置通常为最小值和最大值。 ⑤直条图：用于比较统计指标数值的大小和对比关系，各等宽直条间隔排布，直条高度表示统计指标的数值大小。直条可竖向排布也可横向排布，根据分组标志或统计指标多少可以分为单式条图和复式条图。

单式直条图具有一个统计指标和一个分组指标。 复式直条图可同时比较一个统计指标多种分组标志或一个分组标志多个统计指标的差异。

⑥圆图 ：用于表示构成比，圆的总面积为100%，圆内各扇形区域表示各部分所占比例。绘制时各扇形的排布顺序通常按比例从大到小或自然顺序由12点位置起，顺时针排布，每3.6度角为1%。 ⑦百分条图：当要同时比较多组构成比时，采用百分条图比圆图更直观便捷。百分条图中直条的全长代表100%，其中每段长度对应该部分在全体中占比。

课本例子：

①直方图 图意：194名被调查社区老年人中，跌倒风险评分主要集中在10分左右，评分6-16的老年人占了绝大部分。 ②折线图 图意：甲患者连续5日收缩压的波动幅度，要大于乙患者，但两名患者连续5日收缩压平均水平接近。 ③误差条图 ④箱式图 图意：社区老年人跌倒风险总分的平均水平略高于养老机构老年人，从箱体高度可知社区老年人跌倒风险总分的变异程度也大于养老机构老年人。 ④单式直条图 图意：社区老年人跌倒高危率比养老机构高 ⑤复式直条图 图意：相较于养老机构老年人，社区老年人跌倒高危率高而跌倒认知率低。 ⑥圆图 图意：415名社区老年人中，80-90岁人数最多，占比46.7%，90岁以上人数最少，占比8.9% ⑦百分条图 图意：社区老年人中80-90岁组占比最高，达到46.7，养老机构老年人中70-80岁组占比最高，达到39.1%。总体上，社区老年人80岁以上占比55.6%高于养老机构36.6%

四、统计推断

1 统计推断的概念：是用样本信息推断总体特征,包括总体参数的估计和假设检验,它是统计学的核心内容。 2 数值变量的统计推断主要包括：

①总体均数估计、 ②t 检验,
③方差分析
④ 数值变量资料的秩和检验;

3 分类变量资料的统计推断包括：

①总体率的估计
②分类变量的 z 检验、χ2(卡方)检验、秩和检验。

4 假设检验的基本原理：亦称为显著性检验，是统计推断的核心，也是实际应用最广的内容。把需要判断的总体特征叫做“统计假设”，简称假设，利用样本信息判断假设是否成立的统计方法称为假设检验。假设总体分布类型已知，对参数进行假设检验，称为参数检验。 5 假设检验的基本步骤 （1）建立假设检验，确定检验水准。

①根据统计推断目的，提出对总体特征的假设。检验假设有两种

A 无效假设：又称零假设，用Ho表示，一般将欲否定的假设设为Ho，它是计算检验统计量的基础。 B 备择假设：用H1表示，H1与Ho相互对立，当Ho被拒绝时，则接受H1。

②确定检验水准：也称为显著性水准，符号为α，是事先确定的允许犯1类错误的概率，也是是否拒绝Ho的界值。通常把α取为小概率事件界值。

（2）选定检验方法，计算检验统计量。 检验统计量是在Ho假设的条件下计算出来的，其抽样分布在统计推断中是十分重要的。 （3）确定P值，做出推断结论。 P值得含义是指从Ho所规定的总体中做随机抽样，获得等于及大于(或等于及小于)现有样本的检验统计量值的概率。然后将概率P与检验水准α比较，得出结论。

①P≤α，拒绝Ho，接受H1，可以认为差别有统计学意义，两总体均数不相等。 ②P>α，不拒绝Ho，差别无统计学意义，不能认为两总体均数不相等。

6 假设检验的基本思想：首先针对研究总体建立假设，在假设成立的前提下，通过计算样本统计量判断抽到目前样本的可能性是否为小概率事件，若为小概率事件，则拒绝Ho，否则，不拒绝Ho。 7 假设检验的注意事项

（1）检验方法的正确选择 每种检验方法有其话用的条件,应根据研究目的、设计方案、研究变量的类型、资料的分布、样本大小等进行选择。 （2）结果的解释 正确解释**“差别有统计学意义”**的含义。

①一般情况,假设检验中 P≤0.05,称为差别有统计学意义；P≤0.01,称为差别有高度统计学意义。此时拒绝Ho，接受H1。 α越小，拒绝Ho时犯1类错误的概率越小，越有理由相信Ho不真。但这不意味着两个总体均数相差很大，差别的大小及差别有无实际意义应根据专业知识来确定。 ②当不拒绝Ho时，称为差别无统计学意义，不能认为两个总体均数相差不大，或一定相等，即应同时考虑其统计学意义与临床意义。

例如，某进口抗高血压高价药与传统复方降压片低价药的临床试验结果显示：新药组较传统组降压幅度仅提高1mmHg，其提高临床治疗作用不明显，但因为大样本各1000例试验，故差异有统计学意义(P<0.001)

本文作者：猫佳
文章链接：https://laiui.com/2020/07311755/
版权声明：本站所有文章除注明转载/出处外，皆为作者原创，欢迎转载。转载请注明作者瘦瘦及在文章页面明显位置给出原文链接，否则保留追究法律责任的权利!

基础知识流行病学统计图统计表

健康管理师基础知识--第五章《流行病学和医学统计学基本知识》重点

一、 基本概念

1 流行病学的定义

2 流行病学的任务：

3 流行病学的研究方法：

二、常用指标：

1 率和比(proportion)

(1)比例：是表示同一事物局部与总体之间数量上的比值，分子和分母单位相同，且分子包含于分母之中，

(2)率(rate)：表示在一定的条件下某现象实际发生的例数与可能发生该现象的总例数之比，来说明单位时间内某现象发生的频率或强度。一般用百分率、千分率、万分率或10万分率表示。

2 发病指标

(1)发病率(incidence rate)的概念: 是指一定时期内特定人群中某病新病例出现的频率。

(2)患病率的定义(prevalence rate)：

3 死亡指标

(1)死亡率(mortality rate):是指某人群在单位时间内死于所有原因的人数在该人群中所占的比例。

(2)病死率(fatality rate/case fatality)：表示一定时期内患某病的全部患者中因该病而死亡的比例.

（3）生存率(survival rate)：又称存活率,是指患某种病的人(或接受某种治疗措施的患者，)经 n 年随访,到随访结束时仍存活的病例数占观察病例数的比例。

4 相对危险度

(1)相对危险度的概念：相对危险度(relative risk,RR)或率比(rate ratio) ，是指暴露组发病率 Ie,与非暴露组发病率 Io,之比,它反映了暴露与疾病的关联强度。

(2)比值比(odds ratio，OR)的概念：又称优势比、交叉乘积比。指病例组中暴露人数与非暴露人数的比值除以对照组中暴露人数与非暴露人数的比值。

5 归因危险度(人群公共卫生意义)

（1）归因危险度(attributable risk，AR)：又叫率差(rate difference，RD),指暴露组发病率与非暴露组发病率之差, 它反映发病归因于暴露因素的程度.

（2）归因危险度百分比（AR%）：是指暴露人群总由暴露因素引起的发病在所有发病中所占的百分比。

（3）人群归因危险度百分比（PAR%）：表示全人群中由暴露引起的发病在全部发病中的比例

三、常用的研究方法：

1 现况调查：是描述性流行病学最常用的研究方法，在病因研究中作用有限。

2 队列研究(群组研究)

3 病例对照研究：省时、省力，比队列研究更为广泛

4 实验性研究(干预研究): (1)临床试验、(2)社区试验

(1)临床试验（clincical trial）

(2) 社区试验（community trial）

5 诊断试验的评价研究

(2)诊断试验的诊断指标：可分为三类：

(3)诊断试验的诊断标准：

(4)诊断试验的评价指标：真实性、可靠性、收益

(5)诊断试验的评价标准：

(6)提高诊断质量的方法：

6 筛检试验的评价研究

一、基本概念

二、统计描述

1 数值变量资料的统计描述：

2 分类资料的统计描述：

三、统计表和统计图

1 统计表：

2 统计图：

课本例子：

四、统计推断

一、基本概念