阿尔茨海默病:相对重要性诊断
-
+
御姐音
大叔音
萝莉音
型男音
摘要:随着人口老龄化,阿尔茨海默病正在迅速增加,对该病的诊断仍然知之甚少。与癌症相比,90% 的患者会意识到自己的诊断,但只有 45% 的阿尔茨海默氏症患者知道。因此,对可靠诊断的生物标志物的需求对于帮助寻找这种严重疾病的治疗方法是巨大的。因此,本文的主要目的是利用来自基线测量的信息来开发使用多元逻辑回归的统计预测模型,以区分阿尔茨海默病患者和认知正常的个体。我们的最佳预测模型包括六个风险因素和两个交互项,并已使用分类准确性、敏感性、特异性值和曲线下面积进行了评估。
关键词
阿尔茨海默病,多元 Logistic 回归,预测 模型,分类 精度
一、简介
阿尔茨海默病会导致记忆力减退,这不是衰老的正常部分。它是唯一无法预防、治疗甚至减缓的疾病。阿尔茨海默病协会 2018 年报告的最新事实表明,只有阿尔茨海默病导致的死亡人数显着增加,而美国其他主要死因的死亡人数显着减少。图 1中的条形图显示了 2000 年至 2015 年间主要死因的百分比变化。正如我们所见,心脏病(美国第一大死因)的死亡人数下降了 11%;然而,记录在案的阿尔茨海默病死亡人数增加了 123% [ 1 ]。
图 1。2000-2015 年选定死因的百分比。资料来源:2018 年阿尔茨海默病事实和数据。
与癌症相比,90% 的患者会意识到自己的诊断,但只有 45% 的阿尔茨海默氏症患者知道 [ 2 ]。因此,研究人员和医生正在努力开发一种阿尔茨海默病的诊断模式,有助于在症状加重之前及早发现这种疾病。不同类型的测试包括神经心理学测试、血液测试、脑脊液分析和脑成像已被用于帮助理解和诊断这种严重的疾病。神经心理学测试是对大脑功能的评估,以评估包括注意力、解决问题、记忆力、语言、情绪和行为在内的多个领域。常用的测试工具包括简易精神状态检查(MMSE)和痴呆评定量表(CDR)。
脑成像用于检测阿尔茨海默病引起的一些大脑变化,即检测斑块和缠结的水平,这是与阿尔茨海默病存在相关的两种大脑疾病。在大脑中垂死的细胞之间发现了由一种叫做 β-淀粉样蛋白的蛋白质积聚而成的斑块,而缠结是垂死细胞内来自另一种叫做 tau 的蛋白质的扭曲纤维。β-淀粉样蛋白和 tau 蛋白通常是身体产生的碎片,但在阿尔茨海默病中,这些蛋白质是异常的。
脑脊液分析 (CSF) 收集保护和包围大脑和脊髓的透明液体,以确定 β-淀粉样蛋白、总 tau (T-tau) 和磷酸化 tau (P-tau) 蛋白的水平。由于 CSF 与大脑和脊柱直接接触,因此收集液体样本可能是这种神经退行性疾病的有用诊断工具。
本研究的主要目标是开发最佳统计模型,以使用逻辑回归模型正确预测阿尔茨海默病患者的人口统计学、脑脊液、实验室和脑成像因素。该模型将使我们能够准确评估患者被诊断患有阿尔茨海默病的概率。此外,我们可以根据它们对响应的相对重要性对重要的风险因素进行排名。因此,医生可以在开始任何治疗之前使用我们提出的数据驱动模型作为决策支持。
2. 数据
在本研究中,我们使用了来自阿尔茨海默病神经影像学倡议 (ADNI) 数据库的数据。ADNI 的主要目标是通过结合参与者的临床、影像、遗传和生物标志物来检测和跟踪阿尔茨海默病的进展,以帮助研究人员和医生开发新的治疗方法。有关 ADNI 的更多信息,请访问 http://adni.loni.usc.edu。
我们的数据包括 169 名年龄在 58 至 94 岁之间的受试者。我们有关于他们的人口统计学特征、神经心理学测试、实验室数据、脑脊液分析和脑成像数据的信息。下面的图 2给出了我们数据的扩展细节。
在脑脊液分析中,我们从脑脊液中获得了以皮克/毫升 (pg/ml) 为单位的 P-tau 和淀粉样蛋白 β 浓度。实验室数据包括以纳克/毫升 (ng/mL) 为单位的维生素 B12、以毫克/升 (mU/L) 为单位的促甲状腺激素、以克/分升 (g/dL) 为单位的血红蛋白和以毫克/分升为单位的胆固醇水平。 mg/dL),因为它们与阿尔茨海默病有关。
图 2。数据示意图。
MRI 扫描包括关于总脑体积、全脑灰质体积、全脑白质体积和颅内体积的测量。
我们在本分析中的回应是基于 SPARE-AD 评分(用于识别早期 AD 的异常空间模式)参与者作为认知正常个体 (CN) 或阿尔茨海默病 (AD) 的状态。SPARE-AD 是对脑萎缩空间模式的成像分析,用于区分 AD 和 CN。阳性诊断值表明存在阿尔茨海默病,阴性值表明大脑结构的正常模式 [ 3 ] [ 4 ] [ 5 ]。
男性和女性被诊断患有阿尔茨海默病的概率比较
几项研究提到,女性比男性更容易被诊断出患有阿尔茨海默病 [ 6 ]。我们通过解决以下问题继续调查此问题:
● 男女平等是否被诊断患有阿尔茨海默病?
为了回答这个问题,我们使用假设检验来确定两个比例之间的差异是否显着。也就是检验假设
那 H0:磷1=磷2对比 H1:磷1≠磷2, 在哪里 磷1= 0.5643 = (57101)是患有 AD 的男性比例和 磷2= 0.5441 = (3768)是女性的比例
广告。p值= 0.7951 表明在 5% 的显着性水平下,被诊断患有阿尔茨海默病的男性和女性的百分比之间没有统计学上的显着差异。
3. 统计方法
对于我们的分析,我们使用多元逻辑回归来预测患者的状态为 CN 或 AD。逻辑回归是一种用于描述和解释二元响应与具有统计学意义的风险因素之间关系的方法。它可以回答以下问题:年龄、体重、维生素 B12、胆固醇水平、tau 和 β-淀粉样蛋白是否会影响患阿尔茨海默病的概率?
在数学上,设Y为二进制响应,其可能的结果为 1(“AD”)和 0(“CN”)。Y的分布由概率指定 磷(是= 1 ) =πAD 和 磷(是= 0 ) = ( 1 - π)CN 的,其中 乙(是) = π是Y的平均值。让 π( × )表示在给定风险因素x的情况下选择 AD 患者的概率。逻辑回归模型对该概率的 logit 具有线性形式,定义为 [ 7 ]。
对数[ π( x ) ]=对数(π( × )1 - π( × )) = ∑βjX我j,(1)
在哪里 βj是第j个风险因素 的系数( j = 1 , ⋯ , p ), X我j是风险因子j的第i个观测值 ( i = 1 , ⋯ , n )和 (π( × )1 - π( × ))是几率
表示预测 AD 患者的概率与 CN 概率之间的比率。
逻辑回归模型意味着对由风险因素给出的选择 AD 患者的概率进行分析:
π( x ) =exp ( ∑βjX我j)1 + exp ( ∑βjX我j).(2)
4. 多元物流模型的实现
我们将数据集分为训练和测试两部分,分别使用 75% 和 25% 的数据。我们从包含所有预测变量及其可能交互作用的完整逻辑回归模型开始。我们的逻辑模型包含所有自变量及其可能的相互作用,以预测患者是否患有阿尔茨海默病:
登录[磷1 - P] =β0+β1X1+β2X2+ ⋯ +βjXj,(3)
其中P表示选择 AD 患者的概率,β j表示系数,X表示风险因素和可能的相互作用。使用反向消除算法去除复杂模型中P值最大的项,并在任何进一步消除导致拟合不佳时停止。除了通过拟合值与真实期望值的接近程度来判断模型质量的最小 AIC(Akaike 信息标准)之外,这意味着,选择最小化的最佳统计预测模型,
AIC = - 2 ln ( L ) + 2 k ,
其中L是似然值,k是模型中的参数数量。因此,我们以最小 AIC 预测患者状况的最优数据驱动统计逻辑模型由下式给出:
日志[磷1 - P] =7.55-0.003Abeta+0.170PTau+10.18甲状腺 + 0.002 VB12 - 0.14 Chelost - 0.44下摆 + 0.01 ( Chelost ∩ Hemog ) - 0.87 (甲状腺∩ Hemog )(4)
符号 ( ∩) 表示交互作用,从我们提出的模型中可以看出,六个风险因素和只有两个交互作用项在统计上显着有助于预测患者的病情,即磷酸化 tau 蛋白 (P-tau)、β-淀粉样蛋白、甲状腺刺激激素、维生素 B12、胆固醇、血红蛋白和(胆固醇)之间的相互作用 ∩血红蛋白)和(促甲状腺激素 ∩血红蛋白)。此外,正如我们所看到的,在我们的最佳预测模型中,年龄并不是重要的风险因素之一,这表明阿尔茨海默病不是正常衰老的一部分。
逻辑回归中的系数表明预期对数几率的变化相对于 ( X j ) 中的一个单位变化,保持所有其他预测变量是恒定的 [ 8 ] [ 9 ]。因此,对 P-tau 蛋白系数 (0.170) 的解释意味着随着 P-tau 蛋白水平的增加,被诊断患有 AD 的参与者的几率将增加,同时保持所有其他变量不变。或者,我们可以使用优势比 经验( 0.170 ) = 1.85,这意味着在所有其他预测变量不变的情况下,P-tau 蛋白每增加一个单位,阿尔茨海默病患者的几率就会增加 1.85 倍。
类似地,β-淀粉样蛋白的系数 (-0.003) 的解释意味着随着 β-淀粉样蛋白水平的降低,在所有其他变量保持不变的情况下,被诊断患有 AD 的参与者的几率将增加。或者,通过使用优势比 exp ( - 0.003 ) = 0.997,在所有其他预测因子不变的情况下,β-淀粉样蛋白每减少一个单位,阿尔茨海默病患者的几率就会增加 0.997 倍。
模型评估
为了评估我们的最佳预测模型,我们使用分类准确性、敏感性、特异性值和曲线下面积 (AUC) 来测试数据。从多重逻辑模型中正确识别的 AD 和 CN 参与者的比例称为“准确性”。从我们的预测模型中正确识别为患有该疾病的实际阿尔茨海默病患者的比例称为“敏感性”,而从模型中正确识别出的实际认知正常个体的比例称为“特异性”。一个完美的预测模型将被描述为 100% 敏感(即将阿尔茨海默病组中的所有病人预测为阿尔茨海默病)和 100% 特异性(即将所有正常个体预测为认知正常)。然而,对于任何测试,
我们使用测试数据的混淆矩阵来获得评估模型所需的值。混淆矩阵是一个分类表,描述了我们的多元逻辑回归模型在从认知正常的个体中预测阿尔茨海默病患者方面的效果。表 1展示了一个混淆矩阵,我们用它来评估我们在测试数据上提出的模型。制定该表的四个结果是真阳性 ( TP )、真阴性 ( TN )、假阳性 ( FP ) 和假阴性 ( FN )。TP是正确识别为患病的阿尔茨海默病患者的数量,TN是正确分类为健康的正常个体的数量。FP是错误的健康人数
实际班级
广告
中国
全部的
预测等级
中国
总氮= 10
FN= 5
15
广告
FP= 2
TP= 18
20
全部的
N=12
P= 23
35
表 1。混淆矩阵。
确定为生病,FN是我们的模型错误地预测为健康个体的阿尔茨海默氏症病例数。
使用混淆矩阵,我们发现我们的模型准确率是 (吨磷+ Tññ+ P) =80%它正确预测了所有阿尔茨海默病病例的 78.26%(敏感性 = (吨磷磷))。此外,它正确识别了 83.33% 的非阿尔茨海默病患者(特异性 = (吨ññ))。我们的分类结果总结在下面的表 2中给出。
另一种以图形方式评估我们的模型的方法是接收器操作特性 (ROC)。ROC 曲线上的每个点代表一个(敏感性,1-特异性)对,对应于不同的决策截止点。ROC 曲线下面积 (AUC) 衡量模型区分两个诊断组的能力。对于我们提出的模型,AUC 值为 87.68%,这意味着我们的模型在区分两类患者状况方面做得很好。图 3表示具有相应 AUC 值的接收器操作特征曲线。在仔细研究我们的结果后,我们可以得出结论,我们的预测模型可以很好地预测患者的状况。
评价值
百分比
准确性
80%
灵敏度
78.26%
特异性
83.33%
表 2。多元逻辑回归模型的分类总结。
图 3。受试者工作特征曲线。
在验证了我们提出的模型后,我们需要根据风险因素对阿尔茨海默病诊断的重要性对风险因素进行排名。我们通过其标准化系数(权重)和伪偏相关的绝对值来确定风险因素的相对重要性。在标准化系数中,绝对值越高表明与阿尔茨海默氏症诊断的关联强度越大 [ 10 ] [ 11 ]。标准化重量定义为:
标准化重量=β一世秒/秒d一世,(5)
在哪里 β一世是预测变量i的估计系数(权重) , sd一世是预测变量i的样本标准差,并且 s = π/3–√.
伪偏相关由下式给出:
r = ±(W一世− 2千) / - 2升大号0----------------√(6)
在哪里 W一世是预测变量i的 Wald 卡方统计量,K是预测变量i的自由度,并且 − 2升大号0是只有截距项的模型的对数似然。值越接近 1 或 -1,预测变量与结果之间的关联越强 [ 12 ]。
因此,在我们的预测模型中显着影响风险因素的相对重要性如表 3 所示。可以看出,两种方法的结果是一致的,我们发现P-tau蛋白是诊断阿尔茨海默病的最关键因素,其次是β-淀粉样蛋白。作者对这两种蛋白质进行了广泛的研究[ 13 ]。此外,(甲状腺)之间的相互作用 ∩血红蛋白)在单独的甲状腺激素和单独的血红蛋白水平之前被列为第三重要的预测因子,它们分别被列为第四和第八重要的危险因素。
秩
风险因素
标准化重量
伪偏相关
1
P-Tau蛋白
4.384
0.542
2
β-淀粉样蛋白
3.568
-0.410
3
甲状腺∩血红蛋白
2.514
-0.243
4
甲状腺
2.171
0.212
5
维生素 B12
1.665
0.196
6
胆固醇
1.554
-0.154
7
胆固醇∩血红蛋白
1.496
0.147
8
血红蛋白
0.349
-0.019
表 3。风险因素的相对重要性。
5。结论
了解疾病原因的重要性有助于找到治愈它的最佳方法。虽然几个主要的死亡原因正在减少,但阿尔茨海默氏症的死亡人数却在上升。因此,在本研究中,我们开发了一个使用多元逻辑回归的统计预测模型,通过使用反向消除选择相关风险因素来预测阿尔茨海默病患者。我们发现了六个危险因素和只有两个相互作用项,即磷酸化 tau 蛋白 (P-tau)、β-淀粉样蛋白、促甲状腺激素、维生素 B12、胆固醇和(胆固醇)之间的相互作用。 ∩血红蛋白)和(促甲状腺激素 ∩血红蛋白)对阿尔茨海默病有显着影响。
我们通过分类准确性、敏感性、特异性值和曲线下面积来评估所提出模型的质量,结果证明了模型的有效性。然后,我们检查响应和显着贡献预测变量之间的关系,并根据它们的标准化系数对它们进行排名。通过定义和排列具有统计学意义的风险因素,它们将成为区分阿尔茨海默病患者和认知正常个体的筛查工具。
致谢
用于准备本文的数据来自阿尔茨海默病神经影像学倡议 (ADNI) 数据库 (adni.loni.usc.edu)。因此,ADNI 的研究人员为 ADNI 的设计和实施做出了贡献和/或提供了数据,但没有参与分析或撰写本报告。ADNI 调查人员的完整列表可在以下网址找到:http://adni.loni.usc.edu/wp-content/uploads/how_to_apply/ADNI_Acknowledgement_List.pdf。
利益冲突
作者声明与本文的发表没有利益冲突。
参考
[ 1 ] 阿尔茨海默病协会 (2018) 2018 年阿尔茨海默病事实和数据。包括一份关于早期诊断的财务和个人利益的特别报告。阿尔茨海默氏症和痴呆症,14, 367-429。
[ 2 ] 阿尔茨海默氏症统计数据——美国和全球统计数据。可用:
https ://braintest.com/alzheimers-statistics-throughout-the-united-states-and-worldwide/
[ 3 ] Davatzikos, C. 和 Da, X. (2013) Upenn/Sbia 的备用 Mci 评分:基于 MRI 的从 MCI 到 AD 转换的生物标志物。3-5。
[ 4 ] Davatzikos, C.、Xu, F.、An, Y.、Fan, Y. 和 Resnick, SM (2009) 正常老年人阿尔茨海默病样萎缩模式的纵向进展:备用 AD 指数。大脑,132,2026-2035。
[ 5 ] Davatzikos, C., Bhatt, P., Shaw, LM, Batmanghelich, KN 和 Trojanowski, JQ (2011) Prediction of MCI to AD Conversion, via MRI, CSF Biomarkers, and Pattern Classification。衰老的神经生物学,32, 2322.e19-2322.e27。
[ 6 ] 查普曼,RM 等人。(2011) 女性还有更远的路要走:正常老年人和阿尔茨海默病在口头记忆中的性别差异有助于更好地检测女性的阿尔茨海默病。国际神经心理学会杂志,17, 654-662。