也有一些常常用在ICU上的预后评分模型。APACHE-II评分(急性生理、年龄、慢性健康评测)是用来预测ICU中危重住院患者住院死亡危险程度的。这种模型最近已经被APACHE-III改进了,主要是细化了评分项,采用了ICU入院之前的诸如主要的内科和外科疾病分类、急性生理异常、年龄、原有功能的局限性、主要的合并症和治疗地点等因素。另一个在ICU中常用的评分系统是简化急性生理评分,也称作SAPS II,它是根据病人的生理和潜在疾病这些变量来计算的。当病人已经转入ICU时,虽然这些评分对治疗组来说是有用的,但是他们在确定患者是否是有长期死亡风险的方面是有限的。但是这些评分仍然能够让他们对其目标和价值进行有意义的讨论,以便他们确定另一种护理方式。
图5是模型在测试集上表现情况的受试者工作特性曲线(ROC)
结论
Positive实例:positive实例的限制条件的确定基于这一理论基础:在死亡之前的3-12个月内被推荐接受姑息治疗的病人最能从中获益。我们认为在病人死亡前的3个月内对其进行死亡几率预测为时太晚,因为病人在接受姑息治疗前需要一定的筹备时间;这一时间超过12个月也不可行,因为预测病人在很长时间范围内的死亡几率非常困难。更重要的是,姑息治疗介入协助是有限的,最好主要用于满足较为迫切的需求。
我们将这个问题看作为一个二分类问题,然后通过构建深度学习监督模型来解决。我们的目标不只是构建出可以很好地解决上述问题的模型,我们还希望探讨该模型在解决以下这个子问题(即:预测住院病人的死亡率)时的表现。因为姑息治疗工作者往往更容易介入住院病人的治疗。
我们还考虑了病人的人口统计数据(年龄、性别、种族、民族)以及观察期内各编码类别的汇总数据(如下所示):
方法
相关工作
我们的模型是由一个输入层(13654个维度)、18个隐藏层(每层 512 个维度)和一个标量输出层构成的深度神经网络(DNN)。我们在输出层应用逻辑损失函数(logistic loss function),在模型每层上都应用缩放指数线性单元(Scaled Exponential Linear Unit ,SeLU)。我们使用 Adam optimizer 和大小为128个样本的 mini-batch 对模型进行了优化。然后,我们对每250 个mini-batch迭代提取中间体模型snapshot(Intermediate model snapshots),选择在验证集上表现最好的snapshot作为最终模型。我们发现没有必要进行明确的正则化操作。通过对各种网络深度(从2到32)和激活函数(tanh、ReLU和SeLU)进行广泛的超参数搜索,我们得到了最终的网络架构。
评估
值得一提的是,预测死亡率是确定能从姑息治疗中获益病人的一个代理(proxy)问题。为了评估模型在原始问题上的性能,我们检验了高输出概率的假阳性患者情况。我们注意到,虽然这样的患者并没有在他们的预测日期12个月内死亡,但是他们经常被诊断为疾病晚期和/或需要高标准的医疗服务。这在第五节所示的阳性和假阳性例子中可以看到。
我们按照以下方法生成特征。为了捕获数据的纵向性质,bt网页游戏sf,我们将每位病人的观察期划分为4个观察阶段,表III显示了这四个阶段与预测日期(PD)的对比,阶段1最靠近预测日期,阶段4离预测日期最远。我们对各观察阶段分配不均匀的时间长度,目的是为了让模型更多关注靠近预测日期的数据。在每个病人的各观察阶段中,我们记录了每个编码类别中的每个编码出现的次数(开处方、计费等)。我们将这些编码出现的次数作为一个单独的特征。
我们将每位病人的预测日期之前的12个月作为观察期。在每位病人的观察期内,我们使用ICD9(国际疾病分类第9修订版)诊断和计费编码、《当代操作术语集》(Current Procedural Terminology,CPT)操作编码、RxNorm处方编码以及观察期内的医患接触来生成特征。
Intermountain死亡风险评分是一种基于实验室常规检查的针对所有原因进行死亡率预测的评分机制。该模型提供了30天、1年和5年死亡风险的评分,它的训练集包含71921人的数据,测试集包含47458人的数据。
图4是插值精度召回曲线( Interpolated Precision-Recall curve)
译文地址:微信公众号“AI科技大本营”(ID:rgznai100)
特征提取
表1:病人人数的划分
在本文中,我们主要从两个角度探讨这个问题。首先,医生不推荐病人接受姑息治疗的原因有很多,例如:对病情的预估过度乐观、时间压力或治疗惯性。这可能会导致病人在临终前无法按照自己的意愿生活,反而接受过度的侵入式治疗。其次,姑息治疗专业人员短缺严重,这使得通过人工审查病例的方法对候选病人进行筛选既昂贵又耗时。
我们将已登记死亡日期的病人作为positive实例,将其他病人作为negative实例。然后,我们将病人的预期死亡时间作为分界点,将健康档案上的时间线划分为虚拟未来(virtual future)和过去事件。我们利用每位病人在虚拟过去(virtual past)的数据来预测他们在未来3-12个月内的死亡几率。注意:在定义预测日期时,必须避免违反常识性的限制条件(见下文),不然的话标签就会无效。我们只针对可以在满足这些约束情况的前提下找到预测日期的病人。
研究表明,大约80%的美国人希望能在自己家中度过生命的最后时光,但是如愿的只有20%。事实上,超过60%的死亡发生在医院的急诊病房,而病人在临终前的最后一段时间会接受侵入性治疗。在过去10年间,可以提供姑息治疗的医院一直在增加。在2008年,全美所有病床数超过50张的医院中,有53%的医院设有姑息治疗团队,2015年这一比例已攀升至67%。虽然可以提供姑息治疗的医院越来越多,但是根据国家姑息治疗登记处(National Palliative Care Registry)的数据,在所有需要接受姑息治疗的病人(占所有住院病人7% – 8%)中,只有不到一半的人真正接受了这种治疗。造成这种情况的主要原因是姑息治疗专业人员的短缺以及缺乏让医疗系统聘用这些人员的激励措施。通过相关技术我们可以高效地识别出最需要姑息治疗的病人,但是在现有治疗模式下人们可能会忽视技术的应用。
在本节中,我们将根据在验证集上获得最好AP分数选择的模型,来给出在测试集上获得的技术评估结果。我们观察到模型根据0.042的Brier score进行了合理的校正(如图3所示)。在我们感兴趣的高阈值的规则下,该模型在估计概率方面是一个比较保守(显得信心不足)的模型,但是这应该不会有什么坏的影响。
住院病人(admitted patients):预测日期与住院日期相对应的病人为住院病人,其余病人为非住院病人。(注意:非住院病人治疗历史中可能还有其他记录在案的住院经历)。对住院病人的预测日期进行再调整: 将住院后的第二天作为预测日期。这样做的理论根据是:在住院后的24小时内,医院通常会用最新的数据(初步检测数据、诊断数据等)对病人记录进行更新,住院后的第二天更适合作为预测日期。注意:住院病人是本试验所有病人的一个子集(而不是一个单独的数据集)。positive实例和negative实例都对预测日期后收集的所有数据进行审核。
早期识别的预后方法
图2. 预测时病人的年龄
为了尽早发现绝症患者,为其制定一个临终的计划并确保其有意义,现在这方面已经有许多的研究和开发的方法了。CriSTAL (适当的照顾和养护筛选标准)就是一种用来确定老年患者是否接近生命的尽头,以及量化在住院时的死亡风险或出院后不久的死亡风险的方法。为了识别濒死的病人,CriSTAL 提供了一个采用十八个预测因子的检查表。