肾脏病与透析肾移植杂志 ›› 2021, Vol. 30 ›› Issue (5): 476-479.DOI: 10.3969/j.jssn.1006-298X2021.5.016
摘要: 在临床数据的统计分析中,我们常会遇到数据缺失。根据数据的缺失情况,使用妥当的方法处理缺失值关系着统计推断的可靠性和准确性。本文对数据缺失的模式、比例和常见的处理方法进行了简单的总结,对基于R语言程序包mice的多重填补的流程和内容进行了详细的梳理,并以急性肾损伤的影响因素分析为例,展示和对比基于多重填补数据集、缺失数据集和原始数据集的广义线性模型的结果。结果表明,多重填补可以很好地对定量变量、二分类变量和有序多分类变量进行填补,基于多重填补数据集的模型结果稳健、可靠。