Uma comparação de métodos de múltiplas imputações para a análise de dados de sobrevivência com valores de covariáveis ausentes relacionados ao resultado
Palavras-chave:
Covariáveis ausentes, modelo de Cox, imputação múltipla, estudo de simulação, MARResumo
O modelo de taxas de falha proporcionais de Cox é comumente usado na área médica para investigar a associação entre o tempo de sobrevivência e covariáveis. No entanto, é bastante comum que a análise envolva covariáveis com valores ausentes. Uma suposição razoável é que os dados são censoring-ignorable MAR. Nesse caso, uma análise de casos completos produz estimativas viesadas para os coeficientes de regressão. Através de um estudo de simulação, comparamos três abordagens de imputação múltipla para uma covariável parcialmente observada quando o mecanismo de perda envolve o tempo de sobrevivência: (i) o método proposto por White e Royston (2009) que usa a função de taxa de falha acumulada em uma aproximação do modelo de imputação, (ii) o método descrito por Bartlett et al. (2015) que incorpora o modelo de Cox no processo de imputação, e (iii) a abordagem CART, um método conhecido por lidar com distribuições assimétricas, interações e relações não lineares. Os resultados da simulação mostraram que o método de White e Royston (2009) pode produzir estimativas severamente viesadas enquanto a abordagem CART subestima a incerteza da imputação resultando em baixas taxas de cobertura. O método de Bartlett et al. (2015) apresentou o melhor desempenho geral, com pequeno viés de pequenas amostras e taxas de cobertura próximas aos valores nominais. Os métodos de imputação são aplicados a um conjunto de dados de sobrevida de pacientes com doença de Chagas.
Referências
Bartlett, Jonathan W, Seaman, Shaun R, White, Ian R, Carpenter, James R, & Initiative*, Alzheimer’s Disease Neuroimaging. 2015. Multiple imputation of covariates by fully conditional specification: accommodating the substantive model. Statistical methods in medical research, 24(4), 462–487.
Breiman, Leo, Friedman, Jerome H, Olshen, Richard A, & Stone, Charles J. 2017. Classification and regression trees. Routledge.
Carpenter, James, & Kenward, Michael. 2012. Multiple imputation and its application. John Wiley & Sons.
Carpenter, James R., Kenward, Michael G., & Vansteelandt, Stijn. 2006. A comparison of multiple imputation and doubly robust estimation for analyses with missing data. Journal of the Royal Statistical Society: Series A (Statistics in Society), 169(3), 571–584.
Chen, Ming-Hui, Ibrahim, Joseph G, & Shao, Qi-Man. 2009. Maximum likelihood inference for the Cox regression model with applications to missing covariates. Journal of multivariate analysis, 100(9), 2018–2030.
Collins, Linda M, Schafer, Joseph L, & Kam, Chi-Ming. 2001. A comparison of inclusive and restrictive strategies in modern missing data procedures. Psychological methods, 6(4), 330.
Cox, David R. 1972. Regression models and life-tables. Journal of the Royal Statistical Society: Series B (Methodological), 34(2), 187–202.
Cox, David R. 1975. Partial likelihood. Biometrika, 62(2), 269–276.
Hsu, Chiu-Hsieh, & Yu, Mandi. 2019. Cox regression analysis with missing covariates via nonparametric multiple imputation. Statistical methods in medical research, 28(6), 1676–1688.
Kalbfleisch, John D, & Prentice, Ross L. 2011. The statistical analysis of failure time data. Vol. 360. John Wiley & Sons.
Little, Roderick JA, & Rubin, Donald B. 2019. Statistical analysis with missing data. Vol. 793. John Wiley & Sons.
Nunes, Maria Carmo Pereira, Beaton, Andrea, Acquatella, Harry, Bern, Caryn, Bolger, Ann F, Echeverria, Luis E, Dutra, Walderez O, Gascon, Joaquim,
Morillo, Carlos A, Oliveira-Filho, Jamary, et al. 2018. Chagas cardiomyopathy: an update of current clinical knowledge and management: a scientific statement from the American Heart Association. Circulation, 138(12), e169–e209.
Nunes, Maria do Carmo Pereira, Rocha, Manoel Ot´avio C, Ribeiro, Antˆonio Luiz P, Colosimo, Enrico A, Rezende, Renato A, Carmo, Guilherme Augusto A, & Barbosa, Marcia M. 2008. Right ventricular dysfunction is an independent predictor of survival in patients with dilated chronic Chagas’ cardiomyopathy. International journal of cardiology, 127(3), 372–379.
Paik, Myunghee Cho, & Tsai, Wei-Yann. 1997. On using the Cox proportional hazards model with missing covariates. Biometrika, 84(3), 579–593.
Qi, Lihong, Wang, Ying-Fang, & He, Yulei. 2010. A comparison of multiple imputation and fully augmented weighted estimators for Cox regression with missing covariates. Statistics in medicine, 29(25), 2592–2604.
Rathouz, Paul J. 2007. Identifiability assumptions for missing covariate data in failure time regression models. Biostatistics, 8(2), 345–356.
Robins, James M, Rotnitzky, Andrea, & Zhao, Lue Ping. 1994. Estimation of regression coefficients when some regressors are not always observed. Journal of the American statistical Association, 89(427), 846–866.
Rubin, Donald B. 1987. Multiple imputation for survey nonresponse.
Rubin, Donald B. 1996. Multiple imputation after 18+ years. Journal of the American statistical Association, 91(434), 473–489.
Seaman, Shaun R, & White, Ian R. 2013. Review of inverse probability weighting for dealing with missing data. Statistical methods in medical research, 22(3), 278–295.
Seaman, Shaun R, White, Ian R, Copas, Andrew J, & Li, Leah. 2012. Combining multiple imputation and inverse-probability weighting. Biometrics, 68(1), 129–137.
Steyerberg, Ewout W, et al. 2019. Clinical prediction models. Springer.
Tsiatis, Anastasios A. 1981. A large sample study of Cox’s regression model. The Annals of Statistics, 9(1), 93–108.
Van Buuren, Stef. 2018. Flexible imputation of missing data. CRC press.
White, Ian R., & Royston, Patrick. 2009. Imputing missing covariate values for the Cox model. Statistics in medicine, 28(15), 1982–1998.
White, Ian R, Royston, Patrick, & Wood, Angela M. 2011. Multiple imputation using chained equations: issues and guidance for practice. Statistics in medicine, 30(4), 377–399.
Yi, Yanyao, Ye, Ting, Yu, Menggang, & Shao, Jun. 2020. Cox regression with survival-time-dependent missing covariate values. Biometrics, 76(2), 460–471.
Downloads
Publicado
Como Citar
Edição
Seção
Licença
Proposta de Política para Periódicos de Acesso Livre
Autores que publicam nesta revista concordam com os seguintes termos:
- Autores mantém os direitos autorais e concedem à revista o direito de primeira publicação, com o trabalho simultaneamente licenciado sob a Licença Creative Commons Attribution que permite o compartilhamento do trabalho com reconhecimento da autoria e publicação inicial nesta revista.
- Autores têm autorização para assumir contratos adicionais separadamente, para distribuição não-exclusiva da versão do trabalho publicada nesta revista (ex.: publicar em repositório institucional ou como capítulo de livro), com reconhecimento de autoria e publicação inicial nesta revista.
- Autores têm permissão e são estimulados a publicar e distribuir seu trabalho online (ex.: em repositórios institucionais ou na sua página pessoal) a qualquer ponto antes ou durante o processo editorial, já que isso pode gerar alterações produtivas, bem como aumentar o impacto e a citação do trabalho publicado (Veja O Efeito do Acesso Livre).