Survival analysis is an essential tool for the study of health data. An inherent component of such data is the presence of missing values. In recent years, researchers proposed new learning algorithms for survival tasks based on neural networks. Here, we studied the predictive performance of such algorithms coupled with different methods for handling missing values on simulated data that reflect a realistic situation, i.e., when individuals belong to unobserved clusters. We investigated different patterns of missing data. The results show that, without further feature engineering, no single imputation method is better than the others in all cases. The proposed methodology can be used to compare other missing data patterns and/or survival models. The Python code is accessible via the package survivalsim. -- L'analyse de survie est un outil essentiel pour l'\'etude des donn\'ees de sant\'e. Une composante inh\'erente \`a ces donn\'ees est la pr\'esence de valeurs manquantes. Ces derni\`eres ann\'ees, de nouveaux algorithmes d'apprentissage pour la survie, bas\'es sur les r\'eseaux de neurones, ont \'et\'e con\c{c}us. L'objectif de ce travail est d'\'etudier la performance en pr\'ediction de ces algorithmes coupl\'es \`a diff\'erentes m\'ethodes pour g\'erer les valeurs manquantes, sur des donn\'ees simul\'ees qui refl\`etent une situation rencontr\'ee en pratique, c'est-\`a dire lorsque les individus peuvent \^etre group\'es selon leurs covariables. Diff\'erents sch\'emas de donn\'ees manquantes sont \'etudi\'es. Les r\'esultats montrent que, sans l'ajout de variables suppl\'ementaires, aucune m\'ethode d'imputation n'est meilleure que les autres dans tous les cas. La m\'ethodologie propos\'ee peut \^etre utilis\'ee pour comparer d'autres mod\`eles de survie. Le code en Python est accessible via le package survivalsim.
翻译:生存分析是研究健康数据的重要工具。这些数据的固有组成部分是缺失值的存在。近年来,研究人员基于神经网络提出了新的存活任务学习算法。在这里,我们研究了这些算法与不同的处理缺失值方法相结合,在模拟数据上的预测性能,以反映现实情况,即当个体属于未观察到的集群时。我们研究了不同的缺失数据模式。结果表明,在未进行任何特征工程的情况下,没有单一的插补方法在所有情况下都优于其他方法。所提出的方法可以用于比较其他缺失数据模式和/或生存模型。Python代码可通过软件包survivalsim访问。--生存分析是研究健康数据的重要工具。这些数据的固有组成部分是缺失值的存在。近年来,研究人员基于神经网络提出了新的存活任务学习算法。在这里,我们研究了这些算法与不同的处理缺失值方法相结合,在模拟数据上的预测性能,以反映现实情况,即当个体属于未观察到的集群时。我们研究了不同的缺失数据模式。结果表明,在未进行任何特征工程的情况下,没有单一的插补方法在所有情况下都优于其他方法。所提出的方法可以用于比较其他缺失数据模式和/或生存模型。Python代码可通过软件包survivalsim访问。