大数据时代,数据爆炸式的增长,数据获取变得更容易的同时数据缺失现象也更加普遍。数据的缺失极大的降低了数据的实用性。数据缺失问题的处理成为大数据处理的热点研究课题。文章首先介绍了数据缺失问题的研究意义和国内外研究现状。然后系统地分析了造成数据缺失的原因,对数据缺失问题进行了分类。对近年来国内外缺失数据处理方法进行了综述,总结了各自优缺点、适用范围、效果评价指标。其中重点阐述了回归填充、聚类填充等填充方法。最后对缺失数据处理方法领域进行了总结与展望。