从RGB图像估算深度是一个长期存在的不适定问题,计算机视觉、图形学和机器学习领域已经对这个问题进行了数十年的研究。在现有的技术中,立体匹配仍然是文献中使用最广泛的技术之一,因为它与人类的双目系统有很强的联系。传统上,基于立体的深度估计是通过匹配多幅图像的手工特征来实现的。尽管进行了大量的研究,这些传统的技术仍然受到高度纹理区域、大的均匀区域和遮挡的影响。深度学习在解决各种2D和3D视觉问题上越来越成功,在此基础上,基于立体的深度估计引起了社区越来越多的兴趣,在2014年至2019年期间,该领域发表了150多篇论文。新一代的方法在性能上有了显著的飞跃,使自动驾驶和增强现实等应用成为可能。在本文中,我们对这一新的、不断增长的研究领域进行了全面的调研,总结了最常用的处理流程,并讨论了它们的优点和局限性。在回顾到目前为止所取得的成果的同时,我们也对基于深度学习的立体视觉在深度估计方面的研究前景进行了展望。