Automatic and accurate detection of anatomical landmarks is an essential operation in medical image analysis with a multitude of applications. Recent deep learning methods have improved results by directly encoding the appearance of the captured anatomy with the likelihood maps (i.e., heatmaps). However, most current solutions overlook another essence of heatmap regression, the objective metric for regressing target heatmaps and rely on hand-crafted heuristics to set the target precision, thus being usually cumbersome and task-specific. In this paper, we propose a novel learning-to-learn framework for landmark detection to optimize the neural network and the target precision simultaneously. The pivot of this work is to leverage the reinforcement learning (RL) framework to search objective metrics for regressing multiple heatmaps dynamically during the training process, thus avoiding setting problem-specific target precision. We also introduce an early-stop strategy for active termination of the RL agent's interaction that adapts the optimal precision for separate targets considering exploration-exploitation tradeoffs. This approach shows better stability in training and improved localization accuracy in inference. Extensive experimental results on two different applications of landmark localization: 1) our in-house prenatal ultrasound (US) dataset and 2) the publicly available dataset of cephalometric X-Ray landmark detection, demonstrate the effectiveness of our proposed method. Our proposed framework is general and shows the potential to improve the efficiency of anatomical landmark detection.
翻译:对解剖地标进行自动和准确的检测,是医学图像分析中的一项必要操作,应用了多种应用。最近深层的学习方法通过直接将所捕获的解剖图的外观与可能地图(即热映射图)相匹配,改善了结果。然而,大多数目前的解决办法忽略了热映射回归的另一个精髓,即回归目标热映射的客观指标,并依靠手工制作的具有历史意义的图象来设定目标精确度,因此通常是繁琐和具体任务。在本文件中,我们提出一个新的“从学习到阅读”框架,以便进行里程碑式的探测,同时优化神经网络和目标精确度。这项工作的重心力是利用强化性学习(RL)框架,以在培训过程中以动态的方式寻找再反多重热映射的客观指标,从而避免设定特定目标精确度。我们还为积极终止RL代理人的拟议互动,以调整最佳精确度,用于不同的目标,同时考虑到勘探-开发的权衡取舍取。这一方法显示培训的稳定性和更好的地方化度精确度。在两个具有历史标定标的的内部勘测方法方面,我们现有“X号”的“全面”的“系统”的“系统”的“系统”的“测试结果显示现有”的“地面”的“地面”系统”的“现有”的“地面”的“地面”系统”中,显示的“地面”的“地面”的“系统”的“地面”的“系统”的“地面”的“地面”的“系统”的“地面”的“地面”的“地面”的“地面”的“地面”的“地面”的“地面”数据效率”的“地面”的“地面”的“地面”的“地面”的“地面”的“地面”的“地面”的“地面”的“地面”的“地面”的“地面”的”的“地面”的“地面”的“地面”的“地面”的“地面”的“地面”的“效率”的“地面”的“地面”的”的“地面”的“地面”的“地面”的“地面”的“地面”的“地面”的”的”的“地面”的“地面”的“地面”的“地面”的“地面”的“地面”的“地面”的“地面”的“地面”的“地面”