U-LanD:基于不确定性的视频地标检测


小白导读

论文是学术研究的精华和未来发展的明灯。小白决心每天为大家带来经典或者最新论文的解读和分享,旨在帮助各位读者快速了解论文内容。个人能力有限,理解难免出现偏差,建议对文章内容感兴趣的读者,一定要下载原文,了解具体内容。

摘要

论文创新点

我们证明了U-LanD在具有挑战性数据集的稀疏注释数据上的有效性,即超声心动图(回声,心脏超声)。回声视频,又名回声电影系列,有着臭名昭著的噪声性质(样本帧可以在图1中看到),这增加了自动分析的复杂性。我们解决了左室流出道(LVOT)里程碑检测[23]的任务,这是一个遭受标签稀疏性极端限制的问题;在LVOT训练视频中,整个帧跨度中只有一帧具有ground-truth landmark标签。在每个训练视频中,临床专家都标注了两个点的位置(用于测量左心室直径的点的坐标),只标注了一帧(心脏收缩期中期周围的一帧),在这一帧中,目标对象,即主动脉,具有最高的可见性。在我们的实验中,我们收集了4493名患者的大规模回声数据集,证明了ULanD可以显著提高最先进的非贝叶斯对应对象的结果。同时,U-LanD是全自动的,它可以超过涉及专家监督的半自动关键帧地标检测的结果。

框架结构

提出的U-LanD框架的框图,包括训练、统计校准和测试阶段。ULanD自动预测视频关键帧上的地标,而训练视频只标注在一帧上。我们建议利用贝叶斯地标检测器(BU-Net)的预测不确定性,通过时间来识别关键帧和非关键帧。

实验结果

测试视频的样本帧,以及它们对应的任意和认知不确定性映射。a)采样非关键帧,不确定度高(无地标预测)自动丢弃。b)将预测地标叠加在关键帧上的关键帧样本。心脏超声视频的目标是左血流;地标是用来测量LVOT长度(两点之间的线)。图(b)显示了预测的地标(绿色)、地面真实地标(橙色)和重叠部分(黄色)。这种情况下的预测误差(长度的平均绝对差)为0.18 mm。此外,样本视频结果在补充材料中给出。

结论

论文链接:
https://arxiv.org/pdf/2102.01586.pdf

每日坚持论文分享不易,如果喜欢我们的内容,希望可以推荐或者转发给周围的同学。

– END –

声明:本站部分文章内容及图片转载于互联 、内容不代表本站观点,如有内容涉及侵权,请您立即联系本站处理,非常感谢!

(0)
上一篇 2021年2月14日 上午10:12
下一篇 2021年2月14日

相关推荐