We present EgoBlind, the first egocentric VideoQA dataset collected from blind individuals to evaluate the assistive capabilities of contemporary multimodal large language models (MLLMs). EgoBlind comprises 1,392 first-person videos from the daily lives of blind and visually impaired individuals. It also features 5,311 questions directly posed or verified by the blind to reflect their in-situation needs for visual assistance. Each question has an average of 3 manually annotated reference answers to reduce subjectiveness. Using EgoBlind, we comprehensively evaluate 16 advanced MLLMs and find that all models struggle. The best performers achieve an accuracy near 60\%, which is far behind human performance of 87.4\%. To guide future advancements, we identify and summarize major limitations of existing MLLMs in egocentric visual assistance for the blind and explore heuristic solutions for improvement. With these efforts, we hope that EgoBlind will serve as a foundation for developing effective AI assistants to enhance the independence of the blind and visually impaired. Data and code are available at https://github.com/doc-doc/EgoBlind.


翻译:本文介绍了EgoBlind,这是首个从盲人视角收集的第一人称视频问答数据集,旨在评估当前多模态大语言模型(MLLMs)的辅助能力。EgoBlind包含1,392个来自盲人和视障人士日常生活的第一人称视频,并收录了5,311个由盲人直接提出或验证的问题,以反映他们在实际情境中对视觉辅助的需求。每个问题平均配有3个人工标注的参考答案,以减少主观偏差。基于EgoBlind,我们对16个先进MLLMs进行了全面评估,发现所有模型均表现欠佳。最佳模型的准确率仅接近60%,远低于人类表现的87.4%。为引导未来研究,我们总结并分析了现有MLLMs在盲人第一人称视觉辅助中的主要局限,并探索了启发式改进方案。通过这些工作,我们希望EgoBlind能为开发有效的AI助手提供基础,以提升盲人和视障人士的独立生活能力。数据集与代码已公开于https://github.com/doc-doc/EgoBlind。

0
下载
关闭预览

相关内容

可解释强化学习,Explainable Reinforcement Learning: A Survey
专知会员服务
132+阅读 · 2020年5月14日
ICLR'21 | GNN联邦学习的新基准
图与推荐
12+阅读 · 2021年11月15日
【Tutorial】计算机视觉中的Transformer,98页ppt
专知
21+阅读 · 2021年10月25日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员