成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
0
二战照片出自谁手?人工智能识别初露锋芒
2020 年 11 月 3 日
学术头条
在日常生活中,我们经常会看到一些十分漂亮、构思精妙的照片,但某张照片背后的摄影师是谁?我们有时却并不清楚。
如今,人工智能(AI)可以帮助我们找到图片背后的摄影师。
在一项新的国际跨学科研究中,研究人员通过使用人工智能算法分析近 60000 张二战时期的历史照片发现,人工智能可以根据照片内容来识别摄影师的身份。相关研究成果以论文的形式发表在科学杂志 IEEE Access上。
研究人员展示了使用现代神经网络分析图像的优势,以使机器可以自动检测各种场景中的人和物体,甚至可以根据图像中的特征区分摄影师,这些操作比任何人工检查过程都要快得多。获得的结果将有助于历史学家、其他研究人员和专业人员在工作中使用历史照片档案来分析和比较特定摄影师的作品。
通过这项工作,研究人员证明了人工智能可以在某些方面帮助学者“追溯”历史照片档案的潜力。
令人惊讶
研究人员选择了 23 名芬兰战地摄影师作为实验对象。他们中的 20 人是芬兰战时照片档案中图像总数最高的摄影师,另外 3 人则是因为有专家认为他们的照片对这项摄影新闻研究很有趣。
他们提出并评估了机器学习可以帮助分析历史图像的几个应用领域,即分析场景中存在的对象、照片取景评估、摄影师分类以及评估它们的视觉相似性。
他们使用人工智能技术对这 23 位著名芬兰摄影师在第二次世界大战期间拍摄的照片进行了识别,所用照片来自公开可用的芬兰战时照片档案库,其中包含约 160000 张 1939-1945 年间从芬兰冬季战争、延续战争(第二次世界大战期间芬兰与苏联之间的两场战争中的第二场战争)和拉普兰战争中拍摄的照片。
由于芬兰战时照片档案中的数千张照片仍然没有摄影师的名字,所以这项研究中选用的照片总数为 59000 多张。
这种自动分析可以作为一种工具,以提供基于内容的公共照片档案的文本描述,比如丹麦抵抗博物馆的照片档案。今年 9 月生效欧盟可访问性指令(DIRECTIVE(EU)2016/2102),要求将图像内容的文字描述添加到网络上的所有公共图像中。
对此,论文作者之一 Alexandros Iosifidis 表示:“这让我们非常惊讶,人工智能可以根据照片中的特征(如内容和框架)识别摄影师。”
准确率最高可达 69.7%
在这项研究中,研究人员应用了最先进的目标检测模型和神经网络体系结构,以获得来自杰出二战摄影师的统计数据和特征。
由于每个摄影师都有一定数量的重复图像,这里研究人员根据拍摄时间将照片分成训练集和测试集,以确保描述同一事件的照片不会用于训练和测试。
研究中分析的照片显示,一些摄影师具有非常独特且容易识别的特征,而另一些则很难被人工智能识别。这一人工智能模型的分类准确率区间为 20.1-69.7%,平均为 41.1%。
图 | 1941 年 9 月 5 日,芬兰波拉米,一名芬兰士兵站在一辆缴获的 BA-10 装甲车前,摄影师为 Heikki Roivainen(来源:SA-Kuva)
通过将识别结果与先前对检测到的物体的分析进行比较发现,一些摄影师因为有着特定的拍摄物体和喜好很容易被识别。
因此,研究人员检查了每个摄影师照片中的典型物体类别,并分析了他们捕捉和框定人的方式差异。
Roivainen 拍摄的照片中拥有最多的狗、马和汽车,预测准确率为 69.7%;Hollming 拍摄了大量滑雪照片,所有照片中只有几把椅子出现,即户外照片多,预测准确率为 51.4%;Manninen 拍摄的人物照片中的平均人数最高,椅子(即室内照片)出现率最高,预测准确率为 35.5%;SJ Blom 喜欢在城市环境中拍摄照片,预测准确率为 50.4%。
研究结果证明,除了确定照片的作者身份之外,这些特征代表了模型对这些摄影师的整体视觉相似性和照片风格相似性的认知。此外,由于卷积神经网络可以在一定程度上从照片中识别摄影师,某些照片可以被认为是特定摄影师的典型。其中最著名的摄影师是 Heikki Roivainen,他是芬兰植物学教授,曾在延续战争期间担任官方战地摄影师。
通往更多应用的大门
在这项工作中,研究人员只使用了可公开获得的预处理对象检测模型和基本照片信息,但他们认为这一模型可用于大多数照片档案,且提供了所有代码、模型和数据注释,以及如何使用它们的详细描述。
例如,可以通过考虑摄影师的意图和他们的照片质量来进一步增强摄影师分析。此外,可以通过考虑信息融合方法来增强对象检测性能,以及改善较小尺寸对象的检测。除了对象级分析,场景识别将有助于进一步描述摄影师的特征。
在未来,研究人员将专注于需要更专业方法的问题,比如识别仅出现在芬兰历史照片或二战期间的对象类别。他们的目标是利用原始的文本照片描述来产生更完整的对象标签以及主题和事件识别。
这将有助于人们解决分析战时照片时面临的最大挑战之一,即区分拍摄对象的不同状态——照片中的人是活着的、受伤的还是死亡的。
这些更精细的结果最终可以帮助人们更详细地描绘出传统知识摄影师的目标、素质和性格。这项研究的目标是在档案中公布所有的结果,以帮助对档案进行不同类型的社会研究。
对于此次研究结果,作者之一、从事新闻摄影研究已有 25 年以上的 Anssi Männistö 认为,“对照片蕴含的内容进行大数据分析是我的一个长期梦想,我对这个项目的结果非常着迷。人工智能可以识别诸如照片中的框架和内容的各个方面,这将在人文科学和社会科学领域中有着广泛的应用。”
参考资料:
https://www.eurekalert.org/pub_releases/2020-10/au-aid102820.php
https://ieeexplore.ieee.org/document/9159591
点击
阅读原文
,查看更多精彩!
喜欢本篇内容,请
分享、点赞、
在看
登录查看更多
点赞并收藏
0
暂时没有读者
0
权益说明
本文档仅做收录索引使用,若发现您的权益受到侵害,请立即联系客服(微信: zhuanzhi02,邮箱:bd@zhuanzhi.ai),我们会尽快为您处理
相关内容
人工智能
关注
49083
人工智能(Artificial Intelligence, AI )
是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。 人工智能是计算机科学的一个分支。
Python机器学习经典实例,366页pdf
专知会员服务
105+阅读 · 2021年1月2日
深度伪造与检测技术综述
专知会员服务
73+阅读 · 2020年12月12日
深度学习图像检索(CBIR): 十年之大综述
专知会员服务
47+阅读 · 2020年12月5日
【经典书】人工智能在21世纪,1020pdf
专知会员服务
42+阅读 · 2020年8月2日
【快讯】CCF-A ACM ACM Multimedia 2020论文出炉,1361篇上榜, 你的paper中了吗?
专知会员服务
32+阅读 · 2020年7月26日
Yoshua Bengio最新《深度学习》MLSS2020教程,附104页PPT及视频
专知会员服务
134+阅读 · 2020年7月10日
【实用书】Python机器学习Scikit-Learn应用指南,247页pdf
专知会员服务
269+阅读 · 2020年6月10日
【2020新书】简明机器学习导论,电子书与500页PPT
专知会员服务
203+阅读 · 2020年2月7日
图像内容自动描述技术综述
专知会员服务
87+阅读 · 2019年11月17日
WSDM 2019教程—李航、何向南等,深度学习匹配在搜索和推荐中的应用
专知会员服务
75+阅读 · 2019年10月19日
清华大学提出APDrawingGAN,人脸照片秒变艺术肖像画
AI100
7+阅读 · 2019年6月12日
一套书看懂百年飞机史!
地球知识局
3+阅读 · 2019年5月4日
玩转老照片,一台GeForce 1080 Ti 就能让黑白照片展“新颜”
英伟达NVIDIA中国
4+阅读 · 2019年1月29日
业界 | GAN生成的假脸太逼真了!别怕,十招教你识别AI生成的假图像
大数据文摘
15+阅读 · 2018年12月18日
开眼|鉴黄人工智能取代人工鉴黄师?这些图居然能搞错
机器人大讲堂
4+阅读 · 2018年8月19日
揭秘AI识别虚假新闻背后的原理
DeepTech深科技
10+阅读 · 2018年8月5日
历经近一个世纪的OCR技术如今怎么样了?
InfoQ
16+阅读 · 2018年4月5日
HoloLens新应用:扫描脸部就能读出你的心跳
雷锋网
3+阅读 · 2018年3月3日
世界最大黄网要用 AI “鉴黄”,还号称要让鉴黄师下岗
AI掘金志
4+阅读 · 2017年10月16日
基于图片内容的深度学习图片检索(一)
七月在线实验室
20+阅读 · 2017年10月1日
Leveraging Regular Fundus Images for Training UWF Fundus Diagnosis Models via Adversarial Learning and Pseudo-Labeling
Arxiv
0+阅读 · 2021年2月2日
Deep Image Retrieval: A Survey
Arxiv
16+阅读 · 2021年1月27日
AliCoCo: Alibaba E-commerce Cognitive Concept Net
Arxiv
13+阅读 · 2020年3月30日
Text-to-Image Synthesis Based on Machine Generated Captions
Arxiv
3+阅读 · 2019年10月9日
Variational Hetero-Encoder Randomized GANs for Joint Image-Text Modeling
Arxiv
4+阅读 · 2019年9月25日
Improving Visual Question Answering by Referring to Generated Paragraph Captions
Arxiv
7+阅读 · 2019年6月14日
Learning to Estimate Pose and Shape of Hand-Held Objects from RGB Images
Arxiv
5+阅读 · 2019年3月8日
SemStyle: Learning to Generate Stylised Image Captions using Unaligned Text
Arxiv
5+阅读 · 2018年5月18日
Generating Diverse and Accurate Visual Captions by Comparative Adversarial Learning
Arxiv
4+阅读 · 2018年4月3日
Parallel Tracking and Verifying
Arxiv
8+阅读 · 2018年1月30日
VIP会员
自助开通(推荐)
客服开通
详情
相关主题
人工智能
准确率
预测准确率
神经网络
电气电子工程师学会
论文
相关VIP内容
Python机器学习经典实例,366页pdf
专知会员服务
105+阅读 · 2021年1月2日
深度伪造与检测技术综述
专知会员服务
73+阅读 · 2020年12月12日
深度学习图像检索(CBIR): 十年之大综述
专知会员服务
47+阅读 · 2020年12月5日
【经典书】人工智能在21世纪,1020pdf
专知会员服务
42+阅读 · 2020年8月2日
【快讯】CCF-A ACM ACM Multimedia 2020论文出炉,1361篇上榜, 你的paper中了吗?
专知会员服务
32+阅读 · 2020年7月26日
Yoshua Bengio最新《深度学习》MLSS2020教程,附104页PPT及视频
专知会员服务
134+阅读 · 2020年7月10日
【实用书】Python机器学习Scikit-Learn应用指南,247页pdf
专知会员服务
269+阅读 · 2020年6月10日
【2020新书】简明机器学习导论,电子书与500页PPT
专知会员服务
203+阅读 · 2020年2月7日
图像内容自动描述技术综述
专知会员服务
87+阅读 · 2019年11月17日
WSDM 2019教程—李航、何向南等,深度学习匹配在搜索和推荐中的应用
专知会员服务
75+阅读 · 2019年10月19日
热门VIP内容
开通专知VIP会员 享更多权益服务
【CVPR2025】ShotAdapter:基于扩散模型的文本生成多镜头视频方法
空间智能研究报告
中文版 | 美陆军信息收集操作员工具(OPTIC):以安全、效率与创新重塑任务规划
大型社会模拟器:前沿与展望
相关资讯
清华大学提出APDrawingGAN,人脸照片秒变艺术肖像画
AI100
7+阅读 · 2019年6月12日
一套书看懂百年飞机史!
地球知识局
3+阅读 · 2019年5月4日
玩转老照片,一台GeForce 1080 Ti 就能让黑白照片展“新颜”
英伟达NVIDIA中国
4+阅读 · 2019年1月29日
业界 | GAN生成的假脸太逼真了!别怕,十招教你识别AI生成的假图像
大数据文摘
15+阅读 · 2018年12月18日
开眼|鉴黄人工智能取代人工鉴黄师?这些图居然能搞错
机器人大讲堂
4+阅读 · 2018年8月19日
揭秘AI识别虚假新闻背后的原理
DeepTech深科技
10+阅读 · 2018年8月5日
历经近一个世纪的OCR技术如今怎么样了?
InfoQ
16+阅读 · 2018年4月5日
HoloLens新应用:扫描脸部就能读出你的心跳
雷锋网
3+阅读 · 2018年3月3日
世界最大黄网要用 AI “鉴黄”,还号称要让鉴黄师下岗
AI掘金志
4+阅读 · 2017年10月16日
基于图片内容的深度学习图片检索(一)
七月在线实验室
20+阅读 · 2017年10月1日
相关论文
Leveraging Regular Fundus Images for Training UWF Fundus Diagnosis Models via Adversarial Learning and Pseudo-Labeling
Arxiv
0+阅读 · 2021年2月2日
Deep Image Retrieval: A Survey
Arxiv
16+阅读 · 2021年1月27日
AliCoCo: Alibaba E-commerce Cognitive Concept Net
Arxiv
13+阅读 · 2020年3月30日
Text-to-Image Synthesis Based on Machine Generated Captions
Arxiv
3+阅读 · 2019年10月9日
Variational Hetero-Encoder Randomized GANs for Joint Image-Text Modeling
Arxiv
4+阅读 · 2019年9月25日
Improving Visual Question Answering by Referring to Generated Paragraph Captions
Arxiv
7+阅读 · 2019年6月14日
Learning to Estimate Pose and Shape of Hand-Held Objects from RGB Images
Arxiv
5+阅读 · 2019年3月8日
SemStyle: Learning to Generate Stylised Image Captions using Unaligned Text
Arxiv
5+阅读 · 2018年5月18日
Generating Diverse and Accurate Visual Captions by Comparative Adversarial Learning
Arxiv
4+阅读 · 2018年4月3日
Parallel Tracking and Verifying
Arxiv
8+阅读 · 2018年1月30日
大家都在搜
用户画像
SoSITE
语言模型推理
研究报告
俄乌战争
jwcc
银行
t-sne
量化交易
“小鹿撞怀”的鹿,可是这只萌萌的梅花鹿?
Top
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top