开源数据支撑下的人物与装备分析

2022 年 3 月 20 日 PaperWeekly


3月19日,南京摄星智能科技有限公司CAO张侨应邀参与了某军校举办的课程专题讲学,进行了题为《开源数据支撑下的人物与装备分析》的在线专题讲座。



本次课程中,张侨结合摄星智能研发的多项产品与技术,详细介绍了开源数据概况、人工智能现状、开源数据结合人工智能解决的问题、开源数据智能系统、未来应用展望与挑战等相关内容进行专题授课。来自学校近百位师生参加了课程学习。


▲ 张侨(图右一),摄星智能CAO,主要研究方向为NLP和强化学习,专长于分布式人工智能与多智能体系统、自主无人系统与集群控制等。

课程伊始,张侨以美国法典第50卷《战争和国防》中开源数据(Open Source Intelligence,OSINT)的定义为引(定义:面向一定的用户群体,以获取情报为目的,从公开各类型信息中及时采集、分析和分发情报),为广大师生讲解了开源数据的系列内容,让大家充分认识到开源数据工作的重要性。 

随着来源和应用类型的增加,开源数据的数据量也成倍增长,难以充分利用其隐含的巨大信息价值。而人工智能(AI)在计算机视觉、图像识别、自然语言处理、语音处理等方面的应用,生动的体现在开源数据的典型案例中。

▲ 开源数据典型案例分析

针对开源数据的应用案例,张侨结合摄星智能科研能力,向大家展示了开源数据的星河搜索产品,有效助力开源数据支撑下的人物与装备分析工作。

▲  面向军事开源数据的“星河搜索”平台


张侨分别从产品架构、解决的问题及产品能力等方面详细介绍了星河搜索平台。

其中,猎户星数据采集平台基于分布式数据采集技术,目前采集完成近14亿的文本、图片、视频、音频等多模态数据以及千亿级海空目标数据,来源超过40多个国家和地区,覆盖中文、英文、日文、阿拉伯文等80多种语言,具备全面性、专业性、多样性、完整性、扩展性等特点,为开源信息智能分析与应用提供数据支撑。


▲  “猎户星”数据采集平台

在开源信息的采集、抽取、融合、检测、识别、应用等过程中,共计积累500w+标注数据,约80余种专用算法模型。


基于多模态知识图谱、联合推理、计算机视觉、自然语言处理等技术,实现从数据到知识的“智变”,从基础知识、静态知识、动态知识三个层次,实现知识的生成、更新、积累、应用为一体的知识体系,有效实现情报挖掘分析、支撑战略态势研判、辅助战场指挥决策等军事场景应用服务。


基于情报要素本体模型,通过跨语言文本的多源语言实体识别、视频数据的关键帧提取、图像数据的目标检测和识别等过程,形成结构化的情报要素;利用军事知识图谱实现情报要素的关联、消歧和融合,完成情报槽位的补全和验证,形成更全面、更准确、价值更高的的融合情报。

张侨结合当前军事热点,以乌克兰情报人员为例的人物追踪案例、俄乌冲突中的情报鉴伪案例,充分展示了星河搜索在开源数据萃取、人物追踪、事件追踪、目标监视等方面的能力。

▲  开源数据的挑战案例

最后,张侨分析了开源数据也面临着严峻的挑战,现实生活中,我们也会被多种多样的虚假情报迷惑,如人为杜撰、歪曲事实、合成影像、深度伪造等技术制造的虚假情报。我们看到的某一事件可能不会完全准确或真实。如何在海量的信息中获取有效有价值的情报信息,并且有效甄别,这就需要新兴技术的赋能,特别是人工智能技术、生物技术和量子计算等,以及它们在外交政策、经济竞争力、军事和情报行动领域的应用。


摄星智能作为开源数据分析的领军企业,将持续加强在开源数据的探索与实践,在开源数据专业人才培养、军事科技与军事装备的自主创新等方面贡献更多力量。



公司介绍


摄星智能科技有限公司(Starsee)成立于2018年9月,是国内第一家军事智能化企业,公司通过引入先进的人工智能技术和作战理念,将自主研发的军用智能算法和软件在不同硬件产品形态上实现集成,为未来智能化作战增效赋能。


星河搜索(https://xinghe.starsee.cn),摄星智能旗下自研的面向全球视角的智能防务信息服务平台。基于开源互联网数据,融汇贯穿泛军事、全球化、全链路、多模态、多语言的开源信息,综合运用人工智能和大数据技术,实现了智能数据采集、深度知识挖掘、多模态情报分析、智能态势感知和辅助决策等能力,为互联网上的广大军事爱好者、军工从业人员、现(退)役军人以及其它用户群体,提供军事动态实时推送、目标图像精准识别、人物/装备一点链网、军事文献深析汇聚、军事知识综合检索等功能和服务。


PS:摄星智能近期开启新一轮“百万年薪人才引进计划”,大力招募NLP、CV、机器学习等方向的精英人才,主要负责新型产品研发及领域内技术科研工作。欢迎优秀人才加入摄星,一起为国防智能化建设贡献力量。简历投递:sunyu@starsee.cn




登录查看更多
4

相关内容

多智能体系统(multi-agent system,MAS) 是一种全新的分布式计算技术。自20 世纪70年代出现以来得到迅速发展,目前已经成为一种进行复杂系统分析与模拟的思想方法与工具。
军事知识图谱构建技术
专知会员服务
125+阅读 · 2022年4月8日
美国陆军情报分析手册,新版174页pdf
专知会员服务
170+阅读 · 2022年3月25日
数据价值释放与隐私保护计算应用研究报告,64页pdf
专知会员服务
39+阅读 · 2021年11月29日
工业互联网平台发展与展望,33页ppt
专知会员服务
67+阅读 · 2021年3月6日
专知会员服务
103+阅读 · 2020年11月27日
事件知识图谱构建技术与应用综述
专知会员服务
148+阅读 · 2020年8月6日
中文知识图谱构建技术以及应用的综述
专知会员服务
312+阅读 · 2019年10月19日
会议交流 | 开源开放知识图谱的构建与应用
开放知识图谱
2+阅读 · 2022年3月6日
10个开源工业检测数据集汇总
夕小瑶的卖萌屋
0+阅读 · 2022年2月11日
开源开放 | 中国近代历史人物知识图谱
开放知识图谱
2+阅读 · 2021年12月3日
京东零售数据智能探索实践
图与推荐
0+阅读 · 2021年10月11日
国家自然科学基金
0+阅读 · 2016年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
3+阅读 · 2009年12月31日
Arxiv
21+阅读 · 2021年12月31日
Arxiv
15+阅读 · 2021年11月19日
Arxiv
10+阅读 · 2021年11月10日
VIP会员
相关VIP内容
军事知识图谱构建技术
专知会员服务
125+阅读 · 2022年4月8日
美国陆军情报分析手册,新版174页pdf
专知会员服务
170+阅读 · 2022年3月25日
数据价值释放与隐私保护计算应用研究报告,64页pdf
专知会员服务
39+阅读 · 2021年11月29日
工业互联网平台发展与展望,33页ppt
专知会员服务
67+阅读 · 2021年3月6日
专知会员服务
103+阅读 · 2020年11月27日
事件知识图谱构建技术与应用综述
专知会员服务
148+阅读 · 2020年8月6日
中文知识图谱构建技术以及应用的综述
专知会员服务
312+阅读 · 2019年10月19日
相关基金
国家自然科学基金
0+阅读 · 2016年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
3+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员