中国科学院大学MBA教育管理中心 领域大数据系列讲座之“视觉媒体的上下文关联分析与理解” - 中国科学院大学MBA教育管理中心

领域大数据系列讲座之“视觉媒体的上下文关联分析与理解”

  • 日期:2022-10-25

2022年10月21日,中科院计算所研究员蒋树强做客MBA《领域大数据系列讲座》特色课程,为同学们讲授“视觉媒体的上下文关联分析与理解”。讲座由经济与管理学院副院长田英杰教授主持。

 

蒋树强,中科院计算所研究员,博士生导师,国家杰出青年科学基金获得者,中科院智能信息处理重点实验室副主任,国际期刊ACM ToMM编委,任CCF多媒体专委会秘书长、CCF专委工委委员。研究方向为图像/视频等多媒体信息的分析、理解与检索技术,主持承担科技创新2030 —“新一代人工智能”重大项目、国家自然科学基金等项目20余项,共在IEEE/ACM汇刊和CCF-A类会议上发表论文60余篇,获授权专利15项,先后获中国计算机学会科学技术奖、中国图象图形学会自然科学二等奖、吴文俊人工智能自然科学一等奖和北京市科技进步二等奖。

 



蒋树强首先从智能建筑、医疗诊断、人脸识别、唐山打人案视频等事例讲起,引出计算机视觉的研究意义,表示计算机视觉的识别和理解是人工智能的研究重点,也是世界科技的前沿领域。

 

随后,蒋树强从“基于物体关联的视觉场景理解与描述”和“动态环境下的视频识别与行为预测”两个方面阐述了当前计算机视觉的主要研究内容、基本原理、研究热点、发展方向和社会价值。

 

计算机对图像的理解和人对图像的理解是不同的,需要为计算机构建概念空间,即视觉识别的训练模型,以识别树上明月这样的空间关系。

 

 

局部区域是组成图像的基本单元,包含丰富的信息,局部区域间也存在多种形式的关联,通过对图像方寸间的显著关联、集合关联、属性关联、语言关联、概念共生关联、概念尺度关联、概念空间关联以及概念知识关联等建立了局部模式的非均等化处理,提出了局部概念关联分布学习方法,突破了概念分布在局部区域独立处理的限制。

 

 

现在人工智能的主要发展趋势之一,是从互联网AI转向具身AI。人工智能虽然有很多算法和先进技术,但需要附在一个本体上,和真实环境动态交互,即“魂要附体”。换句话说,具身智能就是AI加上机器人,机器人是个广义的概念,包括无人车、无人机等。具身智能需要用到机器学习的算法、推理的算法、自然语言处理的算法、图像识别的算法等大量算法。由于现实环境中很多数据难以获得,训练成本较大,所以目前具身智能还是在虚拟环境中研发。

 

最后,蒋树强特别强调,人工智能是要拿来用的,并且一定要深入到任务中、行业中,因为即使研究者发表的论文水平再高,现实应用则完全是另外一回事,这并不代表技术水平不高,而是因为实际应用中的问题更真实,难度更大。因此,人工智能研究者需要放下身段,向其他行业的人去学习,不怕做脏活、累活,这样才能把人工智能真正做好。

 

(文、图/李天舟)