+86 0551-63607054

“视觉智能”学术研讨会在合肥召开

  • 袁国富
  • 2024-05-07
  • 10



428日,由中国科学技术大学信息科学技术学院主办的“视觉智能”学术研讨会在中国科大先进技术研究院未来中心召开。会议由中国科大刘东特任教授主持,邀请了来自中科院计算所、北京大学等国内单位的七位专家作学术报告,并特别邀请了来中国科大进行学术访问的瑞士洛桑联邦理工学院(École Polytechnique Fédérale de Lausanne, EPFL)Touradj Ebrahimi教授共同参会。到会专家学者聚焦于视觉智能领域不同方向的科研创新与挑战,分享了各自团队的最新工作与计划。


在多媒体编码压缩方面,中科院计算所的纪雯研究员分享了其团队在端云协同系统与标准方面的工作;中国科大的李礼特任教授介绍了其团队在多媒体压缩领域的工作如视频编码、三维医学图像压缩、语义可伸缩图像压缩等;北京大学的贾川民助理教授分享了编码技术在生成式AI席卷而来的浪潮下的创新与应用。专家们认为,AI生成的内容具有它自身的特点,编码可以帮助保存AI生成的内容,以备未来的训练和参考。编码最大的优势或许不在实时的压缩,而更在于提供了结构性理解图像数据的方式。

在点云编码方面,中国科学院大学的张新峰副教授介绍了其团队在点云压缩领域的进展,包括通过时空域模型对动态点云的高效压缩以及对三维人像的压缩;中南财经政法大学的丁晓颖副教授展示了点云显著性预测的最新工作,以及这种预测方式在点云分割与质量评价等方面的有效应用。

在信息安全方面,重庆邮电大学的袁霖副教授分享了其团队关于人脸数据隐私保护的工作进展,通过隐藏、扭曲等方式处理人脸数据,使其既可为机器识别,又可有效防止隐私泄露;中国科大的陈可江博士介绍了其团队关于AI生成内容的检测与追踪工作,包括AI生成文本检测、基于语义引导的图像再生成模型的AI生成图像的检测等。


学术报告结束后,会议开展了圆桌讨论,专家们围绕人工智能与大模型对未来研究的影响,进一步探讨了视觉智能领域发展的可能。专家们指出,生成式AI或可帮助产生大量的数据集,AI生成的内容应当是可靠安全的,随着信息的形式越来越多元化,音频、图像、视频、点云等的编码技术在底层逻辑上都有共同之处,未来或可有通用的编码方式,适用所有数据,真正实现多媒体的编码。

本次会议得到国家自然科学基金项目(批准号:62036005)支持。