皇冠体育·(中国)官方网站
学科与科研
科研动态
当前位置: 首页 >> 学科与科研 >> 科研动态 >> 正文

【科研新成果】我院科研团队在计算机视觉领域取得四项新成果

2021-07-27  点击:[]

近日,我院几何计算与智能媒体技术研究所四项成果被国际计算机视觉大会 (IEEE International Conference on Computer Vision 2021)录用。ICCV是计算机视觉领域最高级别的会议,在世界范围内每两年召开一次。会议的论文集代表了计算机视觉领域最新的发展方向和水平。本届ICCV大会收到6236篇论文投稿,录用1617篇,录用率仅为25.9%。其中由张淼副教授指导的研究生刘杰和2019级本科生王逸飞的论文被选为口头发表(Oral presentation),录取率仅为3%。

论文“FFT-OT: A Fast Algorithm for Optimal Transportation”由雷娜教授团队与海外学者合作完成,在最优传输理论、计算及应用研究方面取得新突破。最优传输映射给出了从一个概率分布到另一个概率分布的最经济的传输方式,在计算机视觉、计算机图形学、医学图像等问题中被广泛应用,现已成为深度学习的理论基础之一,尤其是在生成模型中起到根本的重要作用。根据Brenier理论,计算最优传输映射等价于求解Monge-Ampere方程。但是由于Monge-Ampere方程强烈非线性,最优传输映射的计算极具挑战性。合作团队提出了一种全新的最优传输映射的计算方法:FFT-OT。该方法用快速傅里叶分解来加速最优传输映射的计算,而且FFT可以用专有硬件实现,因此可将最优传输映射的计算速度提高数个数量级。



论文“Cortical Surface Shape Analysis Based on AlexandrovPolyhedra”由雷娜教授团队与海外学者合作完成。该工作基于Alexandov定理,将最优传输映射的从欧几里得几何推广到球面几何,为零亏格曲面的黎曼度量提供了新颖的特征曲面。将此方法应用于脑神经的疾病研究,提高了阿尔兹海默症的智能诊断效率。



论文“Dynamic Context-Sensitive Filtering Network for Video Salient Object Detection”由研究生刘杰,19级本科生王逸飞,张淼副教授等合作完成。该工作旨在解决视频显著性目标检测(VSOD)中应对动态变化场景的不足,提出了一个动态上下文相关滤波模块(DCFM)。该模块通过估计位置相关权重,可在多个尺度生成包含丰富上下文信息的动态卷积核来提高模型对动态视频场景的适应性。其次,考虑到视频场景中时空特征间的紧密依赖特性,提出了一种双向动态特征融合策略,将Encoder-Decoder结构中的解码过程划分为多个阶段,在每一阶段均设置了一个动态融合模块,自适应的融合时空双向特征,使该模型在高挑战性场景下依然保持稳定的性能。大量的实验表明,该工作提出的DCFNet在多个公开数据集上表现出了最优性能,尤其在复杂动态的视频场景具有良好的适应性。此外,DCFM模块展现了在RGB显著性检测模型中的可扩展性,提升了其性能表现。



论文“MFNet: Multi-filter Directive Network for Weakly SupervisedSalient Object Detection”由研究生王健,张淼副教授等合作完成。该工作聚焦于如何有效的利用多路伪标签中的互补信息,提出了一个针对弱监督显著性目标检测的多信息整合方法。首先,该方法构建了一种基于多路指导滤波器的整合框架(MFNet),整合多路伪标签中互补的显著性信息,有效避免了单一伪标签对预测结果产生的负面影响。具体来讲,该模型中设计了一种可有效提取伪标签中准确显著性信息的指导滤波器(DF)。采用多路指导滤波器的结构整合和细化提取的显著性信息,通过设计的多路指导损失函数传递给最终的显著性检测网络。该工作提出的方法在多个公开数据集上均达到了目前最优的性能。此外,该框架框架具有较好的可扩展性,可灵活地应用到现有的弱监督SOD方法中,提高其约20%性能(MAE指标)。



相关介绍:

几何计算与智能媒体技术研究团队隶属于皇冠体育·(中国)官方网站皇冠体育·(中国)官方网站,与立命馆大学合作建立健康医疗智能计算联合研究中心。研究课题包括机器学习、深度学习、计算机视觉、多媒体技术、优化方法等当前最前沿的领域,及其在医疗和健康领域中的应用。近年来在IEEE TPAMI、TIP、TNNLS、TMM、NeurIPS、IJCAI、AAAI、CVPR、ICCV、ECCV、ACM MM等人工智能、多媒体技术等多领域的重要期刊及会议上发表论文达100余篇。近一年来针对可学习优化的理论及应用研究已发表顶级会议和期刊(包括NeurIPS, AAAI, IJCAI, ACM MM, TIP, TNNLS等)论文30余篇。研究所在科学研究的基础上,还面向国家重大战略需求,如开展全天候车载多波段立体视觉感知单元研发,在重大项目实物竞标中取得第一名;开展水下目标抓取机器人研发,在水下目标自主抓取中取得突破等。


责任编辑:潘树孟

上一条:【科研新成果】我院科研团队在网格生成领域取得算法新突破 下一条:【科研新成果】我院科研团队在多媒体技术领域取得四项新成果

关闭

Baidu
sogou