19、多模态大数据智能理解与视觉感知

时间:2021-11-16 点击数量:

成果介绍

基于深度学习的粗细粒度融合图像检索系统CFFIRDLCFFIRDL整体框架包含特征提取、编码降维以及排序匹配三个模块:

1)特征提取模块:在图像检索整体框架中,特征提取模块负责提取图像的特征,提取特征的优劣直接影响到检索的准确性。

2)编码降维模块:为了提高检索的时效性,并减少特征存储的空间花销,我们提出并实现基于Wasserstein距离的卷积自编码器用于降低原始特征维度。

3)排序匹配模块:对于检索模型的输入图像,通过特征提取模块的得到其表示图像的全局特征和表示图中物体的局部特征,以及通过编码降维模块得到对应的全局降维特征和局部降维特征。

优势CFFIRDL检索平均准确率在两个全球公开权威标准数据集上分别达到81.3%和86.9%,与现有5个先进图像检索模型对比效果最优,同时CFFIRDL支持基于全局特征的初次检索、基于全局降维特征的二次检索、基于局部特征的重新检索、基于局部降维特征的二次检索4种不同粒度的检索。

应用领域:各种图像检索领域。

成果来源:国家重点研发计划、国家自然科学基金、重庆市重点研发项目。

获奖情况:山区公路状态智能感知和协同管理关键技术及应用获得2018年度中国公路学会科学技术奖三等奖