近日,国际顶级会议ACM Multimedia 2022在葡萄牙里斯本举办,由公司朱艾春老师指导的学院2021级研究生王子杰同学的两篇长论文均被大会录用,受到了业内的关注。
两篇论文的题目分别是《CAIBC: Capturing All-round Information Beyond Color for Text-based Person Retrieval》和《Look Before You Leap: Improving Text-based Person Retrieval by Learning A Consistent Cross-modal Common Manifold》,均围绕“跨模态行人重识别”方向展开,旨在通过对文本信息的学习与理解,在海量的图像库中快速准确地找到所要检索的图像。前篇论文针对现有跨模态行人重识别方法普遍存在对色彩信息过度依赖的问题,提出了一种多分支架构,旨在捕捉超越色彩的全面信息,其包含RGB、GRS与CLR三个分支;后篇论文提出了一种名为“三思而后行”的基于文本的行人重识别算法模型,该方法在将任一模态映射到公共空间之前需充分考虑该模态的自身分布特征,从而构建了一种更稳定的跨模态分布一致性。两项研究成果可应用于失踪人口追踪、跨模态搜索引擎等相关检索领域。
图1: CAIBC模型结构图
图2:Look Before You Leap模型结构图
据悉,ACM Multimedia是计算机学科多媒体领域的顶级国际会议,也是中国计算机学会(CCF)推荐的该领域唯一的A类国际学术会议。ACM Multimedia有着严苛的录用标准,2022年的投稿量达2473篇之多,最终录用690篇,录用率为27.9%。计算机科学与技术学院学子2项研究成果同时在该会议发表,表明学院的科研和人才培养工作迈上了新台阶。
作者:计算机科学与技术学院 审核:高辉庆、万夕里