山东工商学院首次以第一作者单位在CVPR发表论文 计算机视觉研究跻身国际前沿

近日,山东工商学院计算机视觉与模式识别方向取得新进展。由该校信息与电子工程学院郭文教授牵头,与2024级电子信息专业研究生赵鹏飞、中国科学院自动化研究所高君宇副研究员及内蒙古大学有关研究人员合作完成的论文《Dual-level Adaptation for Multi-Object Tracking: Building Test-Time Calibration from Experience and Intuition》被IEEE/CVF计算机视觉与模式识别会议(CVPR 2026)接收。此次入选实现了山东工商学院首次以第一作者单位在CVPR发表论文,具有标志性意义。 问题:真实场景“分布偏移”制约多目标跟踪可靠性 多目标跟踪是智慧交通、安防巡检、体育赛事分析与无人系统感知中的关键技术,其核心任务是在连续视频中对多个目标进行检测、跟踪并保持身份一致。业内普遍面临的难题在于:模型通常在特定数据集上训练,但部署时往往遇到新的城市道路、不同摄像机参数、光照变化、遮挡增多、运动模式突变等情况,导致训练数据与测试数据之间存在明显“分布偏移”。这种偏移容易引发身份切换、轨迹断裂、误关联等问题,进而影响系统的稳定性与安全边界。 原因:外观变化与运动异常叠加,传统策略难以及时自校准 多目标跟踪的身份关联既依赖外观特征,也依赖运动规律。然而在拥挤场景、视角变化或低清画面中,外观特征不稳定;在急转弯、加速、遮挡后重现等情况下,运动预测也容易失准。部分既有方法尝试通过更强的特征提取或更复杂的关联策略提升精度,但在“训练—测试差异显著”条件下,模型仍可能将训练期形成的“固定偏好”带入测试,难以根据当前视频环境进行快速、可解释的自适应校准,从而影响推理阶段的鲁棒性。 影响:提升推理可靠性,为工程落地提供更稳的技术支撑 论文提出面向多目标跟踪的测试时校准框架,核心思路是将测试阶段的自适应划分为双层:一上利用近期观测形成“瞬时记忆”,及时响应短时间尺度的外观变化与遮挡干扰;另一方面从测试视频的历史信息中提炼“长期经验”,在更长时间尺度上稳定关联判断,减少偶发异常带来的连锁错误。研究显示,该框架能够为身份关联提供动态、可调的指导机制,在处理外观漂移、运动异常等典型问题时表现出更强的稳定性。实验结果表明,相关方法在多项评测中优于对比技术路线,并表现出较好的泛化能力,为多场景部署提供了可参考的技术路径。 对策:以测试时校准为抓手,推动算法从“数据集最优”走向“场景可信” 业界对视觉算法的评价正从单一指标提升转向“可用、可靠、可持续维护”。测试时校准的价值在于,把适应能力前移到推理阶段,使模型在不确定环境中具备一定的自修正空间。该研究说明了从工程痛点出发的思路:既关注短期扰动的快速响应,也重视长期统计规律的累积利用,形成更贴近真实应用的综合策略。下一步,相关研究可围绕多源摄像机、跨域长时视频、极端天气与夜间场景等开展更系统验证,并与端侧部署、算力约束、隐私保护等工程需求协同优化。 前景:国际高水平成果带动学科建设与人才培养,区域创新生态有望受益 CVPR自1977年创办以来被公认为计算机视觉领域最具影响力的国际会议之一,在全球学术评价体系中处于前列。此次成果入选不仅有助于提升学校在国际学术共同体中的可见度,也将对学科布局、科研平台建设、研究生培养与高层次合作产生带动效应。随着多目标跟踪在城市治理、工业质检、公共安全等领域的应用加速,面向复杂环境的鲁棒方法将成为竞争焦点。高校与科研机构、产业场景的对接将更为紧密,推动形成从基础研究到应用验证的闭环。

山东工商学院该突破表明,地方院校同样能在国际学术舞台取得亮眼成绩。只要坚持特色发展、深耕专业领域,中国高校完全有能力在世界科技前沿占据一席之地。这一成果也为我国高等教育均衡发展提供了有益范例。