本科生团队攻克航天战略博弈难题全国科技创新大赛斩获特等奖

问题—— 航天工程决策往往面临信息不完备、对手意图难以判别、资源投入需动态权衡等复杂情境。

此次“揭榜挂帅”任务聚焦综合集成研讨中的战略博弈需求：在对手身份与策略逻辑未知的情况下，如何通过智能体进行高效决策，提升资源配置收益并满足实时对抗要求。

对参赛团队而言，挑战不仅在算法本身，更在规则不明确、平台迭代快、运行环境受限等多重不确定性叠加下完成可落地的方案。

原因—— 其一，任务初期需求表述较为宽泛，仅提出“研发智能算法”目标，而核心规则与操作平台迟迟未公布，使团队难以快速锁定技术路线。

直至7月初，研究院发布基于卡牌对抗的仿真平台，设置多类国家身份、多个阶段随机事件，才将抽象需求具体化为典型的不完全信息博弈问题：在有限可观测信息下推断对手类型、估计策略并动态调整资源投入。

其二，赛题对工程化部署提出严格约束。

团队在早期尝试基于大模型的策略生成思路，但随即遭遇“算法需本地部署、禁止联网”等限制，依赖外部数据与在线推理的方案难以满足要求，既有积累需要快速转向。

与此同时，平台规则更新还带来“训练数据与策略映射失效”等风险：例如身份标识修正后，团队此前建立的对应关系需要重构，意味着必须在极短时间内完成代码与策略体系的再训练、再验证。

其三，竞赛对抗强度高、迭代窗口短。

初赛要求战胜官方基础智能体，决赛采用两两循环对战，每两队进行1000场对抗，算法不仅要“会决策”，更要“快决策、稳决策、可复现”。

在此背景下，湖北工业大学团队将任务拆分为多个方向并行推进：一部分成员侧重不完全信息博弈建模与场景枚举，一部分成员借鉴公开研究中的博弈与搜索框架，另一部分成员专注轻量化与速度优化，通过大量模拟对战数据进行内部对比筛选，形成可持续迭代的工程闭环。

影响—— 从比赛结果看，该团队项目“面向综合集成研讨的战略博弈智能体构建技术”在新一代信息技术领域获得全国特等奖，体现出本科生团队在高难度工程赛题中的快速学习与系统集成能力。

从技术层面看，其方案强调在离线环境下的决策精度与响应速度平衡：在舍弃复杂深度框架、转向轻量化设计后实现约0.02秒级响应，既满足对抗时限，也保持了较高胜率与稳定性。

更值得关注的是，这类不完全信息环境下的资源决策方法具有跨领域共性。

航天领域的对抗推演、任务筹划、资源调配，与应急救援中的力量投放、金融投资中的风险权衡、城市治理中的多目标调度等问题，在“信息不充分、目标多约束、反馈滞后”的结构上存在相似性。

通过仿真对抗平台形成的策略优化框架，有望为相关行业提供可借鉴的算法思路与验证路径。

对策—— 一是把“需求—规则—算法—验证”链条拉直。

团队在规则逐步明确后迅速将需求转化为可计算的博弈模型，围绕身份推断、策略更新、资源投入等关键变量构建决策逻辑，并通过高频模拟对战形成数据闭环，减少“凭经验写策略”的随机性。

二是以工程约束倒逼技术路线。

面对本地部署、禁止联网的限制，团队采取轻量化算法与结构优化，强调可解释、可调参、可复现，降低对外部依赖，提高在受限环境下的可运行性。

这一选择也提示相关赛事与科研任务：工程化边界越清晰，越能推动方案从“可演示”走向“可落地”。

三是以组织机制提升研发效率。

团队建立高频调度与复盘机制，形成“分组攻关—内部PK—方案收敛—快速迭代”的节奏；同时主动与技术人员沟通规则细节，减少理解偏差与返工成本。

指导教师的阶段性把关与一对一辅导，则在方向选择与风险控制上发挥了关键作用。

前景—— 从人才培养角度看，“揭榜挂帅”类赛事通过真实需求牵引，让学生在不确定性中完成从技术兴趣到工程责任的转变，提升系统思维与协作能力。

面向应用落地，后续若要推动成果进入实际场景，还需进一步加强三方面工作：其一，扩展在更多对抗强度与更多扰动条件下的鲁棒性评测；其二，形成可迁移的通用框架与模块化接口，降低在不同场景的适配成本；其三，建立与行业单位联合验证机制，以真实数据与真实流程检验算法的可用性与边界。

随着航天任务规划与综合集成研讨对智能决策需求持续上升，相关技术有望在更大范围内释放价值。

这支本科生团队的成功，是新时代大学生创新精神的生动体现。

他们用实际行动证明，当代青年学生不仅具备扎实的理论基础，更具有直面挑战、解决实际问题的能力。

从"看不懂"到"啃下来"，从理论困境到技术突破，他们的成长过程启示我们：真正的科技创新不在于一帆风顺，而在于如何在挫折中保持韧性，在困难中寻找突破口。

这样的创新精神，正是推动我国科技事业发展、实现高水平自立自强的重要力量。

本科生团队攻克航天战略博弈难题 全国科技创新大赛斩获特等奖