我国科研智能化取得突破性进展 科学基座模型在沪问世推动学科变革

近年来,面向化学、材料、物理等领域的科研活动呈现数据体量快速增长、工具体系高度专业化、跨学科协同需求显著上升等趋势。另外,传统科研流程“信息检索—文献阅读—理论推演—数值计算—实验设计—论文写作”链条上环节多、门槛高、周期长,重复性劳动占比偏高,制约了知识发现效率与创新扩散速度。如何建设通用、可靠、可扩展的科研基础设施,成为提升科研组织效率与创新产出的重要课题。 ,“Agentic Science at Scale——AI4S科学基座模型和通用科研智能体研讨会”日前在上海模速空间举行。会上发布科学基座模型Innovator、科研智能体SciMaster等核心成果,并面向产学研各界展示以人工智能驱动科学创新的整体能力。研讨会期间,主办方还推动产学研战略签约,意在贯通技术供给、场景应用与成果转化链条,促进科研智能化从样机验证走向规模部署,继续打通“最后一公里”。 从问题维度看,科研数字化虽已积累大量数据与软件工具,但仍存在三上瓶颈:其一,科学数据多模态并存,既有文本、图表,也有谱图、显微图像、结构信息与仿真结果,跨模态对齐与统一理解难度大;其二,科学问题往往需要严格推理与可验证的计算过程,单纯的语言生成难以满足可重复、可审计的科研要求;其三,科研工具链复杂,涉及数据库检索、仿真计算、编程与实验流程管理,缺少能够不同工具间自洽协同的通用“指挥系统”。 从原因维度看,上述瓶颈的形成既有学科专业化加深、数据与工具碎片化的问题,也有科研流程强依赖经验、知识更新快导致的组织成本上升。尤其在跨学科研究中,研究者往往需要在短时间内完成新领域学习、快速判断研究路径并组织验证,这对知识获取与决策效率提出更高要求。建设“模型—工具—流程”一体化的科研基础设施,成为提升科研生产率的重要方向。 此次发布的Innovator基座模型,围绕科学多模态感知、科学推理与科学工具调用三项能力目标构建:一上面向化学、材料、物理等学科多模态数据建立理解与表征能力,提升对复杂科学信息的综合把握;另一方面强化科学推理与多模态推理能力,支持在多源证据基础上形成可检验的研究假设;同时具备面向真实科学任务的科学编程能力,为后续计算验证、流程自动化提供支撑。与之配套的通用科研智能体SciMaster,则强调全学科科研“搜、读、算、做、写”闭环能力,依托工具调用与长上下文管理,将分散的科研环节串联为可执行的工作流,促进从信息获取到结果产出的连续迭代。据介绍,其在一定时长内的运行产出可显著压缩常规理论研究中的整理与推导周期,体现出科研流程再组织的潜力。 从影响维度看,科研基础设施的系统化升级有望在三个层面产生带动效应:对科研组织而言,通过流程自动化与工具编排,减少重复劳动、缩短试错周期,提升团队协同效率;对产业创新而言,材料筛选、药物研发、工艺优化等领域的研发周期与成本有望进一步降低,促进技术迭代加速;对人才培养而言,科研训练将更强调问题定义、实验设计与结果评估等关键能力,引导研究者从“执行型”向“决策型、创造型”转变。中国科学院院士、上海交通大学人工智能学院首席顾问鄂维南在会上表示,当前AI for Science的关键基础设施正逐步成形,规模化、智能体驱动的科学研究从概念走向现实的条件日益成熟,科研范式可能迎来重要跃迁。 从对策维度看,要推动科研智能体与基座模型真正发挥“基础设施”作用,仍需在可验证性、可复现性与安全边界上持续完善:一是建立面向科学任务的标准评测体系与数据治理机制,确保结果可追溯、可审计;二是强化“模型+工具”协同的工程化能力,提升在不同学科工具链、数据库与算力环境中的适配性与稳定性;三是推动产学研深度协同,围绕真实场景开展迭代验证,将算法能力转化为可交付的科研生产力;四是完善科研伦理与合规框架,明确数据使用、成果署名与责任边界,保障科研活动规范运行。 从前景维度看,随着多模态科学数据持续增长、科研工具链进一步开放互联,以及高性能计算与实验自动化的融合发展,科研智能化将从“辅助环节”走向“系统协同”。未来一段时期,科学基座模型与通用科研智能体或将更多嵌入实验室与企业研发流程,在材料发现、分子设计、复杂系统模拟等方向形成规模化应用,并推动跨学科知识流动与创新组织方式变革。与此同时,只有坚持以科学问题为牵引、以验证闭环为准绳、以开放协作为路径,才能让技术进步转化为可持续的科研质量提升。

Innovator和SciMaster的发布标志着AI在科研领域的应用进入新阶段。从单点突破到系统解决方案的转变,展现了我国在该领域的积极探索。随着技术进步和应用拓展,人工智能有望成为推动科学发现的重要力量。