把清华大学智能产业研究院(AIR)和专注于AI药物研发的水木分子公司联合攻关的成果拿出来给大家用,这次开源的BioMedGPT-Mol模型就是专门给搞新药研发的人准备的。这个化学分子通用任务大模型的发布,让中国在生物医药领域的大模型应用方面迈了一大步。 以前搞新药,从找到靶点到把药搞出来,平均得花十到十五年的时间,钱也烧得厉害。问题出在得测那么多化合物的性质,全靠经验试错效率太低。现在有了AI就不一样了,通过机器学习分析文献和数据,能帮人设计分子结构,效率肯定高很多。 不过以前的工具门槛太高,很多人不会编程用不了。这次BioMedGPT-Mol就把这事儿解决了。它是在千问大模型的基础上打磨出来的,最大的特点就是能直接跟人用自然语言对话。研究人员只要打打字、发句话,就能让模型去做分子解释、性质预测、结构优化这些关键活儿,再也不用自己去写复杂代码了。 技术上的成绩更是没得说。研发团队公开的数据显示,这个模型在六大类分子任务的综合评测指标上都是国际领先水平(SOTA)。特别是在“分子编辑”这种比较难的活儿上,要是切换到特定模式,效果还能更好。 水木分子团队还做了个大胆的尝试:只用大模型去做有机分子逆合成分析——这可是规划合成路线的核心步骤。他们在RetroBench这个权威基准上拿到了好成绩,说明解决复杂合成问题它有潜力。 为了把这个先进的东西用好,水木分子找阿里云合作搞基础设施。他们用容器服务和DevOps平台搭建了一个安全又高效的环境,既保护了数据安全又把成本降下来了。 把这个模型开源出来对大家都有好处。把核心技术开放出来能吸引更多人参与改进和应用场景拓展。同时也能促进科研数据的标准化和知识共享,推动整个AI for Science(科学智能),特别是AI for Drug Discovery(人工智能药物发现)的发展。 这事儿是产学研用协同创新的一个好例子。它不光展示了咱们中国在交叉学科领域的研发实力,更把工具变得更易用、更先进。这就好比给新药研发装上了“智能催化剂”,以后肯定能帮咱们攻克更多疾病,为健康中国出力。 以后的路还长着呢。随着这些模型能力变强、跟实验室实验平台深度融合还有创新生态越来越完善,AI肯定会更深层次地改变搞药的方式,为老百姓的健康生活贡献更多力量。