昨天,也就是3月3日,谷歌搞了个大新闻,给大家带来了一款新的AI模型,叫Gemini 3.1 Flash-Lite。它把速度给提升了整整2.5倍,这下可好了。咱们先来看价格,这个模型价格相当亲民,每百万输入Tokens才要0.25美元,听起来还蛮划算的。谷歌还承诺,把Gemini 3.1 Flash-Lite搞成了Gemini 3系列里速度最快、性价比最高的那个。 大家都知道,Gemini这个系列可是谷歌的明星产品,之前就挺受欢迎的。现在,Flash-Lite版本也是一样。开发者们现在就可以在Google AI Studio里用Gemini API来体验了。企业级用户也不用着急,直接在Vertex AI平台上就能用上。 这个模型不光便宜,性能还真挺强的。权威的Artificial Analysis评测平台说了,和以前的2.5 Flash比起来,Gemini 3.1 Flash-Lite的首字响应速度快了2.5倍,整体输出速度也提高了45%。这延迟低了,搞实时响应体验就非常不错。 那在各项测试中表现怎么样呢?Gemini 3.1 Flash-Lite表现得相当给力。Arena.ai排行榜上它的Elo得分达到了1432分,这个分数可是挺高的。在多模态理解和逻辑推理测试里,它也是全面领先竞争对手的。具体点说,在GPQA Diamond测试里它拿了86.9%的高分,在MMMU Pro测试里也有76.8%。这些数据都说明这个模型挺厉害的。 还有一点让我觉得特别实用的是,Gemini 3.1 Flash-Lite在AI Studio和Vertex AI里给开发者标配了一个叫“思考层级”的功能。这个功能让开发者可以灵活控制模型在执行任务时的思考深度。比如说处理一些基础任务,像翻译或者审核这些比较简单又要求速度快的任务,就可以调低思考深度来提高效率;如果遇到生成用户界面或者复杂逻辑模拟这些难度高的任务,就把思考层级调高一点,让模型深入思考。 现在已经有一些企业开始用Gemini 3.1 Flash-Lite了,像Latitude、Cartwheel还有Whering这些公司都在自己的复杂业务场景里试用了它。大家用下来觉得这模型处理效率高、逻辑推理能力强,而且准确度也很高。看来谷歌这次推出的Gemini 3.1 Flash-Lite确实是个不错的选择啊!