谷歌Gemini 2.5 Flash混合推理AI模型上线：性能成本双优

发布日期：2025-04-21 14:15:25

字号：A+A-

近日，谷歌发布公告，宣布在 Google AI Studio 和 Vertex AI 中，以 Gemini API 的方式推出 Gemini 2.5 Flash Preview 预览 AI 模型。用户还可通过 Gemini 应用内的模型选择器直接使用，并结合 Canvas 工具优化文档和代码编辑。

据了解，Gemini 2.5 Flash 是一个混合推理模型，具备“动态且可控”的计算能力，开发者能够根据查询请求的复杂程度灵活调整处理时间。

谷歌指出，Gemini 2.5 Flash 非常适合用于“高容量”和“实时”的应用场景，例如客户服务和文档解析。谷歌在其博客文章中提到：“这款工作型模型专门针对低延迟和降低成本进行了优化，是响应式虚拟助手和实时总结工具的理想引擎”。

根据谷歌官方公布的定价，Gemini 2.5 Flash 模型每 100 万 tokens 输入为 0.15 美元，每 100 万 tokens 输出（不含推理）为 0.6 美元、每 100 万 tokens 输出（含推理）为 3.5 美元.

作为首款全混合推理模型，开发者可根据需求开关推理功能，灵活调整响应质量、成本和延迟，与 Anthropic 和 Grok 的前沿模型相比，Gemini 2.5 Flash 成本更低但表现不俗。（新闻来源：IT之家）

商务合作：13146398132 undefined

媒体合作：13341147250

爆料投稿：editor@vrarworld.cn

如需转载请联系13341147250 / editor@vrarworld.cn 申请授权，转载时请注明来源并保留VRAR星球原文链接。

本文部分图片及视频来源于互联网，如涉及侵权请联系我们删除。

已赞 5

谷歌 Gemini 2.5 AI模型 AI

相关推荐

传谷歌已暂停AR智能眼镜项目Iris的开发

消息称谷歌老将吴永辉加入字节，专注大模型基础研究探索

AI公司Anthropic联合创始人：团队成员极具使命感，Meta天价薪酬也挖不动

Meta计划两年内推出Orion AR眼镜；苹果将重新引用MicroLED；谷歌展示多款智能眼镜原型

部门被分拆后，谷歌的AR/VR业务反而能发力了

OmniOps获得800万美元融资，助力沙特阿拉伯的AI转型

调查显示：45%的消费者乐于使用VR和AI进行在线美容购物

阿里云推出首个AI程序员，分钟级即可完成应用开发

支付宝上线AI视觉搜索产品“探一下”

苹果正测试生成式人工智能工具，欲与OpenAI ChatGPT竞争

发表评论（0）

热门资讯