谷歌全新AI模型Gemini 3发布:宣称"全球最智能模型" - 新闻详情

谷歌全新AI模型Gemini 3发布:宣称"全球最智能模型"

来源:腾讯科技

分类: 其他

发布时间:2025-11-18 19:59:17





当地时间11月18日,Alphabet旗下的谷歌正式推出Gemini 3系列模型。Gemini 3Pro已于即日起在Gemini应用、Search AI Mode、AI Studio、VertexAI以及全新代理式开发平台Google Antigravity中开放预览。

性能全面跃升:多项前沿基准测试夺冠



谷歌表示,Gemini 3Pro在推理与多模态能力上实现了“前所未有的深度与细腻度”,并在几乎所有主流AI基准上全面超越前代2.5 Pro。它以1501Elo(Elo评分体系,用于衡量模型在盲测对战中的相对实力)的突破性成绩登顶LMArena榜单,在“人类终极考试”(Humanity’sLast Exam)中取得37.5%(无工具)成绩,并在高难度科学推理测试GPQA Diamond中拿下91.9%的顶级表现。

在数学方面,Gemini 3 Pro再次刷新前沿模型记录,以23.4%的成绩夺得MathArenaApex新高,显示出其在结构化逻辑思维与复杂计算上的强势提升。

作为一款完全多模态的基础模型,Gemini 3Pro在视觉和视频理解同样创下新纪录:多模态大考MMMU-Pro得分81%,视频推理基准Video-MMMU得分87.6%,均创当前SOTA。在强调事实一致性的SimpleQAVerified中,它也以72.1%的成绩领先同类模型。

谷歌称,这些能力意味着Gemini 3Pro可以在科学、数学、工程等高复杂度任务中提供更可靠的分析与建议,并在日常交互中给出“更直接、更有洞察力”的回应。

除了在多项基准测试中刷新纪录外,Gemini 3Pro也为每一次交互带来了全新的深度与细腻度。谷歌表示,新模型的回答更加聪明、简洁且直截了当,避免陈词滥调和无谓的恭维,更倾向于提供具有洞见的结论与判断——“告诉你需要知道的,而不是你想听的”。

这一代模型更像一个真正的思考伙伴。它能够帮助用户以全新的方式理解信息和表达观点,例如将晦涩难懂的科学概念转译为高保真的可视化代码,或在创作、规划等场景中进行更具启发性的头脑风暴。谷歌强调,这种“深度交互体验”是Gemini3 Pro在推理与多模态能力跃升后的自然结果,使其在专业分析与日常创意任务中都表现得更加可靠而富有洞察力。

Gemini 3 Deep Think:推理能力进一步跃升



谷歌同步预览了增强版Gemini 3 Deep Think。该模型进一步突破了智能边界,在Gemini3的推理和多模态理解能力上实现了阶跃式提升,能够帮助用户解决更为复杂的问题。

Gemini 3 Deep Think在极难测试中再次刷新记录:Humanity’s LastExam提升至41%(无工具),GPQADiamond提升至93.8%,并在核心AGI测试ARC-AGI-2(带代码执行、官方验证)中获得前所未有的45.1%。谷歌称该模式代表其在自主推理与新颖任务解决能力上的重大突破。

Gemini 3系列模型的发布规划

谷歌表示,Gemini 3的推出只是新一代模型周期的起点。自发布起,Gemini 3已开始在不同产品与平台中分阶段上线:

·面向普通用户:Gemini应用已全面接入新模型;Google AIPro与Ultra用户也可在谷歌搜索的AI Mode中直接体验。

·面向开发者:Gemini 3已同步登陆Gemini API、AIStudio,以及全新的智能体开发平台Google Antigravity,并可通过Gemini CLI使用。

·面向企业客户:Vertex AI与Gemini Enterprise现已支持Gemini3部署,覆盖更多企业级应用场景。

对于高阶版本Gemini 3 DeepThink,谷歌强调正在进行额外的安全审查,并收集来自独立安全团队的反馈,预计将在未来几周向GoogleAI Ultra用户开放

谷歌同时透露,未来将陆续推出更多Gemini 3系列模型,以扩展其在不同场景下的能力与覆盖范围。“我们期待看到用户使用Gemini 在学习、构建与规划中解锁更多可能性。”

演示环节:多模态推理、代码生成与视觉理解的全面展示

在发布现场,谷歌展示了一系列基于Gemini3的实时演示,覆盖学习、构建与视觉分析等核心场景,重点体现其在多模态理解、跨介质推理以及端到端代码生成方面的跃升能力。



Gemini 3生成的生成带有封面与章节导航的数字化家庭食谱电子书

在学习场景的展示中,Gemini3通过多模态处理能力展现出强大的信息整合能力。谷歌工程师向模型上传了一张带有折痕与油渍的手写家族食谱照片。Gemini3能够准确识别并翻译不同语言的笔迹,再将内容自动排版,生成带有封面与章节导航的数字化家庭食谱电子书。



Gemini 3生成的RNA聚合酶结构与运动流程等交互式动画截图

随后,演示切换到科研学习场景:面对超40页的PDF学术论文与一段长时教学视频,Gemini3一次性提取核心理论,生成变量关系图,并编写可执行的可视化代码,实时绘制出如RNA聚合酶结构与运动流程等交互式动画,同时自动产出可点击的学习闪卡与结构化学习指南。



Gemini 3在运动训练中展示其视觉理解与动作分析能力

在运动训练演示中,Gemini3则展示其视觉理解与动作分析能力。模型对一段匹克球比赛视频进行逐帧解析,在画面中叠加挥拍角度轨迹、移动路径热力图以及失误动作标注,并基于分析结果给出专业训练建议与改进计划,类似一位具备视频分析能力的体育教练。



基于Gemini 3的Search AI Mode生成式界面

谷歌还首次展示了基于Gemini 3的Search AI Mode生成式界面。用户搜索“RNA聚合酶如何工作?”时,系统会即时生成沉浸式、互动式的可视化布局,包括结构模型、工作模拟和可操控的动态图示,使复杂概念以全新方式呈现。



Gemini 3可用简单提示生成3D太空射击游戏

在构建类演示中,Gemini 3展示出面向开发者的强大代码生成能力。工程师仅以简短提示,即可让模型从零生成一个带有光影效果的3D 太空射击游戏,包括可操控飞船、实时渲染场景与完整游戏逻辑。



Gemini 3生成的复杂3D voxel像素结构

Gemini 3还可根据自然语言描述生成复杂的3Dvoxel像素结构,支持自动拆解与重混,并能构建带有自定义shader的可探索科幻世界。谷歌表示,这些能力体现了 Gemini 3在自主编码(agentic coding)与零样本生成方面的显著提升。

整场演示显示,Gemini 3在理解文本、图像、视频与代码方面的能力已能支撑多类端到端工作流程,从数字化家庭记忆、科研学习到内容创作与应用开发,呈现出显著的灵活性与实用价值。

推出全新的“智能体优先”开发体验



随着Gemini3模型智能能力的跃升,谷歌认为开发者体验正迎来一次被彻底重塑的机会。此次发布中,谷歌同步推出了面向未来“智能体开发环境”的GoogleAntigravity平台,让开发者能够以更高层次、更任务导向的方式进行软件构建。

借助Gemini 3的高级推理、工具使用能力与智能体编码(agentic coding)能力,GoogleAntigravity将AI从传统意义上“开发者工具箱中的一个工具”,提升为能够主动协作的开发伙伴。虽然Antigravity的核心界面仍保留了AIIDE的常见形态,但平台为AI智能体提供了专属工作空间,并赋予其对编辑器、终端与浏览器的直接访问权限。开发者可以让这些智能体自主规划并执行复杂且端到端的软件任务,包括多步骤流程的并行执行与代码自我验证。

除了Gemini 3 Pro之外,Google Antigravity还与谷歌的Gemini 2.5 ComputerUse(用于浏览器操作)以及图像编辑模型Nano Banana(Gemini 2.5Image)深度集成,为自动化开发和跨工具操作提供更强支持。

规划能力:长链推理与自动化执行的大幅增强



Gemini 3在长链任务规划方面取得明显提升

在智能体能力不断增强的背景下,Gemini 3 在长链任务规划方面也取得了明显提升。谷歌指出,自Gemini2引入“agentic”概念以来,团队持续强化模型的自主编码和任务执行能力,而Gemini3则在更长时间尺度上的决策一致性上迈出关键一步。

在最新的Vending-Bench 2基准中,Gemini 3Pro登顶榜首。该测试模拟经营一项自动售货机业务,要求模型在长达一年的虚拟运营周期内进行定价、补货、策略调整等决策。Gemini 3Pro在整个过程中保持稳定的工具调用和策略一致性,不偏离任务目标,并最终获得明显高于其他前沿模型的整体收益。

谷歌表示,这意味着Gemini3在现实生活中的“任务执行”能力也显著增强。通过更深的推理能力和更可靠的工具使用能力,模型能够在用户授权下完成更复杂的多步骤工作流,例如自动预订本地服务或整理电子邮箱,并从流程开始到结束保持连贯执行。

目前,Google AI Ultra用户已经可以在Gemini应用中试用这些智能体能力,包括由 GeminiAgent驱动的Gmail自动整理功能。谷歌称,随着相关能力不断完善,公司计划将其扩展至更多谷歌产品线。

附:Alphabet兼谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)的寄语

将近两年前,谷歌开启了Gemini时代,这是公司有史以来规模最大、影响最深远的科学与产品项目之一。此后,用户对它的喜爱超出了预期。AIOverviews每月活跃用户已达20亿,Gemini应用月活跃用户超过6.5亿,超过70%的谷歌云客户正在使用我们的 AI服务,已有1300万开发者基于我们的生成式模型进行开发。这些仅仅是我们观察到影响力的冰山一角。

凭借在AI创新方面的全栈优势,包括领先的基础设施、世界一流的研究、模型与工具链,以及触达全球数十亿用户的终端产品,我们得以以前所未有的速度将前沿能力推向全世界。

每一代Gemini都在前一代的基础上持续进化,使用户能够实现更多可能。Gemini 1实现了原生多模态和超长上下文窗口的突破,极大拓展了可处理的信息种类与规模。Gemini2为代理能力奠定基础,并在推理与思考维度上大幅提升,帮助用户应对更复杂的任务与想法。Gemini 2.5Pro在LMArena榜单上连续六个月稳居榜首。

今天,我们正式推出Gemini3,这一代模型是迄今为止最智能的Gemini,将系列所有能力融为一体,帮助用户将任何想法转化为现实。Gemini3在推理能力上达到全新高度,能够深刻把握细微差别与深层含义,无论是捕捉创意中的微妙线索,还是剖析复杂问题的多层结构。

它能够更精准地理解用户上下文与真实意图,使用户只需提供更少提示便能获得所需结果。短短两年时间,AI已从单纯“读懂文字和图片”进化为能够理解场景和氛围的智能体。

从今天起,谷歌将以全球规模全面推送Gemini 3,包括在搜索的AI Mode中引入Gemini3,以支持更复杂的推理和全新动态体验,这也是首次在发布当天将模型部署到搜索中。

同时,Gemini 3也在Gemini应用、开发者平台AI Studio、Vertex AI以及全新智能体开发平台GoogleAntigravity上同步上线。

与前几代模型一样,Gemini3再次刷新了业界最先进水平。谷歌将持续推动智能、智能体能力和个性化的突破,致力于让AI成为每个人的得力助手。我们期待用户借助Gemini 3创造出更多精彩作品,同时也将继续迭代优化,为未来带来更多惊喜。

评论 (0)