这是美好的一周!人工智能的进步使得按下“快进按钮”变得更加困难。谷歌、OpenAI、xAI三大巨头似乎已约好,同时亮出“追踪牌”。尤其是谷歌,这次可以说是红了眼,誓要夺回王座。那么话不多说,让我们一起回顾一下这疯狂的一周,看看诸神之战到底有多残酷。 1.重磅工具:谷歌Gemini 3 全家桶轰炸场 毫无疑问,本周的明星就是谷歌。 Gemini 3 Pro的推出标志着AI时代翻开了新篇章,为多模态推理和整体性能树立了新标杆。 1. Gemini 3 Pro:推理能力加倍。这是谷歌迄今为止最先进的多模态人工智能推理模型。 · 卓越的性能:在推理、数学、编码、视觉理解等基准测试中达到 SOTA(最先进的)水平。 · 数据爆炸:在最新的ARC-AGI-2基准测试中,Gemini 3 Pro 在启用“深度思考”模式的情况下得分达到了惊人的 45%。这是之前所有人工智能模型得分的两倍多。 · 在野外无与伦比:对于分析视频和编写 UI 代码等实际应用,它远远优于基准数据。 2. Nano Banana Pro:Nano Banana,影像的“精致疯狂”,带来专业进化。这一次不再是“小伎俩”了。 Google 在 Gemini 3 Pro 中创建的成像模型注重精度和真实感。 ・4K 级图像质量:支持高达 4K 分辨率的高保真渲染。 · 文本渲染更流畅:文本渲染错误率从56%大幅降低至8%。 · 超级慧差跟踪功能:支持混合生成多达14张参考图像,非常适合创建复杂的信息图表、产品原型、建筑图和漫画。目前在 Gemini 应用程序中可供付费用户使用,也可以由开发者通过 API 调用。 3.蚂蚁igravity:原生 AI 编程 IDE。这款AI编程IDE(集成开发环境)可以说重新定义了编程。看来程序员的生产力工具要被取代了。除了代码补全和在线编辑等标准功能外,Antigravity IDE 还具有强大的代理功能。 ·多代理工作流程:具有专用的纠错代理、文档代理,甚至内置浏览器。 · 代理管理器:开发者可以像员工一样管理AI。本机支持 Gemini 3 Pro,但其他型号也兼容。谷歌的宝座基本稳固。据报道,竞争对手 OpenAI 的研究人员上个月听说谷歌开发了一种新的人工智能,并且这种新的人工智能正在进入技术阶段。看起来已经超越了OpenAI。 “我们知道还有很多工作要做,但我们正在迅速赶上,”首席执行官萨姆·奥尔特曼在一份内部备忘录中承认。他准确地警告员工“我们期望外部但三英尺的冰冻并非一日之功。本周,谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)在推特上发了一条五个字母的信息:“iykyk”(我明白了)。附上的照片是一个美味多汁的人工智能生成的芝士汉堡。看似滑稽的欺骗背后,隐藏着谷歌重返技术巅峰的霸道宣言。这表明现实广告终于按照Gemini 3的理解回到了正确的轴心:一般人可能认为这没什么大不了的,但在科技巨头眼中,这代表了人工智能技术的巨大飞跃。“通常,人工智能模型在处理空间方向,尤其是物体的相对位置时遇到很多麻烦。但这张照片显示Gemini 3解决了这个问题。如果人工智能确切地知道把奶酪放在哪里,它就具有真正的空间推理能力。”他指出。本周的主要反应是,谷歌的股价飙升至历史新高,其市值一跃超过微软。科技媒体 BI 认为,这是皮查伊长达十年的“人工智能优先”战略终于取得成果。斯里尼瓦桑先生评价道:“谷歌真正‘放下一切’专注于人工智能。Gemini 3标志着他们重新夺回领先地位的时刻。皮查伊不仅使谷歌的收入翻了一番,达到1000亿美元,而且现在将公司在技术和业务方面带到了前所未有的高度。” 2. 敌对阵营:OpenAI 和 xAI 反击 尽管谷歌蒸蒸日上,但它的人工智能竞争对手却绝非幼稚。 1. OpenAI:GPT-5.1 来了。 OpenAI 本周还发布了 GPT-5.1-Codex-Max 和 GPT-5.1 Pro,但显然不希望 Google 这么做。抢尽风头。 · Codex-Max:专为长周期软件工程而设计,可以处理长达24小时的任务并自动压缩上下文。它在 SWE-Lancer 等基准测试中获得了 SOTA 分数。 · 专业版升级:ChatGPT Pro 已升级升级至GPT-5.1 Pro,称为“研究级”模式,推理能力显着提升。用户反馈:使用GPT-5.1 Pro一周后,程序员普遍发现GPT-5.1是最强大的模型,具有怪物级功能,适合复杂任务但具有安全过滤。问题是输出过多,在某些情况下变得困难。 Codex-Max 现在执行长任务的效率提高了 30%,但上下文管理需要优化。 2. xAI:Grok 4.1 正在快速发展。马斯克的 xAI 玩法极其激进。 Grok 4.1 及其更快的版本已于本周发布。 · Grok 4.1:情商和创意写作都有了很大的提高。其思维模式在LMArena中获得1483分,仅次于Gemini 3 Pro位居第二。 · Grok 4.1 Fast:提供200万个token上下文窗口。不仅经济实惠,还拥有强大的Agent Tools API(Agent Tools Interface),支持联网,X post搜索和代码执行,使其成为“深度调查的最佳人工智能代理”。用户反馈:Grok 4.1“Thoughtless”已经达到了大多数高端机型只能通过“Thought Chain”模型才能达到的智能水平。 3. 硬核工具和开源生态系统 Meta SAM 3 和 SAM 3D:视觉大片。 Meta 推出了第三代“Segment Everything”模型(SAM 3),可以检测和分割视频中的任何对象。新的 SAM 3D 还可以将单张照片转换为 3D 模型。该技术已被用于 Facebook Marketplace 的“实时预览”功能。用户评价:生成速度很快,但生成多个对象时,排列有点乱,生成的文件仍然无法下载。 AI2 Olmo 3:艾伦艺术情报学院官方发布了完全开源的SOTA Olmo 3模型(提供7B和32B版本)。这不仅释放了重量,还释放了整个训练过程流程和数据,这对开源社区来说是真正的好处。用户代码提及:基础模型的性能与Qwen 2.5处于同一水平。 Replit设计模式 – 有效利用Gemini 3 Pro的功能,仅使用配色和文字段落即可生成设计精美的复杂UI界面。普通用户的反馈:30 分钟内创建一个设计。没有AI的痕迹,没有典型的紫色渐变,效果很好。 Google WeatherNext 2:谷歌推出了内置于 Pixel 手机中的新一代 AI 天气模型,旨在使天气预报更加准确和高分辨率。热心用户评论:人工智能的预测速度现在比气候变化还要快。 4. 机器人与科学前沿 Sunday Robotics Memo:斯坦福大学中国团队创立的体力智能公司Sunday Robotics展示了一款名为Memo的人形机器人。它没有复杂的五指键edle,不过是双爪设计,却练习洗碗、洗衣服、煮咖啡等家务活。凭借ACT-1的基本“零数据”模型,该公司希望通过低成本培训降低机器人开发的门槛。热门用户评论:为什么机器人公司如此热衷于制造可怕的设备? Memo 是唯一不会在睡梦中杀死我的机器人。您可能认为“看起来不致命”将是家庭机器人的首要考虑因素,但显然事实并非如此。干得好! GPT-5 对于科学研究很有用:OpenAI 发表或发表了一篇文章,展示了 GPT-5 在数学、物理和生物学领域的应用。它还帮助研究人员发现了四个以前未解决的数学问题的证据。用户评论:这篇 80 页的文章给科学界敲响了警钟。 5、商业和政治趋势 NVIDIA势头持续:NVIDIA最新季度财报公布交易额达 570 亿美元,超出华尔街预期。 CEO黄仁勋坦言,“Blackwell芯片稀缺,AI无处不在”。经常有用户评论:50%的交易利润率!这是地球上存在的东西吗? Genspark获巨额融资:AI智能搜索公司Genspark已完成2.75亿美元B轮融资(估值12.5亿美元)。用户评价:我们仅用 30 人的团队,在短短 6 个月内就达到了 10 亿美元的估值。两个政策世界:美国白宫正在准备让联邦政府承担对人工智能的监管权,以防止各州“单打独斗”。与此同时,欧盟正在放松对高风险人工智能模型的监管,并推迟合规期限,以放松对创新的监管。 6. 近距离观察:人工智能音乐隐藏的问题 Deezer 和 Ipsos 联合进行的一项新研究揭示了一个有趣的现象:97% 的听众无法区分人类音乐音乐和人工智能生成的音乐。目前,Deezer 平台每天发布超过 50,000 首 AI 音乐作品。虽然大家都支持“AI生成”的标签,但51%的人担心流媒体平台未来会充斥着平庸、低质量的“AI吐槽歌曲”。人类的创造力会被海量的人工智能创造所淹没吗?这取决于我们每个人的选择。用户评论:一位说唱歌手突然意识到自己的性能不如GPU。结论:我们应该做什么?本周让我们对未来有了清晰的愿景,人工智能不再只是一个聊天玩具,而是真正进入了“强推理”和“代理执行”阶段。如果您是开发人员,请尽快尝试 Antigravity 和 Codex-Max。如果您是一名设计师,Nano Banana Pro 可能是您新的生产力补充。如果您是普通用户,可以使用 ChatGPT。不要忘记体验我们的群聊功能。在这个科技时代科学爆炸,唯一的风险就是停止学习。 (辰辰)