NVIDIA GTC 2026:Vera Rubin 平台发布,AI 芯片需求达万亿美元
3天前
CNBC / NVIDIA Blog
发生了什么:Jensen Huang 在 GTC 2026 发布 Vera Rubin 全栈平台(7 款芯片、5 套机架系统),性能是 Grace Blackwell 的 10 倍/瓦特。同时发布 Groq 3 LPU(收购 Groq 后首款产品)。预计 AI 芯片需求 2027 年达 1 万亿美元。
为什么重要:AI 硬件从"卖 GPU"进入"卖 AI 工厂"时代,AWS 将部署超百万块 NVIDIA GPU,Azure 首家上线 Vera Rubin NVL72。
与你相关:推理成本将随新硬件代际下降,本地部署和云端推理的性价比格局即将改变。
白宫发布国家 AI 立法框架,试图统一联邦监管
1天前
NBC News
发生了什么:白宫发布六大方向 AI 立法框架,涵盖儿童安全保护、数据中心能源规范、开发者法律责任限制等,呼吁国会建立统一联邦标准,限制各州自行立法。
为什么重要:美国首个系统性联邦级 AI 立法提案,将直接影响 AI 产品的合规设计和上市策略。超过 50 名共和党议员对限制州立法权表示担忧。
与你相关:关注对模型透明度和数据使用的具体要求,可能影响 AI 产品架构设计。
DeepSeek-V3.2 发布,推理能力追平 Gemini-3.0-Pro
本周
LLM Stats / DEV Community
发生了什么:DeepSeek-V3.2 发布,专注推理和 Agent 场景。其 Speciale 变体在 AIME 和 HMMT 2025 基准上超越 GPT-5,达到 Gemini-3.0-Pro 级别。
为什么重要:开源模型在推理能力上首次与闭源前沿模型并驾齐驱,对 AI 技术选型有重大影响。
与你相关:如果你在做 Agent 或推理密集型应用,DeepSeek-V3.2 是一个值得评测的开源替代方案。
OpenAI 发布 GPT-5.4 Thinking,引入规划和中断机制
本月
AI Agent 社区
发生了什么:OpenAI 发布推理模型 GPT-5.4 Thinking,引入执行前"Planning"和执行中"Interrupting"机制,1M token 上下文窗口,原生 Computer Use 能力。
为什么重要:Planning + Interrupting 改变了人机协作模式,Agent 可以先规划再执行,执行中可被人类中断修正。
与你相关:新的 Planning/Interrupting 范式值得关注,可能成为 Agent 开发的标准交互模式。
Kimi K2.5 发布:万亿参数 + Agent Swarm 百 Agent 并行
本月
新浪 / AI Agent 社区
Kimi K2.5 拥有万亿参数,核心特性是 Agent Swarm——能自主拆解任务并并行调度最多 100 个子 Agent。MIT 许可证开源,在多项编码和推理基准上接近闭源前沿模型。
与你相关:Agent Swarm 的多 Agent 并行调度是一个值得深入研究的架构模式。
Qwen3.5 发布四款多模态小模型,覆盖边缘到云端
本周
LLM Stats
阿里云发布 Qwen3.5 系列四款开源小模型(0.8B/2B/4B/9B),支持文本、图像和视频处理,可在边缘设备运行。9B 版本在 MMLU-Pro 上达到 82.5 分。
与你相关:端侧多模态模型意味着更多场景可以离线运行 AI,值得评估本地部署方案。
AI 生成代码 14.3% 含安全漏洞,FTC 要求企业承担全部责任
本月
WBN Digital
斯坦福和 MIT 联合研究分析 200 万+ AI 生成代码片段,发现 14.3% 含安全漏洞(人类代码 9.1%)。FTC 发布指引:无论代码由人类还是 AI 生成,企业承担全部安全质量责任。
与你相关:使用 AI 编程工具时需要更严格的代码审查流程,关注自动安全扫描工具的集成。
AMI Labs 完成 10.3 亿美元种子轮,"世界模型"挑战 LLM
3天前
Crescendo AI News
Yann LeCun 创办的 AMI Labs 完成欧洲最大种子轮融资,估值 35 亿美元,获 Nvidia 和 Bezos Expeditions 支持,致力于开发面向机器人和制造业的"世界模型"。
与你相关:"世界模型"是 LLM 之外的另一条技术路线,可能在 2-3 年内开辟新的 AI 应用范式。
Google Gemini Embedding 2:首个跨模态统一向量模型
本周
LLM Stats
Google 发布 Gemini Embedding 2,首个将文本、图像、视频、音频和 PDF 编码到同一向量空间的模型,支持 8192 token 文本、6 张图片、120 秒视频、原生音频处理。
与你相关:统一向量空间大幅简化多模态 RAG 架构,不再需要为不同模态维护独立的 Embedding 管线。
OpenAI 收购 Python 工具商 Astral,强化 AI 编程布局
本月
WBN Digital
OpenAI 将收购 Python 工具开发商 Astral,加强在 AI 辅助软件开发领域的布局。Astral 开发的工具链被广泛用于 Python 生态的代码质量和开发效率提升。
与你相关:OpenAI 进入开发工具链,可能推出更深度集成模型能力的 Python 工具。
三人因走私 AI 芯片至中国在美被起诉,涉案 25 亿美元
1天前
美国司法部 / Al Jazeera
三名与 Super Micro Computer 相关人员被起诉,涉嫌走私价值超 25 亿美元的 AI 芯片至中国。同时美国对华芯片出口管制政策出现微妙调整,NVIDIA H200 获批向中国销售。
与你相关:芯片管制政策的松紧直接影响 AI 算力成本和技术方案选择。
Meta 发布四款自研 AI 芯片,Atlassian 裁 1600 人转向 AI
3天前
Crescendo AI News
Meta 公布自研芯片路线图(MTIA 300-500),计划 2027 年部署。Atlassian 裁减 10% 员工转向 AI,替换 CTO 为两位 AI 负责人。Samsung 计划 2026 年投资 730 亿美元强化半导体。
与你相关:科技巨头全面 AI 转型,Jira/Confluence 可能迎来 AI 能力大升级。
Google 个人智能全面开放,Gemini 整合 Gmail/Photos/YouTube
本周
Crescendo AI News
Google 向全美免费用户开放 Personal Intelligence 功能,Gemini 可调用 Gmail、Photos、YouTube 等数据提供上下文感知响应。此前仅付费用户可用。
与你相关:AI 从独立工具走向平台级集成,个人数据+AI 的结合模式值得产品层面思考。
拓展Shopify 押注 Agent 驱动电商,AI 代替用户挑选购买商品
本周
Crescendo AI News
Shopify 大力投入 Agent 驱动电商,AI 系统作为"个人购物助手"代替用户发现、比较和购买商品,通过学习用户偏好提供深度个性化推荐。
拓展Ford 推出 AI 车队管理助手,日处理 10 亿数据点
3天前
Crescendo AI News
Ford 推出 "Ford Pro AI" 商用车 AI 助手,每日分析超 10 亿数据点,免费提供给 84 万订阅用户,目标减少车队管理人员每周 23 小时的行政工作。
数据来源:NVIDIA、CNBC、NBC News、DOJ、LLM Stats、DEV Community、WBN、Crescendo AI、新浪、Al Jazeera 等
生成时间 2026-03-21 08:00