你的日报

|

2026年3月21日 · 周六

15 条资讯
生成于 08:00 综合关注

今日资讯按相关度排序 · 共 15 条

NVIDIA GTC 2026:Vera Rubin 平台发布,AI 芯片需求达万亿美元

3天前

CNBC / NVIDIA Blog

发生了什么:Jensen Huang 在 GTC 2026 发布 Vera Rubin 全栈平台(7 款芯片、5 套机架系统),性能是 Grace Blackwell 的 10 倍/瓦特。同时发布 Groq 3 LPU(收购 Groq 后首款产品)。预计 AI 芯片需求 2027 年达 1 万亿美元。

为什么重要:AI 硬件从"卖 GPU"进入"卖 AI 工厂"时代,AWS 将部署超百万块 NVIDIA GPU,Azure 首家上线 Vera Rubin NVL72。

与你相关:推理成本将随新硬件代际下降,本地部署和云端推理的性价比格局即将改变。
#AI基础设施#NVIDIA#芯片
原文

白宫发布国家 AI 立法框架,试图统一联邦监管

1天前

NBC News

发生了什么:白宫发布六大方向 AI 立法框架,涵盖儿童安全保护、数据中心能源规范、开发者法律责任限制等,呼吁国会建立统一联邦标准,限制各州自行立法。

为什么重要:美国首个系统性联邦级 AI 立法提案,将直接影响 AI 产品的合规设计和上市策略。超过 50 名共和党议员对限制州立法权表示担忧。

与你相关:关注对模型透明度和数据使用的具体要求,可能影响 AI 产品架构设计。
#AI政策#监管
原文

DeepSeek-V3.2 发布,推理能力追平 Gemini-3.0-Pro

本周

LLM Stats / DEV Community

发生了什么:DeepSeek-V3.2 发布,专注推理和 Agent 场景。其 Speciale 变体在 AIME 和 HMMT 2025 基准上超越 GPT-5,达到 Gemini-3.0-Pro 级别。

为什么重要:开源模型在推理能力上首次与闭源前沿模型并驾齐驱,对 AI 技术选型有重大影响。

与你相关:如果你在做 Agent 或推理密集型应用,DeepSeek-V3.2 是一个值得评测的开源替代方案。
#开源#大模型#DeepSeek
原文

OpenAI 发布 GPT-5.4 Thinking,引入规划和中断机制

本月

AI Agent 社区

发生了什么:OpenAI 发布推理模型 GPT-5.4 Thinking,引入执行前"Planning"和执行中"Interrupting"机制,1M token 上下文窗口,原生 Computer Use 能力。

为什么重要:Planning + Interrupting 改变了人机协作模式,Agent 可以先规划再执行,执行中可被人类中断修正。

与你相关:新的 Planning/Interrupting 范式值得关注,可能成为 Agent 开发的标准交互模式。
#大模型#OpenAI#Agent
原文

Kimi K2.5 发布:万亿参数 + Agent Swarm 百 Agent 并行

本月

新浪 / AI Agent 社区

Kimi K2.5 拥有万亿参数,核心特性是 Agent Swarm——能自主拆解任务并并行调度最多 100 个子 Agent。MIT 许可证开源,在多项编码和推理基准上接近闭源前沿模型。
与你相关:Agent Swarm 的多 Agent 并行调度是一个值得深入研究的架构模式。
#Agent#开源#国产AI
原文

Qwen3.5 发布四款多模态小模型,覆盖边缘到云端

本周

LLM Stats

阿里云发布 Qwen3.5 系列四款开源小模型(0.8B/2B/4B/9B),支持文本、图像和视频处理,可在边缘设备运行。9B 版本在 MMLU-Pro 上达到 82.5 分。
与你相关:端侧多模态模型意味着更多场景可以离线运行 AI,值得评估本地部署方案。
#开源#多模态#Qwen
原文

AI 生成代码 14.3% 含安全漏洞,FTC 要求企业承担全部责任

本月

WBN Digital

斯坦福和 MIT 联合研究分析 200 万+ AI 生成代码片段,发现 14.3% 含安全漏洞(人类代码 9.1%)。FTC 发布指引:无论代码由人类还是 AI 生成,企业承担全部安全质量责任。
与你相关:使用 AI 编程工具时需要更严格的代码审查流程,关注自动安全扫描工具的集成。
#AI编程#安全
原文

AMI Labs 完成 10.3 亿美元种子轮,"世界模型"挑战 LLM

3天前

Crescendo AI News

Yann LeCun 创办的 AMI Labs 完成欧洲最大种子轮融资,估值 35 亿美元,获 Nvidia 和 Bezos Expeditions 支持,致力于开发面向机器人和制造业的"世界模型"。
与你相关:"世界模型"是 LLM 之外的另一条技术路线,可能在 2-3 年内开辟新的 AI 应用范式。
#前沿研究#融资
原文

Google Gemini Embedding 2:首个跨模态统一向量模型

本周

LLM Stats

Google 发布 Gemini Embedding 2,首个将文本、图像、视频、音频和 PDF 编码到同一向量空间的模型,支持 8192 token 文本、6 张图片、120 秒视频、原生音频处理。
与你相关:统一向量空间大幅简化多模态 RAG 架构,不再需要为不同模态维护独立的 Embedding 管线。
#RAG#多模态#Google
原文

OpenAI 收购 Python 工具商 Astral,强化 AI 编程布局

本月

WBN Digital

OpenAI 将收购 Python 工具开发商 Astral,加强在 AI 辅助软件开发领域的布局。Astral 开发的工具链被广泛用于 Python 生态的代码质量和开发效率提升。
与你相关:OpenAI 进入开发工具链,可能推出更深度集成模型能力的 Python 工具。
#AI编程#OpenAI
原文

三人因走私 AI 芯片至中国在美被起诉,涉案 25 亿美元

1天前

美国司法部 / Al Jazeera

三名与 Super Micro Computer 相关人员被起诉,涉嫌走私价值超 25 亿美元的 AI 芯片至中国。同时美国对华芯片出口管制政策出现微妙调整,NVIDIA H200 获批向中国销售。
与你相关:芯片管制政策的松紧直接影响 AI 算力成本和技术方案选择。
#AI芯片#出口管制
原文

Meta 发布四款自研 AI 芯片,Atlassian 裁 1600 人转向 AI

3天前

Crescendo AI News

Meta 公布自研芯片路线图(MTIA 300-500),计划 2027 年部署。Atlassian 裁减 10% 员工转向 AI,替换 CTO 为两位 AI 负责人。Samsung 计划 2026 年投资 730 亿美元强化半导体。
与你相关:科技巨头全面 AI 转型,Jira/Confluence 可能迎来 AI 能力大升级。
#AI基础设施#行业动态
原文

Google 个人智能全面开放,Gemini 整合 Gmail/Photos/YouTube

本周

Crescendo AI News

Google 向全美免费用户开放 Personal Intelligence 功能,Gemini 可调用 Gmail、Photos、YouTube 等数据提供上下文感知响应。此前仅付费用户可用。
与你相关:AI 从独立工具走向平台级集成,个人数据+AI 的结合模式值得产品层面思考。
#AI应用#Google
原文

拓展Shopify 押注 Agent 驱动电商,AI 代替用户挑选购买商品

本周

Crescendo AI News

Shopify 大力投入 Agent 驱动电商,AI 系统作为"个人购物助手"代替用户发现、比较和购买商品,通过学习用户偏好提供深度个性化推荐。
#AI应用#电商
原文

拓展Ford 推出 AI 车队管理助手,日处理 10 亿数据点

3天前

Crescendo AI News

Ford 推出 "Ford Pro AI" 商用车 AI 助手,每日分析超 10 亿数据点,免费提供给 84 万订阅用户,目标减少车队管理人员每周 23 小时的行政工作。
#AI应用#汽车
原文
数据来源:NVIDIA、CNBC、NBC News、DOJ、LLM Stats、DEV Community、WBN、Crescendo AI、新浪、Al Jazeera 等
生成时间 2026-03-21 08:00