AI 中文资讯日报

发表于 2026-05-13 分类于 AI自动生成， AI中文日报

AI中文资讯日报 - 覆盖2026年05月12-13日，共31条行业与技术动态

覆盖时间：2026年05月12日 09:00 — 2026年05月13日 09:00（北京时间）
共 31 条资讯

⚠️ 以下来源抓取失败：

筛选统计：筛选掉 4 篇不相关文章

🏭 行业动态（16 条）

光轮智能与谷歌、英伟达共同定义物理AI仿真标准

📡 来源：机器之心
光轮智能与谷歌、英伟达合作，共同定义物理AI仿真标准。
要点：- 光轮智能与谷歌、英伟达联合推动物理AI仿真领域的标准化。

刚刚，ThinkingMachines出手！首款交互模型来了，翁荔出镜实测

📡 来源：机器之心
ThinkingMachines发布首款交互模型，并邀请AI安全专家翁荔进行实测。
要点：1. ThinkingMachines公司发布了其首款交互模型。2. 该模型由知名AI安全专家翁荔进行实际测试。

绝杀！OpenAI正式接管人类耳朵，首个GPT-5级推理音频模型来了

📡 来源：新智元
OpenAI发布了首个具备GPT-5级推理能力的音频模型，标志着AI在音频处理领域的重大突破。
要点：1. 该模型被描述为“GPT-5级”，暗示其推理能力接近或达到GPT-5水平，专注于音频理解和生成。

算力账单暴涨！你给OpenAl花的钱，全成了三星SK海力士的年终奖

📡 来源：新智元
文章指出AI算力需求激增导致芯片成本暴涨，三星和SK海力士等存储芯片厂商成为主要受益者。
要点：- AI大模型训练和推理对高性能存储（如HBM）需求旺盛，推动存储芯片价格和厂商营收飙升。

北大校友Lilian Weng 出镜，爆出120亿估值首个交互模型！

📡 来源：新智元
北大校友Lilian Weng出镜，介绍估值120亿的首个交互模型。
要点：- 文章提及北大校友Lilian Weng（翁丽莲）出镜，介绍一款估值达120亿的AI交互模型。

原来Ilya还有70亿美元OpenAl股权

📡 来源：量子位
报道指出OpenAI前首席科学家Ilya Sutskever仍持有约70亿美元的OpenAI股权。
要点：1. Ilya Sutskever作为OpenAI联合创始人，持有大量公司股权，估值约70亿美元。

AI第一金主黄仁勋：日均花掉20亿

📡 来源：量子位
英伟达CEO黄仁勋在AI领域的日均投资高达20亿元人民币，凸显其作为AI行业最大“金主”的地位。
要点：1. 英伟达在AI基础设施（如GPU、数据中心）上的巨额投入持续增长，日均投入约20亿元。2. 黄仁勋的战略性投资旨在巩固英伟达在AI芯片和算力市场的绝对领先地位。3. 该投入反映了AI行业对算力需求的爆发式增长，以及头部企业之间的资本竞争加剧。

爱思唯尔把Meta告了：拿Sci-Hub盗版论文训练大模型

📡 来源：量子位
爱思唯尔起诉Meta，指控其使用Sci-Hub上的盗版学术论文训练大模型。
要点：- 爱思唯尔是全球知名学术出版集团，指控Meta未经授权使用其版权论文。

AGl-Eval社区招聘「Al+游戏」Agent工程师(可远程兼职）

📡 来源：PaperWeekly
AGI-Eval社区招聘“AI+游戏”Agent工程师，支持远程兼职。
要点：- 招聘岗位聚焦于AI Agent在游戏领域的应用开发。

谷歌在安卓上全面强化 Gemini AI；宇树发布全球首款载人机甲，售价 390 万元；追觅高管回应「崩老头」

📡 来源：极客公园
谷歌在安卓系统全面强化Gemini AI，并推出生成式桌面组件等新功能。
要点：- 谷歌推出“Gemini Intelligence”概念，整合AI新功能，包括“Create My Widget”生成式桌面组件，用户可通过自然语言描述自动创建个性化组件，并同步至Wear OS。

谷歌开了一场「读作 Android，写作 Gemini」的硬件发布会

📡 来源：极客公园
谷歌在2026年Android Show上宣布将Gemini作为核心，通过推出Gemini Intelligence品牌和Googlebooks新硬件品类，推动AI与高端硬件的深度绑定，但面临中国厂商自研AI战略的挑战。
要点：1. Gemini Intelligence成为Google AI能力的伞形品牌，仅限高端Android设备（如最新Pixel和三星Galaxy）使用，模仿苹果Apple Intelligence的硬件特权路线。

在中国市场搞「付费订阅」，豆包咋想的？

📡 来源：极客公园
字节跳动旗下AI产品豆包推出付费订阅服务，三档定价68-500元/月，探索国内C端AI商业化路径。
要点：1. 豆包在保留免费版基础上推出付费订阅，标准版68元/月、加强版200元/月、专业版500元/月，聚焦PPT生成、数据分析等复杂生产力场景。

对话维他动力余轶南：融资 5 亿，如何跨过从 Demo 到量产的 5 个月

📡 来源：极客公园
维他动力完成近5亿元Pre-A轮融资，并实现消费级四足机器狗从Demo到量产的关键跨越。
要点：1. 维他动力（Vbot）完成近5亿元Pre-A轮融资，为国内消费级具身智能赛道最大单笔融资，资金用于量产、销售网络建设及人形机器人研发。2. 首款超能机器狗已量产下线，5个月解决上千个软硬件bug，关键结构件强度达汽车5倍，6月产能将提升至2500台/月。3. 用户数据亮眼：核心用户日均交互超80次，日活稳定在2小时以上，主要用户为有6-12岁孩子的家庭，且B端巡检等二次开发需求成为意外增长点。

传可灵计划独立融资上市：300 亿美元的快手长出 200 亿美元的 AI 视频子公司

📡 来源：极客公园
快手计划分拆AI视频业务可灵独立融资上市，估值200亿美元，远超母公司核心业务估值，引发市场对AI资产价值重估的关注。
要点：1. 快手计划于2027年Q1将可灵（Kling）AI视频业务分拆上市，目前正进行上市前融资，估值高达200亿美元，而快手母公司整体市值不到300亿美元。

OpenAI 前 CTO，拿出了一个「最人性」的 AI

📡 来源：极客公园
OpenAI 前 CTO Mira Murati 创立的 Thinking Machines Lab 发布“交互模型”，实现 AI 实时双向对话与协作，颠覆传统回合制交互模式。
要点：1. Thinking Machines 推出“时间对齐的微回合”技术，将时间切分为 200 毫秒单位，使 AI 能够实时感知、打断并同步处理音频、视频和文本，实现类人对话体验。

0.2 元 / 通，淘天用 AI 店小蜜重新定义了电商客服价格

📡 来源：极客公园
淘天发布AI店小蜜高阶版，以0.2-0.5元/通的极低定价重新定义电商客服，并推动客服从成本中心向客户运营中心转型。
要点：1. AI店小蜜高阶版基于千问大模型和Agent框架，具备用户画像识别、工具调用（21个接口）、主动跟单和售后挽单能力，灰度测试中转化率提升10%以上，售后挽单成功率从个位数提升至15%-20%。

🔬 技术前沿（9 条）

Auto Research最后一块拼图，Frontier-Eng Bench登场，在工程闭环里死磕最优

📡 来源：机器之心
文章介绍了Frontier-Eng Bench作为Auto Research领域工程闭环中的关键基准测试工具，旨在推动AI在工程任务上的优化与评估。
要点：1. Frontier-Eng Bench被定位为Auto Research的“最后一块拼图”，专注于工程闭环中的最优方案探索。2. 该基准测试可能用于评估AI系统在复杂工程任务中的自动化研究与优化能力。3. 文章强调在工程闭环中“死磕最优”，体现对AI工程化落地效率与精度的追求。

一个框架，重塑具身研发流程：Dexbotic走向具身PyTorch

📡 来源：机器之心
Dexbotic 推出一个类似 PyTorch 的框架，旨在重塑具身智能（Embodied AI）的研发流程。
要点：- 该框架旨在标准化和简化具身智能系统的开发流程，类似 PyTorch 对深度学习领域的简化作用。

ICLR 2026Oral|大模型总爱「想太多」？DECS从源头消除冗余思考，…..

📡 来源：机器之心
ICLR 2026 Oral论文提出DECS方法，从源头消除大模型中的冗余思考，提升推理效率。
要点：- DECS方法旨在解决大语言模型在推理过程中产生过多无关或冗余思考的问题。

TTS也要真人感！首个字级内容、毫秒级停顿控制的语音合成系统

📡 来源：新智元
首个实现字级内容与毫秒级停顿控制的语音合成系统发布，旨在提升TTS的真人感。
要点：- 该系统实现了字级粒度的内容控制，能够精确调节每个字的发音细节。

谷歌全新GeminiOmni首曝，视频版「香蕉」来了！教授黑板推公式全对

📡 来源：新智元
谷歌发布全新GeminiOmni多模态模型，支持视频理解与黑板公式推理，性能显著提升。
要点：1. GeminiOmni是谷歌最新多模态AI模型，具备视频理解能力，可实时分析视频内容。2. 该模型在复杂场景中表现突出，例如能准确识别教授在黑板上推演的数学公式。3. 被称为“视频版‘香蕉’”，暗示其可能继承或超越此前Gemini的多模态交互能力。

上海AI Lab新研究：SFT能泛化，只要满足这三个条件

📡 来源：量子位
上海AI Lab提出SFT（监督微调）能够实现泛化的三个必要条件。
要点：1. 研究揭示了SFT泛化的关键条件，包括数据多样性、模型容量和训练策略。

无惧Off-Policy偏移！Bengio团队解绑后训练，大模型RL提速50倍

📡 来源：PaperWeekly
Bengio团队提出解绑后训练方法，大幅提升大模型强化学习效率，速度提升50倍。
要点：- 该方法通过解绑后训练，有效克服了Off-Policy偏移问题，使得大模型在强化学习中能更稳定地利用历史数据。

AAAI2026I北航团队提出ICAD-LLM，异常检测迎来“通用模型”时刻

📡 来源：PaperWeekly
北航团队提出ICAD-LLM，利用大语言模型实现通用异常检测，标志该领域迈向通用模型阶段。
要点：- 该研究被AAAI 2026接收，提出一种基于大语言模型的通用异常检测框架ICAD-LLM。

浙大联合上海AILab发布：首个AI原生科学知识图谱上线

📡 来源：PaperWeekly
浙大与上海AI实验室联合发布首个AI原生科学知识图谱。
要点：- 该知识图谱为AI原生架构，旨在提升科学知识的组织与检索效率。

🎓 学术研究（1 条）

Codex跑了22小时，真赚16.88美元：奥特曼预言的「AI打工人」来了

📡 来源：新智元
OpenAI的Codex模型在无人干预下连续运行22小时，成功完成自由职业平台任务并赚取16.88美元，验证了AI作为“数字打工人”的可行性。
要点：- Codex在22小时内自主完成自由职业任务，赚取16.88美元。

📌 📌 其他资讯（2 条）

宇树造了款民用高达！390万元起

📡 来源：机器之心
SKIP

Markdown要凉…卡帕西也站HTML了

📡 来源：量子位
SKIP

📌 产品与工具（2 条）

告别云端依赖！字节开源新作DreamLite让手机秒变A画板

📡 来源：机器之心
字节跳动开源DreamLite，实现手机端AI绘画功能，摆脱云端依赖。
要点：- DreamLite是字节跳动开源的移动端AI绘画模型，支持在手机上本地运行。

ClaudeCode终于长出调度台：一个屏幕盯住所有AI会话，无需多开

📡 来源：新智元
ClaudeCode推出调度台功能，用户可在单一界面监控和管理所有AI会话，无需多开窗口。
要点：- 新功能允许用户在一个屏幕上同时查看和切换多个ClaudeCode AI会话

📌 政策与安全（1 条）

国家队出手！AI智能体要发「身份证」，首个互联国标将落地

📡 来源：新智元
中国国家队将推出AI智能体“身份证”制度，首个互联互通国家标准即将落地。
要点：1. 国家层面将出台针对AI智能体的身份认证标准，为每个智能体发放唯一“身份证”。

本文由 AI 日报系统自动生成 · 2026年05月13日