AI 中文资讯日报 - 2026年05月25日 09:00 至 2026年05月26日 09:00

覆盖时间:2026年05月25日 09:00 — 2026年05月26日 09:00(北京时间) | 共 76 条资讯

来源分布:稀土掘金 人工智能频道(13 条) · 夕小瑶科技说(1 条) · Datawhale(1 条) · RadarAI(45 条) · 我爱计算机视觉(1 条) · 腾讯技术工程(1 条) · 机器之心(2 条) · 新智元(3 条) · 量子位(3 条) · PaperWeekly(2 条) · InfoQ 中文(4 条)

以下来源抓取失败:

  • 筛选统计:筛选掉 24 篇不相关文章

📡 稀土掘金 人工智能频道(13 条)

09aaa-LayerNorm是什么?

介绍层归一化(LayerNorm)的原理、计算步骤及其与批归一化的区别。

📡 来源:稀土掘金 人工智能频道 | ✍️ 郑恩赐 · 2026-05-25 22:34

要点

  • LayerNorm 的数学定义和计算步骤(对每个样本的特征维度归一化)

Agent系列(四):工具调用深度解析——Agent 的手和眼

深度解析AI Agent中工具调用的核心机制,包括工具设计、参数校验、并行调用、安全防护及错误分类对重试的影响。

📡 来源:稀土掘金 人工智能频道 | ✍️ 冬奇Lab · 2026-05-25 21:38

要点

  • 工具设计三要素:接口定义、参数验证与安全控制。

Transformer 原论文怎么训出来的:8 张 P100、12 小时、warmup 4000 步

复现2017年Transformer原始论文的训练配方,包括8张P100、12小时训练、warmup 4000步等关键配置。

📡 来源:稀土掘金 人工智能频道 | ✍️ ltl · 2026-05-25 21:07

要点

  • 使用8张P100 GPU,训练12小时完成原论文实验

Transformer 中的前馈网络:那个看似平平无奇的两层 MLP,其实是「记忆」所在

探讨 Transformer 中常被忽视的前馈网络(两层 MLP)实际上承担着模型知识存储与记忆检索的核心角色。

📡 来源:稀土掘金 人工智能频道 | ✍️ ltl · 2026-05-25 21:05

要点

  • Transformer 的 Feed-Forward Network(FFN)不仅仅是简单的非线性变换,而是模型长期记忆的主要载体。

【Agentic RL / 强化学习 / OPD】OpenClaw-RL 源码阅读笔记 — (1)—基础

OpenClaw-RL 强化学习源码阅读笔记的第一部分,聚焦基础概念与代码框架。

📡 来源:稀土掘金 人工智能频道 | ✍️ 罗西的思考 · 2026-05-25 20:58

要点

  • 文章是针对 OpenClaw-RL(一个基于强化学习的可抓取机器人控制项目)的源码解读系列的开篇。

09aa-偏置是什么?

解释神经网络中偏置(bias)的数学定义、几何意义及其必要性,并通过PyTorch代码示例对比有无偏置的区别。

📡 来源:稀土掘金 人工智能频道 | ✍️ 郑恩赐 · 2026-05-25 20:48

要点

  • 偏置(bias)在数学上表示为 y=wx+b 中的常数项 b,相当于决策边界的 y 轴截距。

RAG 实战:从一篇掘金文章出发,拆解检索增强生成的全链路

从实际场景出发,拆解检索增强生成(RAG)技术的完整链路,解决大模型知识不足问题。

📡 来源:稀土掘金 人工智能频道 | ✍️ Lee川 · 2026-05-25 19:46

要点

  • 大模型在总结长文章时可能出现知识盲区或错误回答,RAG 通过外部检索弥补这一缺陷。

Milvus 实战:当 RAG 遇上向量数据库,从”玩具 Demo”到”生产可用的”那一步

介绍 RAG 项目中如何将向量存储从原型阶段的 MemoryVectorStore 迁移至生产可用的 Milvus 向量数据库。

📡 来源:稀土掘金 人工智能频道 | ✍️ Lee川 · 2026-05-26 00:08

要点

  • 聚焦 RAG 流程中的“向量存储”环节,对比原型与生产环境的差异。

99%的人都不知道Codex 的 goal 神技!完整设置及提示词模板教学

介绍 Codex 桌面版新增的 /goal 模式,可让 AI 自主持续工作数天。

📡 来源:稀土掘金 人工智能频道 | ✍️ 路导 · 2026-05-25 22:38

要点

  • /goal 模式支持 AI 长期自主执行任务,无需频繁人工干预。

一天一个开源项目(第111篇):Understand Anything - 把代码库变成可探索知识图谱的 AI 引擎

基于 Tree-sitter 静态解析和 LLM 语义理解,将代码库、知识库和文档转换为交互式知识图谱的 Claude Code 插件。

📡 来源:稀土掘金 人工智能频道 | ✍️ 冬奇Lab · 2026-05-25 21:35

要点

  • 把代码库、知识库和文档转换为可交互探索的知识图谱
  • 采用 Tree-sitter 静态解析 + LLM 语义理解的混合架构
  • 作为 Claude Code 插件运行,帮助开发者理解代码结构和语义关系。

Vibe Coding 全栈实战:章鱼哥解题 01|搭好产品底座与登录链路

作者分享使用AI辅助编程(Vibe Coding)进行全栈开发的实战系列,本期聚焦产品基础架构与登录功能搭建。

📡 来源:稀土掘金 人工智能频道 | ✍️ 小小小小小鹿 · 2026-05-25 20:23

要点

  • 作者日常用AI写代码,日均消耗4-5亿token,体现了AI辅助开发的深度应用。

讲讲如何在传统产品中挖掘AI需求

探讨如何在传统产品中发现并落地AI需求,强调应用层才是AI时代真正的风口。

📡 来源:稀土掘金 人工智能频道 | ✍️ 华洛 · 2026-05-25 21:18

要点

  • AI应用层的核心能力在于将模糊的用户需求转化为可落地的产品功能,而非模型参数本身的优化。

AI Coding开始进入第四个时代,我还没上车呢!

文章探讨AI编程(AI Coding)发展进入第四阶段,并引发作者对自身尚未跟上的感慨。

📡 来源:稀土掘金 人工智能频道 | ✍️ why技术 · 2026-05-25 20:59

要点

  • AI Coding被划分为四个时代,目前进入第四阶段。

📡 夕小瑶科技说(1 条)

Gemini也叛变了,付费用户变小丑

谷歌 Gemini 及 Antigravity 将限额从按条数改为算力消耗制,引发付费用户强烈抗议,同时 OpenAI 和 Anthropic 也采取类似措施,标志 AI 订阅模式蜜月期结束。

📡 来源:夕小瑶科技说 · 2026-05-25 17:48

要点

  • 谷歌 Gemini 和 Antigravity 引入基于算力消耗的动态限额(5 小时滚动窗口 + 周上限),且不公开具体消耗数值,导致付费用户可用量大幅缩水,用户普遍感觉服务降级。

📡 Datawhale(1 条)

关于Agent Harness,我整理了一个最小版!

介绍了一个最小化的Agent评测框架(Harness)的构成与实现思路。

📡 来源:Datawhale · 2026-05-25 23:11

要点

  • 最小Harness包含5个模块:Task(任务)、Environment(环境)、Tools(工具接口)、Trace(执行记录)、Grader(评分器)。

📡 RadarAI(45 条)

DeepSeek 要用蜜雪冰城的打法,做中国版 Claude Code

DeepSeek 采取蜜雪冰城式低价策略,永久降价 V4-Pro 模型 API,并计划打造中国版 Claude Code 的 AI 编程 Agent 工具。

📡 来源:RadarAI | ✍️ 莫崇宇 · 2026-05-26 01:33

要点

  • V4-Pro 模型 API 实行永久降价,降低开发者使用门槛;

Claude Design 团队方法论:从 Prompt 到生产的全链路实践

Anthropic Claude Design 团队公开其利用 Claude 自身、通过高频用户对话和极速迭代,实现从自然语言 Prompt 到品牌一致设计再到生产代码的全链路实践经验。

📡 来源:RadarAI | ✍️ meng shao · 2026-05-25 22:25

要点

  • 团队遵循四项核心原则:每日用户对话、每 1-2 天发布、24 小时内修复问题、以实验替代长期预测
  • 自建内部工具,借助 Claude 自身能力打通从 Prompt 到设计再到代码的流程
  • 强调快速反馈循环和极速迭代,避免过度规划,以实际实验驱动决策。

一年赚一万亿人民币!他,赌出亚洲最疯狂的科技公司

SK海力士凭借对HBM技术的长期押注,在AI时代实现市值90倍增长,年利润超万亿人民币,成为AI硬件基础设施的关键玩家。

📡 来源:RadarAI | ✍️ 笔记侠 · 2026-05-25 21:24

要点

  • SK集团会长崔泰源在2012年行业低谷时逆势收购濒临破产的海力士,坚信“信息会成为下一个石油”
  • 长期押注HBM(高带宽内存)技术,该技术成为AI芯片(如GPU)的核心配套,直接受益于AI算力需求爆发
  • 公司市值从2011年的约10万亿韩元飙升至2026年逼近万亿美元,年利润突破万亿人民币,创下韩国科技公司历史纪录。

被 AI 折叠的硅谷:1 万个亿万富翁的诞生,与每天消失的 1000 个饭碗

硅谷AI新贵暴富与普通从业者大规模失业的极端分化现象

📡 来源:RadarAI | ✍️ 乌鸦智能说 · 2026-05-25 19:00

要点

  • OpenAI、Anthropic、Nvidia等AI公司创始人和早期员工通过股权套现与估值暴涨在短短四年间批量成为亿万富翁。

蚂蚁集团领投,光轮智能 20 亿美元估值引领全球具身数据基础设施|甲子光年

光轮智能以超20亿美元估值完成融资,蚂蚁集团领投,标志具身智能产业重心转向数据与评测基础设施。

📡 来源:RadarAI | ✍️ 甲子光年 · 2026-05-25 18:35

要点

  • 光轮智能新一轮融资估值超20亿美元,蚂蚁集团领投。

具身智能的重复造轮子,终于有人开始认真解了

本文分析了具身智能行业因数据质量、效率和成本瓶颈而重复造轮子的困境,并介绍了灵御智能通过自研硬件和云端大脑架构,以低成本提供高质量真机数据的解决方案。

📡 来源:RadarAI | ✍️ 阑夕 · 2026-05-25 18:30

要点

  • 当前具身智能行业面临结构化数据困境:训练数据质量低、采集效率差、成本高昂,导致各公司重复造轮子。

年轻人不买精修图,景区旅拍开始慌了

AI修图工具普及打破景区旅拍行业的信息差,导致消费者不再购买高价精修服务,迫使旅拍店重新定位商业模式。

📡 来源:RadarAI | ✍️ 凤凰网 · 2026-05-25 18:02

要点

  • AI修图工具(如ChatGPT image 2.0、豆包、醒图)大幅降低了后期精修的门槛,消费者可自行完成高质量修图。

Gemini 也叛变了,付费用户变小丑

谷歌悄然将 Gemini 计费模式从按条数改为按算力消耗,并引入双重限额,导致付费用户实际可用额度大幅缩水,引发大规模不满。

📡 来源:RadarAI | ✍️ 夕小瑶科技说 · 2026-05-25 17:48

要点

  • 计费从按消息条数改为基于算力消耗的动态计费,用户无法预知单次对话成本。

关于 AI 就业,1 亿条招聘数据背后的 5 个发现

基于1亿条招聘数据分析,AI岗位渗透率不足2%但薪资溢价超40%,岗位正从造工具转向用工具,中美就业市场呈现不同分化路径。

📡 来源:RadarAI | ✍️ 腾讯研究院 · 2026-05-25 17:00

要点

  • AI岗位渗透率约1.6%-1.9%,整体占比低但增速显著。

无人车遇水则瘫?Waymo 大规模召回,叫停多城 Robotaxi 服务

Waymo因自动驾驶车辆在暴雨中遇积水瘫痪、多次事故而大规模召回并暂停多城服务。

📡 来源:RadarAI | ✍️ 杰西卡 · 2026-05-25 16:48

要点

  • Waymo因积水软件缺陷召回3791辆车,暂停亚特兰大、奥斯汀等城市Robotaxi服务
  • 事故暴露其规则驱动系统在极端天气下的局限性
  • 文章与特斯拉FSD的端到端学习路线进行对比,暗示技术路线差异。

微软将弃用 Claude:太贵了还是薅明白了?

微软因成本与战略双重考量叫停内部工程师使用 Claude Code,背后反映其在 AI 模型、开发工具和生态控制权上的边缘化危机。

📡 来源:RadarAI | ✍️ InfoQ 中文 · 2026-05-25 16:37

要点

  • 直接原因是 Claude Code 按 Token 计费成本高昂,每位工程师月均花费 500-2000 美元。

2026-05-25 Hacker News Top Stories #

汇总Hacker News十大热门话题,其中AI编程工具作为重要议题之一,反映了科技社区对AI开发工具的高度关注。

📡 来源:RadarAI | ✍️ HackerNews · 2026-05-25 15:32

要点

  • 热门话题包括AI编程工具(如Cline等AI代写代码工具)的讨论

ChatGPT Images 2.0 定价策略分析:图像成为 Agent 经济原语

OpenAI 将图像输出按 tokens 定价,标志着图像从消费品升级为 Agent 经济中的可编程原语。

📡 来源:RadarAI | ✍️ AI Will · 2026-05-25 15:02

要点

  • 图像输出定价为 $30/M tokens,与文字并列在同一价目表上。

Ronak Malde 故事总结与原文链接

总结 Ronak Malde 从 Codeium 到 DeepMind 再到离职的两年职业经历,并附其本人发布的原始推文链接。

📡 来源:RadarAI | ✍️ AI Will · 2026-05-25 14:25

要点

  • 提供 Ronak Malde 个人视角的完整叙述链接。

Ronak Malde 放弃 Google DeepMind 收购股权离开

Ronak Malde 放弃 Google DeepMind 收购股权主动离开,他曾是 Codeium 核心成员,主导开发了 AI 编程 IDE Windsurf 和前沿编程模型 SWE-1。

📡 来源:RadarAI | ✍️ AI Will · 2026-05-25 14:19

要点

  • Ronak Malde 在 Codeium 期间主导开发了 AI 编程 IDE Windsurf 并训练了前沿编程模型 SWE-1
  • Codeium 被 Google DeepMind 收购,但他选择放弃收购股权主动离开
  • 此事件反映了 AI 领域核心人才在收购后的个人职业选择。

将 600 亿参数大模型装进手机的瓶颈,终于被中国 AI 公司突破了

面壁智能联合清华、OpenBMB发布基于1.58-bit三值量化的BitCPM-CANN大模型,在华为昇腾上实现端到端训练,大幅降低显存占用并保留97%模型能力,为端侧部署大模型铺平道路。

📡 来源:RadarAI | ✍️ Selina · 2026-05-25 20:04

要点

  • 采用1.58-bit三值量化技术,将模型权重从传统高精度压缩至极低比特,显存节省约6倍。

AI Infra 入门干货总结:大模型是如何高效推理的

本文基于对 vLLM 源码的深入阅读,以 Llama 3 为例,通过追踪推理过程中每一步的张量维度变化,系统讲解了大模型从 Tokenize 到 Sampling 的完整高效推理流程。

📡 来源:RadarAI | ✍️ 腾讯技术工程 · 2026-05-25 17:36

要点

  • 详细拆解了 Decoder-Only 架构 LLM 在推理阶段(Tokenize、Embedding、Attention、FFN、Sampling)的张量流动与计算逻辑。

TogetherAI 开源 OSCAR:超越 TurboQuant! 面向真实 Serving 的 2-bit KV Cache 量化

Together AI 开源 OSCAR,一种面向长上下文服务的 2-bit KV Cache 量化方案,通过注意力感知旋转技术实现显存降低与吞吐提升,同时保持模型性能。

📡 来源:RadarAI | ✍️ 魔搭ModelScope社区 · 2026-05-25 17:14

要点

  • 采用 2-bit 量化大幅压缩 KV Cache 显存占用,提升推理吞吐量。

中国首次提出半导体演进新原则:华为“韬定律”5 年内冲刺等效 1.4nm 制程,麒麟、昇腾将先后落地量产

华为提出“韬(τ)定律”,以时间缩微替代几何缩微,目标2031年实现等效1.4nm制程,麒麟9040、昇腾芯片将先后量产。

📡 来源:RadarAI | ✍️ AI前线 · 2026-05-25 14:53

要点

  • 核心创新是以“时间(τ)缩微”替代传统“几何缩微”,通过逻辑折叠等技术在制程不变的前提下提升芯片性能。

性能超越李飞飞,他们把 10 亿高斯点的 3D 世界装进浏览器

群核科技开源了性能超越李飞飞团队 Spark 2.0 的 3D 高斯浏览器 Aholo Viewer,支持浏览器流畅运行 10 亿+粒子的超大 3D 场景。

📡 来源:RadarAI | ✍️ 机器之心 · 2026-05-25 14:32

要点

  • 群核科技开源了 3D 高斯浏览器 Aholo Viewer,专注于 3D 场景的实时渲染。

告别多奖励跷跷板:Flow-OPD 将多教师 OPD 带入图像生成

Flow-OPD 首次将在线策略蒸馏(OPD)引入流匹配模型,通过多教师密集监督解决多任务图像生成后训练中的跷跷板效应。

📡 来源:RadarAI | ✍️ 机器之心 · 2026-05-25 14:32

要点

  • 该框架由中科大、UCLA、香港中文大学、小红书等机构联合提出。

蚂蚁灵波 LingBot-VA 论文被机器人顶会 RSS 2026 接收,让机器人边推演、边行动

🔬 技术前沿 蚂蚁灵波与港科大提出因果世界建模框架LingBot-VA,被机器人顶会RSS 2026接收,实现机器人边推演边行动。 - 提出面向机器人控制的因果世界建模框架LingBot-VA,核心是让机器人具备边预测环境变化边行动的能力。 - 相关论文被机器人领域顶级会议RSS 2026接收,标志着该技术在学术界获得认可。 - 该框架为全球首个开源的自监督因果世界模型,有望提升机器人在动态环境中

📡 来源:RadarAI | ✍️ 量子位的朋友们 · 2026-05-25 14:26

要点

  • 提出面向机器人控制的因果世界建模框架LingBot-VA,核心是让机器人具备边预测环境变化边行动的能力。

百度 Agent 岗一面:你知道哪些更复杂的 RAG 范式?

以面试问答形式系统梳理RAG范式的三代演进(Naive/Advanced/Modular)及四种高级范式(Self-RAG、CRAG、GraphRAG、Agentic RAG)的核心机制与适用场景。

📡 来源:RadarAI | ✍️ 小林coding · 2026-05-25 14:12

要点

  • RAG范式从基础检索增强演进到模块化设计,包括Naive RAG、Advanced RAG和Modular RAG三代。

Agent 生态分工:模型公司做 Harness,垂直领域做应用

宝玉认为,自建 Agent Harness 价值不大,模型公司将主导,真正的机会在垂直领域包括 AI Native 工作流、Human In Loop 交互和高质量数据整理。

📡 来源:RadarAI | ✍️ 宝玉 · 2026-05-25 23:14

要点

  • 模型公司(如 OpenAI、Anthropic)会主导 Agent Harness 的构建,第三方难以竞争
  • 垂直领域的真正机会在于重新设计 AI Native 工作流、Human In Loop 交互和高质量数据整理
  • 这是对“垂类 Agent 已结束”观点的回应,强调基于成熟 Harness 的垂直应用仍有大量空间。

AI 会写代码了,为什么你还是做不出产品?

探讨 AI 编程在项目开发中的实际效果与常见误区,强调 AI 放大了对需求、测试和产品化的理解能力而非单纯替代写代码。

📡 来源:RadarAI | ✍️ 科技乱炖 · 2026-05-25 23:00

要点

  • AI 编程能提升效率,但成功关键在于正确理解需求、测试和产品化,而非简单依赖代码生成。

王建硕:Markdown,是新时代的编程语言

王建硕提出LLM是新一代编译器,自然语言是新的“汇编”,程序员应转向用自然语言编写可重复执行的工程,而非直接修改AI生成代码。

📡 来源:RadarAI | ✍️ 徐文浩,任鑫 · 2026-05-25 21:02

要点

  • LLM被视为新一代编译器,自然语言相当于底层汇编,开发者应在自然语言层(如Markdown)进行工程控制。

AI 悖论:自动化越多,人越重要,Dan Shipper 预测未来一年工作方式巨变

Dan Shipper 提出“AI 悖论”:自动化越强,人类工作反而越多,并预测未来工作将分为公司超级 Agent 和 Codex 式 AI 操作系统两条主线。

📡 来源:RadarAI | ✍️ 跨国串门儿计划 · 2026-05-25 17:01

要点

  • “AI 悖论”指出模型能力越强,自动化带来的新任务反而需要更多人类参与。

AI 正引发第一波人类降智

文章警示过度依赖 AI 正在导致人类在阅读、记忆、表达和独立思考等认知能力上的全面退化。

📡 来源:RadarAI | ✍️ 投资界 · 2026-05-25 15:47

要点

  • 用 AI 总结代替深度阅读,导致理解力和耐力下降

“VLA 和世界模型都不是终局,会有物理世界独有的模型” | 蚂蚁灵波沈宇军@AIGC2026

蚂蚁灵波首席科学家沈宇军认为具身智能终局不是VLA或世界模型,而是物理世界独有的模型,数据标准化和人人参与数据生产是关键。

📡 来源:RadarAI | ✍️ 一水 · 2026-05-25 14:56

要点

  • 大模型成功依赖互联网数据红利,机器人行业面临物理世界数据空白这一核心挑战。

Copilot 创始工程师:大多数 AI 编码“就像开着法拉利去买牛奶一样”

GitHub Copilot 创始工程师 Neel Sundaresan 指出当前 AI 编码工具普遍存在模型选择不当、成本失控等问题,呼吁开发者根据任务合理选择模型,避免“杀鸡用牛刀”。

📡 来源:RadarAI | ✍️ AI前线 · 2026-05-25 14:53

要点

  • 许多 AI 编码工具过度使用大模型,导致成本高、效率低,如同“开着法拉利去买牛奶”。

重磅!“AIGC 绘画-人物设计白皮书-第一辑”今日发布!

发布“AIGC 绘画-人物设计白皮书-第一辑”,系统整理发型、发饰、服饰的中英文术语,帮助用户用精准词汇描述人物形象以提升AIGC生成质量。

📡 来源:RadarAI | ✍️ Draco · 2026-05-25 18:38

要点

  • 白皮书聚焦人物设计的三大基础要素:发型、发饰、服饰。

今日开源(2026-5-25):微软 Lens 正式开源,3.8B 参数基础文本转图像模型,密集字幕预训练融合混合分辨率学习

2026年5月25日开源社区发布7个AI相关项目,微软开源3.8B参数文本转图像模型Lens,另有闽南语TTS、国际象棋Transformer等工具。

📡 来源:RadarAI | ✍️ 机器之心SOTA模型 · 2026-05-25 18:35

要点

  • 微软开源3.8B参数Lens文本转图像模型,采用密集字幕预训练与混合分辨率学习。

一人公司的门面不能输,我用 Lovart 当我的品牌部

本文介绍独立开发者如何用AI设计工具Lovart系统化打造个人品牌视觉体系。

📡 来源:RadarAI | ✍️ 花叔 · 2026-05-25 18:03

要点

  • 针对一人公司品牌名称不统一等痛点,利用AI工具降低交易成本。

RenderFlow:百度垂类搜索展现服务的 Agentic 代码交付实践

百度搜索团队开发的RenderFlow系统利用LLM代码生成能力,实现垂类搜索展现的Agentic代码自动交付,大幅缩短交付周期。

📡 来源:RadarAI | ✍️ 百度Geek说 · 2026-05-25 18:00

要点

  • RenderFlow通过可执行引擎和多轮修复机制,实现从需求到代码的自动化生成与验证。

蚂蚁集团联合五所高校推出智能体安全评测平台

蚂蚁集团联合清华、北大等五所高校推出智能体安全评测平台 Agent3σ,从七大风险维度、三级评测体系全面评估 AI Agent 在真实环境中的安全风险。

📡 来源:RadarAI | ✍️ 蚂蚁技术 AntTech · 2026-05-25 17:04

要点

  • 平台由蚂蚁集团与清华大学、北京大学、浙江大学、南京大学、杭州电子科技大学共同推出
  • 构建了七大风险维度和三级评测体系,实现多层次、可复现的安全评测
  • 重点针对 AI Agent 在工具调用、系统操控及真实业务执行中的安全风险。

Helio 产品亮点详细解析

Helio 产品核心亮点包括角色匹配模型、BYOK 以及 AI 自主任务管理功能。

📡 来源:RadarAI | ✍️ Ding · 2026-05-25 17:03

要点

  • 支持为不同 AI 队友角色匹配不同模型

Unitree WVLA 2.0 会议室乱局清理测试

Unitree WVLA 2.0 在真实会议室中展示了多任务自主清理的AI能力

📡 来源:RadarAI | ✍️ Berryxia.AI · 2026-05-25 16:58

要点

  • 机器人在未布置的会议室中面对水瓶、纸张、杂物等实现全程自主决策与多任务清理

Anthropic 推出 MCP 隧道,供私有代理访问内部系统

Anthropic 为 Claude Managed Agents 推出自托管沙箱和 MCP 隧道,助力企业安全运行 AI 代理并访问内部系统。

📡 来源:RadarAI | ✍️ InfoQ 中文 · 2026-05-25 16:37

要点

  • 新增自托管沙箱功能,允许企业在自有基础设施(含 Cloudflare 等)上运行 AI 代理。

万级实时推理的商品领域 Agent 实践思考和总结

淘宝商品中心团队构建了万级实时推理的商品领域Agent架构,实现亿级商品智能化理解与实时推理。

📡 来源:RadarAI | ✍️ 大淘宝技术 · 2026-05-25 16:16

要点

  • 采用事件驱动的Function-Centric设计,通过AIFunction标准化封装实现万级实时推理。

推荐关注小小东,分享其 AI 生图探索与开源插件

推荐小小东在AI生图方面的探索与开源的X文章发布Chrome插件。

📡 来源:RadarAI | ✍️ 向阳乔木 · 2026-05-25 15:59

要点

  • 小小东在AI生图领域进行了深入探索,并发布了具有美感的提示词。

分享 Suno 生成小甜歌的提示词技巧

作者分享了使用 AI 音乐生成工具 Suno 时,通过精心选择风格、人声和情绪提示词来创作小甜歌的技巧。

📡 来源:RadarAI | ✍️ 向阳乔木 · 2026-05-25 15:24

要点

  • 提示词关键词包括风格(Dream Pop、Disco-lite)、人声(Breathy female vocal)和情绪(Softly euphoric)。

ChatGPT Images 2.0 对广告行业的影响:一次输出 8 张一致图

ChatGPT Images 2.0 的 Thinking 模式可一次输出 8 张风格一致图,可能颠覆广告代理公司依赖“变体费”的商业模式。

📡 来源:RadarAI | ✍️ AI Will · 2026-05-25 15:02

要点

  • ChatGPT Images 2.0 的 Thinking 模式能输出角色、风格、场景连贯的多张图像。

ChatGPT Images 2.0 真相:OpenAI 发的不是图像模型

OpenAI 的 ChatGPT Images 2.0 并非独立图像模型,而是将图像作为语言的一部分的战略声明。

📡 来源:RadarAI | ✍️ AI Will · 2026-05-25 15:02

要点

  • 作者引用 Sam Altman 言论和官方博客,指出图像被视为主干语言而非装饰。

“构建你的第一个 AI Agent 团队”指南!5 步快速打造个人 Agent,全自动内容 Agent 团队实例:30 分钟内自动出稿,Agent 团队高效运转的技巧

本文提供构建AI Agent团队的零门槛指南,涵盖单Agent构建、多Agent协作工作流及高效运转技巧。

📡 来源:RadarAI | ✍️ 51CTO技术栈 · 2026-05-25 14:13

要点

  • 详细拆解AI Agent的四个核心要素:角色、指令、工具、记忆。

面壁智能正式开源中国首个基于国产算力平台训练的 1.58-bit 端侧高效大模型 BitCPM-CANN

📦 产品与工具 面壁智能开源中国首个基于华为昇腾国产算力平台训练的1.58-bit端侧大模型BitCPM-CANN。 - 中国首个完全基于华为昇腾国产算力平台训练的三值(1.58-bit)端侧大模型。 - 包含0.5B至8B四个尺寸,推理阶段显存降低约6倍。 - 模型能力保留率达到90%-97.2%,兼顾高效与性能。

📡 来源:RadarAI | ✍️ 51CTO技术栈 · 2026-05-25 14:13

要点

  • 中国首个完全基于华为昇腾国产算力平台训练的三值(1.58-bit)端侧大模型。

📡 我爱计算机视觉(1 条)

视觉分割进入下半场:ConceptSeg-R1 开启“分割任意概念”新范式

ConceptSeg-R1 提出“分割任意概念”新范式,通过元强化学习和概念翻译模块使模型能理解复杂规则并执行像素级概念分割。

📡 来源:我爱计算机视觉 · 2026-05-25 22:16

要点

  • 将视觉分割概念分为三级:上下文无关(CI)、上下文相关(CD)、上下文推理(CR),突破传统“类别分割”局限。

📡 腾讯技术工程(1 条)

AI Infra入门干货总结:大模型是如何高效推理的

深度解读vLLM推理引擎,揭示连续批处理与Paged Attention如何协同实现大模型高效推理。

📡 来源:腾讯技术工程 · 2026-05-25 17:36

要点

  • 连续批处理通过将调度从request level下沉到token level,并利用num_computed_tokens追赶num_tokens的逻辑,实现动态、细粒度的GPU利用率提升。

📡 机器之心(2 条)

告别多奖励跷跷板:Flow-OPD将多教师OPD带入图像生成

首个将在线策略蒸馏(OPD)引入流匹配模型的多任务后训练框架,通过多教师密集监督解决联合优化中的“跷跷板效应”。

📡 来源:机器之心 · 2026-05-25 14:32

要点

  • 提出Flow-OPD框架,利用多教师在线策略蒸馏(OPD)和硬路由机制,使学生在不同任务上实时接受对应专家教师的密集监督,避免梯度冲突。

性能超越李飞飞,他们把10亿高斯点的3D世界装进浏览器

群核科技开源Aholo Viewer,实现浏览器内流畅加载10亿+高斯点的3D场景,性能超越李飞飞团队的Spark 2.0。

📡 来源:机器之心 · 2026-05-25 14:32

要点

  • Aholo Viewer采用Chunk-based LOD Tree技术,在内存占用、加载速度、渲染速度及场景容量上限上全面超越Spark 2.0,最高支持10亿高斯点(Spark 2.0的10倍)。

📡 新智元(3 条)

刚刚,Ilya又发神图「思考者」!AI芯片海洋上在想啥?

Ilya发布神秘画作《思考者》引爆AI圈,同时OpenAI在数学推理突破、Codex升级为“驻场工程师”以及筹备IPO三方面同步释放AGI临近信号。

📡 来源:新智元 · 2026-05-25 12:45

要点

  • Ilya在Instagram上传一幅罗丹《思考者》站在AI芯片Die Shot上的画作,暗示AGI临界点思考。

新智元ALL in ASI英雄帖

新智元发布招聘All in ASI的岗位信息,招募ASI架构师和ASI主笔。

📡 来源:新智元 · 2026-05-25 12:45

要点

  • 新智元招聘两个核心战位:ASI架构师和ASI主笔,年薪均为50-70万,工作地点北京上地。

胜率直逼人类大师!这套Agent揭开中国AI「玄学真相」

Tianfu Agent 通过工具化、多 Agent 协作与置信度量化机制,在传统术数领域将准确率从基线模型的随机水平提升至 50%,逼近人类专家。

📡 来源:新智元 · 2026-05-25 12:45

要点

  • 主流大模型(Claude、GPT)在无泄漏的术数选择题(四选一)上准确率仅 23%–40%,接近随机猜测线 25%
  • Tianfu Agent 设计 200+ 原子工具、四级可见性控制、规则函数封装及三层不确定性量化,实现 50% 截尾准确率,接近人类 Top20 选手的 53.5%
  • 该系统的工具化范式(将规则从 Prompt 迁入函数)与工具管理策略,为规则密集、语料稀缺的垂直领域 Agent 落地提供了工程参考。

📡 量子位(3 条)

图灵奖得主领衔,中国大模型第一梯队集结!2026智源大会,看懂AI下一程

2026智源大会将于6月12-13日在北京举办,集结图灵奖得主、中国大模型第一梯队及全球顶尖学者,聚焦世界模型、智能体、具身智能等AI下一程核心方向。

📡 来源:量子位 · 2026-05-25 12:27

要点

  • 大会设25场论坛,覆盖Agent、世界模型、具身智能、AI安全、AI自进化等前沿议题,首次推出“智能体听会”助手。

量子位编辑作者招聘

量子位发布招聘信息,招募AI产业、财经商业、产品方向的内容编辑/主笔/主编。

📡 来源:量子位 · 2026-05-25 12:27

要点

  • 三大招聘方向:AI产业(芯片/Infra/云计算)、AI财经(创投/财报/产业链)、AI产品(应用/硬件终端)。

DeepSeek V4还能更省!新工具缓存命中率高达99.82%,2折稳定到手

Reasonix 是专为 DeepSeek V4 打造的终端编程工具,通过缓存优化实现高达 99.82% 的命中率,将 API 调用成本降至 2 折。

📡 来源:量子位 · 2026-05-25 12:27

要点

  • 采用缓存优先循环、前缀缓存固定与工具调用修复机制,确保长会话缓存命中率稳定在 90% 以上。

📡 PaperWeekly(2 条)

为什么语音大模型一开口,还是像客服?

南京大学与小米联合提出 SpeechParaling-Bench,系统评测语音大模型在语气、情绪、停顿等副语言维度的“人味”,揭示当前模型在动态变化和社交感知上存在明显短板。

📡 来源:PaperWeekly · 2026-05-25 12:21

要点

  • 基准包含 1001 条中英双语语音查询,覆盖 13 个副语言维度和 104 个细粒度特征,任务分三级难度(控制、动态变化、情景适应)。

ICML 2026 | 大模型为何越改越稳?中科大揭开终身归一化黑箱

中科大团队在ICML 2026上揭示了终身归一化(LN)的递归贝叶斯追踪本质,并基于此提出StableEdit方法,实现百万级编辑下的稳定模型更新。

📡 来源:PaperWeekly · 2026-05-25 12:21

要点

  • 终身归一化(LN)并非简单数值归一化,而是对动态梯度分布进行递归贝叶斯追踪,历史编辑能促进后续编辑(正向累积效应)。

📡 InfoQ 中文(4 条)

从 AI 试点到 AI 运营:零售与制造业领导者如何让 Agentic AI 真正落地 | 技术趋势

探讨零售与制造业领导者如何将 Agentic AI 从试点阶段推向实质性运营,实现业务落地。

📡 来源:InfoQ 中文 | ✍️ Rosemary DeAragon · 2026-05-25 22:53

要点

  • 聚焦 Agentic AI 在零售与制造业的实际应用场景与落地路径

ClickHouse实战:Agentic Coding,是“神”还是“坑”?

探讨在 ClickHouse 实战中应用 Agentic Coding(AI 编码代理)的真实效果,分析其是提升效率的“神”还是制造问题的“坑”。

📡 来源:InfoQ 中文 | ✍️ ClickHouse · 2026-05-25 23:46

要点

  • 从实际项目经验出发,评估 AI 编码代理在 ClickHouse 查询优化、数据建模等场景中的表现

Copilot 创始工程师:大多数 AI 编码“就像开着法拉利去买牛奶一样”

💡 观点与趋势 Copilot 创始工程师批评大多数 AI 编码工具的使用场景过于大材小用,就像“开着法拉利去买牛奶”。 - Copilot 创始工程师对当前 AI 编码工具的普遍用法提出批评。 - 他认为很多开发者用 AI 完成简单任务,导致效率低下或资源浪费。 - 比喻“开着法拉利去买牛奶”形象说明 AI 能力与使用场景的不匹配。

📡 来源:InfoQ 中文 | ✍️ Darryl K. Taft · 2026-05-25 19:25

要点

  • Copilot 创始工程师对当前 AI 编码工具的普遍用法提出批评。

人工智能无法加速软件交付

文章论证AI工具在软件交付中的实际成效有限,无法显著加速软件开发流程。

📡 来源:InfoQ 中文 | ✍️ Steve Fenton · 2026-05-25 19:19

要点

  • 指出当前AI辅助编程工具在代码质量、调试效率等方面存在瓶颈,难以真正提升交付速度

📋 本期未收录(24 篇)

Bintrail:利用索引二进制日志实现 MySQL 时间旅行查询

文章介绍了Bintrail工具,通过索引MySQL的二进制日志来实现对数据库历史状态的查询功能。

📡 来源:InfoQ 中文 | ✍️ 作者:Renato Losio · 2026-05-26 01:41


五年陪伴依然不舍,DIY 换壳后让罗技 MX Master 3 继续服役

文章讲述了作者为自己使用了近2000天的罗技MX Master 3鼠标更换外壳,使其继续服役的经历。

📡 来源:少数派 | ✍️ 今天的风儿有点喧嚣V · 2026-05-25 11:23


构建无障碍组件之Toolbar Pattern

本文讲解如何根据W3C ARIA规范构建无障碍工具栏组件,包括键盘导航和焦点管理。

📡 来源:稀土掘金 人工智能频道 | ✍️ anOnion · 2026-05-25 23:46


派评 | 近期值得关注的 App

这篇文章推荐了近期值得关注的各类 App,并推广了少数派平台的相关服务。

📡 来源:少数派 | ✍️ 少数派编辑部 · 2026-05-25 18:00


平台工程如何利用“黄金砖块”实现快速、顺畅的交付

文章讲的是平台工程中利用“黄金砖块”理念来加速和优化软件交付流程。

📡 来源:InfoQ 中文 | ✍️ 作者:Ben Linders · 2026-05-26 03:00


我也该升级了,陪伴了我7年的博客

,这篇文章讲述作者回顾自己7年来搭建个人博客的经历,涉及PHP、MySQL等传统Web开发技术,与AI无关。

📡 来源:稀土掘金 人工智能频道 | ✍️ 知航驿站 · 2026-05-25 20:06


被忙碌与焦虑裹挟时,学会「停下」比「开始」更重要

这篇文章讨论了在忙碌和焦虑的生活中,学会暂停和反思比盲目行动更重要,属于时间管理或心理健康类内容。

📡 来源:少数派 | ✍️ 胖鱼要进步 · 2026-05-25 14:37


宣布前沿生物防御奖学金(截止日期:6 月 2 日)— LessWrong

文章宣布了一个关于生物防御的奖学金项目。

📡 来源:RadarAI | ✍️ Tobias H · 2026-05-25 15:58


我让 AI 加了一个开关,结果代码走了原本不该走的分支

这篇文章主要讨论了在代码中添加一个开关后,导致业务逻辑分支(VIP用户与普通用户)执行异常的问题。

📡 来源:稀土掘金 人工智能频道 | ✍️ 桦说编程 · 2026-05-25 20:12


OpenTofu 1.12发布,带来 Terraform 从未提供的功能

这篇文章报道了OpenTofu 1.12版本发布的消息,并提到了其具备Terraform从未提供的新功能。

📡 来源:InfoQ 中文 | ✍️ 作者:Claudio Masolo · 2026-05-25 21:16


Manim物理模拟:别自己写欧拉了!

这篇文章介绍了使用Manim(一个3D动画库)制作弹簧振子物理模拟动画时,避免手动编写欧拉法迭代的经验。

📡 来源:稀土掘金 人工智能频道 | ✍️ databook · 2026-05-25 20:07


这篇文章是关于2026年投资界SuperLink大会的官方宣传,介绍大会将在苏州吴中举办,旨在构建创投生态全链条的超级枢纽。

📡 来源:RadarAI | ✍️ 量子位的朋友们 · 2026-05-25 15:29


深度剖析:为什么软件开发者应谨慎选择硬件公司

这篇文章旨在提醒软件开发者注意硬件公司与纯软件公司的差异,建议谨慎选择硬件公司作为职业发展平台。

📡 来源:RadarAI | ✍️ meng shao · 2026-05-25 15:37


CSS 已死?DOM 性能黑洞!Pretext 排版革命让你在文本间跳舞,没有 DOM 也能纵享丝滑~

这篇文章介绍了一个名为Pretext的JavaScript文本测量库,它通过避免传统DOM重排并利用现代API实现快速精准的文本测量,支持国际化多语言和Canvas/SVG渲染,旨在提升前端排版性能。

📡 来源:稀土掘金 人工智能频道 | ✍️ Web情报局 · 2026-05-25 20:18


Oracle XStream 技术揭秘:高吞吐 OLTP 场景下的 CDC 影响评估 | 技术实践

文章介绍了Oracle XStream技术在联机事务处理(OLTP)高吞吐场景下实施变更数据捕获(CDC)的性能影响评估。

📡 来源:InfoQ 中文 | ✍️ Jakub Puchalski · 2026-05-26 00:00


量子理论如何成立:实验线索、基本假设与态空间语言 | 量子物理导论第二讲

这篇文章介绍量子物理的基础概念和导论课程,属于物理教学,与人工智能无关。

📡 来源:集智俱乐部 · 2026-05-25 14:30


重磅!华为何庭波正式提出τ缩放定律,晶体管密度直指 1.4 纳米制程,麒麟 2026 首发验证

本文报道了华为何庭波提出的τ缩放定律,旨在通过优化时间常数来提升半导体性能,不涉及AI技术。

📡 来源:RadarAI | ✍️ AI寒武纪 · 2026-05-25 15:32


借助 Android CLI,谷歌正让 Android 工具链更便于代理使用

这篇文章介绍了谷歌改进 Android 命令行工具,使其更便于通过代理进行网络访问。

📡 来源:InfoQ 中文 | ✍️ 作者:Sergio De Simone · 2026-05-25 23:36


无障碍可感知,有爱亦无碍:藏在日常里的 Apple 辅助功能

,这篇文章介绍了Apple的辅助功能,倡导无障碍设计,但并不直接涉及AI技术。

📡 来源:少数派 | ✍️ waychane · 2026-05-25 16:02


免疫环与免疫网络:肿瘤免疫治疗转化研究丨免疫复杂性读书会第6期

这篇文章介绍了一场关于肿瘤免疫治疗转化研究的读书会,讨论免疫环与免疫网络等生物医学复杂系统话题。

📡 来源:集智俱乐部 · 2026-05-25 14:30


越来越不会投资了

文章以一位85后投资者的视角,反思了传统投资逻辑在技术加速时代失效,认为财富将集中于掌握高阶决策能力的少数人手中,投资难度增大。

📡 来源:RadarAI | ✍️ 雪球 · 2026-05-25 15:50


45家机器人厂商背后都是它!天机智能完成10亿元融资,估值奔百亿了

这篇文章报道了机器人厂商背后的供应商天机智能完成10亿元融资,估值接近百亿的消息。

📡 来源:InfoQ 中文 | ✍️ 华卫 · 2026-05-25 22:31


集智百科:鞍结点分岔|刘子豪、杨明哲

本文介绍了非线性动力学中的鞍结点分岔的概念、标准型、稳定性分析和

📡 来源:集智俱乐部 · 2026-05-25 14:30


Hermes 升级后,我的 Telegram 附件突然发不出来了

这篇文章讲述了作者遇到的一个技术问题:在使用 Hermes 升级后,Agent 生成了文件但无法通过 Telegram 发送附件,并介绍了排查和解决过程。

📡 来源:稀土掘金 人工智能频道 | ✍️ 孟健AI编程 · 2026-05-25 21:07


本文由 AI 日报系统自动生成 · 2026年05月26日