观察 — Zhianrui 智安睿

2026-05-01 · AI 工程 · 智安睿研究团队

为什么智能体系统比人类更需要溯源

缺乏溯源纪律的人类研究者会产出糟糕的研究。缺乏溯源纪律的智能体 LLM 系统会以规模化的方式产出自信的幻觉。

2026-04-24 · AI 工程 · 智安睿研究团队

基准分数是模型在静态数据集上取得的成绩。评测体系是你用以判断新模型能否上线的依据。两者不是同一回事。

2026-04-17 · AI 工程 · 智安睿研究团队

检索增强生成看起来像"搜索多一步"。它不是。它是"建立在检索基底之上的生成"。架构含义在每一层都不一样。

2026-04-15 · 方法论 · 智安睿研究团队

溯源不是报告末尾的一个章节。它是一种从第一天起就塑造研究方式的实践。

2026-04-10 · AI 工程 · 智安睿研究团队

大多数咨询公司把内部 AI 使用藏在"人类执笔"的帘子后面。我们认为这块帘子带来的伤害多于收益——对客户、对行业讨论、对我们自己的工作都是如此。

2026-04-08 · 合规 · 智安睿研究团队

大多数合规指南将 NIS2 视为清单。我们将其视为工程规范——由此产生的设计要求截然不同。

2026-03-28 · 运营模式 · 智安睿研究团队

外包的失败模式不是成本——而是实验台与客户之间的翻译层。