方法论术语

我们用来描述自身交付实践的核心词汇。

证据先行交付(Provenance-first delivery)
一种交付实践:交付物中的每一项论断都必须对应到一条已识别的来源行——含分级(A–E)、置信度评级与时间戳——之后才能进入报告。
工作流(Workstream)
委托内一条划定范围的并行分支,有自身的证据要求与里程碑。我们在首次会议中将简报拆解为多条工作流并交回客户对齐。
来源分级框架(A–E)
我们对每一来源所做的分级:A 一手资料(直接测量、签字测试报告);B 登记备案(专利、官方数据库);C 学术(同行评议论文);D 公开报道(行业媒体、新闻稿);E 用户生成(论坛、社交媒体、社区)。
证据行(Evidence row)
智安睿交付物的最小单元。包含:论断、分隔符、分级、置信度评级、来源标识、快照时间戳。报告由确定性步骤从已接受的证据行拼装。
置信度评级
附在每条论断上的四档评级:高(多条独立 A/B 类来源一致)、中(单一强来源或多条较弱来源)、低(合理但来源不足,标记为暂定)、未证实(他处所言但未独立确认;仅出现在公开问题清单中)。
公开问题清单
结构化列表,记录我们无法证实的事项、未能化解的矛盾、不得不做出的假设。每份智安睿交付物都包含一份。

AI / LLM 工程

出现在我们案例、观察与实验笔记中的术语。

LLM(大语言模型)
一类在文本上训练的 AI 模型,接受提示并产出续写;ChatGPT、Claude、Gemini 等系统的底层技术。
智能体系统 / 智能体
一种由 LLM 驱动的过程,按顺序执行动作——调用工具、检索文献、评估自身输出——以完成某项任务。"智能体管道"指多个此类智能体协同的系统。
RAG(检索增强生成)
一种架构:模型在推理时被提供相关文献,并基于这些文献生成答复——而非仅依赖训练时记忆下来的内容。
评测体系(Eval harness)
判断新模型版本是否足以上线的自动化测试基础设施。评测体系不只是基准——它作为门控接入部署管道。
多评审打分(Multi-judge scoring)
每个评测案例使用多于一位独立评审——通常是两位不同模型家族的 LLM 评审外加一定比例的人在回路抽样——以捕捉单一评审会漏掉的失败。
双编码器检索(Bi-encoder retrieval)
RAG 系统的标准快速方法:查询与文献被独立嵌入到同一向量空间,返回最近邻。对于散文足够;对于含大量表面相似分块的技术语料则不充分。
重排序器(Re-ranker)
第二阶段模型(或评分函数),对初次检索的前若干结果重新排序,引入比初次嵌入更具领域特异性的信号。
引用幻觉
RAG 系统的一种失败模式:模型产出的答复带有看似有效的引用,但所引内容并不真正支持论断。常规相关性评测会漏掉这种失败。
部署门控(Deploy gate)
作为发布阻断器接入部署管道的评测体系。新模型版本必须通过配置阈值(总分、子集、校准)才能上线。
受约束生成
强制 LLM 输出符合预定义数据结构——JSON 架构、正则表达式或语法。可通过厂商原生函数调用、语法受约束解码或架构引导采样实现。
函数调用(Function-calling)
一种模型 API 特性:返回符合所提供架构的结构化 JSON。厂商在解码阶段强制保证一致性,而非依赖提示词请求结构化输出。
F1 分数
精确率与召回率的调和平均——一个数值同时概括"是否找到正确条目"与"是否只找到正确条目"。用于对比检索策略。

网络安全与法规

出现在我们网络安全案例与法规引用中的领域术语。

PUF(物理不可克隆函数)
每枚芯片独有的硬件指纹,源自难以复制的细微制造差异。用以在不存储密钥的前提下派生加密密钥——一种嵌入于硅片中的信任根。
OT / ICS(运营技术 / 工业控制系统)
运行工厂、电力、水处理、交通等物理基础设施的计算机。在生命周期长、实时约束、更新窗口有限等方面与"IT"显著不同。
IEC 62443
工业自动化与控制系统网络安全的国际标准。定义安全等级、区域与通道架构、组件认证要求等。
NIS2
欧盟《网络与信息安全指令》第二版(指令 2022/2555)。是欧洲关键基础设施运营者与数字服务提供者的基础网络安全法规。
CRA(欧盟网络韧性法案)
欧盟法规(2024/2847),要求在欧洲市场销售的任何含数字组件的产品在设计阶段即具备网络安全——包括嵌入式系统、物联网设备与软件。
欧盟 AI 法案
欧盟关于人工智能的法规(2024/1689)——全球首个全面的 AI 系统法律框架。按风险分级,对高风险与通用型 AI 设定义务。
EU DPP(数字产品护照)
即将生效的欧盟要求,需为产品的组件、历史与生命终端建立数字记录。源自《可持续产品生态设计法规》;按行业分批生效,从电池、纺织、电子开始。
NIST 800-155 / 800-193
美国政府关于硬件完整性验证的标准——800-155 用于 BIOS 完整性测量,800-193 用于平台固件韧性。欧盟采购越来越多地引用。
PQC(后量子密码)
设计为可抵御足够大规模量子计算机攻击的加密算法——后者将能破解当今标准的公钥密码学。NIST 已标准化首批;受监管基础设施的迁移正在进行中。
KEM(密钥封装机制)
在双方之间安全交换加密密钥的密码学原语。ML-KEM(原 Kyber)与 HQC 是 NIST 已标准化或正在标准化的后量子 KEM 候选方案。