需求

行业:生物技术。合规背景:欧盟两用物项条例、名古屋议定书合规。核心需求:自动化筛查系统,标记生物材料库中异常访问模式,具备完整审计轨迹以满足监管检查。

工作流拆解

  • WS-1:访问模式建模。基于两年历史数据,建立正常访问频率、数量和研究者画像的基线模型。
  • WS-2:异常检测管道。设计并训练 ML 管道(孤立森林 + LSTM 序列模型),标记偏离基线的行为。
  • WS-3:溯源链设计。构建支持从样本接收到处置全流程监管审计的保管链数据模型。

方法亮点

核心挑战是误报管理。孤立森林的早期版本将 12% 的合法访问标记为异常。我们引入了两阶段架构:孤立森林生成候选项,然后由经过已确认合法序列训练的 LSTM 模型进行评分。这将误报率降至 1.8%,同时保持对测试中所有人工注入异常的检出。

交付物

  • 训练完成的 ML 管道,附训练数据溯源文档
  • 溯源链数据模型及 API 规范
  • 研究报告:34 条来源行
  • 欧盟两用物项出口管制合规映射

结果

系统在三个存储库站点分阶段部署。运行首季度检测到两个真实异常——均追溯为管理性错误而非安全事件,证实了系统的灵敏度而未引发警报疲劳。