type
status
date
slug
summary
tags
category
icon
password
TrojanZoo:对Neural Backdoors进行统一、整体和实用的评估。学习这个的主要原因是实验室这边给到的复现后门攻击的任务,以及自己学习BA的需要

Introduction

提出了三个问题
  • 不同攻击防御的优势和局限性
  • 操作它们的最佳实践
  • 如何进一步改进现有的攻击防御
提出了三个挑战
  • 非整体评估 = 如只在有限的攻击防御情况下评估/只使用简单宏观指标判定/没有体现指标之间的trading off
  • 非统一平台 = 使用不同的数据集和DNN,触发定义进行评估,难以比较
  • 非自适应攻击 = 对现有防御的评估,通常为静态的非自适应攻击,而没有充分考虑对手的对策

Related Work

提到了几个集成平台
Cleverhans Deepsec AdvBox 之后可以看看
但这些平台似乎都没有支持评估NN后门
*TROJAI - 一个针对神经后门的模型检测防御竞赛平台
Stop here!我需要调查一下这几个related work
Sleeper Agent: Scalable Hidden Trigger Backdoors for Neural Networks Trained from Scratch.BackdoorBox: A Python Toolbox for Backdoor Learning