2021-10-25 16:54 已编辑滴滴_测试开发工程师

关注

[PAPER]Heat and Blur: An Interpretability Based Defense Against Adversarial Examples

本文提出了一种防御方法，即将特征可视化与输入修改相结合，适用于不同的预训练的网络。即使输入是对抗性的，“真实”对象的相关信息也会由于神经网络的激活保存完好，因此可以以特征可视化的方式提取相关热图里的信息。然后将这些热图用作防御的基础，通过这种防御方法，对抗效果会因图像的大量模糊而损坏。本文还提供了一种新的评估指标，可以更全面的描述攻击和防御的效果。

Feature Visualization

特征可视化方法的原始目的是更好的解释神经网络。已经提出了几种方法可以找出对神经网络决策有帮助的特征。有三种方法可以达到此目的：

输入修改方法，通过修改输入观察对模型输出的影响。
类激活映射方法，该方法将特定层（通常是高层）的激活模式与其他信息（例如输出和梯度）结合在一起；
基于反向传播的方法

反向传播中最基础的贡献规则定义为：

其中 $z_{ij} = x_iw_{ij}$ 和 $R^{（l）}$ 是第 $l$ 层的相关性。

通过使用标准DTD方法首先反向传播所需输出神经元的一热编码来创建热图，然后对热图的像素进行二值化，以便仅将顶部的5％像素被保留：
首先对想要输出的神经元的独热编码进行反向传播得到热图，然后使用标准DTD方法对热图进行二值化。
通过这个公式，热图中对输出结果影响最大的5%个像素被保留下来：

$\bar{P}$ 和 $S_p$ 分别代表热图像素的均值和标准差。

Heat and Blur算法流程：

$\sigma$ 控制模糊效果的大小

评价指标：
作者认为当前的top-k准确性度量标准并不能表达正确预测和对抗预测之间的语义和概念差距。因此作者建议使用信息检索中广泛使用的排名质量度量也称为归一化累计折扣增益Normalized Discounted Cumulative Gain (NDCG)作为评价标准。

对于特定的良性输入 $i_b$ ,模型预测输出集合的分数为：

$l_j$ 是输出神经元 $j$ 预测分类前的值
$K_1 = \underset{k}{max}\sum_{j=1}^{k}p^{(i_b)}_j\leq C_b$
$C_b = [0,1]$

对于对抗样本 $i_a$ ,模型预测输出集合的分数为：

$p_{j_{match}}$ 是与 $i_b$ 输出类别概率 $p_j$ 相匹配的 $i_a$ 预测
$K_2 = \underset{k}{max}\sum_{j=1}^{k}p^{(i_a)}_j\leq C_a$
$C_a = [0,1]$

图像 $i$ 的折扣累计增益为：

DCG规范化为：
IDCG是良性图片预测的理想DCG

对于对抗样本 $i_a$ 的规范化DCG为：

作者提出里一种针对Heat and Blur防御的自适应攻击：

实验结果：

全部评论

推荐最新楼层

06-27 18:13

门头沟学院 Java

牛油们，27届鼠鼠的我可能要离开一段时间了。。。

美团一面挂、理想一面挂、字节一面挂、腾讯一面挂还有两个小厂都挂了，我可能真的撑不下去了。。。但是！！拿到华子实习offer的那一天，一切都将作废，之前的所有面试都作废，简历作废，八股作废，项目作废，星星作废月亮作废银河系作废作废作废……timeline：3.22 投递 5.8 部门捞出 6.6 一面 6.13 二面 6.14入池 6.27offer华为2012中软 base：上海 继续加油吧，拿到offer挺开心的，过程中换了三个hr 感谢全程陪同的hr姐姐跟哥哥！

华为求职进展汇总

点赞评论收藏

分享

06-27 14:50

点点互动_产品管理工程师(准入职员工)

点点互动内推

点点互动面经一面（1）传统自我介绍（2）我看你大学里做了项目是吧，我们来聊聊吧（撕数据库、计算机网络）数据库（3）欸，你用的是 MySQL 吧，我想知道如果我要生成用户的唯一id，有什么方法啊？（4）那我如果有一个主键值是 10，然后删除了这一行，插入下一行数据的时候，主键值是多少呀？（5）你知道 MySQL 的索引的索引数据结构吗？（6）那你知道聚簇索引和非聚簇索引吗？计算机网络（7）你项目中前后端用什么协议通信的？「 HTTP 」为什么 说 HTTP 是无状态的呢？（8）那如何防止 Cookie 劫持？（9）那我如果使用 HTTPS 协议， Cookie 就不会被第三方拿到吗？（10）那你...

点点互动一面20人在聊

点赞评论收藏

分享

06-25 20:44

乐山师范学院 Java

二本计科投了900份简历，面试寥寥无几，简历都是已读不回，怎么办

程序员小白条：你是沟通了900个，不是投了900份简历，你能投900份，意味着对面都要回复你900次，你早就找到实习了，没亮点就是这样的，别局限地区，时间投的也要早，现在都要7月了

点赞评论收藏

分享

06-27 17:14

学而思_HR(准入职员工)

学而思内推

22-25届均可投递）学而思2026届校招提前批启动啦！很多HC！面向对象：22-25届毕业生均可投递，专业不限，应聘阶段无教资要求招聘岗位：高中学科、素养、竞赛教练等（多业务线可选，详见投递主页）📍工作地点：全国39城薪酬：每年4-6次调薪机会福利：六险一金、年度体检、带薪病假、福利年假、司令假期、节日礼盒、团建下午茶、花样周边等。面试流程：初筛-初试（试讲）-复试-培训-offer支持线上面试，抢先锁定offer，心向往之，在学而思！内推码: DS74UTFd(优先处理特权)内推链接：https://app.mokahr.com/m/campus-recruitment/tal/1480...

学而思开奖112人在聊

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 如何准备秋招 #

11256次浏览 193人参与

# 软开人，秋招你打算投哪些公司呢 #

100903次浏览 946人参与

# 现代汽车前瞻技术研发急速编程挑战赛 #

22375次浏览 185人参与

# 你觉得实习能学到东西吗 #

16352次浏览 384人参与

# 秋招什么时候开投比较合适？ #

6912次浏览 147人参与

# 实习，不懂就问 #

28258次浏览 452人参与

# 每个月的工资都是怎么分配的？ #

14362次浏览 312人参与

# 你觉得实习只能是打杂吗？ #

192451次浏览 1223人参与

# 你们公司几号发工资 #

19002次浏览 128人参与

# 你觉得现在还能进互联网吗？ #

4601次浏览 99人参与

# 非技术岗简历怎么写 #

216850次浏览 2918人参与

# 预测一下26届秋招形势 #

24879次浏览 239人参与

# 技术岗笔试题求解 #

75455次浏览 974人参与

# 你最近一次加班是什么时候？ #

67869次浏览 346人参与

# 高考出分的那一天，我__ #

16520次浏览 267人参与

# 聊聊你的职场新体验 #

161434次浏览 1391人参与

# 打工人的精神状态 #

54067次浏览 987人参与

# 大家实习每天都在干啥 #

82864次浏览 506人参与

# 米哈游工作体验 #

17785次浏览 116人参与

# 来聊聊你认为的薪资天花板是哪家？ #

30889次浏览 174人参与

# 机械实习一天多少钱合适？ #

28984次浏览 176人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务