Practical Accuracy Estimation for Efficient Deep Neural

高效深度神经网络测试的实用准确度估计
摘要
深度神经网络 (Deep neural network, DNN) 愈发流行,DNN的测试对DNN的正确性(即DNN在指定工作中的准确度)至关重要。然而,DNN 测试存在严重的效率问题,即,标注每个测试输入以了解DNN在测试集上的准确度的成本很高,因为需要大量的人(甚至他们还需要特定领域知识)来对测试数据进行手工标注,而测试集本身又是大规模的。为缓解此问题,本文提出了一种叫PACE新颖手法(Practical ACcuracy Estimation的缩写),其选择一小部分测试输入,可以精确地估计整个测试集的准确性。这样一来,只需对这小部分选定样本进行标注即可,这很大程度上降低了标注成本。除了实现精确的准确性估计外,为使PACE更加实用,其还被要求应该是可解释的、确定的,并尽可能地高效的。因此,PACE首先结合聚类,将具有不同测试能力(即测试DNN模型不同功能)的测试输入划分为不同的组。然后,PACE利用MMD-critic算法(一种最先进的基于样例的解释算法,根据组的大小,从每组中选择原型,即选择最具代表性的测试输入)来可以减少聚类带来的噪音影响。同时,PACE还使用了自适应随机测试的思想,从少数空间(即没有聚成任何一组的测试输入)中选择测试输入,以保证在所需的测试输入数量下实现极大的多样性。两个平行的选择过程(即同时从组和少数空间中进行选择)组建了最终的一小部分被选中的测试输入集合。结果表明,PACE能够精确估计整个测试集的准确性,平均偏差只有1.181%∼2.302%,大大超过了最先进的方法。