例如,下面的图像显示了Open Images数据集的示例,有一个后轮呈现出了假阳性。这个假阳性结果的起因,来源于有一个注释缺失了。因此,检查一遍数据集中的所有注释,并修正其他相似的错误,可以帮助提高该模型在轮胎上的表现性能。
图:来自Tyler Ganter
这一环节中,常用的工具有:
FiftyOne、Aquarium, Scale Nucleus - 可以通过调试数据集来发现错误
制定解决方案
找出提升模型性能的方法的第一步,是明确失败案例的特征。
在大部分情况下,你需要通过添加训练数据来解决问题,但训练数据不是随意添加的,而应该是哪些和测试失败例子相似的数据。此外,你还可以改变pipeline中的预处理或者后续处理的过程,或者修正注释。
不管解决方案是什么,它都是起源于对模型的失败例子的理解而产生的。
阶段四:生产部分
图:部署一个模型
在这个阶段,你终于得到了一个在评估指标上表现还不错的模型,并且在边缘样本上不会产生重大错误。谢富治简历
现在,你需要做什么呢?