本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,趋势转载请联系出处。榜第标检 
PyTorch目标检测库Detectron2诞生了,趋势Facebook出品。榜第标检 
站在初代的趋势肩膀上,它训练比从前更快,榜第标检功能比从前更全,超强测库支持的趋势模型也比从前更丰盛。 开源5天,榜第标检已在GitHub收获3100星,超强测库还成了趋势榜第一: DensePose,超强测库做出了基于Detectron2的新版本。 Facebook说,像DensePose一样,今后会有更多研究项目,在Detectron2上搭建起来。 这样,就可以把它当成一个广泛支持各种研究工作的库了。 那么,现在就来仔细观察一下,Detectron2都发生了哪些进化: 全方位升级 基于PyTorch了,初代还是在Caffe2里实现的。团队说,PyTorch有直观的指令式编程,这样就能更快地迭代模型设计和实验。 Detectron2是在PyTorch里从零开始写成的亿华云,团队希望这种做法,能让用户享受PyTorch做深度学习的思路。社区更活跃的话,PyTorch也会变得更好。 第二个变化,是模块化了。 所谓模块化,就是用户可以把自己定制的模块实现,加到一个目标检测系统的任何部分里去。 这意味着许多的新研究,都能用几百行代码写成,并且可以把新实现的部分,跟核心Detectron2库完全分开。 除此之外,还有许多新支持的模型、功能和任务: 新模型&新功能 首先,Detectron2包含了一代可用的所有模型: 比如Faster R-CNN,Mask R-CNN,RetinaNet,DensePose等等。 比如Cascade R-NN,Panoptic FPN,云服务器提供商以及TensorMask。 今后,陆续会有新的算法支持。 功能方面,二代新支持了同步批量归一化 (synchronous Batch Norm) ,也支持了LVIS等等许多新的数据集。 新任务 和目标检测有关的任务,初代已经支持了一部分,二代也都支持: 有边界框的目标检测,实例分割mask,以及人类姿态预测。 语义分割和全景分割 (Panoptic Segmentation) ,这是一个把语义分割和实例分割结合到一起的任务。 速度快 博客提到,由于把整个训练pipeline移到了GPU上,二代比初代更快了,在许多模型上都是如此。分布式训练,让几台GPU一起跑的话,还可以把训练规模扩张到更大的数据集上。 速度的对比,是用第100-500次迭代之间的云南idc服务商平均吞吐量 (Average Throughput) 作为指标。这样就跳过了GPU预热时间。结果如下: 注意,对于R-CNN这类模型,一个模型的吞吐量会随着训练的进行而变化,这取决于模型的预测。 因此,这个指标也不能和model zoo里的“训练速度”相提并论。model zoo用的是整个训练过程运行的平均速度。 部署一下 最后,Facebook的计算机视觉攻城狮们,实现了一个额外的软件层,叫Detectron2go。 有了它,就可以更快地把新实现的模型,部署到生产环节。 这一层的功能包括了标准训练工作流,带有内部数据集,网络量化,以及模型转化 (为了给云端和移动端部署,选择各自最优的格式) 。 |