-
背景 2019年对了好几次faster rcnn,第一次是赛事之窗项目和北京的同事,对齐sdk和训练的实现。 第二次是被tensorRT4和tensorRT5之间默认参数不一致的问题坑了一下。 第三次是被caffe proto中roi align 的默认参数坑了。 虽然debug了这么多次,踩了一堆坑,但是一段时间不用,细节就会慢慢不记得了。因此来记录一下。 faster rcnn,是一种"two stage"的目标检测算法。 所谓"two stage",是说在实际进行目标检测之前,先会通过某种"region proposals" algorithm,来获得一定数量 …
Read More -
背景 基于Conv的方法在某年的ImageNet比赛上又重新被人想起之后,大家发现网络堆叠得越深,似乎在cv的各个任务上表现的越好。 然而事情当然没有无脑退跌深度那么简单,人们发现,当网络深到一定程度时,结果还不如浅一些的网络结构。 可能第一反应是,网路那么深,多了那么多参数,有那么多数据吗? overfit了吧 然而情况没有那么简单。如果只是单纯得overfit,那么应该只有test error很高才对。然而现在的情况是training error也很高。 那这是怎么回事呢? Resnet的团队认为,是因为深层的网络在训练的时候很难收敛。 这个想法是有依据的,因为我们可以通过构造一个较深的网络结构,使得后面的layer学成一 …
Read More