111qqz的小窝

记一次faster-rcnn debug记录
2019-12-13 · 4 min read · faster-rcnn
问题描述
一年debug 三次faster rcnn,每次都有新感觉（不
接到一个bug report,现象为某人脸模型，转换成trt模型，当batch size为1时结果完全正确，但是batch size大于1时结果不正确。具体的现象是，如果跑多张不同的图，只有第一张图有结果，后面的图都没有结果。如果跑的图中有相同的，那么和第一张相同的图都会有结果，其余的图没有结果。

阅读更多
FPN:Feature Pyramid Networks 学习笔记
2019-12-08 · 8 min read · feature-pyramid-networks FPN
检测不同尺度的物体一直是计算机视觉领域中比较有挑战性的事情．我们先从之前的工作出发，并对比FPN比起之前的工作有哪些改进．
之前的工作
Featurized image pyramid
思路是对于同一张图，生成不同的scale，然后每个scale的image单独去做检测．这个方法是手工设计feautre时代的常用办法．这个办法是比较显然的，也的确可以解决检测不同尺度物体的问题．缺点非常明显...inference的速度几乎和scale的个数线性相关．以及由于显存的开销，没办法做end-to-end 的training.

阅读更多
SSD: Single Shot MultiBox Detector 学习笔记
2019-12-08 · 7 min read · SSD single state detector
概述
SSD是一种单阶段目标检测算法．所谓单阶段，是指只使用了一个deep neural network,而不是像faster-rcnn这种两阶段网络．为什么有了faster-rcnn还要使用SSD? 最主要是慢... 两阶段网络虽然准确率高，但是在嵌入式等算力不足的设备上做inference速度非常感人，很难达到real time的要求．（实际业务上也是这样，公有云上的检测模型几乎都是faster-rcnn,而到了一些盒子之类的硬件设备，检测模型就全是SSD等single stage 模型了)

阅读更多
rankboost 算法学习笔记
2019-11-26 · 3 min read · boosting
boosting 算法是什么．
机缘使然，接触到了 Boosting 算法．Boosting是一种通过组合弱学习器来产生强学习器的通用且有效的方法.
动机是基于如下观察:尽管委员会中每个成员只提供一些不成熟的判断,但整个委员会却产生较为准确的决策。通过组合多个弱学习器来解决学习问题。给定训练数据,弱学习算法(如决策树)可以训练产生弱学习器,这些弱学习器只需要比随机猜测的准确率好一些。用不同的训练数据训练可以得到不同的弱学习器。这些弱学习器作为委员会成员,共同决策。

阅读更多
Kubernetes(k8s)在深度学习模型转换方面的探索
2019-11-22 · 4 min read · model-convertor docker k8s
年中的时候接了离职的同事模型转换的锅，在不断地更新迭代的过程中，发现了一些痛点。发现k8s能够解决一部分痛点，因此来分享一下在这方面的探索。
什么是模型转换
简单来说，深度学习模型的流程分为training和inference两部分。训练时用的一般是pytorch等框架，这些框架训练出的model是没办法直接部署在各个硬件平台上做inference的。因此需要将使用训练框架得到的模型，转换为能够部署到各个硬件平台上的模型。这个过程就是模型转换。

阅读更多
faster rcnn 模型 tensorrt4与tensorrt5 结果不一致踩坑记录
2019-11-07 · 2 min read · faster-rcnn
最近有同事report给我们,用同一个模型转换工具,转同一个faster rcnn 模型, 同样的sdk代码,在有些显卡上结果正常,但是再比较新的显卡上(比如Titan V)上结果完全不正确.

阅读更多
The Programming Language Course
2019-10-19 · 2 min read · CS341
花了三个月的时间,终于跟完了这门编程语言课. 课程内容非常赞,而且也充分发挥了coursera平台的作用. 非要说缺点的话,就是这门课时间有点短,以及peers' assignments总是找不到人...

阅读更多
yuv 图像格式初探
2019-07-03 · 3 min read · yuv image format 图像处理
概述
YUV是一种图像编码方式,或者称为色彩空间,与RGB是同级的概念. YUV是三个分量,Y,U和V,其中:
- Y 表示明亮度(Luminance或Luma),也就是灰度值,
- U,V表示色度,浓度（Chrominance、Chroma）,可以简单理解成用来表示某个像素的颜色的量.
YUV格式的特点是,在对照片或影片编码时，考虑到人类的感知能力，允许降低色度的带宽。也就是说,YUV不像RGB那样要求三个独立的视频信号同时传输，所以用YUV方式传送占用极少的频宽。

阅读更多
Anchor Box Algorithm
2019-07-01 · 2 min read · Object Detection Anchor box
动机
将一张图分成多个grid cell进行检测之后,每个cell只能检测到一个object. 如果这个grid cell中不止有一个物体要怎么办呢? 因此提出了anchor box algorithm来解决这个问题.

阅读更多
目标检测领域的滑动窗口算法
2019-06-30 · 1 min read · sliding Windows Object Detection
对象检测（Object Detection）的目的是”识别对象并给出其在图中的确切位置”，其内容可解构为三部分：
- 识别某个对象（Classification）；
- 给出对象在图中的位置（Localization）；
- 识别图中所有的目标及其位置（Detection）。
本文将介绍滑动窗口这一方法.

阅读更多
- 4
- 5
- 6
- 7
- 8

问题描述

之前的工作

Featurized image pyramid

概述

boosting 算法是什么．

什么是模型转换

概述

动机