-
被师兄(同事?)普及了一番实验规范orz... 我还是太年轻了 所谓的一个fc的版本是右边的.一个放着不动,另一个在sequence_len(10)的维度上做ave,然后再expand成原来的维度.如下图. 任务命名规则: 如D1V2_a_1,D1表示使用第一个数据集,V2表示是第二个大版本,a表示在V2大版本上的微调,最后的数字表示这是第几次运行该任务(跑三次以减少波动的影响) logdir的地址为:/mnt/lustre/renkuanze/Data_t1/reid/log/{$jobname} * D1:使用ilivids 数据集 * D1V1表示最初始的 baseline model * D1V2表示改为使用一个fc * …
Read More -
CMC曲线全称是Cumulative Match Characteristic (CMC) curve,也就是累积匹配曲线,同ROC曲线Receiver Operating Characteristic (ROC) curve一样,是模式识别系统,如人脸,指纹,虹膜等的重要评价指标,尤其是在生物特征识别系统中,一般同ROC曲线( 多标签图像分类任务的评价方法-mean average precision(mAP) 以及top x的评价方法)一起给出,能够综合评价出算法的好坏。 转一篇通俗易懂的解释: Shortly speaking, imagine that you have 5 classes. For …
Read More -
所谓end-to-end 神经网络,更多是一种思想。 这种思想的核心是,比如对于图像处理,输入原始图像数据,输出的是直接有用的结果(有用取决于具体的任务,比如自动驾驶) 也就是尽可能少得减少人为干预,使训练是end (原始数据) to end (对应用问题直接有用的结果) 端到端指的是输入是原始数据,输出是最后的结果,原来输入端不是直接的原始数据,而是在原始数据中提取的特征,这一点在图像问题上尤为突出,因为图像像素数太多,数据维度高,会产生维度灾难,所以原来一个思路是手工提取图像的一些关键特征,这实际就是就一个降维的过程。 那么问题来了,特征怎么提? 特征提取的好坏异常关键,甚至比学习算法还重要,举个例子,对一系列人的数据分类, …
Read More -
1709.08325 Reid问题指的是判断一个probe person 是否在被不同的camera捕获的gallery person 中出现。 通常是如下情景:给出一个特定camera下某个特定人的probe image 或者 video sequence,从其他camera处询问这个人的图像,地点,时间戳。 ReID问题至今没有很好得解决,主要原因是,不同camera下,人的姿势(pose),观察的视角(viewpoint) 变化太大了。 传统方法主要在两个大方向上努力: 1. **用一些在图像上抽取的不变量来作为人的特征feture** 2. **去学习一个不同的距离度量方式,以至于同一个人在不同camera之间的距离尽可能 …
Read More -
原始论文 DNN在很多问题上效果很不错,但是由于深度和宽度过大,导致需要的执行时间和内存过大。我们需要讨论一些能快速执行并且对内存的需要不大的模型。 已经有很多方法来做这件事,比较重要的是Model distillation(模型蒸馏) 基于蒸馏的模型压缩的有效性是基于一个发现:小的网络有和大的网络一样的表达能力,只不过是更难以训练找到合适的参数。 也就是说,难点在于优化(以找到合适的参数)而不在于网络的尺寸。 蒸馏的模型的做法是把一个有效的(deep or/and wide) network 作为teacher network,让一个size 较小的 student network 模仿teacher network. 这样做的好 …
Read More -
Similarity_learning 相似性学习(Similarity learning )有监督机器学习,它与回归和分类密切相关,但目标是从实例中学习一个相似函数,以衡量两个对象的相似程度或相关程度。 Similarity learning通常有四种setups: * regression similarity learning 在这种方式中,给出的数据是 ![(x_{i}^{1},x_{i}^{2})](https://wikimedia.org/api/rest_v1/media/math/render/svg/cfa249357a1b4a7baf332041d67e480d6bb1f8fb) 和他们的相似度 . 目标 …
Read More -
Key: (1). Pose-driven, body part alignment, combine whole feature and body part feature, focus on alignment of part model, (2). Combine image label and human attributes classes, do classification with attributes and identity learning (3). Based on triplet loss, improve metric learning for an end to end learning (4). …
Read More -
参考资料: 多标签图像分类任务的评价方法-mAP wiki_Sensitivity and specificity False Positives和False Negative等含义 mean average precision(MAP)在计算机视觉中是如何计算和应用的? 首先需要了解True(False) Positives (Negatives)的含义 True Positive (真正, TP)被模型预测为正的正样本;可以称作判断为真的正确率 True Negative(真负 , TN)被模型预测为负的负样本 ;可以称作判断为假的正确率 False Positive (假正, FP)被模型预测为正的负样本; …
Read More -
先粗略读了2遍orz.可能不够严谨,先写一些high-level的理解。 对于序列或者图片数据,如果想获得一个long-range的依赖,通常的做法是循环神经网络(对于序列)或者深层的卷积神经网络(对于图片数据) 但是循环操作(当前的处理依赖于前面有限的若干个)和卷积操作都是一种局部操作。 但是这种局部操作是有一些局限的,比如不好优化,计算代价比较大等。 这篇paper提出了non-local 这个操作。 non-local操作是计算机视觉中广泛使用的一种降噪算法,即non-local mean的一般化。 non-local operation被认为是一个可以被广泛使用的操作,几乎可以和当前神经网络的其他部件结合。 含 …
Read More