↓ 跳过正文

Deep-Learning

2023

[施工中] cupy与torch的导入顺序不同对计算结果的影响

2023-12-17·5 分钟

Deep-Learning Pytorch Cupy Python

背景 # 公司内部的基于torch的toolbox发现某个版本之后,结果发生了偏移. 通过一系列排查,发现当导入cupy和torch的顺序不同时，计算结果会有所差异。也就是说,如下两段代码会导致模型训练等环节的计算得到不同的结果.

Build Onnxruntime With Bazel

2023-01-16·1 分钟

Deep-Learning Onnxruntime Bazel

背景 # 需要使用bazel build onnxruntime

2022

[施工中]caffe 源码学习笔记(11) softmax

2022-08-06·1 分钟

Deep-Learning Caffe

背景 # 2022年惊讶的发现，当时竟然没有写关于softmax的笔记，因此来补充一下。

2021

(CSE 599W)Reverse Mode Autodiff

2021-04-05·3 分钟

Deep-Learning Mooc DL-SYS CSE599W

背景 # 怎么算微分。。通常有三种方法。

【推荐系统】Toward the Next Generation of Recommender Systems: A Survey of the State-of-the-Art and Possible Extensions

2021-01-23·5 分钟

Deep-Learning 推荐系统

迫于生计，从今天开始学习推荐系统相关的内容，今天先来读一篇推荐系统领域的综述 Toward the next generation of recommender systems: a survey of the state-of-the-art and possible extensions

2020

【施工中】torch2trt　学习笔记

2020-09-18·2 分钟

Deep-Learning Jetson Nano 模型转换

前言 # 偶然发现了 torch2trt 的模型转换方案，思路是直接将pytorch op映射到TensorRT的python api. 在pytorch进行每个op　forward的时候，tensorrt也相应往network上添加op. 这里会先涉及torch2trt的使用，后面会补充这个转换工具的代码学习

Jetson Nano踩坑记录

2020-09-08·8 分钟

Deep-Learning Jetson Nano

写在前面 # 主要是需要在jetson nano做模型转换，来记录下踩的坑目前有两条路径，一条是我们现有的转换路径，也就是pytorch->onnx(->caffe)->trt的路径在这条路径上踩了比较多的坑，最终暂时放弃，最直接的原因是cudnn8.0升级接口发生改动，编译caffe遇到较多问题这里其实仍然采用了两条平行的路径，一条是直接在nano上构建环境，另外一种是基于docker(包括构建交叉编译环境用于加快编译速度)

caffe 源码阅读笔记

2020-06-30·1 分钟

Deep-Learning Caffe

caffe做部署是YYDS! blob layer net 激活函数卷积 reshape slice loss function reduce eltwise argmax

caffe 源码学习笔记(11) argmax layer

2020-05-06·3 分钟

Deep-Learning Caffe

背景 # 似乎没什么背景,继续看caffe代码

caffe 源码学习笔记(10) eltwise layer

2020-05-03·3 分钟

Deep-Learning Caffe

背景 # 这个layer和reduce layer有一些相似,就干脆一起看了. 作用是输入至少两个blob,然后对每个blob中的元素所一些运算,最后得到一个blob.

caffe 源码学习笔记(9) reduce layer

2020-05-03·3 分钟

Deep-Learning Caffe

背景 # 其实没什么背景,继续啃caffe代码而已2333

Focal Loss for Dense Object Detection(RetinaNet) 学习笔记

2020-05-02·1 分钟

Deep-Learning 计算机视觉 Retinanet

先写个简略版的笔记..看之后的情况要不要读得更精细一点.. 背景 # two stage的检测比one stage的检测效果好,原因是啥?

caffe 源码学习笔记(8) loss function

2020-04-18·3 分钟

Deep-Learning Caffe

背景 # 虽然不太care 训练的过程，但是由于容易看懂的layer都看得差不多了所以打算看一下这些loss function.

caffe 源码学习笔记(7) slice layer

2020-04-13·3 分钟

Deep-Learning Caffe

背景　# ocr组那边有个shuffle net 的网络,里面有个pytorch op叫chunk,转成的onnx对应的op是 split

caffe 源码学习笔记(6) reshape layer

2020-04-09·4 分钟

Deep-Learning Caffe

背景　# 最近在魔改 tensorRT 的caffe parser 之前caffe模型转到trt模型时，有一个修改是需要将reshape　layer的param末尾补1,比较繁琐，于是看了下caffe的reshape layer的实现．

caffe 源码学习笔记(5) 卷积

2020-04-08·6 分钟

Deep-Learning Caffe

caffe中卷积运算的实现 # 暴力实现的卷积大概是这样子的

tensorrt INT8 量化debug记录（cuda error 700）

2020-04-08·2 分钟

Deep-Learning Tensorrt

背景是要把某个caffe model,转换成tensorrt的INT8 模型。然后遇到如下报错:

caffe 源码学习笔记(4) 激活函数

2020-04-07·6 分钟

Deep-Learning Caffe

在看过caffe代码的三个核心部分,blob,layer,net之后，陷入了不知道以什么顺序继续看的困境。

Faster Rcnn 目标检测算法

2020-04-05·11 分钟

Deep-Learning Faster-Rcnn 计算机视觉

背景 # 2019年对了好几次faster rcnn，第一次是赛事之窗项目和北京的同事，对齐sdk和训练的实现。第二次是被tensorRT4和tensorRT5之间默认参数不一致的问题坑了一下。第三次是被caffe proto中roi align 的默认参数坑了。

resnet 学习笔记

2020-04-05·4 分钟

Deep-Learning Resnet 计算机视觉

背景 # 基于Conv的方法在某年的ImageNet比赛上又重新被人想起之后，大家发现网络堆叠得越深，似乎在cv的各个任务上表现的越好。