111qqz的小窝

(CSE 599W)Reverse Mode Autodiff
2021-04-05 · 3 min read · DL-SYS CSE599W
背景
怎么算微分。。通常有三种方法。
- Symbolic Differentiation
- Numerical Differentiation
- Automatic Differentiation (auto diff)
auto diff中两种主流的方式分别是forward-mode和reverse-mode 由于forward-mode的方法中，计算的时间复杂度是O(n),n是输入的参数个数。而reverse-mode中，计算的时间复杂度是O(m),m是输出节点的个数。在dnn中，n往往很大，远大于m，因此这里主要介绍reverse-mode auto diff方法。

阅读更多
[施工完成] CSAPP Malloc lab
2021-03-14 · 7 min read · CSAPP
背景
动手实现一个memory allocator,体会core到爆炸的乐趣(不是
trace file 结构分析
trace file 是对allocator的输入的描述，可以从mdriver.c中的

阅读更多
【推荐系统】Toward the Next Generation of Recommender Systems: A Survey of the State-of-the-Art and Possible Extensions
2021-01-23 · 5 min read · 推荐系统
迫于生计，从今天开始学习推荐系统相关的内容，今天先来读一篇推荐系统领域的综述 Toward the next generation of recommender systems: a survey of the state-of-the-art and possible extensions
由于目前的工作其实是偏向推荐系统的serving,训练的开发，因此这些paper可能都是粗读，也不会把paper中的内容逐句翻译，而是找出我认为最为重要的一些概念加以记录。

阅读更多
使用github actions来部署 github pages
2021-01-23 · 3 min read · github
目前我的博客是部署在github pages上，源码是一个repo,渲染出来的静态页面是一个repo. 更新的时候是把后者作为前者的submodule. 感觉这种方式有些落后了，简直和某司内部的平台有的一比。因此尝试采用了下github actions，来自动化这个部署的流程。

阅读更多
2020年终总结
2021-01-03 · 3 min read
本来不知道写什么所以不打算写了，不过后来觉得可以把今年做的一些重大的决定写出来，把当时的分析和想法记录下来。这样若干年后再回看，就能找到，是哪些明智或愚蠢的决定，对人生产生了巨大的影响。

阅读更多
[施工完成] CSAPP Cachelab
2020-12-26 · 4 min read · CSAPP
背景
CSAPP:3e 的配套实验地址分成了两个部分，第一部分是模拟一下cache的miss,hit,evict的规则。第二部分是优化一个矩阵的转置，使得miss尽可能少。

阅读更多
【施工中】torch2trt　学习笔记
2020-09-18 · 2 min read · Jetson Nano 模型转换
前言
偶然发现了 torch2trt 的模型转换方案，思路是直接将pytorch op映射到TensorRT的python api. 在pytorch进行每个op　forward的时候，tensorrt也相应往network上添加op. 这里会先涉及torch2trt的使用，后面会补充这个转换工具的代码学习

阅读更多
Jetson Nano踩坑记录
2020-09-08 · 8 min read · Jetson Nano
写在前面
主要是需要在jetson nano做模型转换，来记录下踩的坑目前有两条路径，一条是我们现有的转换路径，也就是pytorch->onnx(->caffe)->trt的路径在这条路径上踩了比较多的坑，最终暂时放弃，最直接的原因是cudnn8.0升级接口发生改动，编译caffe遇到较多问题 这里其实仍然采用了两条平行的路径，一条是直接在nano上构建环境，另外一种是基于docker(包括构建交叉编译环境用于加快编译速度)

阅读更多
k8s nodes is forbidden user cannot list resource nodes in api group at the cluster scope
2020-05-07 · 3 min read · docker k8s
继续将k8s用于模型转换和部署的自动化流程...然后发现之前安装k8s的文档不work了．．时间是2020年5月7日，当前最新的k8s版本是　v1.18.2

阅读更多
caffe 源码学习笔记(11) argmax layer
2020-05-06 · 3 min read · caffe
背景
似乎没什么背景,继续看caffe代码
argmax的作用是返回一个blob某个维度或者batch_size之后的维度的top_k的index(或者pair(index,value))

阅读更多
- 1
- 2
- 3
- 4
- 5

背景

背景

trace file 结构分析

背景

前言

写在前面

背景

背景