Goodbye 2021

在公司做ppt做到吐血,恰好想起2021年终总结还没有写

过去的一年

总的来说,2021年真的是无比辛苦的一年。 转行互联网的阵痛期这句话其实完全不是开玩笑。从CV转来做推荐,技术栈看起来接近,但是问题的重点变得很不一样。

  • 推荐场景存在大量稀疏特征,而CV下大部分特征都是稠密的
  • 推荐模型更新频繁,几分钟就要做一次更新,而CV模型的迭代速度是以天或者周来计算的
  • 离线请求和在线serving. 当然这点其实并不是CV/推荐 带来的不同

以至于对于行业内一些人尽皆知的概念,我第一次听到也一头雾水。比如"看一下服务的流量分布",比如“统计下p99”最初这一个个简单的概念都让工作比较吃力

说起"阵痛期",前两个月组里本来来了个商汤的前同事,做PPL(商汤自研的推理框架)的。然后也是感到了极大的不适应,于是在被折磨了两个月之后跑路到其他组了233

再加上腾讯内部的基础设施非常的烂,不仅仅是PCG内部的,导致最初的几个月过得无比煎熬。

基础设置有多烂呢,拿内部CI/CD平台蓝盾举例,我们每次提交代码会触发5条流水线(有不同tensorflow版本,以及gpu/cpu的区别),所有流水线都通过代码才能被合入。 在有一段时间里,5条流水线同时通过的概率接近为0,原因就是蓝盾上的各种组件非常不稳定。 不是这个挂,就是那个挂。 挂了之后的解决办法就是拉群,然后helper让你这样试试,那样试试,解决不了就再拉人进群。通常一个小问题的三天以上才能解决,有的甚至要一周以上。在解决的过程中是不是做自己的工作就好了呢? 想的太美好了。蓝盾常常会让你进行一个尝试,并声称“这样改一下就可以了”。本来的一个问题在改过会变成新的三个问题,并拉更多的人进群解决。那么平台出问题的频率是怎么样的呢? 大概每周一次吧,非常频繁。 以至于甚至总监在开会的时候都会安慰大家"(腾讯)内部的工具就是这样,大家不要太因为这些工具的不稳定而感到气馁"233

总的来说,转行可真苦

展望

腾讯也要过冬了

"留给PCG的时间也不多了“

2022预计会比2021艰难许多

苟住,我们2023年见