TensorFlow Architecture 学习笔记(二)Adding a New Op

Adding a New Op

Implement the kernel for the op

需要注意的是,你定义的运算的kernel可能被并行地访问,所以要求 Compute method 一定是线程安全的。

可以通过添加互斥锁(c++11?)或者完全就不要通过类成员来共享状态。

可以使用  ResourceMgr 来追踪运算的状态。

 

Multi-threaded CPU kernels

要实现多线程cpu版本的kernel,可以参考  work_sharder.h

GPU kernels

—–先忙手头工作了,有时间再更orz

 

作者: CrazyKK

ex-ACMer@hust,stackoverflow-engineer@sensetime

说点什么

您将是第一位评论人!

提醒
wpDiscuz