工作職責:
該職位負責自研神經(jīng)網(wǎng)絡芯片AI?推理框架的開發(fā),優(yōu)化和集成,具體包括以下一到多項:
?·支持ONNX模型的AI自研推理框架的開發(fā)和擴展。
?·分析和優(yōu)化推理框架的性能,添加,維護推理相關的優(yōu)化pass(es)
?·模型混精,量化推理支持
?·針對神經(jīng)網(wǎng)絡計算設備,設計和調(diào)優(yōu)AI框架圖級別調(diào)度和融合等算法優(yōu)化;
?·跟蹤/分析/評估各主流開源深度學習框架,
?·對接Inference?server。?
職位要求:
?????計算機/電子信息類專業(yè)本科,碩士及以上學歷
?????有扎實的C/C++/Python編程能力
?????對計算機體系結構有深刻理解
?????理解深度學習理論,熟悉Tensorflow/Caffe/Pytorch/MXNet/PaddlePaddle/oneFlow/MindSpore等至少一種開源深度學習框架
?????有較強的快速學習能力,良好的團隊合作能力和溝通能力
?????流利的英語閱讀、寫作能力
?????(加分項)有編譯器(LLVM/GCC),MLIR框架經(jīng)驗
?????(加分項)有CUDA,?TensorRT,?OpenCL或其他并行計算/HPC開發(fā)經(jīng)驗
?????(加分項)有XLA,TVM,ONNX,?PlaidML,?Halide,?M?ISL,?Tiramisu?and?Glow計算圖優(yōu)化經(jīng)驗
?????(加分項)有分布式計算框架的研發(fā)、運維、性能評測調(diào)優(yōu)等經(jīng)驗
?????(加分項)有進程,線程調(diào)度,同步,內(nèi)存搬移調(diào)優(yōu)等經(jīng)驗
?????(加分項)有Inference?server的對接開發(fā)經(jīng)驗:?Triton,?Nvidia?Dali,?DeepStream,?Pytorch?serving,?TensorFlow
serving?etc.
?????(加分項)有在基于深度學習的目標識別、目標檢測、機器視覺、NLP領域有過工程經(jīng)驗或發(fā)表過學術論文