職位描述
該職位信息待核驗,請仔細了解後再進行投遞!
職位描述:
1、研發分布式訓練加速方案,優化ZeRO/FSDP/Pipeline並行策略,提升千億參數模型訓練吞吐量;
2、設計混合精度訓練與顯存優化方案,開發自適應梯度壓縮、通信優化模塊,實現單卡訓練模型規模提升和降低分布式訓練通信開銷
開發量化壓縮工具鏈(支持GPTQ/AWQ等算法),實現模型8/4-bit無損量化部署;
3、設計多GPU推理調度策略,優化顯存碎片管理與計算資源利用率;
4、跟進vLLM/TensorRT-LLM/SGLang等前沿框架,探索MoE架構/稀疏化訓練等新型範式,將最新學術成果快速落地到工程實踐。
職位要求:
1、計算機科學/人工智能方向碩士及以上,3年LLM係統優化經驗;
2、精通PyTorch/TensorFlow框架底層機製,具備CUDA/C 內核開發能力;
3、掌握Megatron-LM/DeepSpeed/HuggingFace生態核心原理;
4、有千億參數模型訓練優化或百萬QPS推理服務落地經驗;
5、熟悉NVIDIA GPU架構與性能分析工具;
6、熟悉大模型推理服務架構設計與微服務化部署。
工作地點
地址:北京朝陽區北京城建智控科技股份有限公司琉璃井路2號院4號樓
📍
點擊查看地圖
詳細位置,可以參考上方地址信息
求職提示:用人單位發布虛假招聘信息,或以任何名義向求職者收取財物(如體檢費、置裝費、押金、服裝費、培訓費、身份證、畢業證等),均涉嫌違法,請求職者務必提高警惕。
職位發布者
1771..HR
北京城建智控科技股份有限公司
-
IT服務·係統集成
-
500-999人
-
股份製企業
-
越城區曲屯路398號聯合大廈16層

北京
應屆畢業生
學曆不限
最近更新
1779人關注
注:聯係我時,請說是在福建人才網上看到的。
