職位描述
該職位信息待核驗,請仔細了解後再進行投遞!
崗位職責:
1.大模型部署與推理優化
負責主流大模型(如Qwen、DeepSeek)的推理服務部署,使用 TensorRT、vLLM、SGLang 等框架進行推理加速,實現低延遲、高吞吐的在線服務;主導模型量化(INT8/FP16)、剪枝、動態批處理、KV Cache優化等技術落地,提升GPU資源利用率,降低單位推理成本。
2.AI係統運維與工程化
基於k8s容器化模型服務,配合商業的算力池化平台實現集群調度、自動擴縮容與服務高可用;構建 CI/CD 流水線(GitLab CI/Jenkins),實現模型版本上線前測試、灰度發布與回滾;部署 Prometheus Grafana 監控體係,追蹤模型響應時間、顯存占用、請求成功率等核心指標,建立告警機製保障服務SLA。
3.智能體應用構建與業務落地
設計並實現基於 LangChain、MCP、Skills 等工具的智能體(Agent)係統,完成RAG增強問答、多工具調用、記憶管理等核心功能;與產品、業務方深度協作,將模糊業務需求(如“提升客服效率”)轉化為可執行的技術方案(如“構建FAQ知識庫 Agent自動應答鏈”),推動從PoC到生產環境的端到端落地。
任職要求:
1.精通 TensorRT、vLLM、SGLang 的部署與調優;熟悉模型量化(INT8/FP4)、動態批處理、PagedAttention、模型並行等優化技術;熟練使用 CUDA、Python、C 進行性能分析與底層優化。
2.熟練掌握 Docker、K8s 集群管理,具備生產級CI/CD流水線搭建經驗;熟悉 Prometheus、Grafana、Alertmanager 監控體係,能自定義指標與告警規則。
3.有 LangChain、LlamaIndex、CrewAI、AutoGen 等框架的實際項目經驗,能獨立構建多智能體協作係統;熟悉RAG流程優化、向量數據庫(Milvus/Chroma)、檢索重排序(Rerank)等關鍵技術。
4.具備優秀的跨團隊溝通能力,能將非技術語言的業務需求轉化為清晰的技術規格文檔;有主導過至少1個AI項目從0到1落地的完整經驗。
1.大模型部署與推理優化
負責主流大模型(如Qwen、DeepSeek)的推理服務部署,使用 TensorRT、vLLM、SGLang 等框架進行推理加速,實現低延遲、高吞吐的在線服務;主導模型量化(INT8/FP16)、剪枝、動態批處理、KV Cache優化等技術落地,提升GPU資源利用率,降低單位推理成本。
2.AI係統運維與工程化
基於k8s容器化模型服務,配合商業的算力池化平台實現集群調度、自動擴縮容與服務高可用;構建 CI/CD 流水線(GitLab CI/Jenkins),實現模型版本上線前測試、灰度發布與回滾;部署 Prometheus Grafana 監控體係,追蹤模型響應時間、顯存占用、請求成功率等核心指標,建立告警機製保障服務SLA。
3.智能體應用構建與業務落地
設計並實現基於 LangChain、MCP、Skills 等工具的智能體(Agent)係統,完成RAG增強問答、多工具調用、記憶管理等核心功能;與產品、業務方深度協作,將模糊業務需求(如“提升客服效率”)轉化為可執行的技術方案(如“構建FAQ知識庫 Agent自動應答鏈”),推動從PoC到生產環境的端到端落地。
任職要求:
1.精通 TensorRT、vLLM、SGLang 的部署與調優;熟悉模型量化(INT8/FP4)、動態批處理、PagedAttention、模型並行等優化技術;熟練使用 CUDA、Python、C 進行性能分析與底層優化。
2.熟練掌握 Docker、K8s 集群管理,具備生產級CI/CD流水線搭建經驗;熟悉 Prometheus、Grafana、Alertmanager 監控體係,能自定義指標與告警規則。
3.有 LangChain、LlamaIndex、CrewAI、AutoGen 等框架的實際項目經驗,能獨立構建多智能體協作係統;熟悉RAG流程優化、向量數據庫(Milvus/Chroma)、檢索重排序(Rerank)等關鍵技術。
4.具備優秀的跨團隊溝通能力,能將非技術語言的業務需求轉化為清晰的技術規格文檔;有主導過至少1個AI項目從0到1落地的完整經驗。
工作地點
地址:浦東南路360號新上海國際大廈24層
📍
點擊查看地圖
詳細位置,可以參考上方地址信息
求職提示:用人單位發布虛假招聘信息,或以任何名義向求職者收取財物(如體檢費、置裝費、押金、服裝費、培訓費、身份證、畢業證等),均涉嫌違法,請求職者務必提高警惕。
職位發布者
君管HR
國泰君安期貨有限公司
-
基金·證券·期貨·投資
-
500-999人
-
股份製企業
-
靜安區延平路121號三和大廈26樓


應屆畢業生
本科
2026-04-25 07:06:13
806人關注
注:聯係我時,請說是在福建人才網上看到的。
