APP下載
機會在手,求職信息實時掌握
    Alternate Text
    APP下載
    Alternate Text
    微信公眾號
    Alternate Text
    小程序
當前位置:首頁> 列表 >職位詳情
端側大模型開發工程師-上海
20000-30000元 應屆畢業生 本科
  • 全勤獎
  • 節日福利
  • 不加班
  • 周末雙休
上汽通用汽車有限公司 2026-04-07 19:18:24 1030人關注
職位描述
該職位信息待核驗,請仔細了解後再進行投遞!
職責描述: 1.模型優化與壓縮 a)剪枝、量化與壓縮:采用剪枝、量化和模型壓縮技術,降低模型尺寸和計算複雜度,滿足端側設備的資源限製。 b)模型蒸餾與輕量化設計:利用模型蒸餾等技術構建輕量級模型,保證在減少資源占用的同時維持較高的推理精度。 2.軟件架構設計 a)輕量級架構構建:設計專為端側設備優化的模型架構,確保在有限計算資源下依然能夠高效運行。 b)模塊化設計:構建靈活、易於擴展的架構,便於後續更新和功能擴展。 3.平台適配與部署 a)跨平台適配:針對不同硬件平台(如高通平台、英偉達平台等),進行模型適配和優化,確保在多種設備上均能穩定部署。 b)部署流程製定:建立標準化的部署流程,包括環境配置、依賴管理和版本控製,確保部署高效且一致。 4.推理性能優化 a)硬件加速利用:結合GPU、NPU或DSP等硬件加速技術,優化模型的推理速度,滿足實時性需求。 b)並行計算與異步處理:設計高效的並行處理方案,減少延遲,提升整體推理性能。 5.資源與能耗管理 a)內存與功耗平衡:通過優化計算圖和算法,合理分配設備內存和處理資源,降低能耗,延長設備續航。 b)實時監控與調優:建立監控機製,實時追蹤模型在端側設備上的資源使用情況,及時調整優化策略。 6.性能評估與反饋 a)指標監測:製定並監控關鍵性能指標(如響應時間、吞吐量、能耗等),確保模型部署後的性能符合預期。 b)持續迭代優化:基於性能數據和用戶反饋,不斷進行迭代優化,完善模型在不同硬件環境下的表現。 7.跨團隊協作 a)整合研發與產品需求:與研發和產品團隊合作,根據業務需求調整部署策略,確保端側方案能夠有效落地並滿足實際應用場景。 任職要求: 1. 計算機科學、人工智能、數學等相關專業本科及以上學曆。 2. 1年以上相關工作經驗,有大規模預訓練模型、微調、端側部署、提示工程及RAG經驗者優先。 3. 熟練掌握深度學習框架(如TensorFlow、PyTorch等),並有實際的模型訓練與優化經驗。 4. 熟悉自然語言處理、計算機視覺等領域的模型微調和應用技術。 5. 熟悉端側設備(如嵌入式係統、移動設備等)上的模型部署與優化技術,了解模型量化、剪枝等優化方法。 6. 熟悉提示工程的設計與實現,能夠通過提示優化模型的生成效果。 7. 熟悉RAG(檢索增強生成)技術,並有實際應用經驗,能夠將外部知識和生成模型有效結合。 8. 能夠獨立完成大規模數據集的處理、清洗、標注和分析工作。 9. 良好的編程能力,熟練使用Python,具有C 等其他語言能力者優先。 10. 良好的團隊協作精神,溝通能力強,能承受工作壓力。
聯係方式
注:聯係我時,請說是在福建人才網上看到的。
工作地點
地址:龍東大道3999號
📍 點擊查看地圖
詳細位置,可以參考上方地址信息
求職提示:用人單位發布虛假招聘信息,或以任何名義向求職者收取財物(如體檢費、置裝費、押金、服裝費、培訓費、身份證、畢業證等),均涉嫌違法,請求職者務必提高警惕。
top
投遞簡曆
馬上投遞
更多優質崗位等你來挑選   加入本站,發現更好的自己
投遞簡曆
馬上投遞
提示
該職位僅支持官方網站投遞
關閉 去投遞
會員中心 提示:訂單支付,立即生效
天數: 0
共計: 0
支付方式:
微信支付
支付寶支付
確認 取消