崗位需求
? 負(fù)責(zé)主導(dǎo)全生命周期行業(yè)大模型開發(fā)的技術(shù)領(lǐng)袖,兼具戰(zhàn)略規(guī)劃能力(技
術(shù)路線制定/風(fēng)險預(yù)判)與實戰(zhàn)經(jīng)驗(至少 1 個完整大模型項目閉環(huán)經(jīng)
驗),能帶領(lǐng)團(tuán)隊突破技術(shù)瓶頸;
? 負(fù)責(zé)主導(dǎo)航天領(lǐng)域大模型開發(fā),重點(diǎn)解決航天特色場景下的模型優(yōu)化問
題。
專業(yè)要求:
u 5 年以上大模型架構(gòu)設(shè)計相關(guān)經(jīng)驗,主導(dǎo)過千億參數(shù)級模型從開發(fā)到形
成產(chǎn)品的全流程工作(需提供項目文檔/論文/代碼倉庫等證明),精通
Transformer 架構(gòu)優(yōu)化;
u 精通分布式訓(xùn)練框架(Megatron/DeepSpeed),具備分布式訓(xùn)練與推理
優(yōu)化經(jīng)驗(如混合精度訓(xùn)練、ZeRO 優(yōu)化);
u 精通計算-通信平衡策略、MoE 架構(gòu)在稀疏計算中的應(yīng)用(如Google Switch Transformer 實戰(zhàn)經(jīng)驗);
u 掌握 CoT 技術(shù)的落地方法,掌握 CoT 提示工程和訓(xùn)練方法;
u 具備知識圖譜與大模型融合經(jīng)驗;
u 掌握多模態(tài)大模型(如 Qwen-VL、DeepSeek-V2)的微調(diào)策略;
u 成功應(yīng)用過模型蒸餾技術(shù),如用 GPT-4 生成仿真數(shù)據(jù)訓(xùn)練輕量化模型。
求職提示:用人單位發(fā)布虛假招聘信息,或以任何名義向求職者收取財物(如體檢費(fèi)、置裝費(fèi)、押金、服裝費(fèi)、培訓(xùn)費(fèi)、身份證、畢業(yè)證等),均涉嫌違法,請求職者務(wù)必提高警惕。
-
請選擇
-
公司規(guī)模未知
-
公司性質(zhì)未知
-
北京市昌平
-
西藥師 4000-6000元應(yīng)屆畢業(yè)生 不限容城安康精神病醫(yī)院
-
生產(chǎn)廠長 7000-14000元應(yīng)屆畢業(yè)生 大專河北冠宇環(huán)保設(shè)備股份有限公司
-
工藝部經(jīng)理 8000-12000元應(yīng)屆畢業(yè)生 大專河北神力索具集團(tuán)有限公司
-
維修主任 8000-12000元應(yīng)屆畢業(yè)生 中技河北神力索具集團(tuán)有限公司
-
視頻拍剪/視頻拍攝/視頻剪輯 4000-5000元應(yīng)屆畢業(yè)生 大專河北神力索具集團(tuán)有限公司
-
張家口錢款護(hù)送包吃住五險一金4-6K 面議應(yīng)屆畢業(yè)生 不限河北鐵祿高豎航空服務(wù)有限公司
應(yīng)屆畢業(yè)生
學(xué)歷不限
最近更新
3624人關(guān)注
注:聯(lián)系我時,請說是在河北人才網(wǎng)上看到的。
