職位描述
該職位已進(jìn)行加V認(rèn)證,請放心投遞
崗位職責(zé):
1. 需求分析與規(guī)劃: 深刻理解VLM核心任務(wù)及其數(shù)據(jù)需求,識別當(dāng)前數(shù)據(jù)短板。
2. 數(shù)據(jù)檢索與獲取:高效利用網(wǎng)絡(luò)資源(包括主流社交媒體平臺、專業(yè)社區(qū)、公開學(xué)術(shù)數(shù)據(jù)集庫、特定領(lǐng)域網(wǎng)站等)檢索、爬取所需的多模態(tài)原始數(shù)據(jù)。
3. 數(shù)據(jù)定制化: 根據(jù)特定項目方向(如面向用戶實時交互的視頻流媒體場景)定制數(shù)據(jù)源策略和數(shù)據(jù)采集方案。
4. 數(shù)據(jù)處理與構(gòu)建:
○ 設(shè)計并執(zhí)行數(shù)據(jù)清洗、預(yù)處理、去噪流程。
○ 定義并確保高質(zhì)量的數(shù)據(jù)標(biāo)準(zhǔn)。
○ 組織和管理數(shù)據(jù)標(biāo)注工作。
○ 構(gòu)建結(jié)構(gòu)化的、適用于模型訓(xùn)練和評測的高質(zhì)量數(shù)據(jù)集。
5. 流程優(yōu)化: 持續(xù)優(yōu)化數(shù)據(jù)獲取、處理、標(biāo)注、存儲和管理流程,提升效率與質(zhì)量。
6. 評測數(shù)據(jù)建設(shè): 專注于構(gòu)建公平、全面、具有挑戰(zhàn)性的VLM模型評測數(shù)據(jù)集,服務(wù)于模型能力評估和行業(yè)對比。
任職資格:
1. 學(xué)歷與專業(yè)背景:
○ 計算機(jī)科學(xué)、數(shù)據(jù)科學(xué)、人工智能、軟件工程或相關(guān)領(lǐng)域的本科及以上學(xué)歷。
2. 相關(guān)經(jīng)驗與技術(shù)領(lǐng)域年限:
○ 年限:
■ 1年~3年數(shù)據(jù)處理、數(shù)據(jù)工程或機(jī)器學(xué)習(xí)相關(guān)領(lǐng)域工作經(jīng)驗。
■ 1年及以上實際處理多模態(tài)數(shù)據(jù)(圖像+文本、視頻+文本等)的項目經(jīng)驗,熟悉其特有挑戰(zhàn)和處理方法。
○ 優(yōu)先:有視覺語言模型(VLM) 相關(guān)項目數(shù)據(jù)工作經(jīng)驗,深刻理解其數(shù)據(jù)需求。
3. 專業(yè)技能:
○ 數(shù)據(jù)處理基礎(chǔ)扎實: 了解數(shù)據(jù)清洗、預(yù)處理、轉(zhuǎn)換技術(shù),熟悉常見的數(shù)據(jù)處理工具和庫(如Pandas, NumPy, SQL等)。
○ 多模態(tài)理解基礎(chǔ): 對計算機(jī)視覺(CV)和自然語言處理(NLP)的基本概念、任務(wù)及數(shù)據(jù)格式有清晰理解。
○ VLM任務(wù)認(rèn)知: 深入理解主流VLM任務(wù)的原理、評估指標(biāo)及其對數(shù)據(jù)的具體要求(如高質(zhì)量的圖文對、精準(zhǔn)的視頻-文本對齊)。
○ 網(wǎng)絡(luò)數(shù)據(jù)檢索能力: 熟練掌握從各類網(wǎng)絡(luò)資源(社交媒體、專業(yè)論壇、公開數(shù)據(jù)集平臺、特定領(lǐng)域網(wǎng)站)高效檢索和獲取所需數(shù)據(jù)的方法與工具(如爬蟲技術(shù)、API使用)。
○ 數(shù)據(jù)標(biāo)準(zhǔn)制定: 具備定義清晰、可執(zhí)行的多模態(tài)數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn)(如圖文相關(guān)性、視頻片段描述準(zhǔn)確性、時序?qū)R度)的能力。
○ (加分項)數(shù)據(jù)標(biāo)注管理: 有設(shè)計標(biāo)注規(guī)范、管理標(biāo)注團(tuán)隊或使用標(biāo)注平臺的經(jīng)驗。
4. 軟技能:
○ 信息搜集與整合能力: 能夠敏銳地發(fā)現(xiàn)并整合分散的網(wǎng)絡(luò)數(shù)據(jù)資源。
○ 分析與解決問題能力: 能夠精準(zhǔn)分析VLM任務(wù)的數(shù)據(jù)需求,識別數(shù)據(jù)短板,并制定有效的解決方案。
○ 細(xì)致嚴(yán)謹(jǐn): 對數(shù)據(jù)質(zhì)量有高標(biāo)準(zhǔn)要求,注重細(xì)節(jié),確保數(shù)據(jù)的準(zhǔn)確性和一致性。
○ 溝通協(xié)作: 能夠清晰表達(dá)數(shù)據(jù)需求和標(biāo)準(zhǔn),與算法工程師、研究員、標(biāo)注團(tuán)隊等進(jìn)行有效協(xié)作。
○ 主動性: 主動探索新的數(shù)據(jù)源、工具和方法,持續(xù)優(yōu)化數(shù)據(jù)流程。
○ 學(xué)習(xí)能力: 能夠快速學(xué)習(xí)VLM領(lǐng)域的新進(jìn)展及其對數(shù)據(jù)提出的新要求。
福利待遇:
1、綜合薪資:12K-24K
2、繳納五險一金,有帶薪休假
上班時間:
1、9:30-18:00雙休
2、可彈性1小時打卡
3、法定節(jié)假日正常休
工作地點
地址:杭州余杭區(qū)五常街道阿里西溪園區(qū)
??
點擊查看地圖
詳細(xì)位置,可以參考上方地址信息
求職提示:用人單位發(fā)布虛假招聘信息,或以任何名義向求職者收取財物(如體檢費、置裝費、押金、服裝費、培訓(xùn)費、身份證、畢業(yè)證等),均涉嫌違法,請求職者務(wù)必提高警惕。
職位發(fā)布者
HRHR
阿里巴巴(中國)有限公司
-
IT服務(wù)·系統(tǒng)集成
-
1000人以上
-
中外合資(合資·合作)
-
杭州濱江區(qū)阿里巴巴濱江園區(qū)699
相似職位
-
新媒體運營 5000-10000元應(yīng)屆畢業(yè)生 高中摩登攝影
-
質(zhì)量工程師 面議應(yīng)屆畢業(yè)生 不限保定申辰泵業(yè)有限公司
-
新媒體運營 面議應(yīng)屆畢業(yè)生 不限滄州市大唐管業(yè)有限公司
-
保定五險一金/上五休二/百度審核 3000-5000元不限 大專內(nèi)蒙古??Э萍加邢薰?
-
糕點研發(fā)工程師 10000-15000元應(yīng)屆畢業(yè)生 不限東莞市華美食品有限公司
-
網(wǎng)絡(luò)推廣 4000-5000元應(yīng)屆畢業(yè)生 大專上海韓施電氣自動化設(shè)備有限公司
1年以上
本科
2026-02-01 10:54:18
723人關(guān)注
注:聯(lián)系我時,請說是在河北人才網(wǎng)上看到的。
