- 首頁(yè)
- 民文
- English
- 舉報(bào)專(zhuān)區(qū)
- 登錄
人工智能大模型訓(xùn)練師——
讓人工智能更“懂”人類(lèi)
上午9時(shí),重慶市渝北區(qū)菲利信科技有限公司的辦公室內(nèi),25歲的蔡川軍開(kāi)始了一天的工作。電腦屏幕上,一款語(yǔ)言類(lèi)人工智能大模型正在總結(jié)小說(shuō)《紅樓夢(mèng)》第四回的內(nèi)容。蔡川軍發(fā)現(xiàn),總結(jié)中缺少了幾個(gè)重要?jiǎng)∏?,便只給了這條結(jié)果3分,并在備注欄中將其缺漏一一列出。
蔡川軍畢業(yè)于重慶郵電大學(xué)計(jì)算機(jī)專(zhuān)業(yè),目前是一名人工智能大模型訓(xùn)練師。他的日常工作就是通過(guò)標(biāo)注數(shù)據(jù)、評(píng)判結(jié)果,讓大模型生成的內(nèi)容越來(lái)越精準(zhǔn)。
一個(gè)成熟的人工智能大模型,算法、算力、數(shù)據(jù)3方面缺一不可。其中,大量高質(zhì)量的數(shù)據(jù)有助于不斷提高大模型的準(zhǔn)確率,這離不開(kāi)訓(xùn)練師的努力。他們通過(guò)清洗、整合、標(biāo)注等操作,生成滿足機(jī)器學(xué)習(xí)訓(xùn)練要求的可讀數(shù)據(jù)編碼。
蔡川軍這一上午的工作內(nèi)容,是訓(xùn)練人工智能全文摘要功能,對(duì)大模型的摘要結(jié)果進(jìn)行打分和評(píng)價(jià)。大模型在收到訓(xùn)練師的反饋后,會(huì)以此調(diào)整算法參數(shù)權(quán)重,不斷優(yōu)化生成結(jié)果。對(duì)普通用戶而言,隨著大模型不斷優(yōu)化,他們會(huì)發(fā)現(xiàn)人工智能越來(lái)越“懂”人類(lèi)。
午休過(guò)后,蔡川軍開(kāi)始進(jìn)行機(jī)器視覺(jué)大模型的標(biāo)注工作。具體來(lái)說(shuō),他需要以自己的審美,對(duì)資料庫(kù)中的服飾圖片評(píng)分,并對(duì)其風(fēng)格進(jìn)行判斷。
“這也是數(shù)據(jù)標(biāo)注的一種,我如何標(biāo)注圖片,人工智能就如何認(rèn)識(shí)這些數(shù)據(jù)。”蔡川軍一邊點(diǎn)擊鼠標(biāo)一邊說(shuō)。當(dāng)人們使用人工智能生成圖片時(shí),大模型能否理解“穿著西裝的男人”“穿衣風(fēng)格帥氣的女生”等指令,給出令人滿意的反饋,就看訓(xùn)練師的標(biāo)注質(zhì)量。
“訓(xùn)練師的工作分為標(biāo)注和質(zhì)檢兩類(lèi),標(biāo)注質(zhì)量較高且穩(wěn)定的訓(xùn)練師,就能負(fù)責(zé)質(zhì)檢任務(wù)。”菲利信科技員工趙楊說(shuō)。2019年進(jìn)入公司的趙楊,剛開(kāi)始也是一名訓(xùn)練師,經(jīng)過(guò)多個(gè)項(xiàng)目的歷練,經(jīng)驗(yàn)豐富的他成長(zhǎng)為培訓(xùn)師,負(fù)責(zé)新員工的培訓(xùn)、標(biāo)注標(biāo)準(zhǔn)制定等工作。
去年蔡川軍初入公司時(shí),接受了為期兩周的培訓(xùn),趙楊就為他授過(guò)課?!罢n程主要包括系統(tǒng)操作、數(shù)據(jù)分類(lèi)、標(biāo)注規(guī)則等,幫助新入職員工快速上手?!壁w楊說(shuō),“做人工智能大模型訓(xùn)練師,我們更看重一個(gè)人的專(zhuān)業(yè)知識(shí)儲(chǔ)備。”
沒(méi)有經(jīng)過(guò)訓(xùn)練的大模型就像一張白紙,需要不斷投喂優(yōu)質(zhì)數(shù)據(jù)才能成長(zhǎng),這便對(duì)訓(xùn)練師的專(zhuān)業(yè)知識(shí)儲(chǔ)備提出了更高要求?!袄?,與醫(yī)療相關(guān)的大模型,我們會(huì)讓有醫(yī)學(xué)背景的員工來(lái)訓(xùn)練數(shù)據(jù)?!壁w楊說(shuō)。
除了專(zhuān)業(yè)知識(shí),這項(xiàng)工作有時(shí)對(duì)訓(xùn)練師的性格也有要求?!坝?xùn)練師的審美、性格、思考方式等,都會(huì)對(duì)人工智能產(chǎn)生影響。例如一款大模型的定位是用戶的‘伙伴’,我們就會(huì)通過(guò)性格測(cè)試,優(yōu)先讓具有溫柔、開(kāi)朗等性格特征的員工參與?!壁w楊介紹。
在菲利信科技,像蔡川軍、趙楊這樣的訓(xùn)練師有1500多名,他們通過(guò)標(biāo)注數(shù)據(jù)、評(píng)判結(jié)果,讓大模型生成的內(nèi)容越來(lái)越精準(zhǔn),助力人工智能行業(yè)發(fā)展。
近年來(lái),渝北區(qū)人力資源和社會(huì)保障局持續(xù)強(qiáng)化數(shù)字人才培育,突出服務(wù)產(chǎn)業(yè)、就業(yè)與人才3個(gè)導(dǎo)向,促進(jìn)產(chǎn)業(yè)鏈、培訓(xùn)鏈與就業(yè)鏈銜接。近3年,全區(qū)累計(jì)從業(yè)人員達(dá)3萬(wàn)人,覆蓋人工智能、大數(shù)據(jù)、機(jī)器人等前沿領(lǐng)域。
《 人民日?qǐng)?bào) 》( 2024年11月18日 10 版)
分享讓更多人看到