• <bdo id="0wauq"></bdo>
  • <tfoot id="0wauq"></tfoot>
    • <s id="0wauq"></s>
    • <sup id="0wauq"></sup>
    • <sup id="0wauq"></sup>
      深圳熱線

      數(shù)據(jù)標注為AI發(fā)展加工“優(yōu)質(zhì)原料”

      2025-01-27 13:18:19 來源:科技日報

      圖為廣東省公共數(shù)據(jù)標注基地(清遠)。 受訪者供圖

      隨著人工智能迅猛發(fā)展,高質(zhì)量訓(xùn)練數(shù)據(jù)短缺逐漸成為制約行業(yè)進步的一大瓶頸,而數(shù)據(jù)標注產(chǎn)業(yè)可為人工智能創(chuàng)新發(fā)展提供強大動力。國家發(fā)展改革委、國家數(shù)據(jù)局、財政部、人力資源和社會保障部四部門日前聯(lián)合印發(fā)的《關(guān)于促進數(shù)據(jù)標注產(chǎn)業(yè)高質(zhì)量發(fā)展的實施意見》(以下簡稱《實施意見》),提出到2027年的發(fā)展目標:數(shù)據(jù)標注產(chǎn)業(yè)專業(yè)化、智能化及科技創(chuàng)新能力顯著提升,產(chǎn)業(yè)規(guī)模大幅躍升,年均復(fù)合增長率超過20%。

      我國數(shù)據(jù)標注產(chǎn)業(yè)現(xiàn)狀如何?數(shù)據(jù)標注產(chǎn)業(yè)高質(zhì)量發(fā)展還需要跨過哪些“門檻”?針對這些問題,科技日報記者進行了采訪。

       原始數(shù)據(jù)變?yōu)榭捎觅Y源

      “通俗地說,訓(xùn)練人工智能大模型的過程就像老師教學生識字。”華南理工大學計算機科學與工程學院副院長張通形象地解釋道,數(shù)據(jù)標注就是給數(shù)據(jù)“貼標簽”或者“做記號”,需要專業(yè)人員向大模型闡釋各個數(shù)據(jù)的標簽及需執(zhí)行的相應(yīng)任務(wù)。他們“教導(dǎo)”大模型參與訓(xùn)練的數(shù)據(jù)是什么,給圖像、語音、文本等各種數(shù)據(jù)“貼標簽”。高質(zhì)量的數(shù)據(jù)標注,有助于機器精準理解、快速學習、高效訓(xùn)練,顯著提升大模型的準確性和泛化能力。

      在訓(xùn)練ChatGPT時,美國開放人工智能研究中心(OpenAI)就投入了大量資源用于數(shù)據(jù)標注。為確保標注任務(wù)高質(zhì)量完成,使ChatGPT能更好地理解人類指令,保障大模型的準確性與可靠性,OpenAI聘請了眾多“老師”。這些“老師”涵蓋一般數(shù)據(jù)標注人員和專業(yè)人士,還包括博士級別的專家。

      數(shù)據(jù)標注是人工智能發(fā)展的核心基石之一。“數(shù)據(jù)標注產(chǎn)業(yè)是對數(shù)據(jù)進行篩選、清洗、分類、注釋、標記和質(zhì)量檢驗等加工處理的新興產(chǎn)業(yè),其核心任務(wù)是對原始數(shù)據(jù)進行加工,使之成為可用于訓(xùn)練人工智能大模型的優(yōu)質(zhì)原料。”張通介紹,數(shù)據(jù)標注作為訓(xùn)練大模型至關(guān)重要的一環(huán),直接影響機器學習模型的性能,對支撐人工智能能力水平提升有重要作用。

      在張通看來,未經(jīng)處理的原始數(shù)據(jù)只是潛在資源,而經(jīng)過標注處理后沉淀的數(shù)據(jù),才能在市場上進行有效交易和流通,從而充分釋放數(shù)據(jù)要素價值。培育壯大數(shù)據(jù)標注產(chǎn)業(yè),對于提升數(shù)據(jù)供給質(zhì)量、推動人工智能創(chuàng)新發(fā)展不可或缺。

      業(yè)內(nèi)人士認為,隨著人工智能技術(shù)不斷成熟、應(yīng)用領(lǐng)域持續(xù)拓展,數(shù)據(jù)標注行業(yè)將迎來更廣闊市場空間,尤其是在低空經(jīng)濟、智慧城市、自動駕駛、智慧醫(yī)療等新興科技領(lǐng)域展現(xiàn)出巨大潛力。

       產(chǎn)業(yè)步入快速發(fā)展階段

      全球數(shù)據(jù)標注市場目前正處于迅速增長期。近年來,我國數(shù)據(jù)標注產(chǎn)業(yè)已進入快速發(fā)展階段,產(chǎn)業(yè)鏈條不斷完善,技術(shù)創(chuàng)新成果逐步實現(xiàn)市場化應(yīng)用。據(jù)測算,2023年我國數(shù)據(jù)標注產(chǎn)業(yè)規(guī)模已達800億元左右。

      四川成都、遼寧沈陽、安徽合肥、湖南長沙等7個承擔數(shù)據(jù)標注基地建設(shè)任務(wù)的城市,在大模型標注、自動化標注等領(lǐng)域取得重要突破。長沙信息產(chǎn)業(yè)園作為長沙首批數(shù)據(jù)標注基地之一,已吸引智能網(wǎng)聯(lián)汽車、數(shù)據(jù)標注、網(wǎng)絡(luò)安全等1萬余家各類數(shù)字企業(yè)入駐,成功打造了人工智能創(chuàng)新中心算力服務(wù)平臺。

      廣東積極推進數(shù)據(jù)標注訓(xùn)練試點和基地建設(shè),為大模型訓(xùn)練提供堅實數(shù)據(jù)支撐。2023年9月,廣東省公共數(shù)據(jù)標注訓(xùn)練試點正式啟動。在廣東省公共數(shù)據(jù)標注基地(清遠),百度、燕湖科技、好思達等一批在自動駕駛、政務(wù)公共標注領(lǐng)域表現(xiàn)突出的企業(yè)已率先入駐。憑借龍頭企業(yè)的帶動作用和數(shù)字經(jīng)濟產(chǎn)業(yè)的集聚效應(yīng),清遠的數(shù)據(jù)標注產(chǎn)業(yè)蓬勃發(fā)展。

      “我們以數(shù)字經(jīng)濟產(chǎn)業(yè)為核心,與數(shù)字經(jīng)濟產(chǎn)業(yè)龍頭企業(yè)緊密合作,致力于打造國家級數(shù)據(jù)標注產(chǎn)業(yè)集聚區(qū)和產(chǎn)教融合示范區(qū)。”廣東省公共數(shù)據(jù)標注基地(清遠)負責人李艷康介紹,落戶在此的百度智能云(清遠)人工智能基礎(chǔ)數(shù)據(jù)產(chǎn)業(yè)基地已累計引進孵化數(shù)據(jù)標注企業(yè)5家,培育專業(yè)數(shù)據(jù)標注師超300人。未來,基地將持續(xù)培育孵化更多優(yōu)秀數(shù)據(jù)標注企業(yè),推動清遠數(shù)據(jù)服務(wù)產(chǎn)業(yè)不斷壯大發(fā)展。

      復(fù)合型人才缺口仍然較大

      《實施意見》的出臺,將進一步提升數(shù)據(jù)供給質(zhì)量,有效解決制約人工智能產(chǎn)業(yè)發(fā)展的高質(zhì)量數(shù)據(jù)短缺問題。

      值得注意的是,隨著人工智能應(yīng)用的不斷深化,對數(shù)據(jù)標注的需求也愈發(fā)細分化和專業(yè)化。2024年7月,張通團隊和廣州華銀康醫(yī)療集團股份有限公司在人工智能與數(shù)字經(jīng)濟廣東省實驗室(廣州)共建AI病理研究中心,著手研發(fā)人工智能病理大模型,讓人工智能模型能像專業(yè)醫(yī)生一樣看病問診。在其中的數(shù)據(jù)預(yù)處理環(huán)節(jié),中心特別聘請了3位資深的主任級醫(yī)師進行數(shù)據(jù)標注。

      “醫(yī)療、材料等專業(yè)領(lǐng)域,涉及到專業(yè)對象和術(shù)語結(jié)合的標注過程,只有專業(yè)從業(yè)人員才能勝任標注工作。而且,標注任務(wù)極其耗時、耗力、耗資源。整個標注工作并非一蹴而就,而是需要在實際應(yīng)用場景中優(yōu)化、持續(xù)迭代,促使模型智能化水平不斷升級。”張通說,當前我國數(shù)據(jù)標注行業(yè)人才缺口仍然較大,亟待培養(yǎng)復(fù)合型數(shù)據(jù)標注人才,這是我國數(shù)據(jù)標注產(chǎn)業(yè)高質(zhì)量發(fā)展必須跨過的“門檻”。

      《實施意見》對加強標注人才隊伍建設(shè)作出部署。以人才項目計劃和科技項目等為抓手,培育和引進高端專業(yè)人才;制(修)定人工智能訓(xùn)練、數(shù)據(jù)標注相關(guān)職業(yè)國家職業(yè)標準;支持數(shù)據(jù)標注領(lǐng)域職業(yè)資格與職業(yè)技能等級銜接互認……一項項舉措,將為數(shù)據(jù)標注產(chǎn)業(yè)高質(zhì)量發(fā)展提供支撐。

      完善的產(chǎn)業(yè)生態(tài)建設(shè)對數(shù)據(jù)標注行業(yè)發(fā)展同樣重要?!秾嵤┮庖姟诽岢?,暢通數(shù)據(jù)采集、標注、人工智能應(yīng)用產(chǎn)業(yè)鏈,推動數(shù)據(jù)標注產(chǎn)業(yè)上下游協(xié)同發(fā)展;支持數(shù)據(jù)標注龍頭企業(yè)和第三方機構(gòu)等建設(shè)數(shù)據(jù)標注開源平臺,助力中小企業(yè)發(fā)展;培育一批人力資源、供需對接、國際合作、法律審計等服務(wù)數(shù)據(jù)標注的第三方機構(gòu),完善數(shù)據(jù)標注產(chǎn)業(yè)生態(tài)。

      “未來數(shù)據(jù)標注行業(yè)的發(fā)展,也可考慮‘以人工智能促人工智能’的思路,即讓已經(jīng)完成學習的人工智能反哺數(shù)據(jù)標注工作,提高效率。這是值得深入探討且極具價值的研究方向。”張通認為,數(shù)據(jù)標注行業(yè)的發(fā)展有望加速推動數(shù)字經(jīng)濟與實體經(jīng)濟深度融合,加快形成新質(zhì)生產(chǎn)力。

      關(guān)鍵詞:

      熱門推薦

      欧美夫妻性生活网,免费一区二区三区久久,免费人成激情视频在线观看冫,欧美成人性色xxxx视频
    • <bdo id="0wauq"></bdo>
    • <tfoot id="0wauq"></tfoot>
      • <s id="0wauq"></s>
      • <sup id="0wauq"></sup>
      • <sup id="0wauq"></sup>
        主站蜘蛛池模板: 亚洲欧洲高清有无| 国产成人精品动图| 亚洲综合在线一区二区三区 | 清早可以吃西瓜吗| 秋葵视频在线观看在线下载| 欧美成人精品第一区二区三区| 成人午夜视频网站| 国产真实乱人视频| 亚洲视频在线观看地址| 久久久久久久久影院| 18禁无遮挡羞羞污污污污免费| 美女舒服好紧太爽了视频| 欧美人与牲动交a欧美精品| 女欢女爱第一季| 国产亚洲人成在线影院| 亚洲国产成人精品无码区在线观看 | 免费无码成人av在线播放不卡| 久久精品视频2| 香蕉久久夜色精品国产| 日本www.色| 吃奶呻吟打开双腿做受视频 | 99精品在线视频| 美女扒开胸罩摸双乳动图| 性欧美18一19sex性高清播放| 免费看黄视频app| 99精品国产在热久久| 欧美成人免费在线| 国产成人精品无码片区在线观看 | 特级毛片爽www免费版| 国产萌白酱在线观看| 免费看美女被靠到爽的视频| gta5圣堂酒店第三辆车在哪里| 污视频在线网站| 国产欧美日韩另类| 久久久老熟女一区二区三区| 四虎免费影院ww4164h| 欧美精品亚洲精品日韩专区va| 国产精品亚韩精品无码a在线| 久久精品人人爽人人爽| 黄色a级片网站| 成人精品视频一区二区三区尤物 |