摘要:2018年,中國(guó)的數(shù)據(jù)量為7.6ZB,占全球總量的23.4%,預(yù)計(jì)到2025年將增至48.6ZB,占全球總量的27.8%,年復(fù)合增長(zhǎng)率達(dá)30.35%。
中國(guó)經(jīng)濟(jì)導(dǎo)報(bào)、中國(guó)戰(zhàn)略新興產(chǎn)業(yè)雜志、中國(guó)發(fā)展網(wǎng)記者 杜壯
目前人工智能市場(chǎng)發(fā)展依然火熱,各行各業(yè)對(duì)數(shù)據(jù)的需求也呈現(xiàn)井噴態(tài)勢(shì)。然而現(xiàn)在很多企業(yè)的大部分非結(jié)構(gòu)化數(shù)據(jù)無(wú)法用于AI(人工智能)模型訓(xùn)練,需要大量的人工進(jìn)行標(biāo)簽化處理。人工智能企業(yè)要想在數(shù)據(jù)標(biāo)注上降本增效,必須選擇更加高效、體驗(yàn)更好的標(biāo)注工具,從而提升標(biāo)注團(tuán)隊(duì)的工作效率。
在2021年中國(guó)國(guó)際服務(wù)貿(mào)易交易會(huì)期間,云測(cè)數(shù)據(jù)發(fā)布了“云測(cè)數(shù)據(jù)標(biāo)注平臺(tái)-AI數(shù)據(jù)集管理系統(tǒng)”,專注于AI數(shù)據(jù)集的上傳、管理、存儲(chǔ)、分享,數(shù)據(jù)類型標(biāo)簽化管理,同時(shí)支持標(biāo)注結(jié)果的存儲(chǔ)、標(biāo)注結(jié)果可視化等功能,從而助力企業(yè)進(jìn)行數(shù)據(jù)管理,提升數(shù)據(jù)訓(xùn)練的匹配度。作為AI訓(xùn)練數(shù)據(jù)頭部服務(wù)商,云測(cè)數(shù)據(jù)總經(jīng)理賈宇航接受記者專訪時(shí)表示,只有把海量的訓(xùn)練數(shù)據(jù)進(jìn)行有效管理,才能減少冗余數(shù)據(jù)、最大化地發(fā)揮訓(xùn)練數(shù)據(jù)的價(jià)值,從而推動(dòng)數(shù)據(jù)要素有序發(fā)展及高效利用。
數(shù)據(jù)服務(wù)成為人工智能商業(yè)化落地的基石
在人工智能產(chǎn)業(yè)鏈中,算法、算力和數(shù)據(jù)共同構(gòu)成技術(shù)發(fā)展的三大核心要素。從人工智能產(chǎn)業(yè)鏈的發(fā)展情況和未來(lái)發(fā)展趨勢(shì)來(lái)看,中國(guó)人工智能數(shù)據(jù)服務(wù)行業(yè)的市場(chǎng)規(guī)模正在逐步擴(kuò)大。
據(jù)IDC預(yù)測(cè),中國(guó)的數(shù)據(jù)量增速最快,平均每年的增長(zhǎng)速度比全球快3%。2018年,中國(guó)的數(shù)據(jù)量為7.6ZB,占全球總量的23.4%,預(yù)計(jì)到2025年將增至48.6ZB,占全球總量的27.8%,年復(fù)合增長(zhǎng)率達(dá)30.35%。在這樣的數(shù)據(jù)增長(zhǎng)背景下,數(shù)據(jù)資產(chǎn)管理的重要性不言而喻。
如今各行各業(yè)紛紛搭乘數(shù)字化轉(zhuǎn)型的快車(chē),以取得市場(chǎng)競(jìng)爭(zhēng)力。值得注意的是,在企業(yè)紛紛投來(lái)數(shù)字化轉(zhuǎn)型意向的同時(shí),部分中小企業(yè)也面臨著“不會(huì)轉(zhuǎn)、不能轉(zhuǎn)、不敢轉(zhuǎn)”的現(xiàn)狀。相關(guān)數(shù)據(jù)顯示,目前我國(guó)僅有25%的企業(yè)開(kāi)展了數(shù)字化轉(zhuǎn)型,中小企業(yè)比例則更小。
賈宇航認(rèn)為,數(shù)字化轉(zhuǎn)型的本質(zhì),是利用軟件技術(shù)、互聯(lián)網(wǎng)、人工智能等數(shù)字手段,降低企業(yè)運(yùn)營(yíng)成本,提升生產(chǎn)運(yùn)營(yíng)效率,為對(duì)外開(kāi)源拓客創(chuàng)造更多價(jià)值的過(guò)程。也正因?yàn)槿绱?#xff0c;企業(yè)的數(shù)字化轉(zhuǎn)型必然離不開(kāi)應(yīng)用、軟件、系統(tǒng)等信息基礎(chǔ)設(shè)施的建設(shè)與運(yùn)用,這背后必然產(chǎn)生大量的數(shù)據(jù)。
“越來(lái)越多的人工智能企業(yè)意識(shí)到,高質(zhì)量的訓(xùn)練數(shù)據(jù)越多,意味著AI落地應(yīng)用效果越精準(zhǔn),但并不意味著所產(chǎn)生的價(jià)值越大?!辟Z宇航說(shuō),“人工智能落地商業(yè)化時(shí)代,企業(yè)面臨著自身AI數(shù)據(jù)量大,對(duì)某個(gè)特殊問(wèn)題場(chǎng)景很難找到有價(jià)值A(chǔ)I數(shù)據(jù)的普遍困境。同時(shí)在人工智能數(shù)據(jù)訓(xùn)練過(guò)程中,AI數(shù)據(jù)管理更是面臨著數(shù)據(jù)資產(chǎn)不能充分利用、管理方式不完善等新的挑戰(zhàn)。”
在賈宇航看來(lái),AI數(shù)據(jù)服務(wù)在企業(yè)整個(gè)數(shù)字化轉(zhuǎn)型的過(guò)程中扮演了一個(gè)基石、底座的角色。“幫助算法提升精度必不可少的就是訓(xùn)練數(shù)據(jù),雖然訓(xùn)練數(shù)據(jù)并不被消費(fèi)者很快注意到,但一些很酷的人工智能產(chǎn)品,諸如自動(dòng)駕駛的汽車(chē),都離不開(kāi)算法,而算法又離不開(kāi)對(duì)應(yīng)的高精度的訓(xùn)練數(shù)據(jù)?!?/p>
AI數(shù)據(jù)集管理系統(tǒng)讓企業(yè)實(shí)現(xiàn)數(shù)據(jù)的“拎包入住”
數(shù)據(jù)服務(wù)痛點(diǎn)的存在也預(yù)示著行業(yè)迎來(lái)新的機(jī)會(huì)。
此次發(fā)布的云測(cè)數(shù)據(jù)標(biāo)注平臺(tái)-AI數(shù)據(jù)集管理系統(tǒng)是業(yè)內(nèi)首個(gè)專注于AI數(shù)據(jù)集的管理系統(tǒng),是云測(cè)數(shù)據(jù)基于人工智能行業(yè)前瞻性發(fā)展的具象化技術(shù)產(chǎn)品體現(xiàn)。賈宇航介紹,其可幫助企業(yè)系統(tǒng)的解決數(shù)據(jù)儲(chǔ)存、數(shù)據(jù)檢索、數(shù)據(jù)資產(chǎn)權(quán)限管理、標(biāo)簽結(jié)果可視化等的數(shù)據(jù)資產(chǎn)管理問(wèn)題。
“人工智能的訓(xùn)練數(shù)據(jù)可以被看作是一本教材,讓算法更精準(zhǔn)。實(shí)際上,人工智能算法,從原來(lái)的瀑布式開(kāi)發(fā)正在向敏捷開(kāi)發(fā)發(fā)展。瀑布式開(kāi)發(fā)對(duì)整個(gè)數(shù)據(jù)的投入是異步的,打個(gè)比方,按項(xiàng)目的方式搜集數(shù)據(jù)優(yōu)化算法,項(xiàng)目一完成后,這些數(shù)據(jù)就沒(méi)有用了,到項(xiàng)目二的時(shí)候,還需要重新獲取數(shù)據(jù)、重新標(biāo)注、重新訓(xùn)練。但是當(dāng)算法朝著更深的領(lǐng)域發(fā)展時(shí),數(shù)據(jù)需要持續(xù)地滾動(dòng)和迭代,這需要一個(gè)系統(tǒng)能夠面向AI算法的敏捷開(kāi)發(fā)進(jìn)行設(shè)置。”賈宇航對(duì)記者說(shuō)。
“企業(yè)在使用系統(tǒng)的過(guò)程中會(huì)有一個(gè)‘拎包入住’的體驗(yàn)?!辟Z宇航告訴記者,這次推出的平臺(tái)將AI數(shù)據(jù)服務(wù)的流程具象化,變成了一個(gè)產(chǎn)品。原來(lái)用于管理云測(cè)數(shù)據(jù)內(nèi)部的服務(wù)流程,如今可以擴(kuò)展到AI相關(guān)企業(yè)中應(yīng)用。再結(jié)合云測(cè)數(shù)據(jù)標(biāo)注平臺(tái),客戶可以一站式、流程化進(jìn)行數(shù)據(jù)采集、數(shù)據(jù)標(biāo)注、數(shù)據(jù)管理。
賈宇航向記者介紹,自主研發(fā)的云測(cè)數(shù)據(jù)標(biāo)注平臺(tái)為AI相關(guān)企業(yè)提供了一站式、大規(guī)模處理訓(xùn)練數(shù)據(jù)的能力,可助力AI數(shù)據(jù)訓(xùn)練綜合效率提升200%、標(biāo)注精準(zhǔn)度最高可達(dá)99.99%。
積極拓展數(shù)據(jù)管理市場(chǎng)應(yīng)用的深度和廣度
隨著人工智能深入自動(dòng)駕駛、智慧醫(yī)療、智慧教育等諸多行業(yè)領(lǐng)域,AI算法對(duì)訓(xùn)練數(shù)據(jù)維度和樣本復(fù)雜性的要求變得越來(lái)越高,對(duì)數(shù)據(jù)標(biāo)注技術(shù)、標(biāo)注平臺(tái)能力、不同維度數(shù)據(jù)協(xié)同標(biāo)注等都提出了挑戰(zhàn)。
“作為AI技術(shù)的三大要素之一,數(shù)據(jù)從本質(zhì)上決定了人工智能的落地水平。通常來(lái)講,數(shù)據(jù)標(biāo)注得越精準(zhǔn),數(shù)據(jù)量越大,模型就越好,最后的AI產(chǎn)品效果也就越好。”對(duì)于未來(lái),賈宇航充滿了信心。他告訴記者,伴隨著國(guó)家多項(xiàng)政策的出臺(tái),AI訓(xùn)練數(shù)據(jù)增速會(huì)很快,并且有一個(gè)很好的市場(chǎng)前景。
在人工智能的大潮中保持技術(shù)和行業(yè)的領(lǐng)先性并非易事。賈宇航也道出了他們發(fā)展的秘密,那就是“一橫一縱”戰(zhàn)略。
談到“一橫”,賈宇航向記者解釋道:“伴隨著整個(gè)人工智能的發(fā)展,我們?cè)谧詣?dòng)駕駛、智能家居、智慧城市和智慧金融等多個(gè)行業(yè),有端到端的訓(xùn)練數(shù)據(jù)服務(wù)解決方案。隨著越來(lái)越多的行業(yè)進(jìn)行智能化、數(shù)字化轉(zhuǎn)型,我們將積極地為這些具有潛力的賽道和行業(yè),去制定數(shù)據(jù)解決方案,幫助更多的人工智能技術(shù)商業(yè)化落地?!?/p>
“‘一縱’更多地是對(duì)熱門(mén)行業(yè)和技術(shù)發(fā)展趨勢(shì)進(jìn)行前瞻性預(yù)測(cè),提前準(zhǔn)備相關(guān)的工具鏈以及數(shù)據(jù)服務(wù)能力,確保有充足的準(zhǔn)備去應(yīng)對(duì)新的AI數(shù)據(jù)需求。”賈宇航說(shuō)。
“人工智能被列入新基建中的新技術(shù)基礎(chǔ)設(shè)施,將會(huì)有更多的資本或者政策關(guān)注,而人工智能三要素之一的數(shù)據(jù),勢(shì)必會(huì)伴隨著人工智能行業(yè)的增長(zhǎng)而增長(zhǎng)。”賈宇航對(duì)記者說(shuō)。
相關(guān)稿件