国产黄色免费网站,人人干人人干人人干,免费大黄网站在线看,国产情侣一区二区三区,99精品国产福利免费一区二区,国产亚洲成归v人片在线观看,伊人88

2023信創(chuàng)獨(dú)角獸企業(yè)100強(qiáng)
全世界各行各業(yè)聯(lián)合起來(lái),internet一定要實(shí)現(xiàn)!

2020數(shù)據(jù)標(biāo)注公司排行

2020-04-08 eNet&Ciweek/2020數(shù)據(jù)標(biāo)注公司排行

2020數(shù)據(jù)標(biāo)注公司排行
排名簡(jiǎn)稱全稱
1Testin云測(cè)北京云測(cè)信息技術(shù)有限公司
2數(shù)據(jù)堂數(shù)據(jù)堂(北京)科技股份有限公司
3龍貓數(shù)據(jù)北京安捷智合科技有限公司
4星塵紀(jì)元北京星塵紀(jì)元智能科技有限公司
5文德數(shù)慧北京文德數(shù)慧科技發(fā)展有限責(zé)任公司
6倍賽BasicFinder北京深度搜索科技有限公司
7標(biāo)貝科技標(biāo)貝(北京)科技有限公司
8愛(ài)數(shù)智慧北京愛(ài)數(shù)智慧科技有限公司
9夢(mèng)動(dòng)科技貴州夢(mèng)動(dòng)科技有限公司
10曼孚科技杭州曼孚科技有限公司
11點(diǎn)我科技鄭州點(diǎn)我科技有限公司
12翊澳數(shù)據(jù)河南翊澳信息科技有限公司
13薈萃上海丁火智能科技有限公司
14智成長(zhǎng)宿州市智成長(zhǎng)科技有限公司
15笑貓科技天津笑貓科技有限公司
2020《互聯(lián)網(wǎng)周刊》&eNet研究院選擇排行
2020數(shù)據(jù)標(biāo)注眾包平臺(tái)排行
排名平臺(tái)企業(yè)
1京東眾智京東數(shù)字科技控股有限公司
2百度眾測(cè)百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司
3數(shù)據(jù)堂數(shù)據(jù)堂(北京)科技股份有限公司
4龍貓眾包北京安捷智合科技有限公司
5格物鈦格物鈦(上海)智能科技有限公司
6MBH莫比嗨客大連莫比嗨客智能科技有限公司
7有道眾包網(wǎng)易有道信息技術(shù)(北京)有限公司
8倍賽BasicFinder北京深度搜索科技有限公司
9淘金云四川淘金你我信息技術(shù)有限公司
10點(diǎn)我科技鄭州點(diǎn)我科技有限公司
2020《互聯(lián)網(wǎng)周刊》&eNet研究院選擇排行
人工智能燃料機(jī)

回想一下你的小時(shí)候,是如何學(xué)習(xí)認(rèn)識(shí)蘋(píng)果的?只需要有人拿一個(gè)蘋(píng)果在你面前展示一遍,告訴你這是蘋(píng)果,你就能舉一反三,認(rèn)識(shí)不同形態(tài),不同顏色的蘋(píng)果。這是人類特有的學(xué)習(xí)能力。

但是,如何教機(jī)器識(shí)別蘋(píng)果呢?我們要教它認(rèn)識(shí)一個(gè)蘋(píng)果,直接給它一張?zhí)O果的照片,它是完全不知道這是什么東西的。我們必須先給它學(xué)習(xí)大量蘋(píng)果的圖片,通過(guò)學(xué)習(xí)各種顏色、各種大小、各種形狀、各種成熟程度和各種光線明亮程度下的蘋(píng)果,掌握大量的圖片中的特征,這時(shí)候再給機(jī)器任意一張?zhí)O果的圖片,它才能認(rèn)出來(lái)這是蘋(píng)果。

人工智能在被投喂了大量數(shù)據(jù)之后,才能認(rèn)出三歲小孩子都能認(rèn)出的東西,學(xué)會(huì)“黑貓白貓都是貓”。

那么,這些供給機(jī)器學(xué)習(xí)的材料從哪里來(lái)呢?這就是我們今天要說(shuō)的一個(gè)因?yàn)槿斯ぶ悄茚绕鸲屡d的行業(yè)——數(shù)據(jù)標(biāo)注行業(yè)。所謂數(shù)據(jù)標(biāo)注,就是人工為圖片、音頻和語(yǔ)音內(nèi)容做標(biāo)記,打標(biāo)簽,把大量非結(jié)構(gòu)性數(shù)據(jù)加工成機(jī)器可以識(shí)別的數(shù)據(jù),標(biāo)注好的數(shù)據(jù)會(huì)被人工智能公司用來(lái)訓(xùn)練算法模型,然后運(yùn)用到圖像識(shí)別、語(yǔ)音識(shí)別、自動(dòng)駕駛等不同領(lǐng)域。

在整個(gè)人工智能體系中,算力、算法和數(shù)據(jù)是人工智能進(jìn)化的三大元素,分別承擔(dān)著人工智能基礎(chǔ)設(shè)施能力、工作指導(dǎo)方法和算法進(jìn)化依據(jù)的角色。這三大元素相輔相成,共同推動(dòng)人工智能的智慧化進(jìn)化水平。在人工智能運(yùn)行模式中,“數(shù)據(jù)”作為至關(guān)重要的參與元素,從本質(zhì)上決定了人工智能的進(jìn)化水平。因?yàn)橥ǔ?lái)說(shuō),數(shù)據(jù)標(biāo)注得越準(zhǔn)確,數(shù)量越多,模型效果越好,最后的產(chǎn)品效果就越好。換句話說(shuō),“數(shù)據(jù)”作為人工智能系統(tǒng)中的算法依據(jù),就是人工智能學(xué)習(xí)的教材,是人工智能的燃料機(jī)。

數(shù)據(jù)標(biāo)注的三種市場(chǎng)結(jié)構(gòu)

一個(gè)完整的數(shù)據(jù)標(biāo)注流程需要經(jīng)過(guò)任務(wù)分配、標(biāo)記程序設(shè)計(jì)、進(jìn)度跟蹤和質(zhì)量跟蹤等幾個(gè)環(huán)節(jié),環(huán)節(jié)中涉及到標(biāo)注員、審核員和管理員幾個(gè)角色,這些是任何一個(gè)數(shù)據(jù)標(biāo)注團(tuán)隊(duì)都具備的基本要素,不同的是組織工作的方式。

大多數(shù)AI實(shí)驗(yàn)室、初創(chuàng)型AI公司在發(fā)展初期,都需要大量的數(shù)據(jù)來(lái)訓(xùn)練模型,但如果雇傭大量的人力進(jìn)行數(shù)據(jù)標(biāo)注,就不得不面臨這樣的處境:一是管理方面的挑戰(zhàn),在研發(fā)產(chǎn)品的同時(shí)還要把大量精力放在管理標(biāo)注人員身上;二是成本的挑戰(zhàn),大量全職標(biāo)注人員的薪酬對(duì)于初創(chuàng)型公司和研究實(shí)驗(yàn)室都是一筆不小的支出。

于是,數(shù)據(jù)標(biāo)注公司隨著發(fā)展如火如荼的人工智能行業(yè)也發(fā)展起來(lái)。為了適應(yīng)人工智能公司對(duì)數(shù)據(jù)標(biāo)注不同程度的需求,當(dāng)前,我國(guó)數(shù)據(jù)標(biāo)注行業(yè)的市場(chǎng)結(jié)構(gòu)也分化為了幾種。

最開(kāi)始興起的是眾包結(jié)構(gòu),在眾包平臺(tái)上,一端對(duì)接需求公司,一端對(duì)接大量有空余時(shí)間的志愿者(兼職人員)。眾包結(jié)構(gòu)的優(yōu)點(diǎn)是可以組織社會(huì)上的大量兼職人員進(jìn)行標(biāo)注,節(jié)省公司的運(yùn)營(yíng)成本,但缺點(diǎn)也很明顯,就是眾多分散的兼職人員之間合力完成一個(gè)大型標(biāo)注任務(wù),他們的專業(yè)背景和工作能力參差不齊,溝通成本高昂,數(shù)據(jù)保密也相對(duì)困難,一旦需求公司要調(diào)整原有標(biāo)注需求,兼職人員流動(dòng)性大,無(wú)法給與需求公司靈活服務(wù)。意識(shí)到自身的缺點(diǎn),近年來(lái)一些眾包平臺(tái)也開(kāi)始對(duì)入駐的數(shù)據(jù)標(biāo)注團(tuán)隊(duì)進(jìn)行測(cè)評(píng),以及采取末尾淘汰等措施,提升平臺(tái)整體的競(jìng)爭(zhēng)能力。當(dāng)前,市場(chǎng)上典型的數(shù)據(jù)眾包平臺(tái)有京東眾智、百度眾測(cè)等。

另外一種就是工廠結(jié)構(gòu),即成立專門的數(shù)據(jù)標(biāo)注公司,有穩(wěn)定的標(biāo)注人員。相對(duì)于眾包結(jié)構(gòu),數(shù)據(jù)工廠的優(yōu)勢(shì)是標(biāo)注人員穩(wěn)定,需求方和數(shù)據(jù)標(biāo)注方能即時(shí)溝通,溝通成本降低,同時(shí),數(shù)據(jù)傳遞也有源可溯,降低了數(shù)據(jù)泄露的可能性。但工廠結(jié)構(gòu)的公司也有它的煩惱。現(xiàn)在市場(chǎng)上工廠結(jié)構(gòu)的數(shù)據(jù)公司兩極分化明顯,較大的長(zhǎng)期員工可以達(dá)到上千人;而較小的,只有幾個(gè)人,很多小團(tuán)隊(duì)還存在有項(xiàng)目時(shí)成立,沒(méi)項(xiàng)目時(shí)解散的現(xiàn)象。由于人工成本風(fēng)險(xiǎn)較高,兩極分化下的工廠結(jié)構(gòu)市場(chǎng)還衍生出了這樣的現(xiàn)象:大公司很少去對(duì)接短期且數(shù)據(jù)量較少的項(xiàng)目,小的公司可以承接這樣的項(xiàng)目但是有大批量數(shù)據(jù)任務(wù)到來(lái)時(shí),數(shù)據(jù)標(biāo)注能力又會(huì)顯得捉襟見(jiàn)肘。目前,市場(chǎng)上規(guī)模較大的專業(yè)的數(shù)據(jù)標(biāo)注公司有Testin云測(cè)、星塵紀(jì)元、夢(mèng)動(dòng)科技等。

也有一些將眾包和工廠結(jié)構(gòu)融合的企業(yè),能夠根據(jù)項(xiàng)目大小和數(shù)據(jù)保密要求靈活部署,例如數(shù)據(jù)堂和龍貓數(shù)據(jù),都有自己的標(biāo)團(tuán)隊(duì),同時(shí)也運(yùn)營(yíng)數(shù)據(jù)標(biāo)注眾包平臺(tái)。

這三種數(shù)據(jù)標(biāo)注的市場(chǎng)結(jié)構(gòu)都有各自的優(yōu)勢(shì)和局限性,結(jié)合眾包+工廠模式的第三種結(jié)構(gòu)是否會(huì)成為未來(lái)數(shù)據(jù)標(biāo)注行業(yè)的主流形式,還有待實(shí)踐的檢驗(yàn)。因?yàn)槌耸袌?chǎng)結(jié)構(gòu),準(zhǔn)確率和靈活性在數(shù)據(jù)標(biāo)注中的重要性正在變得越發(fā)突出。

準(zhǔn)確率是核心競(jìng)爭(zhēng)力

無(wú)論是工廠、眾包還是將兩者結(jié)合的市場(chǎng)結(jié)構(gòu),都是在成本、準(zhǔn)確率和靈活性上做選擇,隨著越來(lái)越多數(shù)據(jù)喂養(yǎng)給了人工智能算法,人工智能公司必須想辦法積累更多更準(zhǔn)確、符合自身應(yīng)用的數(shù)據(jù)。某種程度上來(lái)說(shuō),高質(zhì)量的標(biāo)注數(shù)據(jù),決定了人工智能公司的競(jìng)爭(zhēng)力。

隨著AI應(yīng)用的加速落地,壓低報(bào)價(jià)和提交更多的數(shù)據(jù)標(biāo)注結(jié)果顯得不再那么重要,準(zhǔn)確率成為脫穎而出的命脈。在大型人工智能公司面前,數(shù)據(jù)標(biāo)注企業(yè)的準(zhǔn)確率提升一個(gè)百分點(diǎn),競(jìng)爭(zhēng)力將躍遷幾個(gè)層級(jí)。

任何一個(gè)行業(yè),在經(jīng)歷了早期的瘋狂生長(zhǎng)后,最終一定會(huì)經(jīng)歷一番洗牌,變得更為規(guī)范化、透明化。屆時(shí)質(zhì)量會(huì)取代成本,成為需求方最優(yōu)先考慮的變量。

當(dāng)AI完成初級(jí)識(shí)別,要進(jìn)行深度學(xué)習(xí)訓(xùn)練后,甲方的人工智能公司對(duì)數(shù)據(jù)質(zhì)量和效率的要求將超越對(duì)成本的顧慮。往金字塔的高層發(fā)展,這個(gè)行業(yè)的缺口仍然非常巨大。

大浪淘沙,不妨大膽預(yù)測(cè),數(shù)據(jù)標(biāo)注行業(yè)有兩類機(jī)構(gòu)最終會(huì)發(fā)展較好:一是注重質(zhì)量及服務(wù)的中小型數(shù)據(jù)標(biāo)注公司,二是自有整套數(shù)據(jù)技術(shù),能依靠人工智能增加準(zhǔn)確率的平臺(tái)。

人工智能背后的“人工”

形形色色的數(shù)據(jù)標(biāo)注公司、眾包平臺(tái)之下,不能忽視的是數(shù)據(jù)標(biāo)注員。

盡管對(duì)數(shù)據(jù)標(biāo)注的要求越來(lái)越高、越來(lái)越精準(zhǔn)是大勢(shì)所趨,但是,一個(gè)不容忽視的事實(shí)是,數(shù)據(jù)標(biāo)注行業(yè)現(xiàn)在還是勞動(dòng)密集型產(chǎn)業(yè)。

重復(fù)的拉框、標(biāo)點(diǎn),一個(gè)個(gè)數(shù)據(jù)標(biāo)注員通過(guò)大量重復(fù)勞動(dòng)為AI輸送了幾十億甚至幾百億的喂養(yǎng)數(shù)據(jù),這些數(shù)據(jù)標(biāo)注員有一個(gè)被圈內(nèi)人默認(rèn)的外號(hào):AI民工。

在中國(guó)廣袤的三四線城市、鄉(xiāng)鎮(zhèn),無(wú)數(shù)年輕人正成為“數(shù)據(jù)貼標(biāo)人”,他們每天坐在電腦前工作8小時(shí)以上,為AI公司的算法提供和處理大量數(shù)據(jù)。他們中的大多數(shù)人教育水平不高,重復(fù)的機(jī)械勞動(dòng)為他們帶來(lái)了微薄的工資,全然不知自己正在參與“價(jià)值上億”的項(xiàng)目。

他們是“人工智能背后的人工”。當(dāng)前,人工智能行業(yè)依賴于大量的這種廉價(jià)的人工,因?yàn)樗惴ê汀皺C(jī)器學(xué)習(xí)”在很多情況下都是由真人訓(xùn)練。

這些類似富士康工廠的流水線工人,卻有著自己的夢(mèng)想故事。從大眾的視角,他們是被忽視的一群人;在大眾關(guān)注不到的地方,數(shù)據(jù)標(biāo)注公司不僅僅是為人工智能賦能,也在賦能“人工”。

貴州夢(mèng)動(dòng)科技有限公司是少有的產(chǎn)教融合的數(shù)據(jù)標(biāo)注公司。公司緊鄰著一家扶貧高職“盛華職業(yè)學(xué)院”,此處的學(xué)生大多來(lái)自貧困山區(qū),該公司近一半的數(shù)據(jù)標(biāo)注員也來(lái)自與此。公司的一些工作人員,同時(shí)兼任著學(xué)校的老師。學(xué)校的學(xué)生在公司實(shí)習(xí),賺來(lái)的錢不僅足夠生活,有時(shí)還能拿出一些補(bǔ)貼家用。這份數(shù)據(jù)標(biāo)注的工作幫助他們改變了自己和家庭的命運(yùn),有時(shí),一些優(yōu)秀的學(xué)生還能成為人工智能公司的專業(yè)標(biāo)注員,完成職業(yè)升級(jí)。

同樣賦能“人工”的還有京東眾智。京東眾智上有一千多名聾啞人數(shù)據(jù)標(biāo)注員,京東為他們成立專門的“靜公會(huì)”,項(xiàng)目上優(yōu)先照顧。

這些曾經(jīng)在社會(huì)上的邊緣人物,終于在“數(shù)據(jù)標(biāo)注”領(lǐng)域成了“有用的人”。一位京東眾智平臺(tái)的培訓(xùn)講師說(shuō):“想當(dāng)把英雄,承擔(dān)更多的責(zé)任。”聾啞人培訓(xùn)相對(duì)來(lái)說(shuō)會(huì)費(fèi)勁些,但是他們的優(yōu)點(diǎn)是專注、認(rèn)真、對(duì)視覺(jué)信號(hào)敏銳,數(shù)據(jù)標(biāo)注行業(yè)對(duì)他們來(lái)說(shuō)是機(jī)會(huì)。

事實(shí)上,除了數(shù)據(jù)標(biāo)注員的職業(yè)升級(jí)野望,數(shù)據(jù)標(biāo)注行業(yè)還承載著很多創(chuàng)業(yè)者的人工智能夢(mèng)。

一位小型數(shù)據(jù)標(biāo)注公司創(chuàng)始人曾說(shuō):“雖然標(biāo)注是相當(dāng)?shù)图?jí)別的工作,但進(jìn)入門檻相對(duì)較低,而且仍屬于人工智能行業(yè)?!彼f(shuō),“所以我們認(rèn)為,如果我們可以從這里開(kāi)始,也有可能慢慢地、一步一步地走向更高價(jià)值的領(lǐng)域?!?/p>

機(jī)器會(huì)代替人類嗎?

數(shù)據(jù)標(biāo)注員也有一些擔(dān)憂,他們的工作是幫機(jī)器更好的學(xué)習(xí),促進(jìn)人工智能行業(yè)的發(fā)展,而當(dāng)行業(yè)發(fā)展到一定階段,那還需要人工嗎?數(shù)據(jù)標(biāo)注員所做的工作就是在加速自己失去這份工作。

開(kāi)發(fā)一款能夠?qū)崿F(xiàn)自動(dòng)化數(shù)據(jù)標(biāo)注的工具,既是在解放人力,又是行業(yè)發(fā)展的必然結(jié)果。一旦智能化的數(shù)據(jù)標(biāo)注工具能夠替代人工,即使是能部分替代,數(shù)據(jù)量和質(zhì)量都會(huì)快速提升,進(jìn)而推動(dòng)算法成熟得更快。而市場(chǎng)上已有企業(yè)在開(kāi)發(fā)自動(dòng)化數(shù)據(jù)標(biāo)注工具,嘗試用AI取代“AI民工”。

機(jī)器會(huì)代替人類嗎?或許,馬云先生在2018世界人工智能大會(huì)上所說(shuō)的話,至今仍有啟發(fā)意義:“蒸汽機(jī)釋放了人的體力,但是蒸汽機(jī)并不是模仿人的體力,汽車比人跑得快,但是汽車并不是模仿人的雙腿。未來(lái)的計(jì)算會(huì)釋放人的腦力,但是計(jì)算機(jī)不是按照人腦一樣去思考,機(jī)器必須要有自己的方式去思考?!?/p>

讓計(jì)算機(jī)擁有自己的思考方式,是一個(gè)復(fù)雜的過(guò)程,在這個(gè)復(fù)雜的架構(gòu)中,數(shù)據(jù)標(biāo)注是滋養(yǎng)這個(gè)系統(tǒng)運(yùn)轉(zhuǎn)的燃料,通過(guò)不斷升級(jí)改變的標(biāo)注內(nèi)容來(lái)適應(yīng)不斷強(qiáng)大的人工智能。

汽車的出現(xiàn),讓馬夫失業(yè)了,但是馬夫并沒(méi)有活不下去,而是去做更高級(jí)的工作,比如司機(jī)、汽修人員。19世紀(jì)紡織業(yè)突飛猛進(jìn)發(fā)展,一些任務(wù)變得自動(dòng)化,大量紡織工人下崗,但機(jī)器降低了制作衣服的成本,人們對(duì)布料的需求也在增長(zhǎng)。服裝需求的增長(zhǎng)又帶來(lái)了新的就業(yè)機(jī)會(huì),工廠不得不雇傭新一代的工人,學(xué)習(xí)操作復(fù)雜的機(jī)械。

當(dāng)一些需求被滿足時(shí),又會(huì)產(chǎn)生新的需求。新技術(shù)、新科技,從來(lái)都不是人類的限制,而是人類一種認(rèn)識(shí)和思考世界的方式,我們借助新技術(shù)為自己的未來(lái)確定一種生活方式。

結(jié)語(yǔ)

在探討數(shù)據(jù)標(biāo)注這個(gè)行業(yè)存在的合理性與是否能長(zhǎng)久發(fā)展之前,能帶給從業(yè)者的改變和對(duì)人工智能的推動(dòng)就已足夠振奮人心。

現(xiàn)在就已經(jīng)很有意義,未來(lái)會(huì)更有意義。

相關(guān)頻道: eNews 排行

您對(duì)本文或本站有任何意見(jiàn),請(qǐng)?jiān)谙路教峤?,謝謝!

投稿信箱:tougao@enet16.com