国产黄色免费网站,人人干人人干人人干,免费大黄网站在线看,国产情侣一区二区三区,99精品国产福利免费一区二区,国产亚洲成归v人片在线观看,伊人88

2023信創(chuàng)獨(dú)角獸企業(yè)100強(qiáng)
全世界各行各業(yè)聯(lián)合起來(lái),internet一定要實(shí)現(xiàn)!

中國(guó)的自然語(yǔ)言處理領(lǐng)域的人工智能公司

2018-08-17 eNet&Ciweek/軒中


自然語(yǔ)言處理領(lǐng)域的代表性公司
排名企業(yè)綜述
1微軟亞洲研究院近些年在人工智能領(lǐng)域,尤其是自然語(yǔ)義理解、計(jì)算機(jī)視覺(jué)等方面取得了不菲的成績(jī)。它是人工智能領(lǐng)域的“黃浦軍?!?/td>
2搜狗利用數(shù)據(jù)挖掘、自然語(yǔ)言處理技術(shù)實(shí)現(xiàn)搜狗輸入法
3科大訊飛一家專(zhuān)業(yè)從事智能語(yǔ)音及語(yǔ)音技術(shù)研究、軟件及芯片產(chǎn)品開(kāi)發(fā)、語(yǔ)音信息服務(wù)的國(guó)家級(jí)骨干軟件企業(yè)
4騰訊2017年在西雅圖成立人工智能實(shí)驗(yàn)室,其人工智能實(shí)驗(yàn)室副主任俞棟博士是前微軟研究院語(yǔ)音識(shí)別專(zhuān)家
5華為2016年在香港成立諾亞方舟人工智能實(shí)驗(yàn)室,該實(shí)驗(yàn)室有一個(gè)部門(mén)專(zhuān)注于以無(wú)縫的方式和自然語(yǔ)言讓機(jī)器與人溝通
6阿里巴巴2018年,阿里巴巴達(dá)摩院機(jī)器智能實(shí)驗(yàn)室開(kāi)源了新一代語(yǔ)音識(shí)別模型DFSMN,將全球語(yǔ)音識(shí)別準(zhǔn)確率紀(jì)錄提高至96.04%
7云知聲語(yǔ)音識(shí)別領(lǐng)域的初創(chuàng)公司,在平臺(tái)及行業(yè)領(lǐng)域,云知聲已經(jīng)與科大訊飛構(gòu)成了直接競(jìng)爭(zhēng)
8思必馳思必馳對(duì)話工場(chǎng)是提供語(yǔ)音識(shí)別、語(yǔ)音合成、語(yǔ)義理解、智能對(duì)話以及聲紋識(shí)別服務(wù)的開(kāi)放平臺(tái)
9出門(mén)問(wèn)問(wèn)出門(mén)問(wèn)問(wèn)語(yǔ)音助手APP是一款基于語(yǔ)音識(shí)別、語(yǔ)義理解技術(shù),面向移動(dòng)搜索領(lǐng)域的智能手機(jī)應(yīng)用。用戶只需通過(guò)語(yǔ)音用口語(yǔ)化的提問(wèn)方式就可以搜索出有關(guān)于吃穿住行的服務(wù)。
10達(dá)觀數(shù)據(jù)國(guó)內(nèi)唯一一家將自動(dòng)語(yǔ)義分析技術(shù)應(yīng)用于企業(yè)數(shù)據(jù)化運(yùn)營(yíng)的人工智能公司。
11北京紫平方公司擁有自主研發(fā)的專(zhuān)業(yè)級(jí)人工智能深度學(xué)習(xí)平臺(tái),在自然語(yǔ)言(NLP)處理領(lǐng)域處于業(yè)界領(lǐng)先水平
12追一科技主攻深度學(xué)習(xí)和自然語(yǔ)言處理,通過(guò)將人工智能與企業(yè)場(chǎng)景深度結(jié)合,幫助企業(yè)構(gòu)建人企交互智能化解決方案。
13玻森數(shù)據(jù)一家中文自然語(yǔ)言分析云服務(wù)提供商,旗下有中文語(yǔ)義開(kāi)放平臺(tái) BosonNLP等
14武漢烽火普天專(zhuān)注于互聯(lián)網(wǎng)大數(shù)據(jù)語(yǔ)義分析云服務(wù)的公司
15北京嘿哈科技全球第一家將最先進(jìn)的體感技術(shù)、語(yǔ)音識(shí)別技術(shù)等運(yùn)用在幼兒教育領(lǐng)域的教育軟件開(kāi)發(fā)公司
16拓爾斯基于大數(shù)據(jù)、云服務(wù)和人工智能技術(shù),推出網(wǎng)絡(luò)輿情分析平臺(tái)
17智言科技一家專(zhuān)注于深度學(xué)習(xí)和文本語(yǔ)義理解技術(shù)突破的人工智能公司
18明略數(shù)據(jù)一直深入大數(shù)據(jù)挖掘,致力于用領(lǐng)先科技成就客戶價(jià)值,從大數(shù)據(jù)到人工智能都有很深的技術(shù)積累
19今日頭條通過(guò)自然語(yǔ)言處理技術(shù),對(duì)分發(fā)的內(nèi)容進(jìn)行分類(lèi)、篩選
20蘇州馳聲信息由國(guó)內(nèi)知名的語(yǔ)音技術(shù)提供商思必馳原口語(yǔ)教育事業(yè)部于2014年6月1日剝離成立的公司
2018《互聯(lián)網(wǎng)周刊》&eNet研究院選擇排行

龍泉寺以前并不太出名,它坐落在北京西山鳳凰嶺山腳下,始建于遼朝應(yīng)歷初年。
寺廟山門(mén)前有兩棵遒勁的翠柏拔地而起,據(jù)說(shuō)已經(jīng)有600多歲,走進(jìn)寺內(nèi),可以看到粗壯挺拔的古銀杏樹(shù),據(jù)說(shuō)也已經(jīng)1000多歲。


這里隱居著一批世外高人,他們發(fā)明了一個(gè)會(huì)說(shuō)話的機(jī)器僧人“賢二”。


如果你問(wèn)賢二:“賢二,我心情不好怎么辦呢?”


賢二可能會(huì)說(shuō):“試著讀一些好書(shū)吧?!?/p>


賢二是全球首個(gè)人工智能“出家人”。身高60厘米,穿著黃色僧袍,特長(zhǎng)是誦經(jīng)、對(duì)話,甚至還會(huì)唱歌,尤其難能可貴的是他還會(huì)賣(mài)萌。


賢二為什么能與人對(duì)話呢?原來(lái),它應(yīng)用了最新的人工智能自然語(yǔ)言處理技術(shù)。

什么是自然語(yǔ)言處理?

正如哥德巴赫猜想是數(shù)論皇冠上的明珠,微軟創(chuàng)始人比爾·蓋茨曾經(jīng)如是說(shuō),“自然語(yǔ)言理解是人工智能領(lǐng)域皇冠上的明珠”。


比爾·蓋茨所說(shuō)的自然語(yǔ)言理解是自然語(yǔ)言處理的一個(gè)重要組成部分。自然語(yǔ)言處理的英文是Natural Language Processing,一般被簡(jiǎn)寫(xiě)為NLP,它實(shí)際上包括了三個(gè)方面:語(yǔ)音識(shí)別、自然語(yǔ)言理解與語(yǔ)音合成(有一些人把語(yǔ)音識(shí)別作為自然語(yǔ)言處理之外的技術(shù),在本文中,我們將語(yǔ)音識(shí)別也包含在自然語(yǔ)言處理的技術(shù)范疇之內(nèi))。


霍金不會(huì)說(shuō)話,但英特爾公司給他定制的電腦輪椅可以幫他說(shuō)話,這背后所利用的技術(shù)就是語(yǔ)音合成技術(shù)。語(yǔ)音合成技術(shù)可以把文本信息轉(zhuǎn)化為語(yǔ)音信息。當(dāng)然了,霍金的電腦輪椅設(shè)備是沒(méi)有人工智能的(也就是說(shuō)語(yǔ)音合成并不一定是人工智能,關(guān)鍵還是要看機(jī)器背后的算法)。


科學(xué)家們已經(jīng)可以讓電腦像人那樣自主說(shuō)話,這個(gè)時(shí)候電腦就具有人工智能的語(yǔ)音合成。比如微軟小冰,比如 “賢二”機(jī)器人和尚,這些會(huì)說(shuō)話的機(jī)器人都具有人工智能。
前面已經(jīng)說(shuō)過(guò),自然語(yǔ)言處理包括了三個(gè)方面:語(yǔ)音識(shí)別、自然語(yǔ)言理解與語(yǔ)音合成。這三方面分別解決了三個(gè)問(wèn)題:聽(tīng)清楚別人在說(shuō)什么,理解別人說(shuō)的意思,根據(jù)聽(tīng)到的與理解到的對(duì)話內(nèi)容回答別人的問(wèn)題。


自然語(yǔ)言處理是工業(yè)界與學(xué)術(shù)界都關(guān)注的人工智能領(lǐng)域,這一領(lǐng)域的突破性發(fā)展與深度學(xué)習(xí)算法的成熟有直接的關(guān)系。加拿大多倫多大學(xué)的辛頓是深度學(xué)習(xí)的先驅(qū),他和學(xué)生于2006年發(fā)表在《科學(xué)》上的文章提出了降維與逐層預(yù)訓(xùn)練的方法,這使得深度學(xué)習(xí)成為可能。2009年,微軟亞洲研究院的鄧力小組開(kāi)始與辛頓合作,用深度學(xué)習(xí)加上隱馬爾科夫鏈模型開(kāi)發(fā)了實(shí)用的語(yǔ)音識(shí)別與同聲翻譯系統(tǒng)。


從學(xué)術(shù)界來(lái)說(shuō),中國(guó)大陸地區(qū)除了微軟亞洲研究院,還有哪些研究機(jī)構(gòu)設(shè)置了自然語(yǔ)言處理的實(shí)驗(yàn)室呢?據(jù)《互聯(lián)網(wǎng)周刊》了解,清華大學(xué)自然語(yǔ)言處理與社會(huì)人文計(jì)算實(shí)驗(yàn)室、北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)研究所語(yǔ)言計(jì)算與互聯(lián)網(wǎng)挖掘研究室、哈工大機(jī)器智能技術(shù)與自然語(yǔ)言處理實(shí)驗(yàn)室、中科院自動(dòng)化研究所語(yǔ)音語(yǔ)言技術(shù)研究組、南京大學(xué)自然語(yǔ)言處理研究組、復(fù)旦大學(xué)自然語(yǔ)言處理研究組等都對(duì)自然語(yǔ)言處理有深入的研究。


一般來(lái)講,自然語(yǔ)言處理的步驟主要分為6步:1、獲取原始文本;2、對(duì)文本進(jìn)行預(yù)處理; 3、分詞:將文章按詞組分開(kāi);4、詞法分析:對(duì)名詞、動(dòng)詞、形容詞、副詞、介詞進(jìn)行定性; 5、語(yǔ)法分析:分析主語(yǔ)、謂語(yǔ)、賓語(yǔ)、定語(yǔ)、狀語(yǔ)、補(bǔ)語(yǔ)等句子元素;6、語(yǔ)義分析:將句子的正確含義表達(dá)出來(lái)。

自然語(yǔ)言處理的發(fā)展歷史

20世紀(jì)的80年代,自然語(yǔ)言處理的語(yǔ)音識(shí)別方面開(kāi)始取得了突破性的進(jìn)展,當(dāng)時(shí)以李開(kāi)復(fù)為代表的人工智能科學(xué)家摒棄了符號(hào)主義學(xué)派的方法,選擇用統(tǒng)計(jì)模型來(lái)破解語(yǔ)音識(shí)別的難題,將語(yǔ)音識(shí)別的準(zhǔn)確率提高到了一個(gè)全新的高度。但當(dāng)時(shí)這個(gè)方法離真正的實(shí)用化還是有很遠(yuǎn)的距離。因此,在當(dāng)時(shí)并沒(méi)有誕生出擅長(zhǎng)對(duì)話的機(jī)器人。


于是,科學(xué)家開(kāi)始發(fā)展新的自然語(yǔ)言處理的算法。這里面包括Word2vec、CRF、LDA,LSA、SVD等。
2010年以后,一種更加有效的人工智能算法——深度神經(jīng)網(wǎng)絡(luò)重新打造了語(yǔ)音識(shí)別的算法框架。在這個(gè)過(guò)程中,以科大訊飛為代表的語(yǔ)音識(shí)別公司開(kāi)始崛起,其開(kāi)發(fā)的語(yǔ)音識(shí)別產(chǎn)品已經(jīng)開(kāi)始進(jìn)入實(shí)用化的階段。


2013年,谷歌的語(yǔ)音識(shí)別系統(tǒng)對(duì)英語(yǔ)單詞的識(shí)別錯(cuò)誤率已經(jīng)下降到23%左右。到了2015年,谷歌的語(yǔ)音識(shí)別系統(tǒng)再次刷新了記錄,利用深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),它們將單詞的識(shí)別錯(cuò)誤率下降到了8%。


在這個(gè)過(guò)程中,微軟也不甘落后,在2016年,微軟的語(yǔ)音識(shí)別系統(tǒng)成功地將單詞識(shí)別錯(cuò)誤率下降到了6.3%。


到了今天,語(yǔ)音識(shí)別技術(shù)作為自然語(yǔ)言處理的一個(gè)側(cè)面已經(jīng)非常成熟。比如科大訊飛的語(yǔ)音輸入法可以幫助我們?cè)谝环昼妰?nèi)完成400個(gè)漢字的輸入。人工智能在自然語(yǔ)言處理上已經(jīng)開(kāi)始實(shí)現(xiàn)產(chǎn)業(yè)化落地,成為真正能對(duì)人們的日常生產(chǎn)與生活產(chǎn)生價(jià)值的新工具。

自然語(yǔ)言處理的龍頭企業(yè)

科大訊飛創(chuàng)辦于1999年,目前已經(jīng)成為中國(guó)最有名的自然語(yǔ)言處理的龍頭企業(yè),它于2008年成為中國(guó)人工智能語(yǔ)音產(chǎn)業(yè)界的第一家上市公司。在2016年阿爾法狗打敗李世石之后掀起的人工智能熱潮中,科大訊飛的股價(jià)也是水漲船高,得到了資本市場(chǎng)的瘋狂追捧。2017年,隨著資本大量涌入與相關(guān)科技政策的不斷加持,科大訊飛股價(jià)一度創(chuàng)下歷史新高74.76元/股,市值突破千億大關(guān)。


但是,看起來(lái)如此幸運(yùn)的科大訊飛,在成立的最初幾年里,也面臨前所未有的運(yùn)營(yíng)壓力。
科大訊飛的相關(guān)領(lǐng)導(dǎo)曾經(jīng)這樣描述當(dāng)年的困境:“我們剛開(kāi)始創(chuàng)業(yè)的時(shí)候是挺難的,沒(méi)有錢(qián),沒(méi)有市場(chǎng),也沒(méi)有資源背景,所以是很難的草根創(chuàng)業(yè)。最開(kāi)始大家租了個(gè)房,沒(méi)白天沒(méi)黑夜地干。最困難的時(shí)候是什么呢?快過(guò)年了,發(fā)不出工資,只能以個(gè)人的名義去借錢(qián)渡過(guò)難關(guān)。公司從成立到盈虧平衡我們用了5年的時(shí)間,這五年我們天天在投入,卻不見(jiàn)產(chǎn)出?!?br/>由此可見(jiàn),作為人工智能時(shí)代的弄潮兒,科大訊飛能有今天的輝煌,離不開(kāi)當(dāng)年的艱苦付出。
要理解這一段歷史,其實(shí)還需要理解自然語(yǔ)言處理背后的人工智能算法的發(fā)展過(guò)程。其實(shí)在科大訊飛的早年歲月,人工智能自然語(yǔ)言處理的算法并不成熟。從這個(gè)意義上來(lái)說(shuō),科大訊飛是一個(gè)早產(chǎn)兒。只有到了2006年,深度學(xué)習(xí)的創(chuàng)始人杰弗里.辛頓及合作者發(fā)表了一個(gè)里程碑的文章《一種深度置信網(wǎng)絡(luò)的快速學(xué)習(xí)算法》以后,這一論文宣告了深度學(xué)習(xí)時(shí)代的真正來(lái)臨。只有在深度學(xué)習(xí)算法的指引下,人工智能才真正進(jìn)入了實(shí)用化階段。
因此,2006年是人工智能發(fā)展的分水嶺。從這個(gè)意義上來(lái)說(shuō),1999年就成立的科大訊飛出生的太早了。


科大訊飛在漫長(zhǎng)的時(shí)間賽道上長(zhǎng)跑,通過(guò)自主研發(fā)不斷更新技術(shù)。從國(guó)際上來(lái)看,根據(jù)Research and Markets報(bào)告,在全球語(yǔ)音市場(chǎng),谷歌、微軟、蘋(píng)果和科大訊飛是“四大高手”。它們?cè)谌蚴袌?chǎng)份額分別為20.7%、13.4%、12.9%和6.7%,從這個(gè)意義上來(lái)說(shuō),科大訊飛在自然語(yǔ)言處理上的專(zhuān)項(xiàng)能力是非常杰出的,確實(shí)已經(jīng)超越了國(guó)內(nèi)的其他大公司。


在終端消費(fèi)者應(yīng)用方面,科大訊飛的財(cái)報(bào)顯示,目前訊飛輸入法總用戶發(fā)展至5.6億;訊飛翻譯機(jī)銷(xiāo)售近數(shù)十萬(wàn)臺(tái),用戶已在覆蓋全球130個(gè)國(guó)家。

中國(guó)還有哪些自然語(yǔ)言處理的代表性公司?


自然語(yǔ)言處理的應(yīng)用前景相當(dāng)廣泛,它可以進(jìn)行很多工作,比如機(jī)器翻譯,典型的機(jī)器翻譯有百度翻譯、谷歌翻譯等。自然語(yǔ)言處理還可以用到信息檢索和過(guò)濾,比如在大流量的信息中尋找關(guān)鍵詞,在網(wǎng)絡(luò)瞬時(shí)檢查敏感文字信息。


形形色色的應(yīng)用造就了形形色色的企業(yè),《互聯(lián)網(wǎng)周刊》整理了自然語(yǔ)言處理領(lǐng)域的代表性公司。


目前,專(zhuān)注于自然語(yǔ)言處理的公司相當(dāng)多,外國(guó)大公司有谷歌、蘋(píng)果等,在國(guó)內(nèi)也涌現(xiàn)了科大訊飛、百度、云知聲與思必馳等著名企業(yè)。而且這些企業(yè)都有學(xué)院派的背景,比如在蘇州的思必馳的創(chuàng)始人俞凱本身就是英國(guó)劍橋大學(xué)的博士,后來(lái)成為上海交通大學(xué)的教授,他的研究團(tuán)隊(duì)里就有很多來(lái)自上海交通大學(xué)的博士生。在俞凱教授的推動(dòng)下,思必馳與上海交通大學(xué)成立了Speech Lab聯(lián)合語(yǔ)音實(shí)驗(yàn)室,側(cè)重前沿語(yǔ)音技術(shù)的研發(fā)及轉(zhuǎn)化,取得較多技術(shù)成果,例如,他們推出的VDCNN抗噪算法模型,在噪聲環(huán)境語(yǔ)音識(shí)別的業(yè)界基準(zhǔn)庫(kù)Aurora4上,取得了7.09%的詞錯(cuò)誤率,相比于世界其他機(jī)構(gòu)目前10%左右的最好結(jié)果,有一個(gè)大幅度的提高;而他們開(kāi)發(fā)的PSD新型解碼框架則使語(yǔ)音識(shí)別系統(tǒng)的速度累積提高20-30倍,內(nèi)存下降50%以上。產(chǎn)學(xué)研一體化模式,為思必馳進(jìn)一步拓展市場(chǎng)起到了極大作用。
目前的自然語(yǔ)言處理的公司很多都與高校結(jié)盟進(jìn)行創(chuàng)新發(fā)展,雖然有高等學(xué)校的智力支持,但中文語(yǔ)言的處理比起西方語(yǔ)言更加難以處理。其中最令人費(fèi)解的是多語(yǔ)義現(xiàn)象。
比如假設(shè)在兩場(chǎng)籃球比賽中,中國(guó)隊(duì)都打敗了美國(guó)隊(duì)。在中文報(bào)道中可以分別使用“中國(guó)隊(duì)大勝美國(guó)隊(duì)”、“中國(guó)隊(duì)大敗美國(guó)隊(duì)”來(lái)作為標(biāo)題。這其實(shí)是同一個(gè)意思,但人工智能自然語(yǔ)言處理則很容易把這個(gè)語(yǔ)義分析錯(cuò)。


再舉一個(gè)例子,比如“今天下雨路滑,我騎車(chē)差點(diǎn)翻倒,幸虧我一把把把把住了”。在這句話中,出現(xiàn)了很多“把”字,人工智能如果不了解其中有一個(gè)“把”字是“車(chē)把”的意思,也是很難理解這句話的。


因此,在自然語(yǔ)言處理方面,還有許多的問(wèn)題需要解決,比如訓(xùn)練數(shù)據(jù)的缺乏、成語(yǔ)俗語(yǔ)方言的精確處理。而在這里,其實(shí)算法還是最關(guān)鍵的。
但是,技術(shù)的進(jìn)步是不可阻擋的滾滾潮流,中國(guó)在這方面已經(jīng)做得相當(dāng)不錯(cuò)??拼笥嶏w的董事長(zhǎng)劉慶峰認(rèn)為,科大迅飛在語(yǔ)音合成、語(yǔ)音識(shí)別、口語(yǔ)評(píng)測(cè)、語(yǔ)言翻譯、聲紋識(shí)別、人臉識(shí)別、自然語(yǔ)言處理等智能語(yǔ)音與人工智能核心技術(shù)上已經(jīng)達(dá)到了國(guó)際最高水平。


將來(lái)隨著自然語(yǔ)言處理技術(shù)越來(lái)越成熟,計(jì)算機(jī)能夠更加正確理解人類(lèi)的語(yǔ)言,相關(guān)的人工智能產(chǎn)品將不斷落地,像“賢二和尚”這樣的聊天機(jī)器人一定會(huì)變得越來(lái)越智能。

 

相關(guān)頻道: eNews 排行

您對(duì)本文或本站有任何意見(jiàn),請(qǐng)?jiān)谙路教峤?,謝謝!

投稿信箱:tougao@enet16.com