国产黄色免费网站,人人干人人干人人干,免费大黄网站在线看,国产情侣一区二区三区,99精品国产福利免费一区二区,国产亚洲成归v人片在线观看,伊人88

2023信創(chuàng)獨(dú)角獸企業(yè)100強(qiáng)
全世界各行各業(yè)聯(lián)合起來,internet一定要實(shí)現(xiàn)!

鄒存璐:數(shù)據(jù)科學(xué)助力企業(yè)服務(wù)創(chuàng)新

2017-06-16 eNet&Ciweek

 以下為鄒存璐先生的演講實(shí)錄:


首先非常榮幸有這么一個機(jī)會,能作為嘉賓,作為相應(yīng)主題的一個分享,剛才也聽了一系列嘉賓做了相關(guān)的服務(wù)創(chuàng)新的主題分享,實(shí)際上從剛才聽到的一些內(nèi)容來講,大家不約而同都選擇了一些圍繞大數(shù)據(jù)、數(shù)據(jù)驅(qū)動一些創(chuàng)新內(nèi)容。今天,我這邊分享的內(nèi)容也是跟數(shù)據(jù)相關(guān)的,就是叫數(shù)據(jù)科學(xué)助力企業(yè)服務(wù)創(chuàng)新。東軟大家可能都了解,是作為一個全國最大的IT解決方案的服務(wù)提供商,東軟面對的這些企業(yè),或者面對的這些客戶來講,更多的是傳統(tǒng)的大型的企業(yè)。在這里面,對于這種傳統(tǒng)大型企業(yè)里面,它們在這一輪,尤其是互聯(lián)網(wǎng)+的新聞,這一輪的創(chuàng)新模式的創(chuàng)新,這種沖擊之下,它們在這里面面臨的一些需求,面對這些需求,就是東軟接下來要進(jìn)行的一個應(yīng)對解決的一系列的問題。

商業(yè)模式的創(chuàng)新,包括從傳統(tǒng)的解決方案,外包人力資源的方式,向IP資產(chǎn)這種產(chǎn)品方面的努力的一些突破。今天的主題,我這塊是來自于東軟先行產(chǎn)品事業(yè)部,主要是做大數(shù)據(jù)產(chǎn)品一系列的研發(fā),這次的主題是分享一系列的圍繞這個傳統(tǒng)大型企業(yè)里面的數(shù)據(jù)科學(xué)、人工智能方面創(chuàng)新的歷程分享,在這里面,今天的歷程主要是三個方面。

第一個圍繞數(shù)字化創(chuàng)新的探索歷程,接下來兩個都是一系列創(chuàng)新實(shí)踐的一些案例,包括對這些案例的理解和梳理,包括從大數(shù)據(jù)的轉(zhuǎn)變到因果關(guān)系,從傳統(tǒng)互聯(lián)網(wǎng)產(chǎn)生結(jié)構(gòu)化數(shù)據(jù)到半結(jié)構(gòu)化數(shù)據(jù)應(yīng)用的點(diǎn)。第一個面臨的文化就是企業(yè)級大數(shù)據(jù)的服務(wù)創(chuàng)新應(yīng)該怎么做?幾位嘉賓都分享不同領(lǐng)域的看法,有新零售業(yè)的,有做企業(yè)協(xié)同的,包括研究院旅游方面的創(chuàng)新,大概在六年前加入東軟的,之前我在做讀博之間做生物數(shù)據(jù)的分析,加入到東軟之后,面臨第一個問題,當(dāng)時大數(shù)據(jù)正在起步,谷歌剛剛發(fā)布一些新技術(shù),一些大數(shù)據(jù)生態(tài)的系統(tǒng)。當(dāng)時,我們面臨的第一個問題就是圍繞大數(shù)據(jù)這個領(lǐng)域,我們要做哪方面的創(chuàng)新,要解決哪些客戶方面的痛點(diǎn)和需求問題,畢竟大數(shù)據(jù)的概念是非常大的,當(dāng)時我們來看的,包括整個大數(shù)據(jù)的生態(tài)系統(tǒng),生態(tài)院里,解決Iaas基礎(chǔ)設(shè)施的,包括大數(shù)據(jù)基礎(chǔ)平臺的,有一些是做基礎(chǔ)服務(wù)的,做用戶畫像的標(biāo)簽輸送,有一些還做圍繞數(shù)據(jù)分析挖掘一些內(nèi)容。在這里面,尤其像東軟面臨的是傳統(tǒng)企業(yè),面臨跟互聯(lián)網(wǎng)新企業(yè)相比,在這種業(yè)務(wù)的探索方面,相對來說,在某一些方面是落后一些的,我們在應(yīng)對這種客戶的需求的時候,經(jīng)常會問的第一個問題就是:“我這塊有相應(yīng)的企業(yè)級的數(shù)據(jù),你幫我看看這塊有什么需求,怎么做一些創(chuàng)新的工作?!?/p>

這種服務(wù)來說,跟傳統(tǒng)東軟面臨的客戶需是截然不同的,東軟很早之前做人力外包的商業(yè)模式,比如說像日本企業(yè)的服務(wù)外包,很有可能客戶提出的需求非常的細(xì)致,直接給開發(fā)人員,就可以直接進(jìn)行編碼,這種模式在大數(shù)據(jù)模式下是行不通的,自己也沒有搞清楚應(yīng)該做什么。更多的是我現(xiàn)在有數(shù)據(jù),數(shù)據(jù)質(zhì)量不高,有一些企業(yè)在數(shù)據(jù)積累的階段,并沒有做好很好數(shù)據(jù)治理工作,數(shù)據(jù)質(zhì)量的保證等等一系列工作。在這里面,微少大數(shù)據(jù)在傳統(tǒng)企業(yè)的創(chuàng)新,首先要解決的就是針對傳統(tǒng)企業(yè)的現(xiàn)狀,我們?nèi)绾蝸韼椭M(jìn)行一些相應(yīng)的規(guī)劃。為了解決這個問題,我們也是做了一番大的思考,從兩個方面來看技術(shù)的方面,對于我們接下來要做企業(yè)創(chuàng)新也好,或者相應(yīng)創(chuàng)新產(chǎn)品也好。

第一,從技術(shù)角度發(fā)展來看。當(dāng)時在一年左右,大數(shù)據(jù)概念初現(xiàn)是谷歌發(fā)表的三篇論文,有存儲系統(tǒng),包括一些技術(shù)報價,這套技術(shù)是奠定了大數(shù)據(jù)基礎(chǔ)計算的路程,推動大數(shù)據(jù)的商業(yè)化和價值化最典型的應(yīng)用就是推薦系統(tǒng)的誕生,是亞馬遜系統(tǒng)應(yīng)用這種協(xié)同過濾的算法在網(wǎng)站上,結(jié)合用戶一系列的行為數(shù)據(jù),我們可以做一些個性化的推薦。這是第一次能把數(shù)據(jù)挖掘真正跟用戶緊密的結(jié)合起來,能夠顯著的提高相應(yīng)的收益率。當(dāng)時亞馬遜公布的收益率,通過智能推薦引擎,整個銷售額提高到20%以上,后來除了商品以外,一個電影公司,從商品到虛擬的電影商品上面的推薦,又進(jìn)一步推進(jìn)了數(shù)據(jù)分析挖掘的在商業(yè)企業(yè)應(yīng)用的場景。另一方面,從數(shù)據(jù)發(fā)展的趨勢可以看到,整個的大數(shù)據(jù)的發(fā)展的熱潮,到互聯(lián)網(wǎng)化的趨勢來說,是一個必然的結(jié)果,看整個數(shù)據(jù)發(fā)展的歷程,最早的起源應(yīng)該是來自于天文學(xué),很早之前,人類第一次是從天文里面,通過望遠(yuǎn)鏡觀測到行星運(yùn)行的軌跡,做一些分析和預(yù)測,預(yù)測太陽、行星系的軌跡行為做一些天文方面的內(nèi)容,通過這個方面的發(fā)展,整個數(shù)據(jù)分析挖掘,一片繁榮之后,接下來到了一個微觀的世界,由于很多基因數(shù)據(jù)不斷的發(fā)展,相應(yīng)的DNA采樣的數(shù)據(jù)成本的降低,對DNA、蛋白質(zhì)數(shù)據(jù)的產(chǎn)生,圍繞數(shù)據(jù)分析的技術(shù)開始向生物技術(shù)轉(zhuǎn)移,這個也是我在讀博期間做的內(nèi)容,通過一些疾病因素的分析,包括大家現(xiàn)在一直在生物學(xué)里面做一些探究,一些疾病跟基因的表達(dá),哪些基因表達(dá)會容易導(dǎo)致疾病,生物用藥的時候會影響相應(yīng)的疾病的一些治療。另外,隨著這種生物技術(shù),尤其是互聯(lián)網(wǎng)的發(fā)展,在互聯(lián)網(wǎng)上面產(chǎn)生了大量的行為的數(shù)據(jù),產(chǎn)生了一系列的內(nèi)容數(shù)據(jù),包括互聯(lián)網(wǎng)相應(yīng)技術(shù)的提升之后,采集到用戶在互聯(lián)網(wǎng)一系列的操作行為,這些有系列推動,圍繞互聯(lián)網(wǎng)方面的發(fā)展,說到個性化推薦,提供一系列個性化推薦服務(wù)。下一個階段就是圍繞這種物聯(lián)網(wǎng)信息的發(fā)展,最近工信部推薦NBLT相關(guān)技術(shù)的基礎(chǔ)建設(shè),圍繞物的建設(shè)人工智能、大數(shù)據(jù)的發(fā)展會圍繞物聯(lián)網(wǎng)的趨勢上進(jìn)軍。

從技術(shù)的角度來看,從大數(shù)據(jù)相應(yīng)的技術(shù)里面,跟傳統(tǒng)的分析技術(shù)到底有什么區(qū)別,在互聯(lián)網(wǎng)這一輪大數(shù)據(jù)技術(shù)之前,有了一系列的BI商業(yè)智能的技術(shù),從純技術(shù)上考慮,大數(shù)據(jù)能處理的數(shù)據(jù)量很大,能進(jìn)行相應(yīng)的框架的橫向拓展,比傳統(tǒng)BI的傳統(tǒng)量容納的數(shù)據(jù)量會更多一些。除了量以外,處理的緯度更多了,在互聯(lián)2.0技術(shù)采用以后,像微信、大眾點(diǎn)評、美團(tuán)點(diǎn)評,有大量文本數(shù)據(jù)的產(chǎn)生,這些傳統(tǒng)BI商是不會做這種處理,更多是針對結(jié)構(gòu)性的數(shù)據(jù),針對這個能力來說,有一個相應(yīng)技術(shù)的產(chǎn)生,推動這種文本數(shù)據(jù)挖掘一些潛在的價值,又增加了一個緯度,傳統(tǒng)企業(yè)里面,80%的數(shù)據(jù)都是文本數(shù)據(jù),我們很多做的客服系統(tǒng),做一些咨詢的時候,都是非技術(shù)化的數(shù)據(jù),經(jīng)過這種語音轉(zhuǎn)文本的技術(shù)處理,轉(zhuǎn)變成半結(jié)構(gòu)化的文本數(shù)據(jù),這里面蘊(yùn)含了大量的價值,沒有被傳統(tǒng)的BI挖掘出來,這個大數(shù)據(jù)相關(guān)的技術(shù)給了一個新的活力。

第三個就是時效性的問題,大數(shù)據(jù)產(chǎn)生這種分布式的計算和分布式流的計算技術(shù),有一個顯著的增高。下面也是總結(jié),從業(yè)務(wù)的角度,傳統(tǒng)BI和高級分析的技術(shù)差異的區(qū)別是什么。傳統(tǒng)的BI的商業(yè)智能更多是圖形化的表達(dá),描述你過去發(fā)生了什么,最終是一個輔助決策,最終還是要給人看,人根據(jù)這種相應(yīng)的數(shù)據(jù)報告做最終的決策。新一輪就是第三階段到第四階段就是預(yù)測未來會發(fā)生什么,和決定未來要怎么做,這個內(nèi)容是大數(shù)據(jù)梳理效能提升的一個典型的特點(diǎn)。

有一個典型的例子,在傳統(tǒng)里面,面對傳統(tǒng)金融銀行的企業(yè),里面是他們在用商業(yè)智能是最早的一批用戶,他們是最早非常關(guān)注企業(yè)相應(yīng)內(nèi)部的數(shù)據(jù)的管理,尤其是傳統(tǒng)金融、銀行里面相應(yīng)資金比較雄厚,早期里面對這個投入比較前傾一些,整個的處理流程是這樣,所有銀行的分行,會把數(shù)據(jù)用戶交易信息的相應(yīng)數(shù)據(jù)的采集,總行做數(shù)據(jù)倉庫和BI系統(tǒng)的建設(shè),分行把數(shù)據(jù)收集匯總到總行,總行做分析和預(yù)測,哪些用戶有這種流失的風(fēng)險,經(jīng)過這種分析之后,會形成這樣一個客戶流失的列表,這個列表會下發(fā)到支行里面,支行根據(jù)客戶列表客戶,都有相應(yīng)的客戶經(jīng)理,根據(jù)這種客戶名單進(jìn)行一個比對,發(fā)現(xiàn)有潛在流失客戶的可能,做適當(dāng)?shù)年P(guān)懷,我們了解這個周期下來大概是幾個星期,可以想象幾個星期的周期下來,這個客戶早就流失掉了。

還有一個場景就是互聯(lián)網(wǎng)實(shí)時競價的系統(tǒng),包括DRP也是生態(tài)系統(tǒng)里的一環(huán),根據(jù)互聯(lián)網(wǎng)采集的行為數(shù)據(jù),包括剛才說的眾盟里面WIFI的探針,形成一些用戶畫像,在互聯(lián)網(wǎng)的網(wǎng)頁里面,都有一些廣告位置,這個是按照相應(yīng)的價值來進(jìn)行出售的,每一次用戶進(jìn)來之后,會根據(jù)用戶的畫像的特征,向不同的廠商進(jìn)行展示,會根據(jù)匹配度進(jìn)行價格的信息比對,我就出1塊錢買這個廣告位,展現(xiàn)給客戶,覺得匹配度更低,我就出更低的價格,每一家廠商出價格之后,最后競價高者展現(xiàn)在客戶面前,在這個運(yùn)行時間效率大概是在毫秒級??梢韵胂螅瞧诘胶撩爰壍牟町?,典型的一個問題,如果達(dá)到了毫秒甚至秒級的時候,就不會有人的因素參與進(jìn)來,有人的參與就不會達(dá)到即實(shí)的決策。這個傳統(tǒng)智能更多在第一第二階段,數(shù)據(jù)科學(xué)是高級分析,我們能做出相應(yīng)的決策。

數(shù)據(jù)科學(xué)并不是一個全新的學(xué)科,或者理念。實(shí)際上他是一個復(fù)合型的學(xué)科,傳統(tǒng)里面,我們更多是偏一些技術(shù)的人員都知道,都偏向于計算機(jī)科學(xué)技術(shù)、數(shù)學(xué)統(tǒng)計信息更多,大數(shù)據(jù)相關(guān)的技術(shù),在商業(yè)環(huán)境里面的應(yīng)用,就是領(lǐng)域知識的結(jié)合,沒有這個知識的結(jié)合,很難把相應(yīng)數(shù)據(jù)背后的價值進(jìn)行挖掘出來,傳統(tǒng)里面,更多在技術(shù)里面強(qiáng)調(diào)技術(shù)牛人,現(xiàn)在更多強(qiáng)調(diào)的是技術(shù)商人的概念,怎么把技術(shù)跟現(xiàn)有的業(yè)務(wù)進(jìn)行一個有機(jī)無縫的對接,體現(xiàn)商業(yè)價值。

實(shí)際上在這里面,我是2011年加入東軟,那時候大家都在做HDFS,解決一些大數(shù)據(jù)低廉、高效查處的功能,更多的是圍繞數(shù)據(jù)的挖掘,定的整體的發(fā)展路線還是圍繞數(shù)據(jù)里面的一些價值,也就是現(xiàn)在咱們說的人工智能,當(dāng)時探索之路,由于東軟是解決方案的提供上,本身來說,之前沒有自身業(yè)務(wù)的運(yùn)營,現(xiàn)在來說,東軟也是在做相應(yīng)的轉(zhuǎn)型,有了一系列自己的產(chǎn)品,有了一些商業(yè)模式運(yùn)營的內(nèi)容,所以,當(dāng)時來說,要解決分析應(yīng)用的時候,更多的時候你的數(shù)據(jù)從哪里來,當(dāng)時我們有很多的一些合作的客戶,讓他們這些有一些相應(yīng)的數(shù)據(jù),包括東軟內(nèi)部有一些運(yùn)維數(shù)據(jù),還有企業(yè)協(xié)作的場景,基于這些場景,我們做了一系列的,像亞馬遜這種個性化推薦的內(nèi)容,圍繞企業(yè)內(nèi)部這種協(xié)同辦公的數(shù)據(jù),發(fā)現(xiàn)企業(yè)內(nèi)部的一種意見領(lǐng)袖,他們的影響力做了一些分析,通過這些應(yīng)用場景的分析,我們進(jìn)一步的抽象,形成一種新的工具平臺,機(jī)器學(xué)習(xí)的平臺,文本挖掘的平臺,又進(jìn)行一些新應(yīng)用的拓展,有向物聯(lián)網(wǎng)的拓展,還有預(yù)測性維護(hù)、異常檢測、效能優(yōu)化的場景。

從探索來講,經(jīng)過這么多年的實(shí)踐,總結(jié)下來,包括一些報告也提到,現(xiàn)有企業(yè)級大數(shù)據(jù)相關(guān)數(shù)據(jù)驅(qū)動的模式來說,核心的業(yè)務(wù)就是人、業(yè)務(wù)、物,很多智能場景都是這三者有機(jī)的合同和融合的應(yīng)用。具體來看一下,在這里面,首先是人跟業(yè)務(wù),非常典型的就是剛才提到的個性化的推薦,就是智能業(yè)務(wù)的產(chǎn)生分析人和業(yè)務(wù)系統(tǒng)之間交互的數(shù)據(jù),提供個性化業(yè)務(wù)辦理流程優(yōu)化,提高業(yè)務(wù)處理效率,就是個性化推薦,他們來做這個內(nèi)容,在業(yè)務(wù)辦理過程當(dāng)中,我怎么提高效率,尤其是這種海量的信息里面,我怎么加速用戶找到他感興趣的東西,需要的東西這都是人跟業(yè)務(wù)之間結(jié)合的場景。

另一個場景實(shí)際上就是物跟業(yè)務(wù),這個是比較未來的場景,現(xiàn)在來說,尤其是現(xiàn)在的手機(jī),移動設(shè)備的增加,這個場景離我們也不是太遙遠(yuǎn)了,就是智能設(shè)備基于傳感器采集到環(huán)境信息,進(jìn)行智能自主控制的決策,比如說設(shè)備智能自主效能的優(yōu)化。甚至來說,剛才我們講到的,很多現(xiàn)在的業(yè)務(wù)怎么促進(jìn)人在環(huán)節(jié)里面的體驗(yàn),那么,從未來的角度來說,很多的一些場景,這種決策購買的內(nèi)容,很多是由物,智能設(shè)備來下達(dá)的,大家都開汽車,很多的汽車,到達(dá)一個里程數(shù)量的時候,進(jìn)行一個傳感器監(jiān)測的時候,可以看到保養(yǎng)的時間,汽車可以根據(jù)自身的狀態(tài),向4S店自主發(fā)送相應(yīng)的請求,請求一些相應(yīng)保養(yǎng)的服務(wù),這樣由物直接產(chǎn)生業(yè)務(wù)的場景會越來越多,這種業(yè)務(wù)的辦理跟人的業(yè)務(wù)辦理的時候有很大的不同,物自主消費(fèi)的時候,更多是理性消費(fèi),會促進(jìn)新一輪業(yè)務(wù)模式的改變。

另一個就是人跟物的,在座的都有穿戴設(shè)備的,包括心率、心跳,拓展人行為的特征的數(shù)據(jù),從而提供一些智能信息推送的一些決策,可以根據(jù)心率、心跳、血壓提供一些健康的預(yù)警,提供一些急救自主的場景。人與人實(shí)際上就是現(xiàn)在看到這種社交化網(wǎng)絡(luò)的場景,基于人與人之間的網(wǎng)絡(luò),進(jìn)行一些機(jī)能的發(fā)現(xiàn),跟協(xié)同也是其中的一個問題,大型企業(yè)有幾百人員工,新項目里面,找相應(yīng)的技術(shù)專家,東軟里面有兩萬多人,高層和下面員工的時候,這個項目適合誰來做,誰做這個最合適,如何發(fā)現(xiàn)一些專家的技術(shù)的發(fā)現(xiàn),通過社交的關(guān)系,來做相應(yīng)技能的發(fā)展方式。

再未來一個就是物與物之間的協(xié)作,這個是一個新的理念,就是社交化物聯(lián)網(wǎng)的概念,未來來講,就是物與物之間的自主構(gòu)建社交化的關(guān)系,并通過網(wǎng)絡(luò)推理發(fā)現(xiàn)進(jìn)行協(xié)作完成業(yè)務(wù)目標(biāo)。最終來說,實(shí)際上是三者的大融合,進(jìn)行互相的協(xié)作的場景,這個有一個典型的場景例子是什么呢,就是剛才汽車的例子,人跟汽車還有一個智能的保險,或者理賠的業(yè)務(wù),這三者之間可以協(xié)作產(chǎn)生新的模式,比如說未來的智能汽車,可以根據(jù)駕駛員的習(xí)慣、里程數(shù)進(jìn)行一個智能的投保業(yè)務(wù)的辦理,現(xiàn)在這種保險大家都知道,就是固定的年限,按照去年的出險的次數(shù)進(jìn)行定價,不管你車的里程數(shù)是什么樣的未來保險業(yè)務(wù)可能跟價值習(xí)慣,是一個駕駛的習(xí)慣這些信息,更多提供一個合理的報價,你是一個激烈的駕駛員,就要付出更多額外風(fēng)險的報價,或者是成本吧。當(dāng)事故發(fā)生以后,智能的汽車設(shè)備會采集到人的體能信息,可以向醫(yī)院發(fā)生一些求助的信息,同時可以根據(jù)碰撞的內(nèi)容,向保險業(yè)務(wù)進(jìn)行自動的索賠,這三者來說,可以進(jìn)行一個大的融合,產(chǎn)生更多新的商業(yè)模式。

實(shí)際上從企業(yè)的整體圍繞數(shù)據(jù)分析和挖掘來看,各行各業(yè)都有,現(xiàn)在我們看到的實(shí)際上是一個碎片化,盡管我們看到很多的大型企業(yè)里面,都有這種數(shù)據(jù)分析的一些模型,但是即使是同一個行業(yè)里面,不同家的公司,業(yè)務(wù)里面的差異還是很大的,怎么去解決?很多像互聯(lián)網(wǎng),尤其像互聯(lián)網(wǎng)創(chuàng)新公司,我做一點(diǎn),把這一點(diǎn)做透了,就能保證企業(yè)的生存率,大企業(yè)很難做到這樣,互聯(lián)網(wǎng)那套的邏輯,之所以能成立,因?yàn)榛鶖?shù)非常大,一個小的比例的用戶,由于你的基數(shù)比較大,服務(wù)的人群還是比較多,獲得的利益還是比較多一些,像傳統(tǒng)的大型企業(yè)來講,每一家客戶里面,個性化、定制化的需求很多,很難滿足共性的內(nèi)容,還有一個大的基數(shù)。東軟應(yīng)對的策略,就是利用一系列平臺的產(chǎn)品跟業(yè)務(wù)的應(yīng)用相結(jié)合,實(shí)際上在平臺里面有一個高級分析的產(chǎn)品,就是知識服務(wù)平臺,做一種個性化的推薦,做經(jīng)營者的營銷,做一些客戶的營銷。做一些故障的診斷、一些性能的診斷和優(yōu)化。

圍繞一系列的產(chǎn)品里面,我們做了一系列的案例的實(shí)踐,從總結(jié)下來就是兩大方面。一個是從關(guān)聯(lián)關(guān)系到因果關(guān)系,另外一個就是從結(jié)構(gòu)化數(shù)據(jù)到半結(jié)構(gòu)化數(shù)據(jù)。關(guān)聯(lián)關(guān)系和因果關(guān)系就是啤酒跟尿布的故事,發(fā)現(xiàn)購買啤酒的商戶,很可能同時購買尿布的內(nèi)容,在現(xiàn)實(shí)里面,我們常常很多的一個場景會混淆關(guān)聯(lián)關(guān)系和因果關(guān)系的差異,關(guān)聯(lián)關(guān)系是知道這兩個事件會共同發(fā)生,不知道這兩者之間誰影響誰,因果關(guān)系我們能發(fā)現(xiàn)誰是因誰是果,誰是影響另外一個因素的關(guān)系。如果你有了一個關(guān)聯(lián)關(guān)系的時候,實(shí)際上可以做到相應(yīng)的預(yù)測,如果有因果關(guān)系,在預(yù)測的基礎(chǔ)上可以做到相應(yīng)的控制,能影響干擾這個因,就可以作用到相應(yīng)的果。從大數(shù)據(jù)的角度,從數(shù)據(jù)挖掘的角度是一個很難挖掘定位的地方,把因果關(guān)系弱化掉了,只關(guān)心關(guān)聯(lián)關(guān)系,我是關(guān)心預(yù)測,不是關(guān)心控制,因果關(guān)系是很難定義的,這里面經(jīng)常舉一個例子,在古代的時候,很多的部落,都會迷信,迷信什么呢,比如說,崇拜一些動物,或者物體,比如說有一些部落崇拜雞,當(dāng)一打鳴的時候,太陽會升起來,這就是關(guān)聯(lián)關(guān)系和因果關(guān)系混淆的一個場景。還有一種方法可以干預(yù)某一個事項的發(fā)生,干預(yù)這個事項發(fā)生之后,另一個因素會不會發(fā)生改變,我們把雞殺掉,太陽照常升起,就可以把這個因素去掉,所以很多的因果關(guān)系在現(xiàn)實(shí)里面很難挖掘,更多的是強(qiáng)調(diào)關(guān)聯(lián)關(guān)系的場景。

場景的應(yīng)用是公安犯罪分析預(yù)警系統(tǒng)。在這里面有一個典型的關(guān)聯(lián)關(guān)系推的,哪些特征,哪些出行軌跡的行為特征,你更有可能是犯罪的同謀,或者犯罪行為。還有很多學(xué)術(shù)文章的發(fā)表,單單從人臉的微表情的特征,從證明照里面可以進(jìn)行識別,那個學(xué)術(shù)文章達(dá)到98%左右,這個文章還是非常有爭議的論文,這個是典型的關(guān)聯(lián)關(guān)系,不是你有這個行為導(dǎo)致你犯罪,而是犯罪人群有這樣一些共同的特點(diǎn)和內(nèi)容。

另一個,做風(fēng)洞實(shí)驗(yàn)的,我們軍工的客戶,飛行器和導(dǎo)演的客戶,會進(jìn)行風(fēng)洞的實(shí)驗(yàn)進(jìn)行試吹,來調(diào)一些造型和設(shè)備的制造優(yōu)化的內(nèi)容,在這里面就是一個典型,我們要追求的是因果關(guān)系,要找到哪些參數(shù)會影響相應(yīng)的標(biāo)準(zhǔn)的指標(biāo),或者一些內(nèi)容,在這里面的案例,發(fā)現(xiàn)一些預(yù)測優(yōu)化,來幫助他們在導(dǎo)彈里面或者飛機(jī)制造里面做一些產(chǎn)品優(yōu)化。

還有一個軌道交通的客流量的預(yù)測,要發(fā)現(xiàn)哪些因素會影響客流量的增長或者減少,這里面更多的是向一些地鐵的客戶,除了交通,起來很多政府機(jī)關(guān)對客流量也是非常關(guān)注的,我們接觸的公安的一家客戶,他們對客流量的預(yù)測感興趣,原因是什么呢?去年舉辦過馬拉松的重大活動,對客流量預(yù)測沒有把控好,導(dǎo)致很多選手跑到選手之后,大部分都是走回家的,這里面由于沒有做好相應(yīng)預(yù)測的工作,沒有預(yù)測工作就沒有相應(yīng)合理資源的安排,導(dǎo)致相應(yīng)內(nèi)容的影響。還有旅游景點(diǎn),游客量暴增,會發(fā)生一些危險事件,像天氣的因素、事件的因素等等一系列的因素,會不會能夠影響相應(yīng)客流量的增加或者減少,這個和政府等等一系列公共交通所關(guān)注因素非常的一個重要的點(diǎn)。

另一個是我們跟互聯(lián)網(wǎng)電影渠道的廠商做一些合作,這種廠商在新片上映的時候,都對電影內(nèi)容做全國院線的布局,這個電影知道哪個電影、導(dǎo)演、信息,能不能知道在哪個地區(qū),很多的電影在東北比較受歡迎,跑到南方就一片冷門,任何一個題材有一些地域性的特征,根據(jù)這些數(shù)據(jù),我們能否預(yù)測出來不同院線的信息,通過票房信息的預(yù)測,可以進(jìn)行合理票房、院線的布局排版,做一些相應(yīng)營銷的活動。

另一個圍繞今天的會議,大連最大的一個會議中心,在這個會議中心來講,對耗電部分就是中央空調(diào)系統(tǒng),能效比的優(yōu)化是一個恒久話題,在一個非常復(fù)雜,中央空調(diào)系統(tǒng)COP從3.5優(yōu)化到5.2,很多中央空調(diào)的設(shè)備、壓縮機(jī)等等這些設(shè)備,涉及到每一個冷卻塔要開多大功率、開多少個冷卻塔,每一套中央系統(tǒng)出廠之前會有一些邏輯進(jìn)行相應(yīng)的控制,不會根據(jù)當(dāng)前這個設(shè)備安裝的位置,包括現(xiàn)在客流量的內(nèi)容做一些調(diào)整,實(shí)際上可以根據(jù)一些動態(tài)的信息,來進(jìn)行一個自主的運(yùn)維,發(fā)現(xiàn)一個最優(yōu)的參數(shù),提升能效比的運(yùn)轉(zhuǎn)。

最后一個就是從結(jié)構(gòu)化數(shù)據(jù)到半結(jié)構(gòu)化數(shù)據(jù),主要是圍繞一系列文本數(shù)據(jù)價值的挖掘,最典型的是客戶的洞察服務(wù),像電信行業(yè),我們有很多的客服的系統(tǒng),咱們在打服務(wù)電話的時候,都會有錄音的提醒,這些錄音的數(shù)據(jù),經(jīng)過語音轉(zhuǎn)文本的技術(shù),轉(zhuǎn)化成文本,這些文本數(shù)據(jù)蘊(yùn)含了非常大量的信息,對于一個商品評價的信息,對商品意見的傾向是好還是壞,對哪一部分最感興趣,都是產(chǎn)品優(yōu)化和生產(chǎn)、設(shè)備生產(chǎn)里面重大的依據(jù),通過一系列的熱點(diǎn)發(fā)現(xiàn)一些用戶的傾向。

還有一些電信行業(yè),受互聯(lián)網(wǎng)沖擊最大就是傳統(tǒng)出版商,用戶拿到報紙之后,所有的信息都斷開了,不知道用戶讀者對你內(nèi)容感興趣的內(nèi)容程度是哪一點(diǎn),對信息內(nèi)容的意見是什么樣的,這里面的例子幫助他們做了一系列的在線的爬行技術(shù),發(fā)現(xiàn)用戶一些的評論、匯總,發(fā)現(xiàn)讀者感興趣的點(diǎn),提供給編輯來對未來出版物做一些相應(yīng)的依據(jù),這個實(shí)際上是新聞客戶端,也是咱們經(jīng)常在用的,像新聞頭條,它里面做了大量個性化新聞的推送,這個是央視的新聞客戶端,更多的是做里面新聞的推送,里面涉及到一系列的產(chǎn)品,包括文本分析,還有用戶的興趣偏好,根據(jù)用戶的興趣跟文本內(nèi)容的結(jié)合,來做相應(yīng)個性化文章的推送,提高相應(yīng)用戶的體驗(yàn),讓讀者更容易發(fā)現(xiàn)他們感興趣的文章內(nèi)容。

最后,通過這一系列的內(nèi)容,進(jìn)行在線的智能問答,很多這種常見的問題,可能用自動化的方式來進(jìn)行,京東里面都有這種服務(wù)的內(nèi)容,可以進(jìn)行提問,進(jìn)行相應(yīng)的智能的問題回答,這個客戶更多是用傳統(tǒng)的政府企業(yè),像稅務(wù)方面的一個信息,可以做一些常規(guī)的稅務(wù)信息的問答和用戶回答。今天主要分享的就是這些內(nèi)容,大家關(guān)心更多的內(nèi)容和服務(wù),可以觀眾我們東軟先行產(chǎn)品的官方公眾號謝謝大家!

相關(guān)頻道: eNews

您對本文或本站有任何意見,請在下方提交,謝謝!

投稿信箱:tougao@enet16.com