當大數(shù)據(jù)深度學習失效時

      網(wǎng)友投稿 800 2022-05-30

      這幾年,電信領域的人工智能熱度一直很高,特別是看到圖像識別、語音識別等基礎服務獲得了廣泛應用,以及一些行業(yè)宣稱在人工智能上獲得了突破性進展,并為此開創(chuàng)了新的產(chǎn)業(yè)模式以后。現(xiàn)在從運營商到供應商,都希望能夠通過大投入、大架構(gòu)、大平臺,依托大數(shù)據(jù)挖掘,先進的模型與算法,讓人工智能技術在電信領域產(chǎn)生革命性的突破與價值。

      但實際情況,有沒有感覺電信領域在大數(shù)據(jù)、人工智能的進展上相比IT等領域還滯后很多呢?在我個人來看,其中的問題不少。從某種程度上來看,電信領域引入人工智能技術有點迷失在大數(shù)據(jù)海洋里面,動輒就是要各種數(shù)據(jù)采集、復雜的關聯(lián)模型與深度學習算法、大數(shù)據(jù)挖掘與體系化的平臺架構(gòu),但就此能產(chǎn)生相應的價值嗎?

      我們是不是應該回過頭來考慮一下,電信領域當前需要選擇什么樣的模型怎樣來實現(xiàn)突破呢?

      一、先從一個親身經(jīng)歷的案例說起

      前段時間,家里的寬帶出問題了,正好小孩需要完成網(wǎng)上作業(yè),但是上不了網(wǎng)了,急得直跳。遠程指導斷電重啟終極***之后還是不能上網(wǎng),只得打客服電話,描述故障現(xiàn)象以后,客服說需要安排人上門。第二天維修人員上門處理以后說是家里的無線貓有問題,得換一個,同時留了他的手機號碼。

      等到周末回家以后,趕緊找了一個新的貓換上去,用電腦連接完成配置,特別是寬帶的用戶名、密碼還專門找到開戶時的記錄一個個核對好,但還是上不了網(wǎng)。不過觀察到其中有一個環(huán)節(jié)提示用戶名、密碼錯誤,但很快又跳開了,到了最終顯示無網(wǎng)絡連接的頁面。

      怎么會提示用戶名、密碼錯誤呢?都用了好多年了,一直沒有這樣的問題。好吧,再重新更加仔細的把用戶名、密碼配置好,還是不行。換回老的貓,發(fā)現(xiàn)還有同樣的提示,看來還真不是貓的問題。

      過程中突然想到1月份套餐快到期的時候客服電話聯(lián)系我升級了套餐,客服說會郵寄新套餐的賬單過來繳費,但好像一直沒有收到賬單,因此也沒有去繳費。于是趕緊跑到營業(yè)廳問了一下,確認是處于欠費狀態(tài)。當時就把費用交了,營業(yè)廳說最多個把小時就會好的。結(jié)果等到晚上,還是不行,問題還是一樣。

      只好打電話給之前上門的維修人員,說應該不是貓的問題,換了新貓也不行,兩個貓都碰到了一樣的用戶名、密碼錯誤的提示,對方也只能說再試試換貓、再確認賬號配置是否正確,實在不行的話就準備第二天再次上門了。過程中我把升級了套餐、已經(jīng)完成繳費的情況順嘴提了一下,維修人員突然說不對,這種情況可能會有賬號變化,讓我等等,他去問問后臺。

      過了一會,收到維修人員的短信,給了個新的賬號信息。用老的無線貓,用這個新的賬號信息配置以后,上網(wǎng)正常了。

      為什么之前一直沒有碰到問題?而且欠費也有一段時間了?我估計是因為沒有重啟,所以還是用老賬號之前建立好的通道上網(wǎng),直到欠費到一定時間被停掉,進行重啟以后就切換到新的賬號了,然后就出現(xiàn)賬號不對的問題了。

      就此我也理解了,為什么之前做解決方案規(guī)劃的時候,固定視頻與家庭寬帶領域提到的萬投比都是萬分之幾百(而對應的移動領域萬投比一般都是萬分之幾,相差幾十到上百倍,其中一個關鍵差異就是用戶側(cè)的場景不一樣),目標是要降低到萬分之五十以下。而實際上,根據(jù)一線反饋,大部分投訴(反饋的統(tǒng)計數(shù)據(jù)是70%以上)都是這樣的與欠費、賬號、家庭側(cè)的機頂盒、貓、配置或連接相關的家庭側(cè)低級問題。但就是這些特征明顯、處理簡單的常規(guī)問題,卻耗費了大量的人力物力不停的重復處理,包括上門處理。當然,也正因這樣的常規(guī)問題是主流,雖然問題多,投訴多,支撐體系也不完善,即使萬分之幾百的投訴率,但運營商們依然還能湊合活著,并沒有到我們主觀認為的完全過不下去的情況。

      那么,問題就來了,在電信網(wǎng)絡,如果這樣的常規(guī)問題占了大部分,可以通過基本的規(guī)則套路就能完成處理。那么,我們的大數(shù)據(jù)架構(gòu)以及對應的基于大數(shù)據(jù)的人工智能高維技術,還有必要做成要應對終極復雜問題場景下的那么復雜嗎?更何況,以我做技術支持的經(jīng)歷以及這些年以來的重大問題攻關經(jīng)驗來看,這種終極復雜問題場景,往往都是靠專家會診進行不停的猜測、嘗試才能解決,數(shù)據(jù)也往往需要進行很多輪基于猜測的場景化數(shù)據(jù)獲取才能支撐分析、嘗試。特別是按照現(xiàn)在的數(shù)據(jù)支撐與算法能力,即使人工智能平臺再大、再強,實際上也解決不了這些復雜問題。

      也許,電信領域,我們是否可以找到一種突破對大數(shù)據(jù)依賴的方式,在大數(shù)據(jù)深度學習模式上增加一個選擇,多一條路,用架構(gòu)性創(chuàng)新來解決結(jié)構(gòu)性問題呢?

      二、基于大數(shù)據(jù)深度學習的人工智能嘗試

      在我參與的人工智能項目中,網(wǎng)絡維護業(yè)務的客戶支持模塊在人工智能課題研究中碰到了極大障礙。最初認為是最佳大數(shù)據(jù)源、最能支撐快速實現(xiàn)人工智能應用的每年超過80萬的網(wǎng)上問題單,由于數(shù)據(jù)缺乏結(jié)構(gòu)化與基本的標注,被判定了無法基于此來實現(xiàn)所需要的人工智能應用。為此業(yè)務部門不得不按照在問題處理系統(tǒng)中增加標注字段,并做了業(yè)務規(guī)定,要求工程師在處理問題時都得做出相應的關鍵標注。只是直到現(xiàn)在,基于海量問題單數(shù)據(jù)標注結(jié)合人工智能算法的黑盒式高維應用依然還沒有見到有效成效。我們真要捫心自問一下,占據(jù)主流的常規(guī)問題是否需要基于海量的數(shù)據(jù)需求以及復雜的人工智能算法,采用大平臺、高規(guī)格以及復雜的數(shù)據(jù)需求進行復雜處理?少量的復雜問題,特別是新出現(xiàn)的疑難問題,往往都需要深入到協(xié)議、信元、代碼級的多人會診,單個專家都還不一定能搞定,得靠不停的猜測與嘗試才能最終定位。這樣的場景,當前采用這樣的基于大數(shù)據(jù)架構(gòu)的人工智能技術能否搞定?而去為此構(gòu)建一套復雜的大數(shù)據(jù)采集、分析與處理的龐大架構(gòu)體系嗎?

      前一段時間,有通過MR大數(shù)據(jù)結(jié)合人工智能算法來實現(xiàn)天線接反識別的人工智能應用:“天線接反是網(wǎng)絡優(yōu)化中最常見的天饋問題之一,普通的天線接反識別是用一套算法來適配實際千變?nèi)f化的場景,準確性難以保證。天線接反智能識別,利用天線與信號相匹配的業(yè)務特征,將業(yè)務特征抽樣為相應的業(yè)務圖形,借鑒了手寫識別的機器學習算法(卷積神經(jīng)網(wǎng)絡)思路來解決分類問題,使用了20000張帶標簽的圖形來訓練模型。通過天線接反模型驗證的識別準確率超過95%,天線接反識別由人工識別轉(zhuǎn)向機器自動識別,識別效率提升10倍。”這些信息肯定會讓不做這個工作的人看了很興奮,因為人工智能有了應用突破。但實際上,天線接反是RF領域射頻通道場景的最簡單問題。按照基本的業(yè)務規(guī)則,天線接反有常規(guī)的單站驗證機制在基站入網(wǎng)的時候控制住。少量遺漏的,也可以在后續(xù)通過基于常規(guī)切換話統(tǒng)的輕量級核查工具(切換話統(tǒng)與MR的數(shù)據(jù)體積完全不在一個層次)來完成核查與修正。這個問題歸屬RF的射頻通道場景,天線接反問題是其中最簡單、最明顯的,早就不是關鍵障礙了,麻煩的是射頻通道場景的其他的是各種線纜部分交叉、各種干擾、各種通道硬件與連接質(zhì)量類等問題。在這里,是否還有必要基于海量數(shù)據(jù)采集、基于復雜算法與計算平臺來處理這類特征明顯、基于已有話統(tǒng)與單兵工具本已經(jīng)可以支撐的簡單問題?

      最近,我承擔的一個關于網(wǎng)絡指數(shù)建模的課題也碰到了數(shù)據(jù)與算法的困擾。與大學的大數(shù)據(jù)挖掘研究團隊合作,想辦法采集了多個網(wǎng)絡的海量數(shù)據(jù),試圖結(jié)合號稱領先的基因工程網(wǎng)絡模型與分類、回歸等關鍵算法,完成相關性分析、特征提取、賦權(quán)等關鍵工作,然后實現(xiàn)網(wǎng)絡特征的數(shù)字化呈現(xiàn)。遺憾的是當前基于模型與算法給出的結(jié)果很多了偏離的基本常識,遠不如靠人的經(jīng)驗給出的結(jié)果,甚至結(jié)果還完全不合理。參與客戶很不客氣的說,什么模型與算法,還不如隨便找個懂網(wǎng)絡的工程師拍一下更加合理。大學那邊也很委屈,說沒有想到數(shù)據(jù)會那么多、那么亂,光理解數(shù)據(jù)與做數(shù)據(jù)預處理就花了很多時間。同時所需要的數(shù)據(jù)在時間維度、空間維度、變量維度都不夠,樣本數(shù)量與質(zhì)量都不行,所以在應用的時候出現(xiàn)了很大的偏差。要解決的話,首先得解決數(shù)據(jù)上的問題,需要有匹配模型與算法需要的高質(zhì)量數(shù)據(jù)輸入。這仿佛有點死循環(huán)了,結(jié)果不好是因為數(shù)據(jù)不行,數(shù)據(jù)不行又變成了網(wǎng)絡提供的數(shù)據(jù)質(zhì)量不行,而網(wǎng)絡提供的數(shù)據(jù)質(zhì)量不行最終就成了網(wǎng)絡數(shù)據(jù)的可供給與可采集問題。

      數(shù)據(jù),在多個專題的嘗試中成了電信領域人工智能技術應用的關鍵障礙。確實,人工智能的關鍵技術往往就是基于滿足要求的數(shù)據(jù)之上的,沒有數(shù)據(jù)也不會有人工智能。但問題又是,電信領域天生又是產(chǎn)生海量數(shù)據(jù)的地方,網(wǎng)絡產(chǎn)生的數(shù)據(jù)不已經(jīng)僅僅是海量,還會以海量的平方不斷海量遞增,這對未來的大數(shù)據(jù)架構(gòu)與數(shù)字化模式都提出了極大的挑戰(zhàn)。實際上電信領域的數(shù)據(jù)不是沒有,而是太多了。這仿佛成了一個對立的矛盾體,一方面每天產(chǎn)生海量的數(shù)據(jù),另外一方面,這海量的數(shù)據(jù)到用的時候發(fā)現(xiàn)又用不了。按照無線術語來說的話,這就是信號干擾噪聲比太差signal to interference plus noise ratio(簡稱:SINR),對人工智能來說,網(wǎng)絡提供的很多都不是數(shù)據(jù)了,而是是干擾、噪聲了。

      那么,有沒有可能在電信網(wǎng)絡數(shù)據(jù)海洋里面找到有用信號,而不是信號干擾一把抓,一步就朝著無監(jiān)督、基于大數(shù)據(jù)的深度學習發(fā)展呢?

      三、電信網(wǎng)絡常規(guī)問題的特征分析

      “我所接觸的醫(yī)療影像、生物信息類的數(shù)據(jù),能采集到的樣品數(shù)據(jù),相對于商業(yè)數(shù)據(jù)動則幾萬上億來說,基本上都少的可憐。研究項目其一,與某種特定手術有關的腦影像,數(shù)據(jù)質(zhì)量過關的就22例。項目其二與生物信號有關,受到目前數(shù)據(jù)采集設備的限制,同一批次最多不過300多樣本。實驗室其他疾病相關腦影像,少的14、36、72,多的頂天400、1500,全部都在用機器學習嘗試解決問題。生物信息、生物醫(yī)學鄰域現(xiàn)狀如此,大量的樣本難收集不是特例而是常態(tài)。”

      當大數(shù)據(jù)深度學習失效時

      這是一位生命科學領域研究人員的聲音,可以看到不少領域小樣本基本上是常態(tài),往往也只能基于小樣本來實現(xiàn)突破。

      如果我們再回過頭來看醫(yī)療領域,以內(nèi)科為例,常規(guī)的診斷過程其實就是一個典型的小樣本特征工程,一般就體溫,咽喉,血液,大不了再加一個透視等寥寥幾項檢查項目,以致于醫(yī)生看一個普通病例也就是幾分鐘的事情(當然要排除等待與化驗時間)。而基本的化驗,如血液化驗也僅僅一頁小紙條的一、二十項檢查項目。基于此,基本上80%以上的常規(guī)內(nèi)科病癥就這樣快速的處理了。當然,如果到了復雜的疑難雜癥,就需要更多的檢查與會診了,但這個時候?qū)<覉F都還不一定解決的了,需要現(xiàn)在就靠機器搞定嗎?

      這個場景是不是有點像前面的對于電信網(wǎng)絡的描述?數(shù)據(jù)實際上很多,但多數(shù)場景下能快速采用或者需要的樣本卻有限。常規(guī)的問題是主流,基本的套路分析就足夠了,復雜問題是少數(shù),但往往需要是會診、嘗試。

      同時,電信領域與IT領域有著很大的獨特特征。IT是基于IP連接的基礎上百花齊放,以致于同一個業(yè)務實現(xiàn),都可以五花八門,比如共享單車,摩拜與ofo就是完全不同的兩種實現(xiàn)方式。簡單來說,每個人,每個組織都會按照自己喜歡的方式在IP連接的基礎上完成自己設定的功能。

      但是電信領域卻是另外一套復雜的標準化體系。因為電信本身就是基于機器,要求機器之間按照要求完成任務,因此從其誕生之日就是一個標準化的體系架構(gòu),必需通過提前定義好的標準體系來實現(xiàn)機器之間的互通與動作,以實現(xiàn)定義好的服務。在電信領域,網(wǎng)絡設備是標準化的,其中的網(wǎng)元、網(wǎng)元功能模塊、接口等名稱也是指定好的,不能亂叫,而接口上承載的通信協(xié)議,更是連消息名稱、字段、字段取值都是定義好的,如果違背了這些標準,導致的結(jié)果就是兼容性問題而出現(xiàn)接網(wǎng)元對接不上。同時電信領域所提供的所有業(yè)務,從基本業(yè)務、補充業(yè)務到增值業(yè)務,可以多到幾百個業(yè)務,都沒有離開標準體系的框架,都是提前定義好的,業(yè)務要由哪些網(wǎng)元共同實現(xiàn),之間是通過哪些消息進行交互,消息的名稱、字段以及字段取值,甚至失敗原因碼都是提前定義好的,雖然有時也有保留取值范圍,但典型取值與含義都早就在協(xié)議標準中明確清楚了。隨著社會與技術的發(fā)展,標準體系也在演進加強,比如移動網(wǎng)絡在3G時間還有3GPP、3GPP2等好幾個標準體系,但到了4G、5G,都大一統(tǒng)成了3GPP一個體系了,標準化更強了。

      在標準化的基礎上,盡管實現(xiàn)標準的硬件、連接、配置等具體實現(xiàn)上可能的方式、組合很多,但也是需要從最初的設計就明確最佳路徑的設計原則、標準與規(guī)范。路徑再多,但只會選擇最好的,其他的可能不用管。上周在討論中就聽到了說無線基站智能設計太復雜了,比如BBU的配置有很多種,天線的型號也有很多種,最終導致的組合就太多了。但實際上,這都是有設計規(guī)范約束的,最終可選的范圍是有限的,一個BBU設計實例如下圖:

      所有硬件的位置都是確定的、有規(guī)則的,如2G主控板GTMU的位置,3G4G主控板UMPT的位置,基帶板BBP的位置,甚至起始的槽位位置都是有規(guī)范的,這能保證后續(xù)平滑演進擴容,不會出現(xiàn)擴容還得調(diào)整現(xiàn)有單板、改變現(xiàn)有連接。特別是現(xiàn)在SRAN演進以后,不僅僅主控板、接口板共用了,連基帶板也變成UBBP通用了,相應的設計原則與規(guī)范就此會進一步簡化。

      如果再結(jié)合前面章節(jié)的內(nèi)容,我們可以看到,電信網(wǎng)絡的典型特征就是標準化,相應的規(guī)劃、設計等也是有原則與規(guī)范約束的,產(chǎn)生的問題也具有常規(guī)化、場景化與具體化特質(zhì)的。那么我們的應用是不是可以先對準這些占主流的常規(guī)場景、常規(guī)問題?通過標準、規(guī)則,減少對于數(shù)據(jù)的需求,減少對于學習算法與框架的依賴?找到一條更適合電信網(wǎng)絡這類場景的模型?當然,復雜的電信網(wǎng)絡也會還有一些其他場景,在大數(shù)據(jù)提供容易的情況下,采用基于大數(shù)據(jù)框架下的深度學習方法。

      四、標準化的電信網(wǎng)絡與有監(jiān)督的小樣本學習

      機器學習是人工智能的核心,而機器學習往往又有監(jiān)督學習、強化學習、深度學習與無監(jiān)督學習。其中監(jiān)督學習常見的應用場景如分類問題與回歸問題,其輸入數(shù)據(jù)被稱為訓練數(shù)據(jù),明確的標識或結(jié)果,在學習過程中,將預測結(jié)果與訓練數(shù)據(jù)的實際結(jié)果僅需比較,不斷的挑戰(zhàn)預測模式,直到模型的預測結(jié)果達到一個預期的準確率。

      另外,小樣本也是樣本的一種,是指與“大樣本”相對。在現(xiàn)在的研究中,通常指樣本容量小于或等于30的樣本(小樣本理論也有說法是50)。必須使用統(tǒng)計量的精確分布來進行統(tǒng)計推斷。

      那么,什么又是小樣本學習呢?

      “小樣本學習”的概念依然是太廣了,而且也不是什么新概念,這個研究思路比神經(jīng)網(wǎng)絡的出現(xiàn)還要早很多年。通常所提到的“小樣本學習”,核心就是貝葉斯規(guī)劃學習(Bayesian Program Learning,BPL),為了與深度學習(Deep Learning,DL)相區(qū)分,一般稱為BPL方法。BPL方法是利用參數(shù)的先驗分布,由小樣本信息求來的后驗分布,直接求出總體分布。這種方法使用概率去表示所有形式的不確定性,通過概率規(guī)則來實現(xiàn)學習和推理過程。而深度學習往往是基于大數(shù)據(jù)通過多層網(wǎng)絡實現(xiàn)機器自動識別的有效的特征,一般數(shù)據(jù)越多其效果相對就會越好,在沒有大數(shù)據(jù)的情況下,深度學習的效果將會顯著下降。

      深度學習近年來取得了舉世矚目的成就,被廣泛應用在許多領域,例如內(nèi)容搜索、語音識別、圖像識別等。但是現(xiàn)在看來,在一些場景上似乎貝葉斯規(guī)劃學習要比深度學習的表現(xiàn)更好一點,因為這種方法更加適合我們?nèi)祟愡m應環(huán)境的方式。當然,兩種學習方法在不同的任務上還是獨具特色,各領風騷,假如能彼此借鑒,相互融合,一定能夠大幅提升人工智能的水平。當數(shù)據(jù)量巨大但較混亂的情況下,深度學習能發(fā)揮優(yōu)勢。在數(shù)據(jù)量較少而清晰的情況下,貝葉斯規(guī)劃學習也許能占領上風。

      因此,在數(shù)據(jù)量少,規(guī)則性明顯的場景下,有監(jiān)督小樣本學習,也可以作為機器學習的另一條途徑,通過由相關領域內(nèi)的專家人工提取出有用的特征,配合少量的數(shù)據(jù)進行機器學習。同時作為小樣本學習核心的貝葉斯方法中的一個重要特性就是先驗知識可以與觀察數(shù)據(jù)一起決定假設的最終概率。

      那么,我們回到電信領域,以上小樣本的描述是不是適合當前電信領域的不少場景?以問題處理為例,前面大量篇幅已經(jīng)描述過其典型特征,比如大部分問題都是常規(guī)或重復的問題。參考下圖的小樣本學習初步規(guī)劃:

      通過這段時間的方案審視與思考,我個人越來越感覺到電信領域,因為標準化、規(guī)則化、具體化以及最優(yōu)原則的存在,實際上在諸如規(guī)劃設計、問題處理等典型場景就可以是一個典型的小樣本學習(當前還需要基于有監(jiān)督,以后能否到半監(jiān)督、無監(jiān)督?)的模式。

      隨便舉一個例子,以3G最基本的RTWP問題為例,經(jīng)過那么多年的該類問題處理,實際上早就可以提煉出這個維度的“棋譜”以及更進一步的“定式”。比如影響RTWP的幾個關鍵因素:負荷、干擾、硬件、配置、工程質(zhì)量等等,以上幾大類問題,每類問題都有自己的問題現(xiàn)象表征,有自己的檢查辦法,當然更不用說已具備的諸多的典型案例與解決方案,而且在這個專題場景,現(xiàn)有的經(jīng)驗絕對可以覆蓋90%以上的問題。

      因此,按照小樣本定義,如果每個典型場景有30個典型案例,那基本能搞定80%以上的問題了。且不需要海量的數(shù)據(jù)需求,不需要復雜的建模,不需要厚重的平臺。

      當然,這些都還只是假設與猜想,是鑒于大數(shù)據(jù)的深度學習碰到了數(shù)據(jù)困難、平臺厚重難度下的反思。基于經(jīng)驗的有監(jiān)督的小樣本學習,是否會成為電信網(wǎng)絡人工智能的一條突破性快速通道呢?

      五、附錄:紛紛擾擾的人工智能能告訴我們什么

      2017年,火爆的IBM Watson似乎出現(xiàn)了麻煩。在GE的Predix、Google的AlphaGo橫空出世前,Watson一直是人工智能的代名詞。2013年,IBM與世界頂級的腫瘤治療與研究機構(gòu)MD安德森癌癥中心宣布合作,用Watson輔助醫(yī)生開展抗癌藥物的臨床測試。在當時看來,一扇新的大門正在對人類敞開,門后是AI與現(xiàn)代醫(yī)療結(jié)合的無限可能。對此,福布斯發(fā)表了題為《在MD安德森癌癥中心,IBM Watson解決了臨床測試難題》的社論。而2017年福布斯的新文章,標題則是 《Watson 是不是一個笑話?》。而MD安德森,也在當年中斷了與IBM的合作。前后反差,令人唏噓。有意思的是,MD安德森向IBM支付了3900萬美元,然而所有使用過Watson的醫(yī)生都不愿談及此事。2017年,隨著雙方的分道揚鑣。IBM營收停止增長,股價起起落落,分析師甚至開始質(zhì)疑:沃森真能帶來更多價值嗎?知名科技投資人 Chamath Palihapitiya 在2017年5月接受 CNBC 采訪時表示:“沃森就是一個笑話。”

      Watson 的一則商業(yè)廣告描繪了一家鄉(xiāng)村醫(yī)院的兩名醫(yī)生如何通過智能黑匣子來進行基因組分析。但是一名 IBM Watson Health 的前研究員兼 UX 設計師表示 ,他們與曾經(jīng)聽說過 Watson的患者交談過,這些患者也會詢問 Watson什么時候能幫助到他們。“作為一名設計師,聽到這些是一件令人心碎的事,因為我親眼見過 Watson for Oncology 到底是怎樣的,而且我也痛苦地認識到它的局限性。”這名設計師說道,“這種感覺非常糟糕,這些病人的希望都是 IBM 的營銷帶來的,但是我所知道的產(chǎn)品卻是實現(xiàn)不了的。”報道認為,IBM對于目前沃森所處的水平太過樂觀,這才招來批評。如果說現(xiàn)在還沒有取得很大的成就,那么最大的障礙于數(shù)據(jù),IBM需要特定類型的數(shù)據(jù),用來訓練系統(tǒng)。在多種環(huán)境下,數(shù)據(jù)供應嚴重不足,很難獲得。

      2018年3月22日,一篇數(shù)字化轉(zhuǎn)型失敗,美國通用電器包里了哪些問題的新聞報道在朋友圈里面開始傳送。百年老店GE在七年燒完40億美金之后,隨著杰夫.伊梅***的離去和公司股價的大幅下滑迎來新的挑戰(zhàn)。在報道里,GE Digital不僅放慢了腳步,甚至后退了一步。其旗下最重要的“產(chǎn)品”之一GE Predix已經(jīng)暫時放棄了工業(yè)物聯(lián)網(wǎng)的宏偉計劃,而是把觸角縮回到GE未來利潤所在的航空、醫(yī)療和能源系統(tǒng)三個領域。GE的最初目標是讓開源的Predix平臺稱為工業(yè)物聯(lián)網(wǎng)領域的安卓,但是絕大部分的應用開發(fā)都是GE工程師完成的;當合作伙伴對Predix平臺表示興趣的時候,GE Digital的重點是如何敲定一筆短期收入。在被稱為大眾點評公司版的雇主評價網(wǎng)站Galssdoor.com上,GE Digital的平均得分只有2.9(滿分為5分),管理和架構(gòu)混亂、糟糕的項目和產(chǎn)品管理是其中被提及最多的一些關鍵詞。一位已經(jīng)離職的高級顧問在1月27日給出了1分的最低評分,并留言說“CEO和他的直接下屬根本不知道他們究竟在做什么”

      2018年4月11日,一篇“騰訊AI翻譯搞砸成博鰲亞洲論壇笑話”的新聞報道又橫空出世,其中一段被點名的同傳譯文為“我想如果你能回答,很抱歉,如果你能在我們失去我們的耳朵之前回答這兩個問題,然后,然后我們會,然后我們會來找你”。同時還出現(xiàn)了“騰訊AI翻譯博鰲論壇出錯求助人工同傳”之類的烏龍報道,騰訊之后緊急解釋說找的人工同傳不是用于海南博鰲現(xiàn)場,而是北京的直播間專業(yè)報道。但是在騰訊AI同傳宣傳的描述卻是:“與傳統(tǒng)的基于短語的機器翻譯不通,騰訊翻譯君通過神經(jīng)網(wǎng)絡機器翻譯技術提升了騰訊同傳翻譯系統(tǒng)的翻譯質(zhì)量”。2周以后,4月28日,一篇“GMIC展現(xiàn)中國示例!機器翻譯世界冠軍引來全球“AI教父”關注”的新聞又刷新了視線,表示,承擔本次全球互聯(lián)網(wǎng)大會主論壇翻譯工作的搜狗同傳做出了高效的識別與翻譯,準確率令人滿意。同時該報道也提出了AI機器同傳在前不久的博鰲論壇上翻了車,本次搜狗同傳在GMIC大會的穩(wěn)定發(fā)揮,無疑是一次對于AI翻譯技術的及時救場。

      如果再回到電信領域,這段時間也有不少報道。比如海南移動宣稱,將大數(shù)據(jù)分析、人工智能等新技術應用到通信網(wǎng)絡,首創(chuàng)基于故障模型提前的特征保留投影分析,完成了預測預防性課題的成功實踐,預測準確率達到85%以上,處理效率提高60%以上;湖北移動宣稱中國移動湖北公司創(chuàng)新研發(fā)的無線網(wǎng)絡AI(人工智能)智能優(yōu)化平臺已正式在武漢部分地區(qū)投入使用。作為國內(nèi)首創(chuàng)的智能網(wǎng)絡優(yōu)化技術,該項技術的成功應用能有效提高網(wǎng)絡優(yōu)化效率,解決信號弱覆蓋等問題。海外則是無人網(wǎng)管中心、一個人優(yōu)化監(jiān)督的Elisa的網(wǎng)絡自動化運維案例,在網(wǎng)優(yōu)雇傭軍論壇成為了網(wǎng)紅。當然,Elisa的案例更是基于SON的自動化,并沒有宣稱人工智能。在文章中,Elisa表示,他們的SON網(wǎng)絡就像裝備了魔棒一樣發(fā)揮著神奇的魔力,每天自動執(zhí)行超過300萬次網(wǎng)絡體驗和3000次網(wǎng)絡配置和參數(shù)修改,而這項龐大工程僅需一名優(yōu)化工程師監(jiān)督完成即可。

      先不管新聞報道中的紛紛擾擾,也不管里面可能存在的作秀成分。首先我們得致敬那些有情懷的先行者,雖然先驅(qū)也許會成為先烈,但正因為有這些先行者在追求的道路上不斷的思考、嘗試與突破,才驅(qū)動了人類文明的一步步的革命式發(fā)展。當然,我們也深刻知道了這條路的艱辛與挑戰(zhàn),不是靠情懷、靠砸錢靠投入就能搞定的。盡管現(xiàn)在也能看到一些場景下的應用突破,但同時也無法忽視在基于數(shù)據(jù)的高維應用上依然還需要持續(xù)的探索與關鍵的突破,這不僅僅是需要基礎算法的突破,也許還需要回歸業(yè)務本質(zhì)的視圖,不浮夸,不沖動,對準業(yè)務需求,實現(xiàn)腳踏實地的場景分析與模型突破,以及面向數(shù)據(jù)科學的突破。

      本文來自“人工智能園地”公眾號

      人工智能 深度學習 大數(shù)據(jù) AI

      版權(quán)聲明:本文內(nèi)容由網(wǎng)絡用戶投稿,版權(quán)歸原作者所有,本站不擁有其著作權(quán),亦不承擔相應法律責任。如果您發(fā)現(xiàn)本站中有涉嫌抄襲或描述失實的內(nèi)容,請聯(lián)系我們jiasou666@gmail.com 處理,核實后本網(wǎng)站將在24小時內(nèi)刪除侵權(quán)內(nèi)容。

      上一篇:課程論文:《基于云原生的物聯(lián)網(wǎng)端管云系統(tǒng)方案綜述與演進設想》
      下一篇:藍牙核心規(guī)范(V5.2)7.2-深入詳解之SDP(五星推薦☆☆☆☆☆)
      相關文章
      亚洲av中文无码字幕色不卡| 亚洲人成伊人成综合网久久| 亚洲最大的黄色网| 亚洲av中文无码乱人伦在线播放 | 亚洲理论电影在线观看| 久久乐国产精品亚洲综合| 亚洲日本中文字幕一区二区三区| 亚洲成A人片在线观看中文| 国产精品手机在线亚洲| 国产综合激情在线亚洲第一页| 成人亚洲国产精品久久| 国产成人 亚洲欧洲| 国产精品亚洲а∨无码播放不卡 | 亚洲A丁香五香天堂网| 国产成人久久精品亚洲小说| 国产亚洲视频在线观看| 亚洲av无码天堂一区二区三区 | 亚洲日本香蕉视频| 亚洲一区欧洲一区| 亚洲大码熟女在线观看| 国产区图片区小说区亚洲区| 亚洲毛片不卡av在线播放一区 | 亚洲免费在线观看视频| 亚洲视频一区二区三区四区| 国产精品亚洲一区二区麻豆| 亚洲日本成本人观看| 在线亚洲精品视频| 久久久久亚洲av毛片大| 亚洲国产精品无码久久久秋霞2 | 亚洲国产成人片在线观看无码| 久久久久无码精品亚洲日韩 | 亚洲欧洲综合在线| 国产精品亚洲专区在线观看| 亚洲成a人无码亚洲成www牛牛| 国产精品成人亚洲| 国精无码欧精品亚洲一区| 亚洲综合视频在线| 亚洲高清中文字幕免费| 国产成人亚洲综合a∨| 亚洲精品无码久久千人斩| 亚洲午夜在线电影|