【XFastest訊】我們正在進入一個新的時代——人工智慧時代。依靠大量的試驗研究,Google、Facebook,微軟和蘋果等大型科技或網路公司,正尋求更為強大人工智慧技術。其中包括語言識別,語言翻譯,電腦視覺,以及圖片識別。
打敗Google Brain
在人工智慧領域,Google 相比對手走在了最前列。最近,該公司收購了多倫多大學一家神經網路方面的初創公司DNNResearch。據悉,這家公司創始人是機器“深度學習”(Deep Learning)方面的領軍人物。此外,Google 也公開討論過新型人工智慧技術,其中涉及了Android 手機上的語音搜索。Google 在語音辨識技術和電腦視覺精確度方面都創造了好幾項紀錄。
但是現在,Microsoft 研究團隊表示,它們新開發出了一種新型人工智慧系統,名叫Adam。Microsoft在其近期組織的學術峰會上也是首次提到了這項新技術。Microsoft表示, Adam相比此前的系統,在圖片識別方面精準度提升了一倍,尤其是在識別狗的品種或者蔬菜種類方面。“Adam 旨在探索人類大腦的奧秘。”Microsoft 研究院院長彼得·李(Peter Lee)表示。
彼得·李宣稱,在ImageNet 22K標準測試中,Adam 神經網路在圖片識別方面的表現要比 Google Brain快。ImageNet 22K標準主要向Google 線上服務(包括Android設備語音辨識和Google地圖等)提供了一種人工智慧測評計算方法。這項測試需要系統具備處理2.2萬張圖片資料能力。在Adam之前,只有少數人工智慧模型能夠處理如此規模龐大的資料登錄,其中就包括Google Brain。
不過,Adam並非憑藉“深度學習”演算法來打敗Google,它的取勝之道是優化設備資料處理和調整系統與設備之間交流。Microsoft這項研究的奠基人為Trishul Chilimbi。有意思人的是,Trishul Chilimbi此前並非人工智慧領域專家,而是從事大規模電腦系統研究。
Adam工作原理
與其他“深度學習”系統類似,Adam運行於一組標準電腦伺服器陣列,實際上它使用了Microsoft Azure雲端運算服務。“深度學習”旨在通過構建人腦神經網路系統,更加緊密地模仿人類大腦工作方式。Adam在運行過程中需要大量的伺服器,就如同人腦在運轉過程中需複雜的神經網路一樣。兩者的區別在於,Adma利用的是一項名為“非同步”(asynchrony)技術。
隨著計算系統變得日益複雜,系統內各部分彼此之間在交流時變得越來越困難。不過,“非同步”技術能夠幫助解決這一問題。從根本上講, “非同步”將系統分為多個小部分,它們在 “分享”各自運算和融合為一體前,彼此都是獨立運行的。問題在於,儘管這種技術能夠很好的應用在智慧手機和筆記型電腦上(智慧手機和筆記型電腦的內部計算分散在諸多不同晶片之上),但在包含了很多不同伺服器的系統中(如神經網路),這項技術的表現算不上成功。
但是,諸多研究人員以及包括 Google 在內的科技公司在過去幾年時間都在這一領域投入很多精力,而微軟正是憑藉華盛頓大學研發的“HOGWILD!”技術才占得先機。
“HOGWILD!”技術起初只是讓機器內部每個處理器能夠更為獨立的運行。不同晶片甚至都能夠寫入相同的存儲單元之中,彼此之間不會受到“重疊”影響。對於大部分系統來說,這種技術絕對不算什麼“好東西”,它們可能會導致資料衝突,因為一台設備覆蓋了其設備已完成資料編碼。但在某些情況下,這種技術運作良好。正如華盛頓大學研究員所展示的,“HOGWILD!”可以大幅提升單個設備的運算速度。Microsoft Adam在此基礎之上做了改進,應用了 “HOGWILD!”技術。 “我們比HOGWILD!更瘋狂,因為Adam的非同步性更強。”Chilimbi表示。
儘管神經網路分佈極其密集,且資料衝突風險很大,但這種方法行得通,是因為如果系統能夠避開資料衝突,這種“衝突”則會帶來一種相同的運算。
Microsoft 表示,Adam可以説明神經網路更快速、更精確的來“訓練”設備對圖片的認知能力。讓人感到驚訝的是,Adam運行的竟然是傳統的電腦晶片,而非專門用於圖形處理的GPU。目前,很多“深度學習”系統使用的是GPU,就是為了避免資料通信瓶頸。但Chilimbi表示,Microsoft Adam選擇的是不同的路徑。
神經網路依靠的是海量資料,它所處理的資料比標準電腦晶片CPU要多得多。這也是為什麼它們需要分散到很多機器上的原因。作為另一種選擇,GPU可以來處理如此龐大的資料,且速度更快。但問題是,如果人工智慧系統資料未能完全與GPU或者運行於多個GPU之上的單一伺服器匹配,系統將會崩潰。
另外,資料中心的通訊系統運行速度還不足以跟上GPU處理資訊的速度,這將會導致資料傳輸堵塞。正因為如此,一些專家表示, GPU並非處理大型神經網路系統的最佳選擇。
Microsoft將Adam描述為一種“奇幻”的系統,但某些深度學習領域專家則表示,Microsoft Adam系統的工作原理跟穀歌人工智慧並非完全不用。專家表示,如果不知道更多有關Microsoft如何優化神經網路的細節,人們就很難知道Microsoft Adam團隊是如何來實現他們所宣稱的成果。
前Google Brain部門研究人員馬特·賽勒(Matt Zeiler)表示:“Microsoft的研究成果跟人類已發現的研究成功背道而馳,但這也是它的亮點之處。”他表示,如果Microsoft能夠增加更多設備,那Adam的識別準確率就會越高。
未來潛力巨大
Microsoft 彼特·李表示, Adam專案目前還處於初級階段。到目前為止,它只是在一款應用內部進行測試。測試結果顯示,當你使用手機拍照時,Adam能夠準確的識別照片上的物體。彼特·李使用Adam辨別出了狗的品種以及有毒的蟲子。Microsoft目前還未披露何時向大眾市場推出這款應用的計畫。不過,彼特·李表示,Adam未來肯定可以在電子商務、機器人,以及敏感度分析領域得到“重用”。Microsoft目前也正在討論研究,如果Adam運行在程式設計閘陣列(field-programmable arrays)或運行常規軟體處理器上時,它的效率是否會提高。事實上,微軟已經在測試這類晶片來提升Bing服務。
此外,彼特·李堅信,Adam將可以成為真正的人工智慧技術,這種智慧技術將跟人類處理語言、視覺和文本形態內容功能接近。但是,想要達到這種水準,微軟還需要做很多。自上世紀50年代,人類就已經開始朝這個目標邁進。但現在,可以肯定的是,我們離目標又近了一步。
|