第268期

流轉AI 深度學習承先啟後

藉人工智慧發展的歷史,理解深度學習的原理與應用,並知曉其於未來發展的潛力。

流轉AI 深度學習承先啟後

簡梵軒

談論起人工智慧(Artificial Intelligence,以下簡稱AI),你心中第一個浮現的聯想是什麼呢?是電影中擁有高度智能的機器人?還是能打理一切事物的虛擬管家?這看似遙遠、空泛,卻又家喻戶曉的科技,實際上是存在你我周遭,於日常生活扮演著舉足輕重的角色。大至醫療,小至電子郵件分類,人工智慧的身影處處可見。

追根究底,究竟何謂人工智慧?人工智慧又包含了哪些類目?它如何進步、如何改善人類的生活?

從科幻到日常 人工智慧的起步

人工智慧、機器學習與深度學習相對關係示意圖(簡梵軒/製表)

廣義的人工智慧泛指擁有一切人類感覺、智慧,能如人一般思考的機器;而狹義的人工智慧意指其能在特定任務上表現得和人一樣好、甚至更加出色。而人工智慧中包含不同的分支,其中最廣泛使用的便是機器學習(machine learning)以及近代的巨大突破——深度學習(deep learning)。

故事的開端可追溯到電腦的出現說起。1950年代電腦問世後,人們開始關心「如何以電腦解決問題」,並嘗試使電腦以人類的思維運行,企圖創造擁有人類智慧的機器。然而科學家們很快的遇上瓶頸:電腦是基於人類智能的產物,那電腦又何以得出人類未知的答案?在此困境的阻撓下,人工智慧的發展便改道,朝向「機器學習」邁進。

何謂「機器學習」?機器學習有別於早期人工智慧「一個口令一個動作」由科學家撰寫程式使其運作的模式,而是透過演算法及大量數據分析,以判斷或推測特定目標,同時訓練機器正確執行任務。《數理人文》期刊指出,機器學習旨在使機器自己教育自己,如人類從觀察汲取經驗,機器亦可透過搜尋與分析資料以擁有自我學習功能。

作為人工智慧領域的重要分支,機器學習在近代硬體設施突飛猛進的狀態下獲得良好的發揮,並發展出相當數量的理論。然而,儘管機器學習佔據了1980年代至2006年間的社會主流,其仍有相當的限制,以圖像辨識為例,如欲透過機器學習的模式進行演算,需耗費大量人力編碼,且容易產生錯誤,可見機器學習仍未能滿足人類對人工智慧發展的野心與需求。

為了有助理解,我們在此需提及機器學習的其中一條支線,同時也為深度學習的前身——類神經網路(neural network)。

另尋他路 深度學習的誕生

李宏毅於《數理人文》提到,類神經網路靈感源自於生物大腦科學,其神經元彼此連結形成一個多層的神經網路,每個神經元皆為一簡單的函數,當輸入數值後,將依各自被賦予的權重演算出一個新的數值。訊息輸入後由第一層開始演算,接著傳遞給第二層,每一層的輸出即為下一層的輸入,依此規則直至傳遞予最後一層,成為最終結論。

類神經網路示意圖。(圖片來源/Neural Networks and Deep Learning

那麼,類神經網路是如何找出最佳函數呢?最廣為使用的學習法為梯度下降法(gradient decent)。 機器將隨機指出一組參數,並尋找比其更佳的第二組參數,以此辦法不斷重複,直至找不到更佳的參數為止,其中調整與運算可能高達上萬次,這也是類神經網路需海量運算的原因。然而,此方法並非萬無一失,它無法保證一定能找出最佳函數,僅能挑選出局部最好的,使類神經網路的運算摻雜運氣成分主導的不穩定性。

J.Schmidhuber於《Neural Networks》提及,早期類神經網路層次若大於三層,將出現梯度消失的現象,換言之,即無法得出結果。所以類神經網路研究一度停擺,直到2006年,由多倫多大學Geoffrey Hinton與其團隊提出限制玻爾茲曼機(RBM)模型,成功破解類神經網路的深度問題,並將其命名為深度學習。

事態發展至此,你可能認為,深度學習終於迎來蓬勃發展的曙光,但礙於一般電腦中央處理器(CPU)無法負荷如此大量的運算,深度學習仍無法起飛。不久後,有業者成功發展出圖像處理器(GPU),成功破解硬體設備不足的困境。直至2012年,Hinton的兩位學生成功以深度學習搭配GPU的組合,於ImageNet圖像辨識大賽中拔得頭籌,才正式讓世界看見深度學習的可發展性。

量身訂做 深度學習發展多元

走過人工智慧的發展長河,回到當下,深度學習到底有何用途?

以近年來當紅的AlphaGo為例,研究團隊於設定完成之類神經網路中輸入巨量棋譜,運用深度學習足以計算大量資訊的特性,訓練機器學習下圍棋,值得特別注意的是,AlphaGo所關注的並非「如何贏得棋局」,而是「如何預測並應對對手的每一步棋路」,透過此方法,AlphaGo幾乎能成為超越人類棋手的存在。不過,由另一角度來看,AlphaGo僅適用於圍棋對弈,於其他領域毫無用途。因類神經網路由複雜的函數組成,其結構需人類事先定義,若設定有誤,則可能朝錯誤方向演算,以致無法得到目標結果,可見深度學習仍無法擔任萬能人工智慧之角色,其主要僅限針對特殊需求進行設計並解決問題。

棋譜示意圖(圖片來源/DeepMind

雖說如此,深度學習仍有許多可看性,如語音辨識功能,過去語音辨識須將語音轉化為文字,再行解讀,而深度學習使直接分析語音成為可能,透過龐大的語音資料庫與輸入之個案進行比對,便可直接釋義。

此外,由於深度學習多層、海量計算的特性,其亦可應用於無人駕駛車的範疇。專注於「何處可以通行」,深度學習能迅速並有效地應對道路狀況,並隨著經驗的累積成長,相較於雲端資料庫更即時也更精準,這也為奧迪集團提出「深度學習是無人駕駛汽車的成功關鍵」的一大原因。

醫療方面,深度學習亦有助於提供更好的服務,如辨識醫療影像,包括視網膜病變、核磁共振顯影的腫瘤指標等,透過科技輔助,醫療人員便能直接取得數據並進行診療,省時省力,達到互利的局面。由上述案例可得知,深度學習雖非全面性的人工智慧,卻在各領域大放異彩,可見其有許多未知及應用值得探索。

自電腦的出現所引起人類對人工智慧的無限想像,歷經各式實驗與創新的碰撞,科學家們從錯誤中發掘新靈感,並以毅力證明假想的可實踐性。人工智慧的未知領域仍十分廣大,深度學習固然為人工智慧開闢了一條新的發展道路,卻只算冰山一隅。人類大可將其視為得力的助手,並無須恐懼在未來的某日會被其取代而失去工作。人工智慧持續進步,相對的,人類也未曾停止腳步。

記者 簡梵軒
無貓不歡,無繪畫不歡,無芭樂不歡。  
編輯 蔡翔宇
騎著一台經典車款,聽著90年代的嘻哈音樂,奔馳在鄉間小路之中。 這才是人生啊,酷吧,冰塊庫巴。
記者 簡梵軒
編輯 蔡翔宇