2018年6月7日 星期四

自我學習


人工智能(AI)是指人類製造出來的機器所表現出來的智慧,它從早期是以更聰明的機器手臂取代工廠裏的勞工,到機器學習過濾垃圾郵件,分析我們的行為並且投放相關的廣告,近年由於深度學習技術的突破,無人車即將取代司機,甚至靠腦力的白領工作都岌岌可危,到底什麼是機器學習?什麼又是深度學習呢?

我們常常聽到的「機器學習」是屬於人工智能的一部分,另外「深度學習」又屬於機器學習的一種,如下圖所示:一種多層非性線變換,將輸入資料進行演算分析,得出要學習結果。
機器學習
顧名思義機器學習就是要讓機器(電腦)像人類一樣具有學習的能力,要了解機器學習,就先回頭看看人類學習的過程,人類是如何學會辨識一隻貓的?大致上可以分為「訓練」與「預測」兩個步驟:
訓練:小時候父母帶着我們看標註了動物名字的圖片,我們看到一隻小動物有四隻腳、尖耳朵、長鬍子等,對照圖片上的文字就知道這是貓,如果我們不小心把老虎的照片當成貓,父母會糾正我們,因此我們就自然地學會辨識貓了,這就是我們學習的過程,也可以說是父母在「訓練」我們。
預測:等我們學會了辨識貓,下回去動物園看到一隻有四隻腳、尖耳朵、長鬍子的小動物,我們就知道這是貓,如果我們不小心又把老虎當成貓,父母會再次糾正我們,或者我們自己反覆比較發現其實老虎和貓是不同的,即使父母沒有告訴我們,這個是我們判斷的過程,也可以說是我們在「預測」事物。
機器學習的分類
機器學習和人類學習的過程類似,要先進行「分類」,才能分析理解並且進行判斷,最後才能採取行動, 分類的過程其實就是一種「是非題」(Yes No),例如:這一張照片「是」貓或「非」貓。機器學習是由電腦執行程式自行學習,一邊處理大量資料,一邊自動學會分類方式,就如同人類在學習一樣,因此機器學習就是在進行資料處理。
機器學習的種類
監督式學習:所有資料都有標準答案,可以提供機器學習在輸出時判斷誤差使用,預測時比較精準,就好像模擬考有提供答案,學生考後可以比對誤差,這樣聯考時成績會比較好。例如:我們任意選出100張照片並且「標註」哪些是貓哪些是狗,輸入電腦後讓電腦學習認識貓與狗的外觀,因為照片已經標註了,因此電腦只要把照片內的「特徵」取出來,將來在做預測時只要尋找這個特徵(四隻腳、尖耳朵、長鬍子)就可以辨識貓了!這種方法等於是人工「分類」,對電腦而言最簡單,但是對人類來說最辛苦。
非監督式學習:所有資料都沒有標準答案,無法提供機器學習輸出判斷誤差使用,機器必須自己尋找答案,預測時比較不準,就好像模擬考沒有提供答案,學生考後無法比對誤差,這樣聯考時成績會比較差。例如:選出100張照片但是沒有標註,輸入電腦後讓電腦學習認識貓與狗的外觀,因沒有標註,因此電腦必須自己嘗試把照片內的「特徵」取出來,同時自己進行「分類」,將來在做預測時只要尋找這個特徵(四隻腳、尖耳朵、長鬍子)就可以辨識是「哪類動物」了!這種方法不必人工分類,對人類來說最簡單,但是對電腦來說最辛苦,而且判斷誤差比較大。
半監督式學習:小部分資料有標準答案,可提供機器學習輸出判斷誤差使用;大部分資料沒有標準答案,機器必須自己尋找答案,等於是結合監督式與非監督式學習的優點。例如:選出100張照片,其中10張標註哪些是貓哪些是狗,輸入電腦後讓電腦學習認識貓與狗的外觀,電腦只要把照片內的特徵取出來,再自己嘗試把另外90張照片內的特徵取出來,同時自己進行分類。這種方法只需要少量的人工分類,又可以讓預測時比較精準,是目前最常使用的一種方式。
機器的訓練與預測
要讓機器(電腦)像人類一樣具有學習與判斷的能力,就要把人類大腦學習與判斷的流程轉移到機器(電腦),基本就是運用數據進行「訓練」與「預測」,包括下列4個步驟:
獲取數據:人類的大腦經由眼耳鼻舌皮膚收集大量的數據,才能進行分析與處理,機器學習也必須先收集大量的數據進行訓練。
分析數據:人類的大腦分析收集到的數據找出可能的規則,例如:下雨之後某個溫度與濕度下會出現彩虹,彩虹出現在與太陽相反的方向等。
建立模型:人類的大腦找出可能的規則後,會利用這個規則來建立「模型」,例如:下雨之後某個溫度與濕度、與太陽相反的方向等,就是大腦經由學習而來的經驗,機器學習裏的「模型」有點類似我們所謂的「經驗」。
預測未來:等學習完成了,再將新的數據輸入模型就可以預測未來,例如:以後只要下雨,溫度與濕度達到標準,就可以預測與太陽相反的方向就可能會看到彩虹。

沒有留言:

張貼留言