遇和不遇: 自我學習

人工智能（AI）是指人類製造出來的機器所表現出來的智慧，它從早期是以更聰明的機器手臂取代工廠裏的勞工，到機器學習過濾垃圾郵件，分析我們的行為並且投放相關的廣告，近年由於深度學習技術的突破，無人車即將取代司機，甚至靠腦力的白領工作都岌岌可危，到底什麼是機器學習？什麼又是深度學習呢？

我們常常聽到的「機器學習」是屬於人工智能的一部分，另外「深度學習」又屬於機器學習的一種，如下圖所示：一種多層非性線變換，將輸入資料進行演算分析，得出要學習結果。

機器學習

顧名思義機器學習就是要讓機器（電腦）像人類一樣具有學習的能力，要了解機器學習，就先回頭看看人類學習的過程，人類是如何學會辨識一隻貓的？大致上可以分為「訓練」與「預測」兩個步驟：

訓練：小時候父母帶着我們看標註了動物名字的圖片，我們看到一隻小動物有四隻腳、尖耳朵、長鬍子等，對照圖片上的文字就知道這是貓，如果我們不小心把老虎的照片當成貓，父母會糾正我們，因此我們就自然地學會辨識貓了，這就是我們學習的過程，也可以說是父母在「訓練」我們。

預測：等我們學會了辨識貓，下回去動物園看到一隻有四隻腳、尖耳朵、長鬍子的小動物，我們就知道這是貓，如果我們不小心又把老虎當成貓，父母會再次糾正我們，或者我們自己反覆比較發現其實老虎和貓是不同的，即使父母沒有告訴我們，這個是我們判斷的過程，也可以說是我們在「預測」事物。

機器學習的分類

機器學習和人類學習的過程類似，要先進行「分類」，才能分析理解並且進行判斷，最後才能採取行動，分類的過程其實就是一種「是非題」（Yes 或No），例如：這一張照片「是」貓或「非」貓。機器學習是由電腦執行程式自行學習，一邊處理大量資料，一邊自動學會分類方式，就如同人類在學習一樣，因此機器學習就是在進行資料處理。

機器學習的種類

監督式學習：所有資料都有標準答案，可以提供機器學習在輸出時判斷誤差使用，預測時比較精準，就好像模擬考有提供答案，學生考後可以比對誤差，這樣聯考時成績會比較好。例如：我們任意選出100張照片並且「標註」哪些是貓哪些是狗，輸入電腦後讓電腦學習認識貓與狗的外觀，因為照片已經標註了，因此電腦只要把照片內的「特徵」取出來，將來在做預測時只要尋找這個特徵（四隻腳、尖耳朵、長鬍子）就可以辨識貓了！這種方法等於是人工「分類」，對電腦而言最簡單，但是對人類來說最辛苦。

非監督式學習：所有資料都沒有標準答案，無法提供機器學習輸出判斷誤差使用，機器必須自己尋找答案，預測時比較不準，就好像模擬考沒有提供答案，學生考後無法比對誤差，這樣聯考時成績會比較差。例如：選出100張照片但是沒有標註，輸入電腦後讓電腦學習認識貓與狗的外觀，因沒有標註，因此電腦必須自己嘗試把照片內的「特徵」取出來，同時自己進行「分類」，將來在做預測時只要尋找這個特徵（四隻腳、尖耳朵、長鬍子）就可以辨識是「哪類動物」了！這種方法不必人工分類，對人類來說最簡單，但是對電腦來說最辛苦，而且判斷誤差比較大。

半監督式學習：小部分資料有標準答案，可提供機器學習輸出判斷誤差使用；大部分資料沒有標準答案，機器必須自己尋找答案，等於是結合監督式與非監督式學習的優點。例如：選出100張照片，其中10張標註哪些是貓哪些是狗，輸入電腦後讓電腦學習認識貓與狗的外觀，電腦只要把照片內的特徵取出來，再自己嘗試把另外90張照片內的特徵取出來，同時自己進行分類。這種方法只需要少量的人工分類，又可以讓預測時比較精準，是目前最常使用的一種方式。

機器的訓練與預測

要讓機器（電腦）像人類一樣具有學習與判斷的能力，就要把人類大腦學習與判斷的流程轉移到機器（電腦），基本就是運用數據進行「訓練」與「預測」，包括下列4個步驟：

獲取數據：人類的大腦經由眼耳鼻舌皮膚收集大量的數據，才能進行分析與處理，機器學習也必須先收集大量的數據進行訓練。

分析數據：人類的大腦分析收集到的數據找出可能的規則，例如：下雨之後某個溫度與濕度下會出現彩虹，彩虹出現在與太陽相反的方向等。

建立模型：人類的大腦找出可能的規則後，會利用這個規則來建立「模型」，例如：下雨之後某個溫度與濕度、與太陽相反的方向等，就是大腦經由學習而來的經驗，機器學習裏的「模型」有點類似我們所謂的「經驗」。
預測未來：等學習完成了，再將新的數據輸入模型就可以預測未來，例如：以後只要下雨，溫度與濕度達到標準，就可以預測與太陽相反的方向就可能會看到彩虹。

遇和不遇

遇和不遇

2018年6月7日星期四

自我學習

沒有留言:

張貼留言

遇和不遇

2018年6月7日 星期四

自我學習

沒有留言:

張貼留言

2018年6月7日星期四