機器學習(Machine Learning)是人工智慧(AI)的一種,著重於建立能根據訓練樣本資料來學習或改善效能的系統。人工智慧為廣義詞,意指能模擬人類智慧的系統和機器。機器學習和 AI 經常一起被討論,且有時術語可以互換使用,但其含義並不相同。其中一項重要的區別是:雖然所有機器學習都屬於 AI,但並非所有 AI 都是機器學習。
機器學習如何運作?
機器學習演算法的基本目的,是讓電腦對訓練樣本資料形成概念,以對未來資料進行預測。機器學習是現今多數服務背後所運用的技術。近年來各種企業都採用機器學習,因為可以在資料中找到模式,並在不改變程式碼的情況下改善工作流程和服務。
以 Facebook 廣告為例。如果您是一個狂熱的登山者,對露營裝備和最新的 GPS 設備感興趣,肯定會收到許多與戶外活動相關的廣告。機器學習會分析用戶的瀏覽歷史、造訪過的網站以及在 Facebook 上關注的人,以便提供相關廣告。分析用戶上網行為會大量增加購買的機會。
只要用戶有了新的愛好,或在網路上搜尋以前從未搜尋過的內容,機器學習就會立即開始發送 目標廣告 。它不斷分析用戶行為的變化,試圖為用戶提供最有可能點擊的廣告,並為服務帶來收入。
以下是一些在日常生活中機器學習應用的常見範例:
- 在串流媒體平台上推薦電視節目。 串流媒體服務會分析用戶曾觀看的內容,並推薦可能喜歡的類似節目。
- 自動修正功能。 許多不同的應用程式和設備都提供自動修正功能,該功能會透過分析輸入內容和建議修正來運作。
- 網路銀行風險 監控與詐欺偵測。 機器學習可以檢測欺詐並避免身份遭竊用。當發現可疑活動時,銀行可能會凍結用戶的帳戶。包括從國外登入帳戶,或進行銀行標記為可疑的交易。
- 虛擬個人助理。 Siri 或 Alexa 這類虛擬助理會分析用戶提供的資訊,將其與以前的資料進行比較,並執行各種任務。
- 交通預測。 Google 地圖、Waze 和其他類似的應用程式會分析交通資料並建議最快的行車路線。
- 在社交網路上推薦朋友。 這種演算法會分析用戶的位置、朋友、興趣、年齡和工作場所,並向用戶推薦可能認識的人員清單。
- 垃圾郵件篩選器。 人工智慧在網路安全上也有了廣泛的應用。如果提供 垃圾郵件 或網路釣魚電子郵件的範例提供給機器學習,就可以防止類似的電子郵件寄送到用戶的收件匣。
- 運動手錶。 這類小裝置可以追蹤用戶的活動,監控心率,並通知進度或休息時間等因素。
- 人臉辨識。 機器學習可以分析生物特徵資料,並從資料庫比較人臉來識別人員。
- 串流服務(如 Netflix 和 Spotify)的推薦系統。 機器學習會分析用戶聽過的音樂類型或看過的影片,以推薦用戶可能喜歡的播放清單。
機器學習的類型
機器學習演算法有許多不同類型,一般來說按照學習方式可分為以下幾個類型。
監督式學習
監督式學習是在訓練中提供有標記的資料,以便對其訓練以進行預測。演算法分析資料後,發現模式,並逐漸學習如何將輸入資料關聯到輸出資料。這種方法需要人工介入,目前可以獨立運作並服務於其目的。
例如若要訓練機器用 圖片辨識 技術去辨識猴子和猩猩的照片,則提供機器 100 張猴子和猩猩照片,讓機器去學習這兩種動物的特徵,未來提供新的照片,機器就能辨識出這張照片中的動物是猴子或猩猩。
非監督式學習
非監督式學習不需要人工介入,機器會自己在訓練資料中找到模式。這種能力使其能够執行比監督式學習更複雜和更通用的任務。不過,非監督式學習演算法的精確度較低。
例如若使用非監督式學習去辨識猴子和猩猩的照片,機器需自行從提供的 100 張照片判斷資料特徵。在未來進行預測時,機器會利用習得的特徵去判斷新照片是猴子或猩猩,但機器判斷的結果不一定正確。
半監督式學習
顧名思義,半監督式學習是監督式學習和非監督式學習的綜合。它使用標記和未標記的資料,因此模型可以學習並預測新的資料。半監督式學習可讓預測較為精確。例如若有 100 張照片,則標記其中 10 張照片,讓機器透過這 10 張照片的特徵去預測剩餘的照片。
強化式學習
强化式學習的模型會根據人類的反饋自行逐步修正,最終得到正確的結果。例如機器將猩猩的照片判斷成猴子,而人類告知這是錯誤判斷,機器會再次辨認特徵並分類。透過不斷的試誤,最終的預測就會越來越精確。
機器學習、深度學習與人工智慧
雖然許多人將機器學習和 人工智慧 這兩個名詞劃上等號,但不應被視為同義詞。人工智慧是定義可類比人類思維和行為方式的機器的概念,屬於較廣泛的名詞。機器學習是人工智慧的子集合,允許機器去學習各種模式並解決問題。
深度學習 是機器學習的一種進階演算法。資料科學家常使用 Python 程式語言來開發深度學習模型。這種演算法試圖模仿人類神經元網路,將其轉化為一個極其複雜且可自行做出決策的系統。過去十年來,目標檢測與識別、文字轉語音、資訊檢索等領域,使用深度學習取得重大進展。目前的研究集中在個人化醫療照護、機器人增強式學習、情緒分析等尖端領域,開發高效使用資料的機器學習。也就是說在相同性能、更短時間及更少資料的情況下,深度學習技術能更有效率的學習。
機器學習需要人工介入,而深度學習可以評估結果是否令人滿意。因為深度學習可以從自己的錯誤中學習,所以經常被比喻為人腦。雖然這聽起來像科幻小說,但未來學家的預測指出,人工智慧領域未來將更深入到人類生活當中。
機器學習的應用領域
各行各業目前都有機器學習的相關應用,以下是機器學習在產業中一些範例:
銀行與金融業
機器學習在銀行和金融業的應用包括風險管理和詐欺保護。可使用過去的交易記錄,透過機器學習篩選出可疑交易,並找出有問題的警示帳戶,以進行風險管理和和詐欺保護。
醫療保健
機器學習可協助醫療機構診斷疾病、開發新藥、提供傳染預測和輔助監控病患病情。
客戶服務
客服中心可透過機器學習來取代人工客服自動回應客戶問題、測量客戶體驗滿意度、收集意見反應和提供虛擬協助。例如, 聊天機器人 的應用就屬於此類。
零售業
機器學習可協助零售業分析客戶購買模式、擬定定價策略、使用資料改善客戶體驗。
農業
機器學習可協助農業減少勞力成本、提高作物產能、診斷植物疾病、監控土壤健康情況。
物聯網
物聯網 和機器學習提供隱藏在資料中的洞察力,以快速、自動化的反應和改進決策。為了優化算法的決策能力,需要大量的歷史資料。這使得物聯網成為機器學習的理想用例,因為設備生成資料非常迅速和準確。 使用 IoT 和 ML,一家公司可以自動化其裝配線上的質量檢查和缺陷跟蹤,跟蹤現場資產的活動,並預測消費和需求模式。
機器學習的倫理挑戰
監控
儘管機器學習可以改善用戶體驗,但也可能被用於監控等爭議性目的。某些城市使用人臉辨識系統來監控公共場所並找出罪犯。因此,資安人士對機器學習的準確性以及監視他人是否合乎道德提出了擔憂。
缺乏透明度
人工智慧仍然缺乏監管和國際法規的規範。我們無法確定人們會如何使用人工智慧技術,以及哪些人會收集我們的私人資料。它甚至可以用於惡意目的,讓不法之徒受益。
權力分配不均
大公司有更多的資源採用人工智慧,在市場中超越競爭對手。資訊專家一致認為,擁有人工智慧技術的公司將比其他公司更具優勢。
隱私權
企業收集了大量用戶的相關資料,例如上網活動和位置(了解更多關於 資料收集 的信息)。雖然他們聲稱這是為用戶提供最佳體驗所必需的資訊,但這也引發了道德議題。我們無法確定用戶資料會如何被保存,哪些人可以存取這些資料。由於資料外洩每天都在發生,資料收集讓人們很容易遭受攻擊。
按一下啟動網路安全。
使用全球領先的 VPN 保護設備的安全