機械学習とは何か?
機械学習は「マシンラーニング(ML)」とも呼ばれていて、人間の学習を真似て、データを分析し、他のタスクの入力として使えるように予測・分類を行うテクノロジー全般を指します。言語翻訳、ストリーミングサービス、チャットボット、検索エンジン、生体認証などは、この機械学習のアルゴリズムを使用しているものが増えてきています。
目次
目次
機械学習とよく似た用語で「人工知能(AI)」や「ディープラーニング(深層学習)」がありますが、厳密には機械学習とこれらの定義は異なります。この記事では、機械学習の仕組みや活用事例、機械学習のさまざまな種類、機械学習と、統計学、ディープラーニング、AIの学習方法との違いについて解説します。
機械学習の仕組み
現在、私たちが利用しているほとんどのサービスを支えているのは、機械学習と言っても過言ではないでしょう。機械学習は、データのパターンを見つけ出し、コードを変更することなくサービスを改善できるため、さまざまな企業が機械学習のメリットを見出して積極的に取り入れています。
ここで、Facebook広告を例に考えてみましょう。もし、あなたがキャンプ用品や最新のGPSトラッカーに興味がある場合、間違いなくアウトドア関連の広告がフィードに流れるでしょう。機械学習は、あなたの閲覧履歴、訪問したウェブサイト、Facebookでフォローしている人などを分析し、あなたに関連する広告を提供します。このように、あなたの行動を分析して、興味を引きそうな商品を提示することで、購入をする確率を高めることができるのです。
あなたが新しい趣味を始めたり、今まで検索したことのないものをネットで探したりすると、機械学習はすぐにさまざまな広告のターゲティングを開始します。ユーザーの行動の変化を常に分析し、ユーザーにクリックしたいと思わせる広告を提供し、サービスに収益をもたらそうとしているのです。
ここからは、日常生活における機械学習技術の活用事例として有名なものをいくつか紹介します。
- ストリーミングプラットフォームのおすすめ番組。ストリーミングサービスでは、ユーザーが視聴した番組を分析し、あなたが好きそうな類似の番組を提案します。
- オートコレクト機能。さまざまなアプリケーションやデバイスに搭載されているオートコレクト機能は、入力内容を分析し、修正を提案する機能です。
- オンラインバンキングでの不正検知。機械学習によって不正を検知することで、なりすましを防止することができます。インターネットバンキングで不審な行動が検出されると、銀行はあなたの口座を凍結することがあります。特に、遠隔地から口座にログインしたり、銀行が疑わしいと判断した買い物をしたりした場合などに、利用が制限されます。
- 仮想パーソナルアシスタント。SiriやAlexaなどのバーチャルアシスタントは、ユーザーから提供された情報を分析し、過去のデータと比較し、さまざまなタスクを実行します。
- 交通量予測アプリ。Google MapsやWazeなどの地図・ナビゲーションアプリは、交通データを解析し、最短ルートを提案します。
- ソーシャルネットワーク上にいる友人の提案。位置情報、友人、興味、年齢、勤務先などをアルゴリズムで解析し、知り合いのリストを提示します。
- スパムフィルター。サイバーセキュリティにおける人工知能も広く応用されています。スパムメールやフィッシングメールの事例を機械学習に提供すると、類似のメールが受信トレイに届くのを防ぐことができます。
- スポーツウォッチ。運動量や心拍数を計測し、運動量や休憩時間などを通知するガジェットにも応用されています。
- 顔認識。機械学習により生体情報を解析し、データベースに登録された顔と照合することで個人を特定します。
- Spotifyのおすすめ曲。あなたが聴く音楽のジャンルやアーティストを機械学習が分析し、あなたが好きそうな音楽を毎週プレイリストとして提供します。
機械学習の種類
上記で紹介したサービスを支える機械学習には、大きく分けて4つの種類があります。ここからは、機械学習の種類の特徴をそれぞれ紹介します。
教師あり学習
教師あり学習は、アルゴリズムに入力データと希望する出力データを与えて、予測をさせる手法です。アルゴリズムはデータを分析した後、パターンを発見し、徐々に入力データを出力データに相関させる方法を学習します。これを繰り返すことで、独立して動作し、目的を果たすことができるようになります。
アルゴリズムの学習プロセスは、目的が果たされた段階で終わることはなく、入力されるデータを分析しながら、新しいパターンを発見し続けます。
教師なし学習
教師なし学習アルゴリズムでは、教師あり学習のように学習データに正解を与えません。コンピュータが自力でデータの規則性や特徴を見つけ出してクラスタ分けを行い、共通項や頻出パターンを見つけ出していくため、人間の介入を必要としないのが特徴です。この手法により、教師あり学習よりも複雑で多様なタスクを実行することができます。しかし、教師なし学習アルゴリズムは精度が低いと言われています。
半教師あり学習
半教師あり学習は、教師あり学習と教師なし学習の両方を組み合わせた学習手法です。ラベル付けされたデータとラベル付けされていないデータを使って、モデルが学習し、新しいデータの入力を予測できるようにします。
半教師あり学習は、アルゴリズムが学習するためのデータが十分でない場合によく使われます。しかし、データが不足していると、信頼性の低い結果をもたらす可能性があります。
強化学習
強化学習は、価値を最大化するために、システムが自力で試行錯誤しながら学習する手法です。従って、より多くの報酬を得られるかどうか、課題を果たせるかどうかはシステム次第です。強化学習アルゴリズムは複雑な問題を解決するのに適しているため、単純な課題には使われません。問題は、さまざまな方法で解決され、最終的に報酬を最大化する方法を見つけることができます。
機械学習と統計学の違い
機械学習と統計学は似ているようで異なります。一般的には、機械学習は機械が自動的に学習することで、統計学はデータの規則やパターンを統計的に決定することを意味します。
しかし現代では、コンピュータを統計にも利用することが一般的であるため、両者の間に明確な線引きをすることが難しくなってきています。しかし、注目してほしいのが両者のデータに対する考え方です。
統計学ではデータを説明することが目的であるのに対し、機械学習ではデータを予測することを目的としています。機械学習は直感的に理解できない説明変数も考慮することで、より高い精度を得ることができるので、ビッグデータに強いと言われています。
機械学習、ディープラーニング、AIの違い
「機械学習」と「AI」は同じ意味で使われることが多いですが、同義語と考えるべきではありません。AIは、知的なコンピュータプログラムを作る科学と技術なのに対し、機械学習はデータを使って機械を訓練するAIのサブセットで、情報のさまざまな側面に着目し、AIによる判断を強固なものにするという特徴があります。
「ディープラーニング」は、人間の神経細胞のネットワークを模倣し、人間が自然に行うタスクをコンピュータに学習させる手法です。ディープラーニングは、機械学習の一種ですが、より精度が高いと考えられています。
機械学習は人間の介入が必要ですが、ディープラーニングは自力で結果を評価して、それが満足のいくものであるかどうかを判断することができます。ディープラーニングは自らの失敗から学ぶことができるため、しばしば人間の脳と比較されます。SFの世界のように聞こえるかもしれませんが、未来学者による2025年の予測では、さまざまな技術がより発展すると言われています。
機械学習の倫理的課題
監視
機械学習はユーザーエクスペリエンスを向上させる一方で、インターネットユーザーの行動を監視するという目的に使われることがあります。多くの都市では、公共スペースの監視や犯罪者の特定に顔認識ソフトウェアが使用されています。しかし、プライバシー保護活動家は、その精度や、人々を監視することが倫理的かどうかについて懸念を示しています。
透明性の欠如
AIには、まともな規制や国際法がまだありません。AI技術がどのように使われ、誰が私たちの個人情報を収集しているのか、その個人情報が盗まれたらどうなるのか、確信が持てないのが現状です。言い換えれば、悪質な目的で使われて、ハッカーやサイバー犯罪者に利益をもたらすことさえあるのです。
影響力の偏り
大企業はAIを導入し、競合他社を市場から追い出すためのリソースをより多く持っています。コンピューティングの専門家は、AI技術を所有する者は他の誰よりも数歩先を行っていると考えています。
プライバシー
企業は、閲覧の習慣から位置情報まで、私たちに関する多くのデータを収集しています。これらの情報は、ユーザーに最高の体験を提供するために必要だと主張する企業がほとんどですが、同時に倫理的なジレンマも生じています。私たちのデータがどのように保存され、誰がそれにアクセスできるのか、確信が持てないのです。私たちは、SNSの危険性やデータ漏洩に毎日のように直面しているため、データが収集されると、私たち全員が脆弱になる可能性があります。
まとめ
今や、機械学習はさまざまな分野で活用されていて、私たちの生活を支える存在になっています。
とても画期的な仕組みである一方で、倫理的な問題もあるため、機械学習のメリットだけでなく、問題点や懸念点にも目を向ける必要があります。機械学習の課題のひとつにプライバシーの問題がありますが、オンラインプライバシーを重視する場合、VPNのダウンロードを検討しましょう。
VPNはオンライントラフィックを暗号化して、デジタルライフの安全性を確保するための仕組みです。VPNを利用すると、第三者があなたのオンライン活動を追跡したり、データを盗んだりすることが難しくなります。また、NordVPNの脅威対策Pro機能を有効にすると、悪質かつ危険なトラッカー、広告、ウェブサイトへのアクセスをブロックしてくれます。