ビッグデータ時代を迎え、データ処理・データ分析を行うための手法は大きく変わってきています。
キーワードとなっているのは、「機械学習」。
機械学習が注目されるようになり、関連して下記のようなキーワードも目にするようになりました。
- 統計学
- ディープラーニング
- ニューラルネットワーク
- 機械学習アルゴリズム
- AI(人口知能)
機械学習を説明されたWeb記事や本を読んでも、ピンと来ていない人は多いかもしれません。
この記事では、機械学習についてわかりやすくお伝えします。
今、注目される人口知能(AI)について、知識を深めたいという方はぜひ読んでみてください。

先に挙げたキーワードですが、結局のところは、ビジネスを円滑に進めるための「分析」というステップの中の話です。
この記事では、知識の繋がりや、応用されるシーンについて、わかりやすく説明していきます。
機械学習とは?
機械学習をざっくりお伝えすると下記のとおり。
統計学(とくに推測統計と呼ばれる種類)も収集したデータから、傾向や性質を知り、確率論的に推測する
という手法です。
機械学習と統計学の違い
機械学習との違いを伝えるなら、下記のように言えます。
ある池で釣った魚の大きさが平均30cmだったとき、
- 機械学習
→その池で「どのくらいの大きさの魚が釣れるか」を予測する - 統計学
→その池に「どのような大きさの魚がいるか」を推測する
機械学習も統計学も「データの規則性を見出す」という点では共通しています。
しかし、機械学習は「未知のデータを予測する」ことに重点を置いているのが特徴だと考えてください。
機械学習と人口知能(AI)の関係性
最近ではディープラーニングや、ニューラルネットワークといった言葉もあります。
Google翻訳の精度が飛躍的に向上したのは、ニューラルネットワークの技術があるからと言われています。
また、画像解析の領域ではディープラーニングが注目されています。
ディープラーニングと機械学習は違うの? と思う方はいるかもしれません。
定義をまとめると下図のようになります。


そもそも、なぜAIはここまで注目されるの? という方は、こちらの「なぜAI(人工知能)は注目される?働くことが楽しくなる世の中はすぐそこ」という記事もあわせて読んでみてください。
機械学習が活用されることで起こる変化
次に機械学習が活用されることによって、どういった変化が起こったのかをまとめてみましょう。
これまでの分析
- 販売、会計など社内にあるさまざまなデータをデータベースに集約
- 集約したデータをもとに分析する
ビッグデータ時代の分析
- 自社のデータベースに加え、GPSやICカード、Webサイトのアクセス情報などをリアルタイムに処理・収集
- 機械に大量のデータを解析させ、データに潜むルールやパターンを発見し発展させる
機械学習を活用したアプリの例
それでは、わかりやすい例を挙げてみます。
タクシーアプリの例です。

上記のようなデータをもとに、AIによる分析をすることによって、需要の予測が可能となります。
そして、その需要予測により効率的な運行を実現できるというわけです。
これは機械学習のひとつ、「予測モデル」と言われるものです。
機械学習の予測モデルの活用事例
該当するエリアに何人くらいお客さんが来るのか予測できれば、タクシーの運行会社は、そこにタクシーを向かわせて売上を伸ばすことができます。
必要なデータは、下記のとおり。
- タクシーの運行状況
- リアルタイムの人の動き
- 緯度・経度
- 近隣の施設情報
- 周辺人口
- 天気
など。
このようなデータを活用して、客数を予測するというわけです。
- ある施設でイベントが開催されている
- 突然のゲリラ豪雨により、雨宿りをしている人がたくさんいる
- 電車が止まってしまって、駅で入場規制が行われている
といったように、少し考えただけでも、売上を伸ばすことのできる状況が思い浮かびます。
しかし、最初のうちは、「予測した客数」と「実際の客数」には「ギャップ(=誤差)」が生まれるはず。
その誤差を調整し、より正しい客数を予測できるように調整していくことが必要になります。
それを自動的に実行していくのが「機械学習」というわけです。
機械学習3つの分類【教師あり学習、教師なし学習、強化学習】
機械学習を体系的に理解するうえで、オンラインで学べるAI学習プログラミングサービス「Aidemy」の説明がわかりやすかったので、参考にしながら説明していきます。
Aidemyの「機械学習概論」によると、機械学習は「教師あり学習」「教師なし学習」「強化学習」と、さらに3つに分類できるとのこと。
3つの分類は下記のとおりです。


教師あり学習
例えば、
- 犬の画像を見て「犬」と判断
- 数字の5の画像を見て「5」と判断
- ある小説の文章を書いたテキストデータ読み込んで著者を予測
上記のように、データからカテゴリを予測するモデルを「教師あり学習」と呼びます。
これは「教師あり学習」のなかでも「分類」と呼ばれるモデルです。
また「教師あり学習」には「回帰」と呼ばれるモデルもあります。
「駅から徒歩10分」「広さ20㎡」など複数のデータをもとに、その物件は家賃8万円だろうと予測するモデルです。
「教師あり学習」には、
- 分類
- 回帰
という2つのモデルがあると知っておきましょう。
教師なし学習
「教師あり学習」はあるデータに対して、「犬」「数字の5」といったラベルを判断するものでした。
一方、「教師なし学習」は、正解ラベルなしにデータの塊を分類し、規則性を発見するというもの。
例えば、家賃の価格帯に対して、「立地」「広さ」「築年数」「駅からの徒歩時間」といった複数のインプットデータがあったとします。
下図は、そのインプットデータを適当にサンプリングして作った図ですが、赤い丸囲みのように規則性が見つかるかもしれません。


強化学習
わかりやすい例としては、Googleが開発した「AlphaGo Zero」という囲碁AI。
これは対戦を通じ、データのインプットを繰り返すことで、囲碁の最善の打ち手を学習するという技術。
今注目されている「自動運転技術」も強化学習を応用しています。

Aidemyの「機械学習概論」は、登録すれば無料で見られるので、AIに興味がある方はぜひ見てみてください。
機械学習をビジネスで活用するための組織体制とは?
多くの企業でデータ活用が進まない理由のひとつは、ビジネス担当者とデータ分析担当者(もしくは外部ベンダー)との間に理解の断絶があることかもしれません。
ビジネス側の担当者は、
- 売上を上げたい
- コストを下げたい
- リスクを下げたい
という課題を持っています。
しかし、
- 分析手法や理論
- AI技術で使われる技術や応用パターン
をビジネス側の担当者が理解するのは、難易度が高いでしょう。
そういった中、ビジネス知識をもったデータサイエンティストという人材をどの企業も欲しているというのは当然のことだと思います。
しかし、ビジネススキル、ITスキル、データサイエンススキルのすべてを兼ね備えているスーパーマンなど、ほとんどいません。
データサイエンティストについては、「【注目の職業】データサイエンティストになるには?これから来るAI時代に知りたい最新事情」という記事で詳しく紹介しているので、ぜひ読んでみてください。
機械学習が注目される時代に求められる人材
データサイエンスを取り巻く環境では、下記のようにチーム体制で条件を満たせばいいのではないか? という考え方が主流となりつつあります。
- 統計学に詳しいデータサイエンティスト
- インフラに詳しいデータサイエンティスト
- BIツールの操作やデータの可視化に強いデータサイエンティスト
- コンサルティングが得意なデータサイエンティスト
そこでデータサイエンティストをタイプ別に分類する「タイプ論」も登場しています。
参考までに特徴を紹介しておきますね。
■Data Developers
- 得意:データベース、プログラミング、機械学習
- 苦手:統計学、ビジネス
- 経歴:IT業界
■Data Reseacher
- 得意:統計学、分析
- 苦手:ビジネス
- 経歴:研究者、大学教授
■Data Creatives
- 得意:ビッグデータ、プログラミング
- 苦手:ビジネス
- 経歴:コントリビュータ
■Data Business people
- 得意:ビジネス、技術的な知識
- 苦手:プログラミングや機械学習の実務
- 経歴:ビジネスサイド(マーケッターなど)
機械学習に必要な知識のつながり
何を分析し、どういった結果を出そうとしたいのかがわかっていれば、「ビジネス担当者」「データ分析担当者」の相互理解が進み、円滑に業務は回っていくでしょう。
その相互理解を進めるような人材は、これからの時代において、かなり貴重になるのではないかと予想しています。
参考までに機械学習に必要な知識のつながりも紹介しておきます。


知っておくべきことは、どの技術や知識が、どのように繋がっているかということです。
まとめ:機械学習を学びたい方におすすめの学習方法
AIやディープラーニングはすごいと言っても、そのすごい技術を活用できるシチュエーションを想定できなければ、意味がありません。
機械学習について独学で学ぶのは、かなり困難だと思います。
そういった方におすすめなのは、下記の学び方です。
- データサイエンスに特化「データミックス
」
- 20代に圧倒的オススメ「GEEK JOB
」
- 丁寧なサポートで人気のスクール「TECH::CAMP
」
- 自宅学習なら「TechAcademy」か「Udemy
」
データサイエンティストを育成する学校ってどんな感じ? と気になる方は、こちらの記事を参考にしてください。
あわせて読みたい参考記事
→ 【データミックス(DataMix)の評判】説明会に参加してわかったデータサイエンスが注目されている理由

ぜひ一緒に学んでいきましょう。