機械学習とは?機械学習に必要な知識のつながりを解説【初心者必読】

機械学習とは?機械学習に必要な知識のつながりを解説【初心者必読】



 

ビッグデータ時代を迎え、データ処理・データ分析を行うための手法は大きく変わってきています。

キーワードとなっているのは、「機械学習」。

機械学習が注目されるようになり、関連して下記のようなキーワードも目にするようになりました。

  • 統計学
  • ディープラーニング
  • ニューラルネットワーク
  • 機械学習アルゴリズム
  • AI(人口知能)

機械学習を説明されたWeb記事や本を読んでも、ピンと来ていない人は多いかもしれません。
この記事では、機械学習についてわかりやすくお伝えします。

今、注目される人口知能(AI)について、知識を深めたいという方はぜひ読んでみてください。

 

山根ただし
こんにちは。分析おたすけマンこと、山根です(Twitterはこちらから)。
先に挙げたキーワードですが、結局のところは、ビジネスを円滑に進めるための「分析」というステップの中の話です。
この記事では、知識の繋がりや、応用されるシーンについて、わかりやすく説明していきます。

 

 

機械学習とは?

機械学習のイメージ画像
機械学習をざっくりお伝えすると下記のとおり。

機械に大量にデータを解析させて、データに潜むルール(規則性)やパターンを発見し、発展させていく処理のこと。

 

統計学(とくに推測統計と呼ばれる種類)も収集したデータから、傾向や性質を知り、確率論的に推測する
という手法です。

 

機械学習と統計学の違い

 

機械学習との違いを伝えるなら、下記のように言えます。

ある池で釣った魚の大きさが平均30cmだったとき、

  • 機械学習
    →その池で「どのくらいの大きさの魚が釣れるか」を予測する
  • 統計学
    →その池に「どのような大きさの魚がいるか」を推測する

 

機械学習も統計学も「データの規則性を見出す」という点では共通しています。
しかし、機械学習は「未知のデータを予測する」ことに重点を置いているのが特徴だと考えてください。

 

機械学習と人口知能(AI)の関係性

 

最近ではディープラーニングや、ニューラルネットワークといった言葉もあります。

Google翻訳の精度が飛躍的に向上したのは、ニューラルネットワークの技術があるからと言われています。
また、画像解析の領域ではディープラーニングが注目されています。

 

ディープラーニングと機械学習は違うの? と思う方はいるかもしれません。
定義をまとめると下図のようになります。

機械学習とAIの関係性イメージ画像
▲機械学習とAIの関係性

 

山根ただし
つまり、ディープラーニング=人口知能(AI)というわけではなく、ディープラーニングとは、手法の1つであると覚えておくといいですね。

 

そもそも、なぜAIはここまで注目されるの? という方は、こちらの「なぜAI(人工知能)は注目される?働くことが楽しくなる世の中はすぐそこ」という記事もあわせて読んでみてください。

 

機械学習が活用されることで起こる変化

 

次に機械学習が活用されることによって、どういった変化が起こったのかをまとめてみましょう。

これまでの分析

  • 販売、会計など社内にあるさまざまなデータをデータベースに集約
  • 集約したデータをもとに分析する

 

 

ビッグデータ時代の分析

  • 自社のデータベースに加え、GPSやICカード、Webサイトのアクセス情報などをリアルタイムに処理・収集
  • 機械に大量のデータを解析させ、データに潜むルールやパターンを発見し発展させる

 

機械学習を活用したアプリの例

 

それでは、わかりやすい例を挙げてみます。
タクシーアプリの例です。

タクシーアプリの機械学習
▲タクシーアプリの機械学習

上記のようなデータをもとに、AIによる分析をすることによって、需要の予測が可能となります。

そして、その需要予測により効率的な運行を実現できるというわけです。
これは機械学習のひとつ、「予測モデル」と言われるものです。

 

機械学習の予測モデルの活用事例

 

該当するエリアに何人くらいお客さんが来るのか予測できれば、タクシーの運行会社は、そこにタクシーを向かわせて売上を伸ばすことができます。

 

必要なデータは、下記のとおり。

  • タクシーの運行状況
  • リアルタイムの人の動き
  • 緯度・経度
  • 近隣の施設情報
  • 周辺人口
  • 天気

など。

 

このようなデータを活用して、客数を予測するというわけです。

  • ある施設でイベントが開催されている
  • 突然のゲリラ豪雨により、雨宿りをしている人がたくさんいる
  • 電車が止まってしまって、駅で入場規制が行われている

といったように、少し考えただけでも、売上を伸ばすことのできる状況が思い浮かびます。

 

しかし、最初のうちは、「予測した客数」と「実際の客数」には「ギャップ(=誤差)」が生まれるはず。

その誤差を調整し、より正しい客数を予測できるように調整していくことが必要になります。
それを自動的に実行していくのが「機械学習」というわけです。

 

機械学習をビジネスで活用するための組織体制とは?

 

多くの企業でデータ活用が進まない理由のひとつは、ビジネス担当者とデータ分析担当者(もしくは外部ベンダー)との間に理解の断絶があることかもしれません。

ビジネス側の担当者は、

  • 売上を上げたい
  • コストを下げたい
  • リスクを下げたい

という課題を持っています。

しかし、

  • 分析手法や理論
  • AI技術で使われる技術や応用パターン

をビジネス側の担当者が理解するのは、難易度が高いでしょう。

 

そういった中、ビジネス知識をもったデータサイエンティストという人材をどの企業も欲しているというのは当然のことだと思います。

しかし、ビジネススキル、ITスキル、データサイエンススキルのすべてを兼ね備えているスーパーマンなど、ほとんどいません。

 

データサイエンティストについては、「【注目の職業】データサイエンティストになるには?これから来るAI時代に知りたい最新事情」という記事で詳しく紹介しているので、ぜひ読んでみてください。

 

 

機械学習が注目される時代に求められる人材

 

データサイエンスを取り巻く環境では、下記のようにチーム体制で条件を満たせばいいのではないか? という考え方が主流となりつつあります。

  • 統計学に詳しいデータサイエンティスト
  • インフラに詳しいデータサイエンティスト
  • BIツールの操作やデータの可視化に強いデータサイエンティスト
  • コンサルティングが得意なデータサイエンティスト

そこでデータサイエンティストをタイプ別に分類する「タイプ論」も登場しています。
参考までに特徴を紹介しておきますね。

 

Data Developers

  • 得意:データベース、プログラミング、機械学習
  • 苦手:統計学、ビジネス
  • 経歴:IT業界

 

Data Reseacher

  • 得意:統計学、分析
  • 苦手:ビジネス
  • 経歴:研究者、大学教授

 

Data Creatives

  • 得意:ビッグデータ、プログラミング
  • 苦手:ビジネス
  • 経歴:コントリビュータ

 

Data Business people

  • 得意:ビジネス、技術的な知識
  • 苦手:プログラミングや機械学習の実務
  • 経歴:ビジネスサイド(マーケッターなど)

 

機械学習に必要な知識のつながり

 

何を分析し、どういった結果を出そうとしたいのかがわかっていれば、「ビジネス担当者」「データ分析担当者」の相互理解が進み、円滑に業務は回っていくでしょう。

その相互理解を進めるような人材は、これからの時代において、かなり貴重になるのではないかと予想しています。

参考までに機械学習に必要な知識のつながりも紹介しておきます。

機械学習に必要な知識のつながり
▲機械学習に必要な知識のつながり

 

山根ただし
上記の1つひとつを深く理解するのは大変だということがわかると思います。
知っておくべきことは、どの技術や知識が、どのように繋がっているかということです。

 

 

まとめ:機械学習を学びたい方におすすめの学習方法

 

AIやディープラーニングはすごいと言っても、そのすごい技術を活用できるシチュエーションを想定できなければ、意味がありません。

機械学習について独学で学ぶのは、かなり困難だと思います。
そういった方におすすめなのは、下記の学び方です。

 

データサイエンティストを育成する学校ってどんな感じ? と気になる方は、こちらの記事を参考にしてください。

あわせて読みたい参考記事

【データミックス(DataMix)の評判】説明会に参加してわかったデータサイエンスが注目されている理由

 

山根ただし
このブログでは、「AIに興味がある」「データ分析をビジネスに生かしたい」という方に向けた情報を発信しています。
ぜひ一緒に学んでいきましょう。
機械学習とは?機械学習に必要な知識のつながりを解説【初心者必読】
最新情報をチェックしよう!
>【LCH式】サイト改善コンサルティング

【LCH式】サイト改善コンサルティング

勘や経験に頼らないデータドリブンで、Webサイト・ブログを改善します!

特徴1:
Googleアナリティクスを利用した改善提案

特徴2:
データドリブンマーケティング

特徴3:
ご依頼主に合わせた改善提案

CTR IMG