機械学習の活用事例―機械学習の基本から活用方法まで通しで解説―

Laboro.AIコラム

機械学習の活用事例―機械学習の基本から活用方法まで通しで解説―

2020.11.12公開　2024.10.28更新
株式会社Laboro.AI　執行役員マーケティング部長　和田崇
リードマーケター　熊谷勇一

概　要

人間の知能を模したコンピュータ技術と言われるAIの領域のうち、特に知られる技術が機械学習です。機械学習はコンピュータ自身が予測や分類などのパターンを学習していく技術で、すでにさまざまなサービスとして世の中で活用されています。機械学習について理解を深めながら、実際に私たちの生活で使われている事例についても紹介します。

目　次

・機械学習の基礎知識
　・機械学習とは
　・機械学習が普及してきた背景
　・機械学習で解決できる課題
　　・画像認識の活用
　　・音声認識の活用
　　・分析・予測
　　・レコメンデーション
・機械学習とディープラーニングの違い
・機械学習の手法
　　・機械学習の手法：教師あり学習
　　・機械学習の手法：教師なし学習
　　・機械学習の手法：半教師あり学習
　　・機械学習の手法：強化学習
・機械学習の活用事例
　・①画像認識の活用
　　・データ化やダイジェスト作成
　　・顔認証
　　・異常検知・故障予知
　・②音声認識の活用
　　・音声AIの家庭での活用
　　・コールセンターでの活用
　・③自然言語処理の活用
　　・文書分類の自動化
　・④分析・予測
　　・売り上げ・需要予測
　　・タクシーの乗車予測
　・⑤おすすめを提案してくれるAIレコメンデーションシステム
　　・献立の提案
　　・目的地の提案
・機械学習がこれまでになかったサービスを創出していく

機械学習の基礎知識

機械学習とは

機械学習とは、AIのプログラム自身が与えられたサンプルデータに潜むパターンやルールを学習し、予測や分類などのタスクを自動で実行できるようにする技術です。人間が何かを習得するときと基本的には似ていて、学習の対象であるサンプルデータの数が多ければ多いほど、望ましい学習結果が得られ、より高度なタスクを実行できるようになります。

例えば、赤リンゴと青リンゴを分類できるように機械学習で学習する場合、コンピュータが利用できる赤リンゴと青リンゴのサンプルデータ（この場合は画像データ）が多ければ多いほど、学習後のテストで赤リンゴと青リンゴかを間違える可能性が減ります。こうした、同じリンゴでも色の違いで分類することは、コンピュータにとっては離散的な値（連続しない値）を予測して分類することであり、「分類問題」と呼ばれます。

分類問題と対になる概念が「回帰問題」です。例えば、自分が担当する商品・サービスの今後の売り上げを予測したい場合、サンプルデータ（この場合は過去の売り上げや、天候など売り上げに影響を与えるデータ）が多ければ多いほど予測精度は上がります。そうしたサンプルデータは日次、週次、月次…といった粒度で連続しているデータであるべきです。例えば、来月の売上予測をするときに、前月や前々月の売上データが失われていたら、立てる予測の信頼性が大きく損なわれるのは想像に難くないでしょう。こうした連続した値を予測することを「回帰問題」と呼びます。

機械学習が普及してきた背景

前述の通り、機械学習によって高精度なタスクを実行できるAIを開発するには、大量のデータが必要になります。機械学習は、もともと文字認識などのパターン認識の分野で長年蓄積されてきた技術であり、機械学習で大量のデータを扱えるようになった最初のきっかけは、1990年にインターネット上にウェブページが初めて作られたことでした。その後、ウェブページは爆発的に増加し、それとともにさまざまなデータがインターネット上に蓄積されるようになり、機械学習はそれらのデータを利用できるようになったのです。

2000年以降は、ウェブページだけでなく、交通系ICカードに記録される乗車履歴やGPS（全地球測位システム）から得られる位置情報、メールの内容、SNSの投稿内容といった大量のデータを蓄積・利活用するビッグデータという概念が生まれ、これもまた機械学習に利用されるようになりました。その結果、機械学習が実用化され、さらに特徴量（対象を認識する際に注目すべき特徴を定量的に表したもの）をAIが自ら習得するディープラーニングが注目されることにもなりました。なお、このビッグデータ、そしてディープラーニングをきっかけに生まれたAIの進展を「第３次AIブーム」と呼ぶことがあり、現在まで続いていると理解されています。

なお、第3次AIブームがあるということは、もちろん、第1次も第2次もありました。第１次AIブームは1950年代後半から1960年代で、「推論・探索の時代」とも呼ばれます。コンピュータによる推論や探索の研究が進み、例えば迷路や数学の定理の証明といった特定かつ簡単な問題（トイ・プロブレム、おもちゃの問題）が解けるようになりました。その半面、現実の複雑な問題は解けないことが分かり、ブームは急速に冷めました。

第2次AIブームは1980年代で、「知識の時代」とも呼ばれます。コンピュータに知識を入れると賢くなるというアプローチの下、データベースに大量の専門知識を蓄積したエキスパートシステムが数多く構築されました。日本では、政府が「第五世代コンピュータ」と名付けた大型プロジェクトが推進されましたが、実用レベルに至るには、知識の蓄積・管理に膨大なコストがかかることが明らかになり、1995年ごろにブームが沈静化しました。

ただし、機械学習の本質的な技術の提案は第１次ブームのときにすでになされていたり、第１次ブームの中心の推論・探索や第２次ブームの中心の知識は現在も重要な研究分野として継続されていたりするなどしています。ブームの時期に断絶はありましたが、研究としては王道の「巨人の肩の上に立つ」、つまり、先人たちの研究の上に新しい研究が積み重ね続けられてきたことで、現在のAIの隆盛があるわけです。

機械学習で解決できる課題

機械学習で解決が図られている課題は今や多岐にわたります。まず、前述のインターネット上のウェブページの爆発的な増加をきっかけに急速に進展したのは、ウェブページ上の文字を扱う自然言語処理であり、その中でも統計的自然言語処理と呼ばれる分野の研究が特に進みました。統計的自然言語処理を使った翻訳では、従来のように文法構造や意味構造を分析して単語単位で訳を割り当てるのではなく、複数の単語をひとまとまりにした単位（句または文単位）で用意された膨大な量の対訳データを基に、最も正解である確率が高い訳を選択します。この確率を利用するところから「統計的」という名称が付けられています。

例えば、英語のbankという言葉には、「銀行」や「土手」という言葉が訳語候補となりますが、コーパスと呼ばれる対訳データが大量にあれば、bankの近くにmoneyやinという単語が現れた場合は、「銀行」という訳になる確率が高いということを、機械学習を使って習得することができるわけです。

そのほか、自然言語処理だけでなく、さまざまな課題を解決するために、画像認識や音声認識の活用、分析・予測、レコメンデーションなどがあります。具体例を交えた詳細は後述しますが、ここでは代表的なタスクの概要を説明します。

画像認識の活用

コンピュータは通常、画像をピクセル（画素）の集まりとしてしか認識できません。しかし、その画像には人や動物の姿、イラスト、文字など、必ず何かしらの情報や意味が含まれています。コンピュータは組み込まれた演算処理を通して、ピクセルのパターンから特徴を抽出し、その類似の範囲や差異を学習することでそこに写ったものを認識し、識別、分類などの処理を行えるようになります。

音声認識の活用

音声認識とは、文字通り、人が発した「音声」をコンピュータに「認識」させることを目指した技術領域です。具体的に言えば、人間が話す音声を空気の振動として測定し、そこから得られた波形データを解析、文字データに変換するための技術です。Amazon Echo（Alexa）やGoogleアシスタント、AppleのSiriなどのスマートスピーカーや音声アシスタントの存在も日常的に使われるようになってきました。AIによる音声認識が進化したことで、声だけでデバイスを操作したり、会議の議事録を効率よく作成したりといったことが実現されてきています。

分析・予測

ビジネスはつまるところ製品・サービスの提供であり、過去の売れ方を分析したり、それを基にして将来の需要を予測したりすることが欠かせません。そうしたデータ分析や需要予測にAIを用いることの一番のメリットは、従来、人が頭をひねらせていた予測値の算出作業をコンピュータにさせることによる業務の効率化です。たとえその予測精度・予測内容が完璧でなかったとしても、毎月のデータ集約や分析作業が少しでも楽になれば、人的リソースを他業務に割り振ることができるというわけです。

レコメンデーション

レコメンデーション、あるいはレコメンドとは「recommend（おすすめする）」という言葉の通り、商品やサービスを顧客におすすめすることを指します。例えばECサイトで「あなたにおすすめ」といった具合に商品画像がいくつか表示されることが当たります。その主要技術は「協調フィルタリング」であり、AIが活用されています。また、「おすすめ」をテキストなどのコンテンツを生成するタスクとして捉えて、生成AIであるChatGPTを活用したサービス事例も出てきています。

参考：日本ディープラーニング協会監修『ディープラーニングG検定公式テキスト第2版』

機械学習とディープラーニングの違い

機械学習は前述の通り、大量のデータをコンピュータに読み込ませることでパターンやルールを学ばせ、予測・分類などのタスクを自動で実行できるようにする技術です。例えば、リンゴの画像を大量に取り込ませて学ばせることでコンピュータはリンゴの特徴について学び、赤リンゴと青リンゴの画像の違いを特徴から抽出、次に来る新しいリンゴの画像を高い確率で分類するといったことが可能になります。

ディープラーニングは、機械学習と同様に現在のAI活用の文脈でよく語られる用語ですが、カテゴリーとしては機械学習の１種であり、機械学習を発展させたものでもあります。

主要な機械学習技術とディープラーニングの大きな違いは、特徴量を人間が指定するかコンピュータ自身が学習するかという点にあります。例えばリンゴの画像を分類しようとした場合、形に着目してしまうと赤リンゴと青リンゴを見分けるのは困難ですが、色に着目すれば見分けができそうです。この「色」が特徴量の一つで、ディープラーニングではコンピュータ自身が大量の画像を学習する過程で「色に着目すべき」と判断します。

機械学習の手法

ディープラーニングを含め、機械学習の手法には大きく分けて四つあります。

機械学習の手法：教師あり学習

赤リンゴか青リンゴかの違いを学習させる際、画像に「赤リンゴ」や「青リンゴ」のラベルを付けた上でコンピュータに学ばせることを「教師あり学習」と言います。教師あり学習では入力に対しての正解が示されているので、コンピュータはそのパターンを学習していきます。

画像の識別の他にも、身近な例としては、迷惑メールのフィルタリングにこの技術が使われています。安全なメールと迷惑メールにそれぞれラベルを付けて学ばせることで、コンピュータはそれぞれの境界線がどこにあるかを学び、次に来たメールが安全かどうかを判断できるようになっていきます。

機械学習の手法：教師なし学習

「教師なし学習」は、データにラベルを付けずにコンピュータに学習させます。ラベルがないのでコンピュータは正解が何か分かりませんが、与えられたデータの中から規則性や分類項目を見つけ出していきます。

教師なし学習の代表的な活用方法として、顧客データの分類が挙げられます。顧客データには性別や年齢、取引内容、取引の日付などが含まれていますが、リンゴの画像のように一意の正解があるわけではありません。しかしコンピュータは顧客データにさまざまな項目があることを学習し、データの分類を行うことができるようになります。

機械学習の手法：半教師あり学習

教師あり学習と教師なし学習の間に位置するのが、「半教師あり学習」です。教師あり学習を行いたくても、ラベル付きのデータを大量に用意することは困難なケースもあります。その場合は、少量の教師あり学習でパターンを学習させ、さらに教師なし学習でその精度を深めていくアプローチが取られます。これが半教師あり学習です。

半教師学習については、以下のコラムで詳しく解説しています。

「教師あり学習」「教師なし学習」とは。文系ビジネスパーソンのための機械学習

機械学習の手法：強化学習

「強化学習」は、正解となるラベルが付かない点では教師なし学習と同じです。違いは、コンピュータが返した出力内容を評価し報酬を与える点にあります。強化学習は、コンピュータが高い報酬を得るように動くことを求め、コンピュータ自身に処理方法を試行錯誤させていく技術です。

強化学習は、投資やゲームなど結果に優劣が付く分野での応用に用いられます。Googleの子会社であるDeepMindが開発し、当時の囲碁世界チャンピオンを打ち破り世界を驚かせた「AlphaGo」は、強化学習を用いて囲碁の勝ち方を学習したAIです。

強化学習については、以下のコラムで詳しく解説しています。

正解のない課題にこそ生きる「強化学習」の基本

機械学習の活用事例

機械学習を用いたAIサービスは、すでに私たちの生活のさまざまな場面で展開されています。ここでは、画像認識、音声認識、自然言語処理、分析予測、レコメンドの五つのジャンルに分けて事例をご紹介します。

①画像認識の活用

画像認識は機械学習が得意としている分野の一つであり、応用や組み合わせによりさまざまなサービスが登場しています。

データ化やダイジェスト作成

画像認識の身近な活用例として、手書き書類の自動データ化が挙げられます。手書きの書類をデータ化するには、従来であれば人が入力する必要がありましたが、機械学習により文字を識別する機能が進化し、入力作業を大幅に削減することが可能になっています。人的リソースを別の業務に生かせるだけでなく、入力内容が人が行うより正確になるメリットもあります。

画像データを用いたAIサービスとしては、動画のダイジェストやハイライトの生成などもあります。長時間の動画から見どころを抜き出して短時間の動画を生成するもので、撮影後すぐにダイジェストを配信したい報道機関や、手軽に動画編集を行いたいコンシューマー向けなどに展開されています。

また近年普及が進み続けているネット配信向けショート動画にも活用されています。ショート動画の制作者は「顔のアップは控えたい」「カメラの動きは遅めで」「各カットの長さは短めに」といったさまざまな要望を持っており、例えばNHKは、自動生成された要約動画を簡単な操作で修正できる機能も実現させています。

出典：NHK放送技術研究所「映像自動要約技術の最新動向」
　　　NHK放送技術研究所「画像解析AIによる番組映像自動要約システム」

顔認証

顔認証も、画像認識の活用例としてよく知られているでしょう。まだ実用段階にはないようですが、例えば公共交通機関の乗車システムに顔認証を活用する実証実験がされており、より便利な社会インフラの構築が目指されています。

異常検知・故障予知

画像認識の技術が実用レベルとして活用されているケースでは、製造業における異常検知・故障予知があります。これは工場内の要所にカメラを設置し、リアルタイムで画像分析を行い、異常や故障が起こりそうになったらアラートを出すといったものです。機械学習の力を借りることで人の負担を減らし、また検知や予知の精度も高くなることが期待できます。以下のコラムで詳しく解説しています。
AI×センサーで見通せ。「故障予知」から始まる未来
 「品質管理AI」の違和感。その役目は人にある。

画像認識についてはこちらもご覧ください。
画像認識AIの世界。その仕組みと活用事例

②音声認識の活用

大量のデータを収集しやすい音声の認識も機械学習が得意なジャンルであり、自然言語処理や自動応答といった他のAI技術と比べて、現時点で高いレベルに達しているといわれています。

音声AIの家庭での活用

音声AIとしては、Appleの「Siri」やGoogleの「Googleアシスタント」をはじめとした音声アシスタントがよく普及しています。音声アシスタントは、スマートフォンだけではなくスマートスピーカーからも利用可能で、生活の一部に取り込んでいる家庭も少なくないでしょう。

コールセンターでの活用

音声認識の技術が活用されている業種としては、コールセンターが挙げられます。顧客の問い合わせ音声からコンピュータが自動で何を要望しているか認識し、オペレーターがFAQや顧客データを検索するまでもなくディスプレイに表示させるサービスも登場しています。コンピュータが自動応答まで対応することで、コールセンターの営業時間外でも受付が可能になっています。

また逆に、コールセンターから顧客への営業などの電話にも、音声認識が活用されています。電話の録音・分析し、商談化に結び付きやすい話し方を知見として見いだし、人材教育に用いる例も出てきました。

出典：PRTIMES「Hmcommが、通販大手ディノス・セシールとコールセンター集中呼自動応答(音声Bot)」の共同開発を開始」
　　：日経ビジネス「ベルシステム24野田社長「音声データがAIで宝の山に」」

音声認識についてはこちらもご覧ください。
音声認識AIのいま。その技術や事例を知る

※画像はイメージです。

③自然言語処理の活用

AIは目的に合わせたパターンを学習することで、人間が話す言葉を処理する「自然言語処理」の精度を高めていくことも可能です。

文書分類の自動化

例えば、Laboro.AIではテキストを認識し、文書分類を自動で行う事例を手掛けました。ある大手通信企業では申込書の分類が担当者による手作業で行われていましたが、数が膨大なため、未振り分けのまま送られて不要な情報まで伝達されてしまう課題がありました。機械学習の１種であるニューラルネットワークによる文書分類アルゴリズムを構築することで、自然言語処理によるAIがテキストを分類、結果として業務改善につながっています。

参考：プロジェクト事例　文書分類による業務自動化率の向上

自然言語処理についてはこちらもご覧ください。
無意識で意識的な自然言語処理

※画像はイメージです。

④分析・予測

分析や予測も、機械学習が得意とするジャンルの一つです。過去のデータを大量に学習することで、膨大なデータの分析や、将来どのような結果が起こり得るかの予測ができます。

売り上げ・需要予測

機械学習の分析・予測を生かしたジャンルとしては、売り上げや需要の予測があります。

店舗の来客分析への応用はその一つの例です。店内に分析用のカメラを設置して顧客属性ごとの商品の購買傾向、売り場の移動の仕方などを分析する技術は、機械学習により高精度に行う技術も登場しています。これにより、従来以上にターゲットを意識した仕入れや商品配置、導線を意識した売り場づくりなどの店頭施策の実施が可能になってきています。

小売り向けの自動発注システムを手掛けるシノプスは、スーパーの需要予測を卸業者や食品メーカーと共有するサービスを始めています。AIを活用した需要予測を基にスーパーから卸業者への発注を平準化したり、急な追加発注を減らしたりすることでトラックの無駄な配送を減らすことがねらいであり、トラック運転手の不足が懸念される「2024年問題」も見据えたサービスになっています。

出典：monoist 2020年2月26日「トライアルが首都圏初のスマートストア、リテールAIによる流通情報革命の現場に」
　　：日経産業新聞「シノプス、スーパーの需要予測を卸と共有配送効率化支援」

売上・需要予測についてさらに詳しく知りたい方は、以下の二つのコラムをぜひ参考にしてください。
需要予測AIよ、需要は予測するものでなく作るものだ。
POSからの脱却。小売AIの進化と可能性

タクシーの乗車予測

タクシーの乗車予測にもAIが活用されています。例えば、ソニー系のタクシー配車アプリ大手「S.RIDE」は、ソニーグループの開発チームが携わった独自AIを採用。過去のタクシー利用客がいつ、どこから乗車し、どこで降りたかといった乗降データをAIで分析し、エリア内を走るタクシー空車台数などのデータと突き合わせて、時々刻々と変わるタクシーへの需要の高さを算出するなどしています。導入した会社の一つでは、AI需要予測サービスを使っているドライバーは、使っていないドライバーに比べ、5〜10%売り上げが高いという例も出ています。

出典：日経XTREND「ソニー系配車アプリS.RIDE好調　AI需要予測で売り上げ増」

※画像はイメージです。

⑤おすすめを提案してくれるAIレコメンデーションシステム

機械学習によって大量のデータを分析し、傾向や法則性を導き出すことで、利用者におすすめを提示する「レコメンド」系の製品・サービスが登場しています。

献立の提案

献立のレコメンドサービスの一例として、自動献立提案AIアプリ「勝ち飯®AI」があります。これはトップアスリート向けの献立を分析し、一般アスリートや家庭での献立作りにも取り入れられるようにしたものです。詳しくは、以下のコラムをご覧ください。
新・食体験に挑む。食品AIの可能性

目的地の提案

「クルマに乗ってどこかへ遊びに行きたいけど、行くべきところを具体的におすすめしてほしい」というニーズに対応し、機械学習によっておすすめの目的地をレコメンドするシステムをLaboro.AIが開発しました。AIとの対話を行うことで、ユーザーの潜在的なニーズを分析し、その内容から目的地を提案するAIレコメンデーションシステムです。

ユーザーのニーズを分析するとともに、観光スポットに関するデータを活用することで、レコメンドを行う対象を選定しています。詳しくは、以下のコラムをご覧ください。
自動運転だけじゃない。自動車×AIの最先端

レコメンデーションについてはこちらもご覧ください。
潜在意識も刺激する、AIを用いたレコメンデーション

機械学習がこれまでになかったサービスを創出していく

AI技術の一つである機械学習は、人間ではリソース的にも精度的にも不可能だったデータの出力を可能とし、さまざまなサービスの創出につながっています。多くの応用例が登場しているため、こうした情報をキャッチしながら、自社内でのAI活用の可能性を探ってみるのがおすすめです。

Laboro.AIでは、オーダーメイドによるAIソリューション、「カスタムAI」を開発・ご提供しています。こちらに過去の導入事例・活用事例をまとめていますので、ぜひご覧ください。

Laboro.AI　カスタムAI導入事例

執筆者

執行役員マーケティング部長　和田崇

立教大学大学院経営学修士（マーケティング論・消費者行動論）。立教大学大学院ビジネスデザイン研究科博士後期課程中退。KDDI株式会社に入社、コンシューマ向け商品・サービスのクロスメディアによるプロモーション施策の立案・企画運営に携わったのち、全国漁業協同組合連合会を経て、2019年にLaboro.AIに参画。マーケティング／ブランディング業務に従事する傍ら、NewsPicksプロピッカーとして活動するほか、日経クロストレンドなどメディア寄稿多数。