TOP

アクティビティ

コラム

エンジニアコラム

AIエージェントの定義。AIワークフローとの違いも解説

エンジニアコラム

広い技術領域をカバーする当社の機械学習エンジニアが、アカデミア発のAI&機械学習技術を紹介&解説いたします。

AIエージェントの定義。AIワークフローとの違いも解説

2025.4.23
株式会社Laboro.AI リード機械学習エンジニア 川崎奏宜

概 要

2022年11 月にChatGPTが登場して以降、多くの企業でLLM(Large Language Model、大規模言語モデル)の活用が急速に広がりました。2023年以降はRAG(Retrieval-Augmented Generation、検索に基づく回答生成)やマルチモーダルLLMといった技術が急速に発展しました。そして2025年はAIエージェント元年と呼ばれており、AI自身が状況を判断し、計画を立て、行動するような世界観になってきています。

「AIエージェント」という言葉は広く使われるようになりましたが、その定義は曖昧なものであり、明確な理解が共有されていません。本コラムでは、一般論としてのAIエージェントの考え方を紹介するとともに、AIエージェントの概念を整理します。AIエージェントについて理解を深めたい方や、そしてAIエージェントの導入を検討する際の第一歩として活用していただければ幸いです。

Laboro.AIの「AIエージェント領域のカスタムAI開発」はこちら

目 次

AIエージェント以前のLLM
 ・登場初期のLLM
 ・RAG
 ・ツール利用(Function Calling / Tool Use)
AIエージェントとは
 ・各社のAIエージェントの定義
  ・OpenAI
  ・Anthropic
  ・Google
 ・AIワークフローとAIエージェントの違い
  ・AIワークフロー
  ・AIエージェント
 ・エージェンティックAIという新しい概念
 ・AIエージェントの位置付け
代表的なAIエージェントサービス
 ・Deep Research(自律型調査AIエージェント)
 ・Devin(自律型コーディングAIエージェント)
 ・Genspark Super Agent(自律型汎用AIエージェント)
AIエージェントの活用事例
 ・トヨタ自動車
 ・NEC
 ・デロイト トーマツ
まとめ

AIエージェント以前のLLM

AIエージェントを理解するためには、まずはAIエージェント以前のLLMの進展を把握することが重要です。ここでは、登場初期のLLM、RAG、そしてツール利用(Function Calling / Tool Use)という、AIエージェントに至るまでの技術進歩を解説します。

登場初期のLLM

2022年11 月にChatGPTがリリースされ、LLMが急速に普及しました。LLMは、大量のテキストデータを学習し、テキストの入力に対してテキストを出力するモデルです。ユーザーからの指示を入力として、学習データに基づいた回答を生成します。

しかし、登場初期のLLMには以下のような制約がありました。

・学習データの内容をもとに回答を生成するため、学習していない情報に対して回答できない
・学習された日以降の情報を持たないため、最新の情報に基づいた回答ができない
・学習データに基づいてもっともらしい単語を逐次的に生成するという特性から、実際には存在しない情報や誤った情報を生成してしまう(ハルシネーション)

これらの制約は、LLMを実用化する上での大きな課題となりました。

図1 登場初期のLLM:基本的な回答生成

RAG

RAGは上に挙げた LLMの課題を克服するために開発された手法です。質問に応じて外部知識から関連情報を検索し、その情報をLLMの入力として与えることで、LLMが持たない情報を補完したり、より正確な回答を生成したりすることが可能になります。

RAGの登場によって、以下のことができるようになりました。
・最新情報に基づいた回答:外部のデータベースやドキュメントから情報を取得できるため、モデルの学習時点以降の情報に基づいた応答が可能に
・ドメイン特化への適用:企業内文書や製品マニュアル等の特定のドメインに特化したデータを検索対象とすることで、特定業務に最適化された応答が可能に
・事実性の向上:回答の根拠となる情報がLLMに与えられるため、ハルシネーションのリスクを軽減し、より正確な情報を提供することが可能に

図2 RAG:外部知識を活用した回答

ツール利用(Function Calling / Tool Use)

ツール利用は、LLMが外部システムやAPIと連携して機能を拡張する手法です。Function CallingやTool Useとも呼ばれ、LLMが生成したコードやクエリを実行することで、より高度な処理を実現します。これにより、LLMは単なるテキスト生成だけでなく、実際のアクションを実行することが可能になります。

例えば、以下のようなことができるようになりました。
・データベースへのクエリ実行:LLMが生成したSQL文をデータベースに送信し、結果を取得することが可能に
・外部APIの呼び出し:LLMが生成したAPIリクエストを外部サービスに送信し、結果を受け取ることが可能に
・アクションの実行:LLMが生成したコマンドを実行し、システム上での操作を自動化することが可能に

図3 ツール利用:外部機能との連携による回答の能力拡張

また、最近では、MCP(Model Context Protocol)というツールを呼び出す共通の規格が提案され、より統一的な方法でツールを利用することができるようになりました。

AIエージェントとは

AIエージェントは、 ユーザーから与えられた指示に対し、自律的に問題解決やタスク実行を行うシステムと定義できます 。与えられた指示に対して、タスクを分解・計画し、次に取るべき行動を決定しながらタスクを遂行します。

各社 のAIエージェントの定義

AIエージェントについては、さまざまな企業や研究機関で議論されていますが、定義はそれぞれ異なります。以下に、いくつかの企業 のAIエージェントの定義を紹介します。

OpenAI

私たちは「エージェント」をユーザーの代わりにタスクを自律的に実行するシステムであると捉えています。

出典:OpenAI “New tools for building agents

Anthropic

原文

“Agent” can be defined in several ways. Some customers define agents as fully autonomous systems that operate independently over extended periods, using various tools to accomplish complex tasks. Others use the term to describe more prescriptive implementations that follow predefined workflows. At Anthropic, we categorize all these variations as agentic systems, but draw an important architectural distinction between workflows and agents:
Workflows are systems where LLMs and tools are orchestrated through predefined code paths.
Agents, on the other hand, are systems where LLMs dynamically direct their own processes and tool usage, maintaining control over how they accomplish tasks.
Below, we will explore both types of agentic systems in detail. In Appendix 1 (“Agents in Practice”), we describe two domains where customers have found particular value in using these kinds of systems.

出典: Anthropic “Building effective agents

日本語訳

「エージェント」はさまざまなかたちで定義されます。顧客によっては、エージェントを「完全に自律的なシステム」と定義し、長期間にわたり独立して動作し、多様なツールを使用して複雑なタスクを達成するものと捉えることもあります。一方で、あらかじめ決められたワークフローに従って動作するという、より規定的な実装を指すこともあります。 Anthropicでは、これらのさまざまなタイプをすべて「エージェント的システム(agentic systems)」というカテゴリーでくくっていますが、「ワークフロー(workflow)」と「エージェント(agent)」には重要な構造上の違いを設けています。

ワークフローとは、LLMとツールが、あらかじめ定義されたコードパスに従って統合的に運用されるシステムです。

エージェントとは、LLMが動的に自身のプロセスやツールの使用方法を決定し、タスクの達成方法について制御権を持っているシステムです。

Google

AI agents are software systems that use AI to pursue goals and complete tasks on behalf of users. They show reasoning, planning, and memory and have a level of autonomy to make decisions, learn, and adapt.

出典: Google Cloud “What is an AI agent?

日本語訳

AI エージェントは、AI を使用してユーザーの代わりに目標を追求し、タスクを完了させるソフトウェア システムです。推論、計画、メモリーが可能であることが示されており、意思決定、学習、適応を行うレベルの自律性を備えています。

AIワークフローとAIエージェントの違い

Anthropic の定義を参考にすると、AIエージェントには「AIワークフロー型」と「AIエージェント型」の二つのアプローチがあります。この点は非常に重要であり、各社のAIエージェントの定義を理解する上でのポイントとなります。

AIワークフロー

AIワークフローは、LLMが事前に定義された手順・ルールに従ってタスクを実行する仕組みです。質問に応じて遷移先を決定し、ルールに従って次のアクションを選択します。例えば、単純なタスクであればLLMのみで実行し、人による最終確認が必要な場合は人間にタスクを引き渡すといったフローを組むことができます。

AIワークフローは、予測可能性(確実性)には優れますが、事前にフローを定義する必要があるため、柔軟性には欠けます。

図4 AIワークフローのイメージ

AIエージェント

AIエージェントは、LLMが自律的にタスクを実行する仕組みです。与えられた指示に対して、LLMが自らタスクを計画(プランニング)し、次に取るべき行動を決定し、実行結果のフィードバックをしながらタスクを遂行します。十分な情報が得られた場合、LLMは自らの判断でタスクを完了させます。

AIエージェントは、ユーザーからの指示に基づいて自律的に行動するため、柔軟性がありますが、予測可能性には欠ける場合があります。

図5 AIエージェントのイメージ

エージェンティックAIという新しい概念

最近では、「エージェンティックAI」という言葉も耳にするようになってきました。この概念はAIエージェントの発展系と捉えることができ、より高度な自律性と複雑なタスク処理能力を持つAIシステムのことを指します。しかし、明確な定義はAIエージェントよりもさらに定まっておらず、今後より共通の理解として整理されていくことが期待 されます。

なおNVIDIA によると、エージェンティックAIは以下の四つのプロセスを経て問題解決を行います。

1. Perceive(知覚)
単なるデータ入力を超え、センサー、データベース、デジタルインターフェースなど、多様なソースから能動的にデータを収集・処理・統合します。これにより、より広範な状況理解が可能になります。

2. Reason(推論)
収集した情報に基づき、タスクを深く理解し、効果的な解決策を生成します。この段階では、LLMが中心的な役割を果たし、さまざまな専門モデルを連携させるオーケストレーターとして機能します。

3. Act(行動)
APIを介して外部ツールやソフトウェアと統合することで、エージェントAIは策定した計画に基づいてタスクを迅速に実行できます。

4. Learn(学習)
実行結果からのフィードバックを継続的に取り込み、自己改善を行います。成功パターンと失敗パターンの両方から学習し、次回のタスク実行時にはより効果的なアプローチを取ることができます。

出典:NVIDIA “What Is Agentic AI?

図6 エージェンティックAIのプロセス

この四つのプロセスが継続的なサイクルとして機能することで、エージェンティックAIは時間の経過とともに能力を向上させ、より複雑な問題に対処できるようになります。このような知覚の領域拡大や高度な自律性、学習プロセスの導入などが、AIエージェントとエージェンティックAI の違いと言えそうです。

AIエージェントの位置付け

これまで記した通り、AIエージェントの定義は明確には定まっていませんが、「タスクの自由度」という観点から階層構造として理解することができます。

LLMは与えられた入力に対して回答を生成するという限定的な役割を持ちます。その上のRAGまたはツール利用では、外部ソースを参照・操作する能力が加わって、LLMの機能を拡張します。

さらに上位のAIワークフローでは、定義された手順に従ってタスクを遂行しますが、その行動はあらかじめ設計されたフローに制限されています。AIエージェントになると、与えられた特定のタスクに対して自律的に意思決定と行動を実施することができます。

そして、エージェンティックAIはさらに自由度の高いタスクにおいても自律的に意思決定・行動できる存在として位置付けられます。その上位には汎用型AI(AGI)が想定されています。

この階層構造(図7)において、現在の技術は青で示したAIエージェントのレベルに到達しつつあり、緑で示したエージェンティックAIやAGIの領域は今後の発展が期待される領域と言えます。エージェンティックAIは、AIエージェントの延長線上にあり、より高度な自律性と汎用性を持つAIシステムとして、2025年以降のAI技術発展における重要なテーマとなることが予想されます。

図7 AIエージェントの位置付け

代表的なAIエージェントサービス

Deep Research(自律型調査AIエージェント)

Deep Researchは、特定の調査指示に基づいて、LLMが自律的に情報を収集・分析し、レポートを生成するAIエージェントの仕組みです。GoogleのGeminiをはじめとして、OpenAIのChatGPTやPerplexityなどのプロダクトにも搭載されています。

Devin(自律型コーディングAIエージェント)

Devinは、与えられた要件に基づいて、自律的に開発プロセス全体を自律的に実行可能なAIエージェントプロダクトです。エンジニアの一員として、コードの作成、実行、バグ修正、テスト作成等の幅広いタスクを自律的に実行します。

Genspark Super Agent(自律型汎用AIエージェント)

Genspark Super Agentは、LLMプロダクトであるGensparkで提供されている機能で、さまざまなツールを活用しながら日常業務を効率化するAIエージェントです。例えば、公式のデモでは、旅行計画を立てる、レストラン予約の概要、5時間のYouTube動画を10枚のスライドにまとめるといったタスクを自律的に実行する様子が紹介されています。

AIエージェントの活用事例

トヨタ自動車

トヨタ自動車は、エンジニアの知識継承と開発効率向上を目的に、AIエージェント群からなる「O-Beya(オーベヤ)」システムを導入しました。このシステムは、エンジンやバッテリー、振動、燃費、法規制など9分野の専門AIが協働し、エンジニアの質問に対応します。システムが活用できる知識として、過去の設計データや法規制情報、ベテラン技術者の手書き文書などを統合。2024年1月からパワートレーン開発部門で運用され、約800人のエンジニアが利用しています。これにより、開発スピードの向上と熟練技術者の知見の継承が実現されています。

出典:Microsoft「トヨタ自動車、エンジニアの知見をAIエージェントで継承へ

NEC

NECは、クラフトビールメーカーのコエドブルワリーと連携し、生成AI「cotomi」を活用したAIエージェントを用いて、世代別の特徴や価値観を味や香りで表現したクラフトビール「人生醸造craft」第2弾を開発しました。このプロジェクトでは、ビール職人が「20代日本人をイメージして新しいクラフトビールのレシピを作成して」とプロンプトを入力すると、AIエージェントが自律的にタスクを分解し、社内外のレシピ情報を検索・分析。各世代のペルソナを作成し、味や香り、色などの要素を含むレシピ案を提案しました。ビール職人は、AIエージェントとの対話を通じてレシピを調整し、20代向けの「20’s PINK」や50代向けの「50’s RED」など、4種類のクラフトビールを完成させました。

NEC「NECとコエドブルワリー、Agentic AIとビール職人が協働し、AIクラフトビール「人生醸造craft」第2弾を開発

デロイト トーマツ

デロイト トーマツは、複数のAIエージェントが自律的に連携して業務を自動化する「マルチエージェントアプリ」を開発しました。このアプリは、Web検索、社内データベース検索、分析、資料作成など、各エージェントが特定の役割を担い、連携することで複雑な業務を効率的に遂行します。また、タスク計画用のエージェントが他のエージェントの役割を理解し、ユーザーの業務要求に応じて最適なタスク計画を自動で立案します。さらに、レビュー専用のエージェントが他のエージェントの出力をチェックし、必要に応じて処理を再実行する自己修正機能や、人間の確認を挟む「Human in the Loop」機能も備えています。これにより、ユーザーは自然言語で業務内容を入力するだけで、関連するAIエージェントが連携し、成果物を出力することが可能となります。

デロイト トーマツ「デロイト トーマツ、LLMを自律的に連携させ業務を自動化する「マルチエージェントアプリ」を開発

まとめ

AIエージェントの定義とその位置付け、活用事例について解説しました。AIエージェントは、明確に定められた定義はありませんが、一般的には自律的にタスクを実行するシステムと考えられています。

今後はAIエージェントの定義がより明確になり、さまざまな分野での活用がより一層進むことが期待されます。この記事が、AIエージェントの理解を深める出発点となれば幸いです。

Laboro.AIの「AIエージェント領域のカスタムAI開発」はこちら

執筆者プロフィール

リード機械学習エンジニア 川崎奏宜

九州工業大学情報工学部電気電子情報工学科卒業。卒業後、SIer企業にて、画像認識技術を活用した施工現場の効率化や、自然言語処理技術を用いた人材マッチング案件に従事。2022年に株式会社Laboro.AIに参画し、自然言語処理を活用したビジネス探索やセンサデータを使った検査プロセスの自動化など、多岐にわたるプロジェクトを担当。共著に『今日から使えるファインチューニングレシピ: AI・機械学習の技術と実用をつなぐ基本テクニック』(オーム社刊)

閉じる お問い合わせは
こちら