スポンサーリンク
スポンサーリンク
🎯 この記事でわかること
- Manus AIとは何か?なぜ世界で話題なのか?
- 従来のAI(ChatGPT・AutoGPT)との決定的な違い
- Manus AIのアーキテクチャとその革新性
- 具体的な使い方とステップバイステップ解説
- 拡張や自作エージェントの構築例(コード付き)
- なぜ今、記事にするべきネタなのか?
🔥 はじめに:AIは“言葉”から“行動”へ進化している
2022年のChatGPT、2023年のAuto-GPTと来て、2025年、AIは次の段階に入った。それが「Manus AI」。
Manus AIは、いわば**「AIの手足」であり、「○○しておいて」と言うだけで、Webページの入力、調査、作業の流れを自律的かつ継続的に実行してくれる**。
ChatGPTが「思考するAI」だったとしたら、
Manus AIは「動くAI」「行動するAI」だ。
しかも、現時点では日本語の情報はほぼ皆無。
🧠 Manus AIとは?
Manus AIは、中国発のスタートアップMonica社によって開発された自律型AIエージェントフレームワーク。OpenAI APIをベースにしつつも、他の言語モデル(Claude、Geminiなど)とも連携できるマルチLLMアーキテクチャを持っている。
主な特徴は次の通り
特徴 | 解説 |
---|---|
🧭 自律型エージェント | タスクを分割・計画・実行まで自動 |
🌐 ブラウザ操作可能 | フォーム入力・予約・検索・ログイン対応 |
🔁 タスク記憶 | 途中で止まっても再開・ログ保存可能 |
⚙️ API連携 | 外部サービス(Google、Zapierなど)との連携可能 |
🧩 拡張可能なプラグイン構造 | Node.js/Go/Pythonベースのカスタムモジュール開発可 |
📊 ChatGPTやAuto-GPTとの違い
項目 | ChatGPT | Auto-GPT | Manus AI |
---|---|---|---|
モード | 会話型 | 自律型 | 自律+連携型 |
実行能力 | 単発 | 継続実行(不安定) | 継続実行+復元性あり |
エラー耐性 | 中 | 低 | 高(ログ保存・リトライ機能) |
対応範囲 | テキスト生成 | タスク処理(やや限定) | API・ブラウザ・ファイル全対応 |
言語サポート | ◎ | ◯ | ◎(中国語・英語・日本語) |
🛠️ Manus AIの基本的な使い方(2025年4月時点)
ステップ①:インストールと初期設定
git clone https://github.com/monica-labs/manus-ai
cd manus-ai
npm install
cp .env.example .env
# OpenAI APIキー、ブラウザモードの設定を.envに記述
ステップ②:ベーシックな指示を出してみる
npm run manus
プロンプト例
「明日大阪で空いているホテルを調べて、価格順にリストアップしてCSVに保存して」
出力例(自動)
- ブラウザ起動
- Booking.comにアクセス
- "Osaka hotels"を検索
- 結果をパース
- 価格順に並べてCSV生成 → /outputs/hotels.csv
🧩 拡張:Manus AIで「自分だけのエージェント」を作る
📁 ディレクトリ構成(基本)
manus-ai/
├─ core/
│ ├─ planner.js
│ ├─ executor.js
├─ plugins/
│ ├─ gmail.js
│ ├─ notion.js
├─ agents/
│ ├─ travelAgent.json
├─ tasks/
│ ├─ hotel_search.yaml
例:新しいプラグインを追加(Gmail送信)
// plugins/gmail.js
module.exports = async function sendGmail(task) {
const { to, subject, body } = task.data;
const nodemailer = require('nodemailer');
const transporter = nodemailer.createTransport({ /* Gmail設定 */ });
await transporter.sendMail({ from: 'me@gmail.com', to, subject, text: body });
};
そして、YAMLで使う
task:
name: send_confirmation
plugin: gmail
data:
to: "user@example.com"
subject: "ホテル予約完了"
body: "○月○日の予約が完了しました"
🔎 アーキテクチャ解析:Manus AIはなぜ強い?
🔸 モジュール構成
[User Input]
↓
[Task Planner] ← LLM(GPT-4 / Claude)
↓
[Task Tree Builder]
↓
[Plugin Executor] ──▶ [Browser Layer / API Layer / Script Layer]
↓
[Memory Store(MongoDB)]
↓
[Task Logger / Monitor]
Planner
: LLMを使って指示を自然言語からタスク分解Executor
: 各タスクを最適な手段で実行(ブラウザ/API/スクリプト)Memory Store
: タスク進行状況を永続保存、失敗時リカバリ可能Plugin
: 自作・外部連携可能な操作部(APIコールやUI操作)
💡 応用アイデア
タスク | 解説 |
---|
「GitHubの人気プロジェクトを毎朝メールで送る」 | GitHub API + Gmail Plugin |
「ChatGPTで生成された週報をSlackへ投稿」 | ChatGPT API + Slack Plugin |
「EC価格監視 → 一定以下で自動購入」 | Web Scraping + 自動ブラウザ制御 |
「会議内容を録音→文字起こし→要約→送信」 | Whisper + ChatGPT + Gmail |
📁 Manus AIで使えるテンプレYAML集(5選)
以下はManus AIに組み込みやすい YAMLテンプレート例を紹介します。
🧭 1. ホテル予約タスクテンプレ
task:
name: search_hotel_osaka
description: "大阪で空いているホテルを探し、価格順で一覧化する"
plugin: browser
url: "https://www.booking.com"
actions:
- search: "Osaka hotel"
- sort_by: "Price"
- extract: ["Hotel name", "Price", "Rating"]
- export: "CSV"
📧 2. Gmailで確認メール送信
task:
name: send_confirmation_email
plugin: gmail
data:
to: "customer@example.com"
subject: "予約確認"
body: "ホテルの予約が完了しました。ご確認ください。"
💬 3. ChatGPTで文章生成(後述の連携例とセットで使う)
task:
name: generate_summary
plugin: chatgpt
prompt: "以下の議事録を要約してください。\n---\n{{MEETING_NOTES}}"
save_to: "summary.txt"
📋 4. Webフォーム入力&提出
task:
name: fill_and_submit_form
plugin: browser
url: "https://example.com/contact"
actions:
- fill_form:
name: "田中太郎"
email: "taro@example.com"
message: "お問い合わせです。"
- submit_form: true
📅 5. Googleカレンダーに予定登録
task:
name: create_meeting_event
plugin: gcal
data:
title: "チームミーティング"
date: "2025-04-15"
time: "15:00"
duration: 60
participants:
- "user1@example.com"
- "user2@example.com"
🔗 Manus AI+ChatGPT API連携の超実践記事【第2弾予告】
次回の記事では、Manus AIとChatGPT API(gpt-4)を組み合わせて
🎯 自動で会議議事録を生成→要約→Slack送信までを自律実行するプロセス
を以下の流れで実演&解説予定です
✅ 予定している構成:
- Manus AIが会議録音ファイル(mp3)を検出
- Whisper APIで文字起こし
- ChatGPT APIで内容要約
- Notionへ保存&Slackへ要約送信
💡 使用技術:
Manus + Whisper API + ChatGPT API + Slack Webhook
- 自作YAMLテンプレ + Gmail通知 + ファイル処理モジュール(Node.js)
🧩 内容に含まれる予定:
- YAMLタスクの完全テンプレ
- chatgpt plugin の使い方詳細
- セキュリティ(APIキー保護)と再実行耐性
- Docker化手順(希望あれば)
✅ まとめ:Manus AIがもたらす“動くAI”の未来
- Manus AIは、ChatGPTの“考える”から“行動する”への進化系AI。
- 海外では注目が急上昇中だが、日本ではまだ認知が少なく、今が先取りチャンス。
- マルチエージェント・プラグインベースの構成により、柔軟かつ強力な自動化が可能。
- ブラウザ操作・API連携・Gmail/Slackなど実務利用の幅が広く、業務自動化の核となる技術。
- YAMLで定義して、JavaScriptで拡張できる。
- 今後、企業への導入事例や日本語エコシステムが増えれば、“次のAI潮流”の一つとなる可能性大。