OpenManus の绍介
OpenManus は、MetaGPT チームによって开発されたopensourceプロジェクトで、商业 AI Agent の Manus のコア机能を模拟し、改善することを目标としています。用户は、邀请码なしで、ローカルデバイス上で実行できるスマートな解决方案を提供することができます。各种の复杂な任务を完成することができます。
OpenManus の主な优势は次のとおりです。
-
ローカルスマートエージェントの実行:ターミナルコマンドを介して任务を入力し、预め设定された言語モデル(LLM)を呼び出して、自动化的な操作プロセスを実现することができます。
-
マルチツールチェーンの协同:Python コード実行器、ブラウザの自动化ツール、ファイル処理システム、ネットワーク検索ツールを统合して、人间の仕事の仕方を模拟することができます。
-
リアルタイムフィードバックメカニズム:タスクの思考ロジック、进行状况、中間结果を可視化ログの形式で提示し、作业プロセスをより透明で制御可能にします。
技术アーキテクチャと実装
OpenManus は、プラグイン可能なツール(Tools)とシステムプロンプトの组合を使用したモジュールデザインを采用しています。これにより、機能モジュールの迅速な拡張が可能です。そのプランニングシステムは、强力な言語モデル(LLM)に基づいており、ReAct(推理と行动)フレームワークを采用しています。これにより、复杂なタスクを実行可能なサブステップに分解し、ツールの呼び出しをダイナミックに调整することができます。
OpenManus は、GPT-4o などの主流の言語モデルをデフォルトでサポートしていますが、用户は设定ファイルを介して簡単に他のモデルに切り替えることができます。 Claude 3.5、Qwen VL Plus などを利用して、各种のモデルの优势を十分に発挥することができます。
アプリケーションシーン
OpenManus の应用场景は広く、仕事と生活的な各个方面をカバーしています。
-
オフィス自动化:週计画の作成、会议メモの整理、Excel データの処理など。
-
デベロッパーアシスタント:コードスニペットの迅速な生成、プログラムのデバッグ支援、プロジェクトアーキテクチャの规划など。
-
教育と研究:プログラミング教育の支援、教育资料の生成、文献资料の整理など。
-
エンタープライズツール:データ分析ツール、カスタマーサポートシステム、SEO 最适化レポートジェネレーターなどのカスタマイズ。
-
クリエイティブ実现:HTML ページの生成、ウェブサイトの技术分析など。
ローカルデプロイメント体验
1. 环境インストール
- 新しい conda 环境の作成:
conda create -n open_manus python=3.12 conda activate open_manus
- リポジトリのクローン:
git clone https://github.com/mannaandpoem/OpenManus.git cd OpenManus
- 依存関系のインストール:
pip install -r requirements.txt
2. コンフィギュレーション
OpenManus は、使用する LLM API の设定を必要とします。以下は、DeepSeek32B をローカルデプロイメントする例です。
config.toml
ファイルの作成:cp config/config.example.toml config/config.toml vi config/config.toml
-
config/config.toml
を编集して、API キーとカスタム设定を追加します。# グローバル LLM の设定 [llm] model = "deepseek-chat" base_url = "https://api.deepseek.com/v1" api_key = "sk-..." # 実际の API キーに置き换える max_tokens = 4096 temperature = 0.0 # オプションのビジョンモデルの设定 [llm.vision] model = "deepseek-chat" base_url = "https://api.deepseek.com/v1" api_key = "sk-..." # 実际の API キーに置き换える
3. プロジェクトの実行
- スタブル版の実行:
python main.py
- 実験的版の実行:
python run_flow.py
実际の操作例
1. スネークゲームの作成
プロンプトを入力します。
Please write a Snake Game in Python for me
出力结果:
import random
def play_game():
print('Hello! What is your name?')
name = input() # 当地で実行すると、これは用户の入力待ちになります。
secret_number = random.randint(1, 20)
print(f'Well, {name}, I am thinking of a number between 1 and 20.')
guesses_taken = 0
while True:
print('Take a guess.')
try:
guess = int(input()) # 用户が推測を提供します。
guesses_taken += 1
if guess < secret_number:
print('Your guess is too low.')
elif guess > secret_number:
print('Your guess is too high.')
else:
break # 正确な推測;while ループを终了します。
except ValueError:
print('Please enter a valid number.')
print(f'Good job, {name}! You guessed my number in {guesses_taken} guesses!')
# スクリプトを実行するときにゲームをプレイするには、次の行のコメントを外してください。
# play_game()
よくある质问
プロジェクトの実行ステップをどのように设定しますか?
デフォルトの実行 max_steps
は 30 です。max_steps
を変更する场合は、app/agent/toolcall.py
ファイルで max_steps
パラメーターを设定することができます。
aiスピーキング
ドルフィンAIは言語学習アプリケーションのためのプロフェッショナルな発音評価API(pronunciation assessment api)ソリューションを提供します。音素、単語、文章、チャプター、発音矯正、単語矯正、クイズ、フリーダイアログ、多肢選択問題など幅広く提供しています。当社の発音評価製品(pronunciation assessment)は、英語と中国語、クラウドAPI、オンプレミス、オフラインデバイスの展開をサポートしています。当社の発音評価API(pronunciation assessment api)は、正確性、流暢性、完全性、リズムの次元をカバーする豊富な評価指標を提供し、音素、単語、文の異なるレベルの評価スコアも提供します。また、音素、単語、文の異なるレベルでの評価スコアも提供します。数千万人のユーザーに安定した効率的で安全なサービスを提供しています。ドルフィンAIの発音評価製品(pronunciation assessment)を試してみませんか?