百度が発表した文心4.5と文心X1:AI巨大モデルの“最強コンビ”登場

この記事は約4分で読めます。

2025年3月16日、百度は、技術的な大きな突破をもたらす2つのAI巨大モデル、文心4.5と文心X1を発表しました。この2つのモデルは、技術、コスト、市場への影響など、多くの面で強力な競争力を示し、百度がAI分野における重要な戦略的配置とされています。

モデルの特徴と優位性

  • 文心4.5:原生マルチモーダル巨大モデルとして、文心4.5はテキスト、画像、音声、動画の包括的な理解と生成をサポートしています。マルチモーダルタスクにおいて優れたパフォーマンスを発揮し、特にチャート分析や動画理解において、「高知能」と「高情動」の完璧な融合を示しています。文心4.5は、多项評価でGPT-4.5を凌駕し、スマートカスタマーサービス、教育支援、コンテンツ制作などに適しています。

  • 文心X1:文心X1は、論理的推論、中国語知識の質問応答、文学創作などのタスクにおいて、国際的にリードするDeepSeek-R1に性能を対応させたり、それを超えたりします。マルチモーダル機能とツール呼び出し機能を追加し、コード生成、チャート生成、インターネット検索などを行います。文心X1は、プログレッシブ強化学習、思考チェーンと行動チェーンのエンドツーエンドトレーニングを採用し、長思考チェーン推論をサポートし、金融分析や医療診断など複雑なシーンに適しています。

技術とコストの革新

  • アルゴリズムとアーキテクチャ:文心4.5は、FlashMask動的アテンションマスクとマルチモーダルヘテロジニアスエキスパート拡張技術を採用し、マルチモーダルデータの原生レベルの融合を実現しました。文心X1は、統一評価システムとPaddlePaddleフレームワークの最適化を通じて、推論コストを削減し、トレーニング効率を向上させました。

  • 価格戦略:文心4.5のAPI呼び出し価格は、0.004元/1000トークン(出力0.016元)で、GPT-4.5の1%にすぎません。文心X1の価格は0.002元/1000トークン(出力0.008元)で、DeepSeek-R1の半分です。百度はまた、6月30日に文心巨大モデルを全面的にオープンソース化すると発表し、使用のしきい値をさらに下げました。

  • コンピューティングパワーのサポート:自社開発の第3世代昆仑芯万卡クラスターに基づいて、百度はモデルの効率的な動作と安定性を保証し、「サーバーが忙しい」という問題を回避しました。

市場への影響と競争構造

  • 業界の位置づけ:文心4.5は、マルチモーダルインフラの戦略的高みを狙っており、汎用人工知能(AGI)への重要な一歩とされています。文心X1は、国内モデルが深層推論とツール呼び出し分野における空白を埋め、阿里、騰訊などの企業のAIアプリケーションと差別化された競争を形成しました。

  • 競争戦略:百度は、低価格と無料の戦略を通じて、開発者エコシステムを引き付け、技術の普及を促進し、業界がビジネスモデルを再調整するように強制しました。今回の自社開発モデルの発表は、「絶体絶命の逆転」と見なされ、百度の技術力が依然としてトップティアにあることを証明しました。

  • ユーザーのフィードバックと課題:テスト中、文心4.5は、一部の画像認識タスクで誤差があることがありますが、イテレーション修正メカニズムを通じて、継続的に最適化されています。百度は、データプライバシー、アルゴリズム倫理などの長期的な課題に対処する必要があります。

将来の展望

百度は、2025年下半年に文心5.0を発表し、AIアプリケーションのビジネス化を加速する計画です。マルチモーダルと深層思考モデルの普及に伴い、AI技術はツールから「インテリジェントエージェント」へと進化し、医療、教育、金融などの業界のスマート化を推進します。ただし、パフォーマンス向上とコストコントロールの間のバランスをどのように保つか、健康的な開発エコシステムをどのように構築するかは、百度が継続的に探求する必要があります。

aiスピーキング

ドルフィンAIは言語学習アプリケーションのためのプロフェッショナルな発音評価API(pronunciation assessment api)ソリューションを提供します。音素、単語、文章、チャプター、発音矯正、単語矯正、クイズ、フリーダイアログ、多肢選択問題など幅広く提供しています。当社の発音評価製品(pronunciation assessment)は、英語と中国語、クラウドAPI、オンプレミス、オフラインデバイスの展開をサポートしています。当社の発音評価API(pronunciation assessment api)は、正確性、流暢性、完全性、リズムの次元をカバーする豊富な評価指標を提供し、音素、単語、文の異なるレベルの評価スコアも提供します。また、音素、単語、文の異なるレベルでの評価スコアも提供します。数千万人のユーザーに安定した効率的で安全なサービスを提供しています。ドルフィンAIの発音評価製品(pronunciation assessment)を試してみませんか?

タイトルとURLをコピーしました