2025年2月27日、OpenAIはその大型言語モデル(LLM)ファミリーの最新進化であるGPT-4.5の研究プレビューを発表しました。GPT-4.5は自然会話と感情知能の面で著しい進歩を遂げ、コンテンツ生成、多言語の習熟度等功能をサポートし、AI業界における重要なマイルストーンを示しています。
GPT-4.5とは
GPT-4.5は、OpenAIがこれまでに持っていたGPTシリーズのモデルの中で最も高度なものです。以前のモデルであるGPT-4oやGPT-4を上回る能力を持っています。以前のモデルがマルチモーダル機能に重点を置いていたのとは違い、GPT-4.5はより自然で流暢で人間らしいインタラクションを提供することに重点を置いています。OpenAIの最高経営責任者であるSam Altmanは、X(元Twitter)上でGPT-4.5は「……初めて深く考えられる人間と話しているような感じがする」と述べ、その強化された対話能力和感情知能を強調しました。
GPT-4.5のトレーニング方法
OpenAIは、GPT-4.5を開発およびトレーニングするにあたり、複数の技術を採用しました。これらの技術には以下のものが含まれます。
- スーパーバイズドファインチューニング:このプロセスを通じて、GPT-4.5は人間の期待に合致し、効果的に指示に従うことを学びました。この段階で、OpenAIは潜在的な有害なコンテンツへの暴露を最小限に抑えるために、高度なデータフィルタリングを実施しました。
- ヒューマンフィードバックに基づく強化学習(RLHF):OpenAIは、品質、有用性、安全性に基づいて人間の評価者がモデルの出力をランキングするRLHFを通じてGPT-4.5を最適化しました。
- インストラクション階層構造トレーニング:GPT-4.5は、システムメッセージを優先し、ユーザーの指示との競合を防ぐためのインストラクション階層構造に従うようにトレーニングされました。
GPT-4.5の機能
GPT-4.5は、以前のモデルを上回る多くの高度な機能を提供しています。
- 自然な会話:GPT-4.5のインタラクションはより自然で、会話のニュアンスをよりよく理解することができます。
- 感情知能:GPT-4.5は、感情豊かなクエリを処理する際に適切なアドバイスを提供するか、単に聞くかを判断することができる深いレベルの感情分析を統合しています。
- コンテンツ生成:GPT-4.5は、ユーザーが各種形式のテキストコンテンツを生成するのに役立ちます。
- コンテンツの要約:このモデルは、以前のモデルよりも多くの詳細を提供する明確で简洁な要約を提供する大型ドキュメントや大量のコンテンツを要約することができます。
- 知識ベースのQ&A:GPT-4.5は、クエリに回答するためのより広い知識ベースを持っています。
- ファイルと画像のアップロード:GPT-4.5は、ファイルと画像のアップロードをサポートし、追加のデータを分析することができます。
- 多言語の習熟度:このモデルは、アラビア語、ベンガル語、中国語、フランス語、ドイツ語、ヒンディー語、イタリア語、日本語、韓国語、スペイン語、スワヒリ語を含む14の言語でGPT-4oを上回るパフォーマンスを発揮します。
- プログラミング支援:GPT-4.5は、ソフトウェアアプリケーションの構築を支援するコーディングアシスタントとして機能することができます。
GPT-4.5の使用方法
GPT-4.5は2025年2月に発売され、最初は研究プレビューとして分類されました。今後の数か月のうちに、OpenAIはその可用性を段階的に拡大する予定です。現在、GPT-4.5を使用する方法には以下の通りです。
- ChatGPT Pro:月額200ドルで、OpenAIの最上位のChatGPTサービスクライアントが限定的なアクセス権を得ることができます。
- ChatGPT Plus:2025年3月初旬から、ChatGPT Plusユーザーが最初の限定的なアクセス権を得ることができます。
- APIアクセス:開発者や組織は、OpenAIのAPIを通じてGPT-4.5をアプリケーションに統合することができます。ただし、コストはかかります。入力コストは100万トークンあたり75ドル、出力コストは100万トークンあたり150ドルです。
- Microsoft Azure OpenAIサービス:他のOpenAIモデルと同様に、GPT-4.5はAzure OpenAIサービス上でプレビュー形式でアクセス可能です。
まとめ
GPT-4.5の発売はAI分野における重要なマイルストーンです。自然会話と感情知能の面で著しい進歩を遂げただけでなく、強力なコンテンツ生成能力和多言語能力を備え、AIアプリケーションに新しい可能性を開きました。OpenAIがGPT-4.5の可用性を段階的に拡大するにつれて、世界中のAI技術の進歩を推進し、あらゆる業界に新しい機会と挑戦をもたらすことが期待できます。
aiスピーキング
ドルフィンAIは言語学習アプリケーションのためのプロフェッショナルな発音評価API(pronunciation assessment api)ソリューションを提供します。音素、単語、文章、チャプター、発音矯正、単語矯正、クイズ、フリーダイアログ、多肢選択問題など幅広く提供しています。当社の発音評価製品(pronunciation assessment)は、英語と中国語、クラウドAPI、オンプレミス、オフラインデバイスの展開をサポートしています。当社の発音評価API(pronunciation assessment api)は、正確性、流暢性、完全性、リズムの次元をカバーする豊富な評価指標を提供し、音素、単語、文の異なるレベルの評価スコアも提供します。また、音素、単語、文の異なるレベルでの評価スコアも提供します。数千万人のユーザーに安定した効率的で安全なサービスを提供しています。ドルフィンAIの発音評価製品(pronunciation assessment)を試してみませんか?