作業帮の端到端英語発音誤り検出技術の応用

この記事は約4分で読めます。

現代のグローバル化の中で、英語は国際的な共通言語として重要な位置を占めています。しかし、中国の英語学習者はしばしば「無口英語」や「中国式英語」、発音不正確などの問題に直面しています。これらは彼らの聴解能力に大きな影響を与え、英語の実際の使用にも支障をきたします。英語の対話試験が徐々に中学校入学試験や大学入学試験の一部として導入されるにつれて、生徒たちの対話力の向上への需要も日増しに高まっています。伝統的な対話教育は、1対1の教育機会が希少であるため、コンピュータ輔助言語学習技術(CALL)がこの問題に対する解決策を提供しています。作業帮は端到端英語発音誤り検出技術を活用して、生徒たちにタイムリー、効率的、かつ便利な個人化された発音指導を提供しています。

業界現状と技術的課題

現在の音声評価アプリケーションは通常、発音のスコア만提供し、具体的な誤り原因や的確な指導は提供しにくいです。近年、音素レベルの発音誤り検出技術は、余分な発音、発音漏れ、誤った発音を検出できるため、越来越多的关注(注:此处应翻译为“越来越多的关注”)を集めています。作業帮は専門的な英語教師チーム、豊富なスピーチ練習問題庫、広範なユーザー基盤を持ち、英語学習者には個人化された指導を提供し、教育の普及を実現しています。

伝統的な音声評価方法是、強制対齐(Forced Alignment)を通じて音素の開始と終了の時間を決定し、各音素セグメント内で目標発音音素と他の音素の確率比を計算し、GOP(Goodness of Pronunciation)スコアを求めます。しかし、この方法には多くの問題が存在します。端到端モデル、CTC、AED、RNN-Tは、训练流程(注:此处应翻译为“训练流程”)が簡略化され、伝統的な方法と同等の性能を達成するため、音声識別分野で広く応用されています。作業帮は端到端音素識別技術を採用し、学習者の実際の発音音素シーケンスを直接識別し、最短編集距離を通じて目標発音音素シーケンスと照合、比べることで、正確な発音誤り検出と診断結果を提供しています。

作業帮の実践と解決策

作業帮は端到端発音誤り検出技術を実装する際、L2-ARCTICデータセットを使用して評価を行いました。このデータセットは、英語が母国語ではない人々が英語の文章を読む音声データを含み、音声、ヒントテキスト、そして余分な発音、発音漏れ、誤った発音が標識されています。発音誤り検出と診断タスクの評価指標は、偽陽性率、再現率、そして診断正確率です。誤り検出の正確さを向上させるために、作業帮はattentionに基づくテキスト情報融合と発音誤りデータ拡張戦略を採用しました。これにより、偽陽性率が大幅に低下し、診断正確率も向上しました。

機能境界の決定において、作業帮は、高频の偽陽性と再現率の低い音素対が主に発音が近い音素であることを発見しました。明白な発音誤りに比べて、このような細かい発音訂正は実際の教育活動では優先度が低いです。偽陽性率をさらに低下させ、生徒たちが英語を大胆に話すのを奨励するために、多年の教育経験を持つ研究員とコミュニケーションを取り、/ʌ/と/ɑː/、/s/と/θ/、語尾の/s/と/z/などの発音が近い音素対の訂正優先度を相对较低(注:此处应翻译为“相对较低”)に設定しました。これにより、偽陽性率はさらに7%に低下し、このような発音誤りを考慮に入れない場合、再現率も67%に向上しました。

まとめと展望

作業帮は端到端音素識別技術を通じて、伝統的な強制対齐方案の問題を回避し、発音誤り検出の効果を大幅に向上させました。将来的には、実際の応用シーン下的での実発音データを標識し、マルチタスク知識移行を通じて発音属性識別などの情報を導入し、モデルの音素識別能力を向上させるなどの最適化方向を探求します。また、音声とビデオの多モーダル特徴融合方案を基に、特にノイズ環境下での誤り検出正確率を大幅に向上させることも可能です。

aiスピーキング

ドルフィンAIは言語学習アプリケーションのためのプロフェッショナルな発音評価API(pronunciation assessment api)ソリューションを提供します。音素、単語、文章、チャプター、発音矯正、単語矯正、クイズ、フリーダイアログ、多肢選択問題など幅広く提供しています。当社の発音評価製品(pronunciation assessment)は、英語と中国語、クラウドAPI、オンプレミス、オフラインデバイスの展開をサポートしています。当社の発音評価API(pronunciation assessment api)は、正確性、流暢性、完全性、リズムの次元をカバーする豊富な評価指標を提供し、音素、単語、文の異なるレベルの評価スコアも提供します。また、音素、単語、文の異なるレベルでの評価スコアも提供します。数千万人のユーザーに安定した効率的で安全なサービスを提供しています。ドルフィンAIの発音評価製品(pronunciation assessment)を試してみませんか?

タイトルとURLをコピーしました