スマート音声技術-発音誤り検出・訂正と音声変換

この記事は約3分で読めます。

人工知能技術は世界中で新一轮(しんいん)の技術革新(ぎじゅつかくしん)の波を引き起こし、産業革命(さんぎょうかくめい)の新しいエンジンとなっています。BBCによる予測(よそく)によれば、2020年までに世界人工知能市場(しじょう)の規模(けいぼ)は1190億元(おくげん)に達すると予想されています。艾瑞咨询(あいずいしょうと)によると、中国の人工知能市場規模は約91億元(きゅうじゅういちおくげん)に上がると予想されています。

政策(せいさく)、経済(けいざい)、人材(じんざい)、技術(ぎじゅつ)など各方面(めんぽう)が人工知能の発展(はってん)のために優れた条件(じょうけん)を提供しています。

発音誤り検出・訂正技術

英語は世界で最も一般的な言語であり、その重要性(じゅうようせい)は誰もが深く理解しています。中国では英語学習において発音が一大課題とされています。伝統的な英語教育は教師不足(きょうしふそく)、教育方法の単一性(たんいせい)などに直面しています。スマート音声技術の発音誤り検出・訂正機能は、AI音声評価を通じて、学生により効果的な発音指導を提供しています。

発音誤り検出・訂正技術の難点(なんてん)は、訓練モデルとデータに対してより厳格(げんかく)な要求が存在し、異なる母国語背景(ぼこくごはいけい)の学習者(がくしゅうしゃ)が英語学習で易々(やすい)に犯す誤りも異なるためです。多くの研究機関が大量の資源を投入し、深層神経ネットワーク(しんそうしんけいネットワーク)を用いて音響特性(おんきょうとくせい)と標準発音(ひょうじゅんはつおん)を予測(よそく)し、誤った発音の検出・診断、そしてアクセント、トーン、流暢度(りゅうちょうど)などの評価を実現しています。

音声変換技術

音声変換技術はスマート音声分野の 또一つの大きな突破です。それは非目標(ひもくひょう)話者(わじゃ)の音声色(ごうせいしょく)を変更し、目標話者(もくひょうわじゃ)の音声のように聞こえるようにし、同時に話す内容(りょうい)を保持(じょうじ)します。この技術は个性化(かたいか)された音声合成、コンピュータ輔助(ふじょ)言語学習、機械翻訳(きかいほん역)、言語障害者(げんごしょうがいしゃ)の个性化輔助、エンタメ分野で広範な応用が見込まれています。

深層学習技術の発展により、合成音声と変換音声の自然度(しぜんど)と流暢度が大幅に向上しました。声希科技などの機関は深層循環神経ネットワーク(DBLSTM-RNNs)を用いて変換音声の自然度と流暢度を改善し、多対一(たたいち)の変換を実現し、訓練データの要求を下げ、音声変換技術の実用性を向上させました。

aiスピーキング

ドルフィンAIは言語学習アプリケーションのためのプロフェッショナルな発音評価API(pronunciation assessment api)ソリューションを提供します。音素、単語、文章、チャプター、発音矯正、単語矯正、クイズ、フリーダイアログ、多肢選択問題など幅広く提供しています。当社の発音評価製品(pronunciation assessment)は、英語と中国語、クラウドAPI、オンプレミス、オフラインデバイスの展開をサポートしています。当社の発音評価API(pronunciation assessment api)は、正確性、流暢性、完全性、リズムの次元をカバーする豊富な評価指標を提供し、音素、単語、文の異なるレベルの評価スコアも提供します。また、音素、単語、文の異なるレベルでの評価スコアも提供します。数千万人のユーザーに安定した効率的で安全なサービスを提供しています。ドルフィンAIの発音評価製品(pronunciation assessment)を試してみませんか?

タイトルとURLをコピーしました