中国情報通信研究院(信通院)は2021年2月に「信頼性AI」評価システムを開始しました。これは、音声認識技術が人工知能分野の重要な部分として、標準化と規範化の発展が新しい段階に入ったことを示しています。信通院は音声認識、音声合成、声紋認識、フルデュプレックスインタラクティブ、スマート音声インタラクティブ製品、車載アシスタント、スマートアシスタントなど7つの音声認識関連の評価プロジェクトをカバーしています。
技術成熟度と産業応用
2022年1月14日、信通院クラウドコンピューティングとビッグデータ研究所主催の「信頼性AI 成果発表会」で、何宝宏所長は2021年の第2ラウンド音声認識関連評価テストの結果を正式发布しました。これにより、音声認識技術が多くの次元で顕著な進歩を遂げたことが示されています。Gartnerが発表した2021年の音声技術成熟度曲线によると、音声技術は高峰期に入っており、技術は安定して成長しています。音声認識は生産成熟期に達し、対話型AIプラットフォームは徐々に産業応用に落地しています。
政策推進と市場成長
国家と地方政府が打ち出した人工知能関連の好都合な政策は、音声認識技術の発展に強力な支援を提供しています。政策推進とパンデミックの二重の影響により、音声認識市場規模は持続的に成長しています。消費者市場では、スマートライフシーンの応用需要が急成長しています。スマート運転車輌のスマート前装滲透率も向上しています。企業市場では、金融、電信、行政、インターネットなどの分野での対話型応用需要が依然として主導的で、市場規模は年々増加しています。
評価基準と能力紹介
音声認識評価基準は中国人工知能産業発展連盟(AIIA)評価グループによって組織議論され、中国通信標準協会(CCSA)に同時に提出されています。現在、4つの文書が標準化提案中であり、残りはすべて標準化提案に成功しています。これらの評価基準は音声認識技術の発展に指導を提供し、関連产品和服务の品質にも保証を提供しています。
評価観察と将来展望
今回の評価では、音声合成評価は質の基準度、カスタム似性度、シーンパフォーマンスという3つの次元で総合評価されています。音声認識評価は一般的な認識能力、拡張認識能力、環境認識、多分野および多シーン認識という5つの次元で評価されています。フルデュプレックス音声インタラクティブ評価は、インタラクティブ入力、インタラクティブ理解、インタラクティブ戦略、インタラクティブフィードバック、サービスサポートという5つの次元の多くの詳細な機能ポイントでシステムサービス能力を評価しています。スマート車載音声インタラクティブシステム評価とスマートアシスタント評価も異なる次元から全面的に評価されています。
信通院は2022年上半期の音声認識関連評価テストを正式に開始しました。これにより、音声認識技術の発展に新しい推進力が提供されます。これらの評価を通じて、音声認識技術が多くの分野で革新と突破を実現し、社会に多くの便利性和価値をもたらすことを期待しています。
aiスピーキング
ドルフィンAIは言語学習アプリケーションのためのプロフェッショナルな発音評価API(pronunciation assessment api)ソリューションを提供します。音素、単語、文章、チャプター、発音矯正、単語矯正、クイズ、フリーダイアログ、多肢選択問題など幅広く提供しています。当社の発音評価製品(pronunciation assessment)は、英語と中国語、クラウドAPI、オンプレミス、オフラインデバイスの展開をサポートしています。当社の発音評価API(pronunciation assessment api)は、正確性、流暢性、完全性、リズムの次元をカバーする豊富な評価指標を提供し、音素、単語、文の異なるレベルの評価スコアも提供します。また、音素、単語、文の異なるレベルでの評価スコアも提供します。数千万人のユーザーに安定した効率的で安全なサービスを提供しています。ドルフィンAIの発音評価製品(pronunciation assessment)を試してみませんか?