株式会社アルファネット「音声認識技術紹介」

実用化への大きな障害だった「誤認識」を解消!従来のボイスシステムの多くは大容量辞書を(15万〜20万語)と検索エンジンを用いて 音声認識をはかる「ディクテーション方式」を採用していますが、誤認識が多く、実用レベルに至っていません。

「アルファボイス」は、専門用語や命令語、名詞、動詞などを必要な語だけの辞書を登録して音声認識をはかる「ナビゲーション方式」に特化した技術。 また、アルファネット独自の「ワードスポッティング」技術を使用、「ワクチン」、「栄養剤」と言う システムにより、大幅に認識率の向上と柔軟性、導入対象の拡大をはかることに成功しました。

既存のボイスシステムに「アルファボイス」を上乗せして使用することもでき、既存のボイスシステムの誤認識を解消し、認識率の大幅な向上も行えます。

発音の微妙な違いがあっても認識します。訛りやイントネーションなど、人それぞれの発音の微妙な違いも正しく認識します。 不要音や周囲の騒音を認識せず、必要な語だけを認識します。「あのう」「えーと」などの不要音、周囲の人々の音声や騒音を認識しません。 発声音の中から必要な語だけを認識します。

また、あらゆる人の音声に対応します。事前の声の登録(ソフトウェアに使用者の声を学習させる作業)は不要。 老若男女、すべての方の音声を認識します。

さらに、連続数値を正しく認識します。「1234567〜」などの連続数字も、「棒読み」「桁読み」で13桁まで正しくすばやく認識します。

小容量辞書のナビゲーション方式を採用しています。従来のボイスシステムの多くは、大容量辞書と高速な検索エンジンを用いて音声認識を図る「ディクテーション方式」を採用。 アルファボイスは、専門用語や命令語、名詞、動詞など必要な語だけの小容量辞書を作成して音声認識を図る 「ナビゲーション方式」に特化しています。そのため、従来の音声認識エンジンの認識率を格段に向上させます。

現行のアルファボイスは、いくつかあるうちの一つの音声認識ソフトを利用。 そのソフトの音声認識率を格段に向上させる役割を担います。 現在はPC環境で動作する音声認識ソフトに対応していますが、 アルファボイスの開発とともに、他のOSやミドルウェアなどへの対応も順次図っています。

さらに、産学連携として、「東京電機大学」と共同研究・開発も行っております。