2013年5月3日金曜日

JEITA 音声認識技術の新しい応用に関する調査報告

音声認識関連の情報収集のため、サイトを放浪していたら
表題のタイトルの資料を見つけました。

http://www.jeita-speech.org/report/content/NewApplications_v0.5.pdf


アプリケーションとして発想が面白いのは、
パーキンソン病判定やインテリジェント非常通報システムですね。
2つとも音声認識をセンサーとして使用している点が面白いです。

個人的には、ユーザーの発話を正しく認識できていることを前提にして
UI設計された音声認識システムに疑問を感じていました。
カーナビなんて、代表的な例ですね。

でも、このパーキンソン病判定やインテリジェント非常通報装置は
まずは運用者に実態をチェックさせる動機付けに使用されるので、
多少のシステムの誤りは許容されそうです。
しかも、音声認識のメリットである「素早い入力」をきちんと生かしているので、
とても現実的な使い方をしていると感じました。


書き起こし系のシステムは、シチュエーションに大きく依存しそうです。
自分用のメモといった殴り書き系であれば十分機能すると思うのですが、
システムとして提案されているのが、誰かに向けて提出する系が多いので、
ほぼ必然的に修正が発生してしまう状況を個人的には気になっています。

ただ、音声エージェントのように認識された結果をただちに操作に反映するのではなく
文字に直したところまで行えればシステムとしての役目を完了できるので、
誤作動によるユーザーの負荷や不快感は軽減できる点は良いですよね。



この資料は、ポイントにしぼってまとめられていて
音声認識業界から離れてしまった私がざっくり調査するのに
とても役立ちました。

JEITAに感謝。

0 件のコメント:

コメントを投稿