WEBSpeechAPIによる音声認識

WEBSpeechAPIによる音声認識

WEBSpeechAPIによる音声認識 iPhoneに搭載されているSiriやWindows10に実装されたCortanaは、人の話す言葉を認識して質問に答えたり、様々な機能を実行してくれる便利なサービスです。この音声認識および音声合成の機能は近年目覚ましい発展を遂げ、私たちも身近で利用することができるようになってきました。

また企業別に独自の規格が作られる状況から、現在ではインターネット標準を規定するW3Cによって、WebSpeechAPIScecificationとして仕様がまとめられつつあります。これによって音声認識技術を取り扱うプログラマの数が増加し、ますます身近な技術となってきています。音声認識によって具体的にできることとしては、声を使ったインターネット検索の他、声を使って端末で様々な命令を実行するといったことがあげられます。他にも、文章入力、各種データ入力に応用されることもあります。

WEBブラウザの中で使われているWebkitやBlinkといったブラウザエンジンにおいては、すでにこれらの技術が取り込まれています。そのため特に新たにインストールするようなことなく、すぐに音声技術を利用することができる状況が整っています。

PICK UP! サイト情報