おんせい‐にんしき【音声認識】
音響スペクトログラム
音声認識
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2024/03/06 01:37 UTC 版)
音声認識(おんせいにんしき、英: speech recognition)は声がもつ情報をコンピュータに認識させるタスクの総称である[1]。ヒトの(天然)音声認識と対比して自動音声認識(英: Automatic Speech Recognition; ASR)とも呼ばれる[2]。
- ^ 大辞泉
- ^ "automatic speech recognition (ASR)" Li (2020). Recent Advances in End-to-End Automatic Speech Recognition. arxiv:2111.01690
- ^ 例: フィラー(「あー」「えっと」)の除去
- ^ Garofolo, et. al. CSR-I (WSJ0) Complete LDC93S6A. Linguistic Data Consortium, 1993a. LDC link.
- ^ "vq-wav2vec Gumbel + BERT base 0.93" Baevski, et al. (2019). vq-wav2vec: Self-Supervised Learning of Discrete Speech Representations. arxiv:1910.05453
- ^ "The TIMIT corpus of read speech is designed to provide speech data for acoustic-phonetic studies and for the development and evaluation of automatic speech recognition systems." Data - Linguistic Data Consortium. 2022-07-03閲覧.
- ^ "vq-wav2vec, Gumbel + BERT small 9.64" Baevski, et al. (2019). vq-wav2vec: Self-Supervised Learning of Discrete Speech Representations. arxiv:1910.05453
- ^ Brodbeck, Christian; Bhattasali, Shohini; Cruz Heredia, Aura A. L.; Resnik, Philip; Simon, Jonathan Z.; Lau, Ellen (2021-07-03) (英語). Parallel processing in speech perception with local and global representations of linguistic context. doi:10.1101/2021.07.03.450698 .
- ^ a b c 野澤哲生著 『多数の人の声を一度に聞き分ける聴覚センサ』 日経エレクトロニクス 2008年9月22日号 115-123頁
- ^ “Mac で音声コントロールを使う”. Apple Support. 2021年4月8日閲覧。
- ^ “マイクロソフト、AIと音声認識のニュアンスを2兆円超で買収へ”. CNET Japan (2021年4月13日). 2021年4月13日閲覧。
- ^ ASCII.jpデジタル用語辞典. “PlainTalkとは”. コトバンク. 2021年4月9日閲覧。
- ^ “机からキーボードが消える日”. ニューズウィーク日本版(1991年11月7日号). TBSブリタニカ. (1991-11-7). pp. 64-65.
- ^ 成田一『パソコン翻訳の世界』講談社
- ^ Wall Street Journal
- ^ 綾加, 川俣. “「『らんま1/2』の現場は、私だけが落ちこぼれでした」声に特徴がなく、アフレコでは失敗ばかり…それでも井上喜久子が“人気声優”になれたワケ”. 文春オンライン. 2022年10月21日閲覧。
音声認識
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/03/15 15:40 UTC 版)
音声認識はその仕組み上、「全文の見える化」が行える。要約筆記などに比べて文章量が多く、要約筆記者間の揺らぎや要約解釈の違いによる語彙のばらつきを抑えることができる。ユニバーサル対応の1つで、近年、障害者権利条約における「合理的配慮」対応の1手段として用いられるケースがある。スマートフォンの普及により、無料で使える音声認識システムが身近になった。GoogleやAppleなどの音声認識システムのほか、専用のアプリにより音声を即座に文字化できるものがある。
※この「音声認識」の解説は、「情報保障」の解説の一部です。
「音声認識」を含む「情報保障」の記事については、「情報保障」の概要を参照ください。
音声認識
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2017/08/09 04:19 UTC 版)
「Tablet PC 入力パネル」の記事における「音声認識」の解説
ディクテーション モードでは、マイクに話すことでテキスト入力ができる。また、音声コマンド モードでは、声でコンピュータの操作が行える。
※この「音声認識」の解説は、「Tablet PC 入力パネル」の解説の一部です。
「音声認識」を含む「Tablet PC 入力パネル」の記事については、「Tablet PC 入力パネル」の概要を参照ください。
音声認識
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/11/14 09:26 UTC 版)
斎藤のエッセイ(※)によると、当初音声認識部分ではかなりの苦労があったという。開発中のシーマンはゲーム機という制約もあり、音声認識はそれ程高度なものではなかったため、認識出来ない言葉を何度も聞き返すように作られていた。そのためイベント用のデモプログラムは、プレイヤーがシーマンに対し何度も語りかけても、シーマンも同様に何度も問いただすため、最後にプレイヤーは怒って去ってしまうという光景が繰り返されてしまった。そして苦肉の策として、今度は音声認識がいつまで経っても成功しない場合、逆にシーマンの方が怒って去る様に作り直した。すると今度は、プレイヤーがシーマンに対し、なだめる様に短くゆっくりと話しかけるようになったという。このアイデアがプレイヤー側に話し方のコツを学習させることになり、音声認識の性能が良くないのをユーザーに悟られないようにすることが出来たという。しかし逆に、これがシーマンの「口が悪い」「気難しい」というキャラクターを位置付けしてしまうことになってしまった。また、このアイデアはIBMの音声認識の研究者を驚かせ「一体どの様な技術を使っているのか」と問われた、というエピソードも残されている。 後年、シーマンの音声認識による会話は、所謂囲い込みというもので、プレイヤー側にわざとそう答えるように持って行ってる、いってみれば誘導質問だったと斉藤はコメントしている。シーマンはドリームキャストのハードウェアのプロモーションとしての役割もあったことから、早期リリースという納期の関係で「希望してたもの9割を捨てて引き算で製作」「飛行機でいうとゼロ戦みたいに1番軽くした状態で突入」だったという。当時のこういった製作方針を斉藤は「コレしかやらないと決めてかかると、それが強みになりコンセプトがブレなくなっていいんじゃないかな」とも振り返っている。
※この「音声認識」の解説は、「シーマン」の解説の一部です。
「音声認識」を含む「シーマン」の記事については、「シーマン」の概要を参照ください。
音声認識
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/06/14 13:57 UTC 版)
DS本体に内蔵されたマイクによって、音声を発してゲームに反映させることも可能である。『東北大学未来科学技術共同研究センター川島隆太教授監修 脳を鍛える大人のDSトレーニング』では音声を使用するトレーニングが可能。『ポケットモンスター ダイヤモンド・パール』などではボイスチャットが可能。
※この「音声認識」の解説は、「ニンテンドーDS」の解説の一部です。
「音声認識」を含む「ニンテンドーDS」の記事については、「ニンテンドーDS」の概要を参照ください。
「音声認識」の例文・使い方・用例・文例
音声認識と同じ種類の言葉
- 音声認識のページへのリンク