音声認識とは? わかりやすく解説

Weblio 辞書 > 同じ種類の言葉 > 情報 > 分析 > 認識 > 音声認識の意味・解説 

おんせい‐にんしき【音声認識】

読み方:おんせいにんしき

speech recognition人間の声などを、コンピューター認識させること。音声特徴から発声者を識別したり、話し言葉文字列変換したりする機能を指す。


音響スペクトログラム

同義/類義語:音声認識, 連続音声認識
英訳・(英)同義/類義語:sound spectrum, connected speech voice recognition

音の周波数強度時系列的に記録したデータ音声分析や音声認識に使われる
「生物学用語辞典」の他の用語
物理学分野:  温度  質量  質量数  赤外スペクトル  起動電位  遠心力  音響スペクトログラム

音声認識

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2024/03/06 01:37 UTC 版)

音声認識(おんせいにんしき、: speech recognition)はがもつ情報をコンピュータに認識させるタスクの総称である[1]ヒトの(天然)音声認識と対比して自動音声認識: Automatic Speech Recognition; ASR)とも呼ばれる[2]


  1. ^ 大辞泉
  2. ^ "automatic speech recognition (ASR)" Li (2020). Recent Advances in End-to-End Automatic Speech Recognition. arxiv:2111.01690
  3. ^ 例: フィラー(「あー」「えっと」)の除去
  4. ^ Garofolo, et. al. CSR-I (WSJ0) Complete LDC93S6A. Linguistic Data Consortium, 1993a. LDC link.
  5. ^ "vq-wav2vec Gumbel + BERT base 0.93" Baevski, et al. (2019). vq-wav2vec: Self-Supervised Learning of Discrete Speech Representations. arxiv:1910.05453
  6. ^ "The TIMIT corpus of read speech is designed to provide speech data for acoustic-phonetic studies and for the development and evaluation of automatic speech recognition systems." Data - Linguistic Data Consortium. 2022-07-03閲覧.
  7. ^ "vq-wav2vec, Gumbel + BERT small 9.64" Baevski, et al. (2019). vq-wav2vec: Self-Supervised Learning of Discrete Speech Representations. arxiv:1910.05453
  8. ^ Brodbeck, Christian; Bhattasali, Shohini; Cruz Heredia, Aura A. L.; Resnik, Philip; Simon, Jonathan Z.; Lau, Ellen (2021-07-03) (英語). Parallel processing in speech perception with local and global representations of linguistic context. doi:10.1101/2021.07.03.450698. http://biorxiv.org/lookup/doi/10.1101/2021.07.03.450698. 
  9. ^ a b c 野澤哲生著 『多数の人の声を一度に聞き分ける聴覚センサ』 日経エレクトロニクス 2008年9月22日号 115-123頁
  10. ^ Mac で音声コントロールを使う”. Apple Support. 2021年4月8日閲覧。
  11. ^ マイクロソフト、AIと音声認識のニュアンスを2兆円超で買収へ”. CNET Japan (2021年4月13日). 2021年4月13日閲覧。
  12. ^ ASCII.jpデジタル用語辞典. “PlainTalkとは”. コトバンク. 2021年4月9日閲覧。
  13. ^ “机からキーボードが消える日”. ニューズウィーク日本版(1991年11月7日号). TBSブリタニカ. (1991-11-7). pp. 64-65. 
  14. ^ 成田一『パソコン翻訳の世界』講談社
  15. ^ Wall Street Journal
  16. ^ 綾加, 川俣. “「『らんま1/2』の現場は、私だけが落ちこぼれでした」声に特徴がなく、アフレコでは失敗ばかり…それでも井上喜久子が“人気声優”になれたワケ”. 文春オンライン. 2022年10月21日閲覧。


「音声認識」の続きの解説一覧

音声認識

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/03/15 15:40 UTC 版)

情報保障」の記事における「音声認識」の解説

音声認識はその仕組み上、「全文見える化が行える。要約筆記などに比べて文章量が多く要約筆記者間の揺らぎ要約解釈違いによる語彙ばらつき抑えることができる。ユニバーサル対応の1つで、近年障害者権利条約における「合理的配慮」対応の1手段として用いられるケースがある。スマートフォンの普及により、無料使える音声認識システム身近になった。GoogleAppleなどの音声認識システムのほか、専用アプリにより音声即座に文字化できるものがある。

※この「音声認識」の解説は、「情報保障」の解説の一部です。
「音声認識」を含む「情報保障」の記事については、「情報保障」の概要を参照ください。


音声認識

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2017/08/09 04:19 UTC 版)

Tablet PC 入力パネル」の記事における「音声認識」の解説

ディクテーション モードでは、マイクに話すことでテキスト入力ができる。また、音声コマンド モードでは、声でコンピュータ操作が行える。

※この「音声認識」の解説は、「Tablet PC 入力パネル」の解説の一部です。
「音声認識」を含む「Tablet PC 入力パネル」の記事については、「Tablet PC 入力パネル」の概要を参照ください。


音声認識

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/11/14 09:26 UTC 版)

シーマン」の記事における「音声認識」の解説

斎藤エッセイ(※)によると、当初音声認識部分ではかなりの苦労があったという。開発中シーマンゲーム機という制約もあり、音声認識はそれ程高度なものではなかったため、認識出来ない言葉何度も聞き返すように作られていた。そのためイベント用のデモプログラムは、プレイヤーシーマン対し何度も語りかけてもシーマン同様に何度も問いただすため、最後にプレイヤー怒って去ってしまうという光景繰り返されてしまった。そして苦肉の策として、今度は音声認識がいつまで経って成功しない場合逆にシーマンの方が怒って去る様に作り直した。すると今度は、プレイヤーシーマン対しなだめる様に短くゆっくりと話しかけるようになったという。このアイデアプレイヤー側話し方コツ学習させることになり、音声認識の性能良くないのをユーザー悟られないようにすることが出来たという。しかし逆に、これがシーマンの「口が悪い」「気難しい」というキャラクター位置付けしてしまうことになってしまった。また、このアイデアIBMの音声認識の研究者驚かせ「一体どの様技術使っているのか」と問われた、というエピソード残されている。 後年シーマンの音声認識による会話は、所謂囲い込みというもので、プレイヤー側にわざとそう答えるように持って行ってる、いってみれば誘導質問だったと斉藤コメントしている。シーマンドリームキャストハードウェアプロモーションとしての役割もあったことから、早期リリースという納期の関係で「希望してたもの9割を捨てて引き算で製作」「飛行機でいうとゼロ戦みたいに1番軽くした状態で突入」だったという。当時のこういった製作方針斉藤は「コレしかやらない決めてかかると、それが強みになりコンセプトブレなくなっていんじゃないかな」とも振り返っている。

※この「音声認識」の解説は、「シーマン」の解説の一部です。
「音声認識」を含む「シーマン」の記事については、「シーマン」の概要を参照ください。


音声認識

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/06/14 13:57 UTC 版)

ニンテンドーDS」の記事における「音声認識」の解説

DS本体内蔵されマイクによって、音声発してゲーム反映させることも可能である。『東北大学未来科学技術共同研究センター川島隆太教授監修 脳を鍛える大人のDSトレーニング』では音声使用するトレーニングが可能。『ポケットモンスター ダイヤモンド・パール』などではボイスチャットが可能。

※この「音声認識」の解説は、「ニンテンドーDS」の解説の一部です。
「音声認識」を含む「ニンテンドーDS」の記事については、「ニンテンドーDS」の概要を参照ください。

ウィキペディア小見出し辞書の「音声認識」の項目はプログラムで機械的に意味や本文を生成しているため、不適切な項目が含まれていることもあります。ご了承くださいませ。 お問い合わせ

「音声認識」の例文・使い方・用例・文例

Weblio日本語例文用例辞書はプログラムで機械的に例文を生成しているため、不適切な項目が含まれていることもあります。ご了承くださいませ。



音声認識と同じ種類の言葉


英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「音声認識」の関連用語

音声認識のお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



音声認識のページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
デジタル大辞泉デジタル大辞泉
(C)Shogakukan Inc.
株式会社 小学館
JabionJabion
Copyright (C) 2024 NII,NIG,TUS. All Rights Reserved.
ウィキペディアウィキペディア
All text is available under the terms of the GNU Free Documentation License.
この記事は、ウィキペディアの音声認識 (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。 Weblio辞書に掲載されているウィキペディアの記事も、全てGNU Free Documentation Licenseの元に提供されております。
ウィキペディアウィキペディア
Text is available under GNU Free Documentation License (GFDL).
Weblio辞書に掲載されている「ウィキペディア小見出し辞書」の記事は、Wikipediaの情報保障 (改訂履歴)、Tablet PC 入力パネル (改訂履歴)、シーマン (改訂履歴)、ニンテンドーDS (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。
Tanaka Corpusのコンテンツは、特に明示されている場合を除いて、次のライセンスに従います:
 Creative Commons Attribution (CC-BY) 2.0 France.
この対訳データはCreative Commons Attribution 3.0 Unportedでライセンスされています。
浜島書店 Catch a Wave
Copyright © 1995-2024 Hamajima Shoten, Publishers. All rights reserved.
株式会社ベネッセコーポレーション株式会社ベネッセコーポレーション
Copyright © Benesse Holdings, Inc. All rights reserved.
研究社研究社
Copyright (c) 1995-2024 Kenkyusha Co., Ltd. All rights reserved.
日本語WordNet日本語WordNet
日本語ワードネット1.1版 (C) 情報通信研究機構, 2009-2010 License All rights reserved.
WordNet 3.0 Copyright 2006 by Princeton University. All rights reserved. License
日外アソシエーツ株式会社日外アソシエーツ株式会社
Copyright (C) 1994- Nichigai Associates, Inc., All rights reserved.
「斎藤和英大辞典」斎藤秀三郎著、日外アソシエーツ辞書編集部編
EDRDGEDRDG
This page uses the JMdict dictionary files. These files are the property of the Electronic Dictionary Research and Development Group, and are used in conformance with the Group's licence.

©2024 GRAS Group, Inc.RSS