Corpusとは? わかりやすく解説

corpus

別表記:コーパス

「corpus」とは・「corpus」の意味

「corpus」は、一定の条件目的基づいて収集された言語データ集まりを指す言葉である。言語学自然言語処理研究において、言語パターン特徴分析するために用いられるコーパスは、書籍雑誌ウェブサイト会話記録などさまざまな媒体から収集されることがある

「corpus」の発音・読み方

「corpus」の発音は、IPA表記では /ˈkɔːrpəs/ であり、カタカナ表記では「コーパス」となる。日本人発音する際のカタカナ英語読み方は「コーパス」である。

「corpus」の定義を英語で解説

A corpus is a collection of linguistic data gathered based on certain criteria or purposes, often used in the fields of linguistics and natural language processing to analyze patterns and characteristics of a language. Corpora can be collected from various sources, such as books, magazines, websites, and conversation records.

「corpus」の類語

「corpus」の類語には、以下のような言葉がある。 1. collection: 一般的な集まり収集物を指す言葉で、言語データ限定されない。 2. database: データ集まり管理検索するためのシステムを含む言葉であり、言語データ以外のデータも含むことがある。 3. archive: 古文書歴史的資料集まりを指す言葉で、言語データだけでなく、物理的な資料も含むことがある

「corpus」に関連する用語・表現

「corpus」に関連する用語表現には、以下のようなものがある。 1. concordance: コーパス内の特定の単語表現どのように使われているかを調べるためのツールで、文脈含めた一覧を提供する。 2. frequency list: コーパス内での単語表現出現頻度を一覧にしたもので、言語の特徴傾向把握するために用いられる。 3. annotation: コーパス内のデータに対して品詞構文情報などの付加情報付与する作業アノテーションされたコーパスは、自然言語処理研究アプリケーション開発に役立つ。

「corpus」の例文

1. The researchers compiled a large corpus of spoken language to study regional dialects.(研究者たちは、地域方言研究するために、大量話し言葉コーパスをまとめた。) 2. The corpus contains texts from various genres, such as novels, newspapers, and academic articles.(コーパスには、小説新聞学術論文など、さまざまなジャンルテキスト含まれている。) 3. The linguist analyzed the corpus to identify common patterns in the use of idiomatic expressions.(言語学者は、慣用表現使用における共通のパターン特定するために、コーパス分析した。) 4. The annotated corpus provides valuable information for developing natural language processing applications.(アノテーションされたコーパスは、自然言語処理アプリケーション開発貴重な情報提供する。) 5. The corpus includes both written and spoken language data, allowing for a comprehensive analysis of the language.(コーパスには、書き言葉話し言葉両方データ含まれており、言語包括的な分析が可能である。) 6. The researchers used a balanced corpus to ensure that their findings were representative of the language as a whole.(研究者たちは、言語全体代表する結果を得るために、バランス取れたコーパス使用した。) 7. The size of the corpus is an important factor in determining the reliability of the analysis results.(コーパスサイズは、分析結果信頼性決定する上で重要な要素である。) 8. The corpus was divided into several subcorpora based on the source of the data.(コーパスは、データ出典基づいていくつかのサブコーパスに分割された。) 9. The researchers compared the frequency lists of different corpora to identify the unique features of each language variety.(研究者たちは、異なコーパス頻度リスト比較して各言語バリエーション独自の特徴特定した。) 10. The concordance tool allowed the linguists to examine the use of specific words in context within the corpus.(コンコーダンスツールにより、言語学者たちは、コーパス内での特定の単語文脈での使用調べることができた。)

コーパス【corpus】

読み方:こーぱす

語彙索引など、言語研究のための資料。特に、コンピューター利用してデータベース化された大規模な言語資料


読み方:たい、ちょうけいこつたい
別名:蝶形骨体
【英】:Corpus,Body of sphenoid

蝶形骨体蝶形骨中央部にあり立方体をなしている。上面中央部には鞍状を呈したトルコ鞍があり、その中央横位楕円形の下垂体窩がある。トルコ鞍後方には鞍背という上方突出した骨板があり、その両側外側端の突起後床突起という。鞍背後部台形をなして後頭骨の底部とともに斜台形成する下垂体窩前には体の前部との境界線である鞍結節とよべる横走する稜があり、その両側端にある中床突起発育弱く明瞭なものは少ない。鞍結節前には細い横走する[視神経交叉溝があり、その両外側視神経管につづく。交叉溝の前部蝶形骨隆起よばれているが、これは隆起ではなく滑らかな平面である。体の前部小翼後部大翼結合している。下錐体窩の外側大翼の根部との間には、内側頚動脈溝という前後に走る溝があり、外側蝶形骨小舌という突起状の骨板がある。体の下面鼻腔咽頭腔の上壁をなし、中央蝶形骨吻が前下方突出し鋤骨翼はさまれる。体の前面中央部には蝶形骨稜という上下に走る稜線があり、篩骨の垂直板相接する蝶形骨稜両側でがいおうに蝶形骨甲介認められる。これはバルタン小骨ともよばれ、発生学的には篩骨一部であったものが8~12歳蝶形骨体癒合したものでとくに若年頭蓋著明である。体の内面空洞状をなし蝶形骨洞とよばれ、その正中部には蝶形骨洞中隔があり、洞を左右に分けている。その前面には蝶形骨洞口という開口部両側にあり蝶篩陥凹通じている。

子宮体部

【仮名】しきゅうたいぶ
原文】corpus

子宮主要部

コーパス

(Corpus から転送)

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2024/01/25 16:30 UTC 版)

コーパス: corpus)は、言語学において、自然言語処理の研究に用いるため、自然言語の文章を構造化し大規模に集積したもの。構造化し、言語的な情報(品詞、統語構造など)を付与している。言語学以外では「全集」を意味することもあり、言語学でも日本語を扱う場合には、「言語全集」「名詞全集」「動詞全集」などと呼ぶとよい[1]コンピュータ利用が進み、電子化データとして提供されている[2]




「コーパス」の続きの解説一覧


英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「Corpus」の関連用語

Corpusのお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



Corpusのページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
実用日本語表現辞典実用日本語表現辞典
Copyright © 2024実用日本語表現辞典 All Rights Reserved.
デジタル大辞泉デジタル大辞泉
(C)Shogakukan Inc.
株式会社 小学館
船戸和弥のホームページ船戸和弥のホームページ
Copyright (C) 2024 船戸和弥のホームページ All rights reserved.
がん情報サイトがん情報サイト
Copyright ©2004-2024 Translational Research Informatics Center. All Rights Reserved.
財団法人先端医療振興財団 臨床研究情報センター
ウィキペディアウィキペディア
All text is available under the terms of the GNU Free Documentation License.
この記事は、ウィキペディアのコーパス (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。 Weblio辞書に掲載されているウィキペディアの記事も、全てGNU Free Documentation Licenseの元に提供されております。

©2024 GRAS Group, Inc.RSS