corpus
「corpus」とは・「corpus」の意味
「corpus」は、一定の条件や目的に基づいて収集された、言語データの集まりを指す言葉である。言語学や自然言語処理の研究において、言語のパターンや特徴を分析するために用いられる。コーパスは、書籍や雑誌、ウェブサイト、会話記録など、さまざまな媒体から収集されることがある。「corpus」の発音・読み方
「corpus」の発音は、IPA表記では /ˈkɔːrpəs/ であり、カタカナ表記では「コーパス」となる。日本人が発音する際のカタカナ英語の読み方は「コーパス」である。「corpus」の定義を英語で解説
A corpus is a collection of linguistic data gathered based on certain criteria or purposes, often used in the fields of linguistics and natural language processing to analyze patterns and characteristics of a language. Corpora can be collected from various sources, such as books, magazines, websites, and conversation records.「corpus」の類語
「corpus」の類語には、以下のような言葉がある。 1. collection: 一般的な集まりや収集物を指す言葉で、言語データに限定されない。 2. database: データの集まりを管理・検索するためのシステムを含む言葉であり、言語データ以外のデータも含むことがある。 3. archive: 古文書や歴史的資料の集まりを指す言葉で、言語データだけでなく、物理的な資料も含むことがある。「corpus」に関連する用語・表現
「corpus」に関連する用語や表現には、以下のようなものがある。 1. concordance: コーパス内の特定の単語や表現がどのように使われているかを調べるためのツールで、文脈を含めた一覧を提供する。 2. frequency list: コーパス内での単語や表現の出現頻度を一覧にしたもので、言語の特徴や傾向を把握するために用いられる。 3. annotation: コーパス内のデータに対して、品詞や構文情報などの付加情報を付与する作業。アノテーションされたコーパスは、自然言語処理の研究やアプリケーション開発に役立つ。「corpus」の例文
1. The researchers compiled a large corpus of spoken language to study regional dialects.(研究者たちは、地域の方言を研究するために、大量の話し言葉のコーパスをまとめた。) 2. The corpus contains texts from various genres, such as novels, newspapers, and academic articles.(コーパスには、小説や新聞、学術論文など、さまざまなジャンルのテキストが含まれている。) 3. The linguist analyzed the corpus to identify common patterns in the use of idiomatic expressions.(言語学者は、慣用表現の使用における共通のパターンを特定するために、コーパスを分析した。) 4. The annotated corpus provides valuable information for developing natural language processing applications.(アノテーションされたコーパスは、自然言語処理アプリケーションの開発に貴重な情報を提供する。) 5. The corpus includes both written and spoken language data, allowing for a comprehensive analysis of the language.(コーパスには、書き言葉と話し言葉の両方のデータが含まれており、言語の包括的な分析が可能である。) 6. The researchers used a balanced corpus to ensure that their findings were representative of the language as a whole.(研究者たちは、言語全体を代表する結果を得るために、バランスの取れたコーパスを使用した。) 7. The size of the corpus is an important factor in determining the reliability of the analysis results.(コーパスのサイズは、分析結果の信頼性を決定する上で重要な要素である。) 8. The corpus was divided into several subcorpora based on the source of the data.(コーパスは、データの出典に基づいていくつかのサブコーパスに分割された。) 9. The researchers compared the frequency lists of different corpora to identify the unique features of each language variety.(研究者たちは、異なるコーパスの頻度リストを比較して、各言語のバリエーションの独自の特徴を特定した。) 10. The concordance tool allowed the linguists to examine the use of specific words in context within the corpus.(コンコーダンスツールにより、言語学者たちは、コーパス内での特定の単語の文脈での使用を調べることができた。)コーパス
コーパス
コーパス(CORPUS)
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/04/28 22:51 UTC 版)
「Warframe」の記事における「コーパス(CORPUS)」の解説
クレジットと古代オロキン文明を崇拝する企業。創始者は『Parvos Granum』。
※この「コーパス(CORPUS)」の解説は、「Warframe」の解説の一部です。
「コーパス(CORPUS)」を含む「Warframe」の記事については、「Warframe」の概要を参照ください。
コーパス
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/06/05 20:18 UTC 版)
Ver.135(2012年9月5日)の「例辞郎」および「和英辞郎」から、公益社団法人アムネスティ・インターナショナル日本の「ニュースリリース」対訳データと、国立研究開発法人情報通信研究機構の『日英新聞記事対応付けデータ』のうちチェック・修正を経たものを、コーパスとして含んでいる。 また、かつてはヤック企画から出版されている『ナンパ天国ニッポン』、『日本人女性の実態』、『日本人の秘密』『国籍を超えた若者たち』などの書籍と『ひらがなタイムズ』をコーパスに利用していた。これらの膨大な例文の中には通常の辞書では見かけられないような珍妙なものや、日本人に対する差別主義的、また政治的に偏向している文章が多々含まれていた。度重なる指摘を受けて運営者は2009年11月にヤック企画のデータを「英辞郎 on the Web」から除去した。[要出典]
※この「コーパス」の解説は、「英辞郎」の解説の一部です。
「コーパス」を含む「英辞郎」の記事については、「英辞郎」の概要を参照ください。
「コーパス」の例文・使い方・用例・文例
コーパスと同じ種類の言葉
- コーパスのページへのリンク