Statistically Improbable Phrasesとは? わかりやすく解説

Weblio 辞書 > 辞書・百科事典 > 百科事典 > Statistically Improbable Phrasesの意味・解説 

Statistically Improbable Phrases

(Statistically improbable phrase から転送)

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2020/11/12 07:18 UTC 版)

ナビゲーションに移動 検索に移動

A statistically improbable phrase (統計的にありそうもないフレーズ) は文書内で一部の大規模なコーパスよりも頻繁に出てくるフレーズまたは単語の集まり[1][2][3]。本やチャプターのキーワードはセクション内では偏って現れるため、Amazon.comはこの概念を所定の本またはチャプターを決定するキーワードとして使った[4][5] 。クリスチャン・ラダーは著書『Dataclysm』で一定の人種または性別の最も特徴的なフレーズを決めるためにこのコンセプトを出会い系サイトとツイッターの投稿からのデータと共に使った[6]

コンピューターについての文書内で最も一般的な単語はtheの可能性が高いが、theは英語で最も共通して使われる単語でもあり、どの文書でもtheが頻繁に使われている可能性がある。しかしながら「明示的なブーリアンアルゴリズム」のようなフレーズは英語よりも文書でより高い確率で現れる。「Hence(それ故に)」は与えられたドキュメントでは出てくる可能性は低いが、与えたドキュメントでは現れる。「明示的なブーリアンアルゴリズム」は統計的にありそうもないフレーズである。

ダーウィンの種の起源の統計的に起こりそうもないフレーズは「temperate productions」「genera descended」「transitional gradations)」 「unknown progenitor」 「fossiliferous formations」 「our domestic breeds」 「modified offspring」 「doubtful forms」「closely allied forms」「profitable variations」「enormously remote」「transitional grades」「very distinct species and mongrel offspring」である[7]

関連項目

  • Googlewhack英語版 – グーグル検索に2つの単語を入力し出てくる検索結果を一つだけにするゲーム
  • tf-idf – 情報検索とテキストマイニングで使われる統計

脚注

[脚注の使い方]
  1. ^ SIPping Wikipedia”. Courses.cms.caltech.edu. 2017年1月1日閲覧。
  2. ^ Jonathan Bailey (2012年7月3日). “How Long Should a Statistically Improbably Phrase Be?”. Plagiarism Today. 2018年2月16日閲覧。
  3. ^ Errami, Mounir; Sun, Zhaohui; George, Angela C.; Long, Tara C.; Skinner, Michael A.; Wren, Jonathan D.; Garner, Harold R. (1 June 2010). “Identifying duplicate content using statistically improbable phrases”. Bioinformatics 26 (11): 1453–1457. doi:10.1093/bioinformatics/btq146. PMC: 2872002. PMID 20472545. http://bioinformatics.oxfordjournals.org/content/26/11/1453 2017年1月1日閲覧。. 
  4. ^ What are Statistically Improbable Phrases?”. Amazon.com. 2007年12月18日閲覧。
  5. ^ Weeks, Linton (2005年8月30日). “Amazon's Vital Statistics Show How Books Stack Up”. The Washington Post. http://www.washingtonpost.com/wp-dyn/content/article/2005/08/29/AR2005082901873.html 2015年9月8日閲覧。 
  6. ^ Rudder, Christian (2014). Dataclysm: Who We Are When We Think No One's Looking. New York: Crown Publishers. ISBN 978-0-385-34737-2 
  7. ^ Sociologically Improbable Phrases Crooked Timber April 2005





英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「Statistically Improbable Phrases」の関連用語

Statistically Improbable Phrasesのお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



Statistically Improbable Phrasesのページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
ウィキペディアウィキペディア
All text is available under the terms of the GNU Free Documentation License.
この記事は、ウィキペディアのStatistically Improbable Phrases (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。 Weblio辞書に掲載されているウィキペディアの記事も、全てGNU Free Documentation Licenseの元に提供されております。

©2025 GRAS Group, Inc.RSS