LAION
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2024/06/09 13:11 UTC 版)
LAION (ライオン)はクローラデータなどからAI基盤モデルやデータセットを形成するドイツの非営利団体[1][2][3]。インターネットから無断で集めた画像と説明文の巨大なデータセットを多く公開したことで有名で、Stable DiffusionやMidjourneyやNovelAIなど多数の目立つtext-to-imageモデルの基礎データに使われている[4][5][6][2]。58億5000万もの画像データセットを載せたLAION-5Bは特に有名である[2][7]。LAIONのデータセット群はAI利用者に重宝される一方で、含まれる画像は基本的に権利者の同意なく収集されていることなど、様々な分野から問題の指摘がされており、データセットを利用したAI企業が訴訟されるなどしている[2][8][9][10]。LAIONは「Large-scale Artificial Intelligence Open Network」の頭文字である[1]。
- ^ a b “About”. LAION.ai. 2022年9月26日閲覧。
- ^ a b c d e f g h i j k l m n “きちんとチェックすると「781年」かかるAI用データセット「LAION-5B」の課題がよくわかる「Models All The Way Down」”. GIGAZINE (2024年4月1日). 2024年5月12日閲覧。
- ^ a b c “生成AIの学習データに児童虐待画像 米大学研究者が指摘”. 日本経済新聞 (2022年12月21日). 2024年5月12日閲覧。
- ^ a b Edwards, Benj (2022年9月15日). “Have AI image generators assimilated your art? New tool lets you check”. Ars Technica
- ^ Newman, Marissa; Cantrill, Aggi (2023年4月24日). “The Future of AI Relies on a High School Teacher's Free Database” (英語). Bloomberg News 2023年4月24日閲覧。
- ^ a b “We Are All Raw Material for AI”. Bayerischer Rundfunk (2023年7月7日). 2024年5月12日閲覧。
- ^ a b Beaumont, Romain (2022年3月3日). “LAION-5B: A New Era of Open Large-Scale Multi-Modal Datasets”. LAION blog. 2024年5月12日閲覧。
- ^ a b “A Photographer Tried to Get His Photos Removed from an AI Dataset. He Got an Invoice Instead.” (英語). Vice (2023年4月28日). 2023年5月4日閲覧。
- ^ “Class Action Filed Against Stability AI, Midjourney, and DeviantArt for DMCA Violations, Right of Publicity Violations, Unlawful Competition, Breach of TOS”. PR Newswire. Cision (2023年1月14日). 2024年5月12日閲覧。
- ^ a b c d “画像生成AI「Stable Diffusion」と「Midjourney」に対する集団訴訟でイギリスの写真家が団結呼びかけ”. GIGAZINE (2024年1月25日). 2024年5月12日閲覧。
- ^ “Getty Images (US), Inc. v. Stability AI, Inc., 1:23-cv-00135” (英語). CourtListener. 2023年2月8日閲覧。
- ^ “画像生成AI「Stable Diffusion」開発元のStability AIがかつてGoogleを和解に持ち込ませたこともあるストックフォトサイトのGetty Imagesに訴えられる”. GIGAZINE (2023年1月18日). 2024年5月12日閲覧。
- ^ “画像生成AIによる作品の無許可使用を主張した写真家が逆に損害賠償を請求される”. GIGAZINE (2023年4月27日). 2024年6月6日閲覧。
- ^ a b c d “画像生成AI「Stable Diffusion」が使う無料のデータセット「LAION」の構築を率いているのは1人の高校教師だった”. GIGAZINE (2023年4月26日). 2024年5月12日閲覧。
- ^ a b c d Alford, Anthony (2022年5月17日). “LAION Releases Five Billion Image-Text Pair Dataset LAION-5B”. InfoQ. 2024年5月12日閲覧。
- ^ a b c d Edwards, Benj (2022年9月21日). “Artist finds private medical record photos in popular AI training data set”. Ars Technica
- ^ a b c d e “画像生成AIユーザーがAI学習用データセットから「自分の医療記録の写真」を発見してしまう”. GIGAZINE (2022年9月22日). 2024年5月12日閲覧。
- ^ a b c d “「AI学習用のデータセット作成を大学や非営利団体に任せることで企業は法的責任から逃げている」という批判”. GIGAZINE (2022年10月19日). 2024年5月12日閲覧。
- ^ a b Schuhmann, Christoph (2021年8月8日). “LAION-400-Million Open Dataset”. LAION blog. 2022年9月26日閲覧。
- ^ a b “画像生成AI「Stable Diffusion」などの開発に大きな貢献を果たした超巨大データセット「LAION-5B」とは?”. GIGAZINE (2022年12月14日). 2024年6月7日閲覧。
- ^ Saharia, Chitwan; Chan, William; Saxena, Saurabh; Li, Lala; Whang, Jay; Denton, Emily; Kamyar Seyed Ghasemipour, Seyed; Karagol Ayan, Burcu; Sara Mahdavi, S.; Gontijo Lopes, Rapha; Salimans, Tim; Ho, Jonathan; J Fleet, David; Norouzi, Mohammad (23 May 2022). "Photorealistic Text-to-Image Diffusion Models with Deep Language Understanding". arXiv:2205.11487 [cs.CV]。
- ^ Wiggers, Kyle (2022年8月12日). “This startup is setting a DALL-E 2-like AI free, consequences be damned”. TechCrunch. 2024年5月12日閲覧。
- ^ a b c “画像生成AI「Stable Diffusion」などに使われた50億枚超の画像セット「LAION-5B」に1008枚の児童ポルノ画像が入っていることが判明し削除へ”. GIGAZINE (2023年12月21日). 2024年5月12日閲覧。
- ^ a b c d e “画像生成AI「Stable Diffusion」と「Midjourney」に対して集団訴訟が提起される”. GIGAZINE (2023年1月16日). 2024年5月12日閲覧。
- ^ a b c “画像生成AIサービス「NovelAI Diffusion」が無断転載サイトからの学習で物議 法的観点からも複雑な事態に”. Yahoo! Japan News (2022年8月5日). 2022年10月19日時点のオリジナルよりアーカイブ。2024年5月12日閲覧。
- ^ a b “23億枚もの画像で構成された画像生成AI「Stable Diffusion」のデータセットのうち1200万枚がどこから入手した画像かを調査した結果が公開される”. GIGAZINE (2022年8月31日). 2024年5月12日閲覧。
- ^ Birhane, Abeba; Prabhu, Vinay Uday; Kahembwe, Emmanuel (2021). Multimodal datasets: misogyny, pornography, and malignant stereotypes. arXiv:2110.01963.
- ^ Birhane, Abeba; Prabhu, Vinay; Han, Sang; Boddeti, Vishnu Naresh; Luccioni, Alexandra Sasha (2023-11-06), Into the LAIONs Den: Investigating Hate in Multimodal Datasets, arXiv:2311.03449
- ^ “画像生成AIに自分の作品が勝手に使われたかどうかを検索できる「Have I Been Trained?」”. GIGAZINE (2022年9月15日). 2024年5月12日閲覧。
- ^ a b c “まるで人間のアーティストが描いたような画像を生成するAIが「アーティストの権利を侵害している」と批判される”. GIGAZINE (2022年8月15日). 2024年5月12日閲覧。
- ^ a b c d e “生成AI、児童ポルノ画像を学習か…専門家「被害者の人権侵害恐れ」”. 読売新聞オンライン. 読売新聞 (2024年3月21日). 2024年5月12日閲覧。
- ^ a b Baio, Andy (2022年9月30日). “AI Data Laundering: How Academic and Nonprofit Researchers Shield Tech Companies from Accountability”. waxy.org. 2024年5月12日閲覧。
- ^ “AI無断学習で作画「私の作品のつぎはぎだ」…コピーライト・ロンダリングがもたらす「文化の衰退」”. 読売新聞オンライン. 読売新聞 (2024年2月14日). 2024年5月12日閲覧。
- ^ “米画家ら、画像生成AI「Stable Diffusion」と「Midjourney」を提訴”. PC Watch. インプレス (2023年1月17日). 2024年5月12日閲覧。
- ^ “作家そっくりの作風、チャットGPTが「作品」…著作権の保護曖昧”. 読売新聞オンライン. 読売新聞 (2023年4月26日). 2024年5月12日閲覧。
- ^ a b c “MidjourneyがAIトレーニングに用いた6歳児を含む1万6000人のアーティストリストの存在が発覚”. GIGAZINE (2024年1月11日). 2024年5月12日閲覧。
- ^ a b “イラスト自動生成AI「NovelAI」について学習元となったDanbooru公式が声明を発表”. GIGAZINE (2022年10月5日). 2024年5月12日閲覧。
- ^ “AI学習リスクにイラストレーターが抗議、pixivの作品非公開・削除の動き”. ledge.ai (2023年5月13日). 2024年5月12日閲覧。
- ^ a b c d “「Stable Diffusion」のような画像生成AIに自分の顔写真が使われている可能性は決して低くないとの警告”. GIGAZINE (2022年9月27日). 2024年5月12日閲覧。
- ^ a b c d e “事件・事故の犠牲者の顔写真、生成AIが無断使用…遺族「使うのやめて」・識者「尊厳にかかわる」”. 読売新聞オンライン. 読売新聞 (2024年4月7日). 2024年5月12日閲覧。
- ^ “人気の画像生成AIモデルが子どもの虐待画像でトレーニングされていたことが判明 スタンフォード大学調査”. ledge.ai (2024年1月13日). 2024年5月12日閲覧。
- ^ “Largest Dataset Powering AI Images Removed After Discovery of Child Sexual Abuse Material” (英語). 404 Media (2023年12月20日). 2023年12月22日閲覧。
- 1 LAIONとは
- 2 LAIONの概要
- 3 関連項目
- LAIONのページへのリンク