Common Crawl är en ideell organisation som genomsöker webben och fritt tillhandahåller sina arkiv och datamängder till allmänheten.[1][2] Common Crawls webbarkiv består av petabyte data som samlats in sedan 2011.[3] Den genomför genomsökningar i allmänhet varje månad.[4]

Common Crawl
IT-bolag, ideell organisation Redigera Wikidata
Branschpublicering Redigera Wikidata
Tillkomst2008 Redigera Wikidata
Arbets­fältweb crawling Redigera Wikidata
GrundareGil Elbaz Redigera Wikidata
Språkengelska Redigera Wikidata
Officiell webbplatscommoncrawl.org Redigera Wikidata

Referenser redigera

  1. ^ ”Archives” (på amerikansk engelska). Los Angeles Times. https://www.latimes.com/archives. Läst 18 december 2021. 
  2. ^ ”Common Crawl” (på engelska). Wikipedia. 2021-11-11. https://en.wikipedia.org/w/index.php?title=Common_Crawl&oldid=1054638235. Läst 18 december 2021. 
  3. ^ ”So you’re ready to get started. – Common Crawl” (på amerikansk engelska). https://commoncrawl.org/the-data/get-started/. Läst 18 december 2021. 
  4. ^ ”Winter 2013 Crawl Data Now Available – Common Crawl” (på amerikansk engelska). https://commoncrawl.org/2014/01/winter-2013-crawl-data-now-available/. Läst 18 december 2021. 

Externa länkar redigera