Archive.org

Archive.org est le site web de l'organisme à but non lucrative « Internet Archive », aussi appelé IA. Cet organisme situé en Californie sert de bibliothèque numérique et à pour objectif l'archivage du web. Le robot d'indexation utilisé par IA est le logiciel open source Heritrix. Ce dernier a été publié pour la première fois en 2004.

User Agent
Mozilla/5.0 (compatible; archive.org_bot +http://www.archive.org/details/archive.org_bot)
Mozilla/5.0 (compatible; special_archiver/3.1.1 +http://www.archive.org/details/archive.org_bot)
Mozilla/5.0 (compatible; archive.org_bot +http://archive.org/details/archive.org_bot)
Mozilla/5.0 (compatible; archive.org_bot; Wayback Machine Live Record; +http://archive.org/details/archive.org_bot)
Mozilla/5.0 (compatible; heritrix/3.1.2-SNAPSHOT-20121018.064638 +http://archive.org/details/archive.org_bot)