Архив Интернета

Шаблон:Сайт

Wayback Machine (с англ. — «Машина времени») — бесплатный онлайн-архив некоммерческой библиотеки «Архив Интернета». С помощью поисковых роботов Wayback Machine архивирует и делает общедоступной бо́льшую часть «открытого» интернета^[1]. Вход в архив - через сайт web.archive.org, где указать доменное имя того сайта, который когда-то был активным, но уже перестал действовать; или - актуального сайта, по каким-то причинам удалившего нужную страницу.

Сервис был запущен в 1996 году, однако стал доступен для общественности только в 2001.

За первые 20 лет существования Wayback Machine каталогизировал и сохранил коллекцию из более чем 286 млрд веб-страниц. Архивные снимки отображаются в формате HTML, JavaScript и CSS^[2]. Благодаря сохранённым в Wayback Machine документам пользователи могут отслеживать происходящие на сайтах изменения и сравнивать разные версии правок^[3]. По состоянию на январь 2023 года Wayback Machine предоставляет доступ к более чем 767 миллиардам сохранённых веб-страниц^[4].

СозданиеПравить

Серверы «Архива Интернета», 2008 год

Брюстер Кейл в 2009 году

В 1989 году английский учёный Тим Бернерс-Ли создал всемирную паутину — систему, позволяющую передавать данные через подключённые к интернету компьютеры. Однако с распространением всемирной паутины были выявлены две основные проблемы. Первая состояла в нехватке мест для хранения всех данных, из-за чего многие документы и веб-страницы удалялись. Другая проблема заключалась в том, что после редактирования веб-страницы (например, по юридическим причинам) пользователи не могли посмотреть её изначальную версию. Решить эти недостатки стремилась американская цифровая библиотека «Архив Интернета» — некоммерческая организация, созданная программистами Брюстером Кейлом и Брюсом Галлиатом^[англ.] в 1996 году. При сотрудничестве с Alexa Internet (дочерней компанией Amazon, занимающейся веб-индексированием) «Архив» инициировал создание и хранение копий существующих сайтов для развития «универсального доступа к знанию». Организация предоставляла бесплатный публичный доступ к оцифрованным материалам, таким как веб-страницы, книги, аудиозаписи, включая живые концерты, видео, изображения и программное обеспечение. На 2021 год штаб-квартира «Архива Интернета» находится в Сан-Франциско, в здании бывшей христианской церкви, расположенной в районе Ричмонд. Журналист местной радиостанции Kawl^[англ.] в 2019 году сравнивал офис «Архива» с римским храмом^[5]^[6]^[7]. Организация ставит перед собой цель спасти интернет от исчезновения^[8].

Wayback Machine стал самым известным проектом «Архива». Онлайн-сервис был назван в честь машины времени из мультсериала 1960-х годов «Шоу Рокки и Буллвинкля». Он предоставляет доступ к цифровой коллекции из более чем 550 млрд веб-страниц^[3]^[9]^[10]. Проект Wayback Machine был задуман как решение проблемы ошибки 404, означающей, что сервер не может найти данные по запрошенному адресу. Это связано с так называемым вымиранием ссылок — нарастающей недоступностью некогда опубликованных данных. Так, в 1997 году средняя продолжительность жизни веб-страницы составляла 44 дня. В 2003 году этот показатель составил 100 дней.

Проведённый в 2008 году анализ ссылок на 2700 цифровых ресурсов, большинство из которых не имеет печатных аналогов, показал, что около 8 процентов ссылок переставали работать через год. К 2011 году, по прошествии трёх лет, 30 процентов ссылок в коллекции были неработающими^[11]. Благодаря интеграции с Alexa, столкнувшийся с сообщением об ошибке пользователь мог получить доступ к заархивированной версии страницы через внедрённую в браузер панель инструментов. Если копия недоступной страницы присутствовала в базе данных Wayback Machine, то загоралась специальная кнопка. При этом пользователи могли предоставить браузеру разрешение на просмотр и регистрацию активности — в таком случае все посещаемые сайты архивировались на портале^[12].

Wayback Machine был запущен в мае 1996 года, однако стал доступным для общественности только в 2001 г. — до этого вся записанная на цифровых магнитных лентах информация была открыта только для ограниченного числа учёных и исследователей^[13]. К моменту «открытия» архив содержал более 10 млрд заархивированных страниц^[3]. К декабрю 2014 года руководство Wayback Machine сообщило, что сохранило 435 млрд веб-страниц по всему миру^[1]. С технической точки зрения программное обеспечение Wayback Machine не является архивом, а скорее общедоступным интерфейсом к ограниченному подмножеству всех хранилищ^[14]. Так, Wayback Machine нельзя считать поисковой системой коллекции организации, так как она не осуществляет поиск по базе данных другой крупной виртуальной библиотеки — Open Library, позволяющей пользователям бесплатно получать доступ к цифровым копиям книг, которые загружаются и архивируются в рамках проекта^[15]^[16].

ХарактеристикаПравить

С запуском Wayback Machine «Архив Интернета» стал одним из самых популярных и узнаваемых онлайн-порталов и главным сервисом веб-архивирования^[3]^[8].

В 1999 году «Архив» начал расширять коллекцию за пределы архивного веб-контента, чтобы обеспечить статус как к оцифрованным, так и изначально цифровым ресурсам, в том числе книгам, аудио, фильмам, изображениям, документам, программному обеспечению и видеоиграм^[6]. Некоторые сканирования выполняются поисковыми роботами самого архива, а другие — партнёрскими организациями. Отдельные базы данных могут приобретаться за счёт пожертвований пользователей и целевых приобретений^[16]. Сами создатели организации сравнивали свою коллекцию с Александрийской библиотекой^[6].

На 2021 год Wayback Machine содержал более 424 млрд веб-страниц^[14] — больше, чем документов в Библиотеке Конгресса^[17]^[6]^[16].

Принцип работыПравить

Платформа Wayback Machine функционирует за счёт двух основных элементов — поисковых роботов (или веб-краулеров) и интерфейса. Веб-краулеры занимаются посещением, извлечением, загрузкой и архивацией веб-страниц. В свою очередь, через интерфейс пользователи получают доступ к онлайн-коллекциям^[2].

Поисковые роботыПравить

Шаблон:Bar chart Изначально коллекция архива пополнялась за счёт браузерного плагина от Alexa Internet, который автоматически фиксировал и сохранял каждую веб-страницу по мере её посещения, затем передавая всю собранную информацию в «Архив Интернета». Пользователи также могли установить бесплатную панель инструментов, позволявшую проверять статус архивирования выбранного веб-сайта^[16].

В 2002 году «Архив» запустил собственного поискового робота с открытым исходным кодом — Heritrix^[англ.]. Коды краулеров записаны с помощью комбинации программных языков Си и Perl. Помимо этого, «Архив Интернета» также принимает данные сканирования от других доноров^[6]. Отсканированные копии веб-сайтов автоматически конвертируются в файлы размером около 100 МБ, которые затем сохраняются на серверах. В 2002 году общая скорость пополнения архива составляла около 10 терабайт в месяц^[18].

Веб-краулеры запечатляют версию сайта такой, какой она была сохранена на момент доступа к ней через URL. Роботы регулярно сканируют большое количество веб-страниц, рекурсивно загружая, анализируя и отображая HTML-, JavaScript- и CSS-страницы^[2]. Механизм работы краулеров похож на работу поисковых систем — роботы самостоятельно ищут порталы для архивирования через систему поиска путей, сканируя страницы и связанные с ними сайты, таким образом формируя сеть порталов. На момент создания «Архива Интернета» всемирная сеть была настолько маленькой, что веб-краулеры могли совершить обход всех сайтов за один сеанс. Однако со временем постоянный рост онлайн-порталов и их изменчивость сделали полный обход всей сети практически невозможным. Таким образом, не все изменения на сайтах зафиксированы в Wayback Machine^[8]. Руководство «Архива Интернета» не уточняет то, как роботы находят и выбирают страницы для сканирования, однако заявляет, что чаще всего краулеры направляются на те сайты, которые имеют перекрёстные ссылки с других порталов и находятся в открытом доступе. Сканер начинает с веб-страницы, а затем следует по каждой гиперссылке на этой веб-странице, чтобы перейти на новые сайты. На каждой из новых веб-страниц поисковый робот повторяет процесс^[14]. Он будет продолжаться до того момента, пока архивация не будет остановлена или не достигнет установленного скриптом лимита^[19]. Помимо этого, каждый пользователь может использовать специальную форму на портале и вызвать краулер, который сохранит страницу в текущем состоянии^[2]. Wayback Machine сканирует только общедоступные веб-страницы и не может получить доступ к контенту, защищённому паролем или расположенному на частном сервере^[10]^[14]^[3].

ИнтерфейсПравить

Интерфейс Wayback Machine позволяет пользователям осуществить два основных действия — получить доступ к истории изменений сайта и просмотреть все сделанные на порталах правки. Также доступна функция сравнения разных версий сайтов^[12]^[20]^[17]^[21]. Для этого в специальное окно поиска вводится URL интересующего портала, после чего Wayback Machine выдаёт список дат архивации. Звёздочка после некоторых дат используется для обозначения обнаруженных на странице изменений. URL-адрес заархивированной страницы начинается с web.archive.org^[22]^[14].

Любой пользователь может сохранить URL-адреса для архивирования, а с бесплатной учётной записью в архиве можно создать и заархивировать любые исходящие или внешние ссылки на исходной странице и получить обзорный отчёт^[23]^[23].

ХранениеПравить

На 2018 год коллекция «Архива Интернета» составляла более 40 петабайт или 40 млн гигабайт данных, Wayback Machine предоставлял доступ к примерно 63 % всех имеющихся материалов^[24]. На февраль 2020 года в архиве Wayback Machine числилось более 900 млрд URL-адресов и более 400 млрд веб-страниц^[25]. На июнь 2021 года Wayback Machine предоставлял доступ к более чем 581 млрд сохранённых веб-страниц^[4].

ИспользованиеПравить

Портал Wayback Machine зачастую применяют в правовой сфере — юристы используют сервис для поиска информации по гражданским искам, уголовным делам, в административном делопроизводстве и патентных процессах. Полученные через Wayback Machine архивные версии сайтов могут использоваться для решения вопросов о патентном праве или установлении наказания за публикацию материалов, которые впоследствии были удалены из сети^[2]^[12]. Несмотря на широкое использование коллекции «Архива Интернета» для предоставления доказательств, некоторые суды США отказывались принимать скриншоты веб-страниц, ссылаясь на юридическую сложность отождествления оригинала документа и его заархивированной версии^[26]. В 2018 году Апелляционный суд США по второму федеральному апелляционному округу постановил, что скрины с архива веб-страниц Wayback Machine относятся к законным доказательствам, которые могут быть использованы в судебных разбирательствах; ранее аналогичное решение вынес Апелляционный суд США по третьему федеральному апелляционному округу^[27]; позднее Апелляционный суд США по седьмому федеральному апелляционному округу также признал скриншоты веб-архивов допустимыми электронными доказательствами^[28].

Благодаря архивированным в Wayback Machine статьям авторы могут устанавливать право на открытие или на публикацию^[29]. Для социологов и историков Wayback Machine предлагает ценный крупномасштабный источник данных для анализа поведения компаний, стратегий продаж, социальных практик^[1]^[30]. Также Wayback Machine позволяет получать доступ к журналам открытого доступа. Так, с начала 2000-х годов из интернета исчезло 84 журнала ОД по естественным наукам и ещё около 100 — по социальным и гуманитарным^[31]^[32]^[33].

Активисты и исследователи используют портал для борьбы с дезинформацией, особенно усилившейся после избрания президента Дональда Трампа в США. В ответ на участившиеся противоречивые заявления со стороны администрации президента «Архив» создал отдельную коллекцию под названием «Архив Трампа», содержащую выступления президента на телевидении и твиты. «Архив» надеется, что его хранилище поможет другим выявлять ложную информацию и проверять подозрительный контент^[34]^[35]. Однако в некоторых случаях отдельные активисты утверждали, что заархивированные Wayback Machine ресурсы наоборот способствовали распространению дезинформации. Так, с началом пандемии коронавируса сторонники конспиративных теорий использовали сохранённые порталом скриншоты для распространения ложной информации о коронавирусе^[36]. В качестве контрмер в ноябре 2020 года «Архив» внедрил в Wayback Machine инструменты проверки информации на достоверность. Для этого некоммерческая организация начала сотрудничать с различными компаниями, занимающимися проверкой фактов, чтобы предоставлять пользователям причины удаления той или иной страницы из коллекции. При открытии заархивированной версии сайта Wayback Machine предоставляет пользователям сведения о причине её удаления в виде жёлтого баннера вверху экрана. При подозрении на причастность веб-страницы к кампании по дезинформации Wayback Machine предоставляет данные об организации, проводившей проверку на достоверность, и ссылку на её отчёт^[37].

В отдельных случаях полученная через Wayback Machine информация фигурировала в крупных скандалах. Так, с помощью портала было выяснено, что официальный представитель Министерства здравоохранения и социальных служб США Майкл Капуто^[англ.] в серии уже удалённых твитов публиковал расистские и уничижительные комментарии о китайском народе^[38]. Помимо этого, Wayback Machine хранит копию удалённого сообщения со страницы, озаглавленной «Сводки от Стрелкова Игоря Ивановича» в социальной сети «ВКонтакте», о сбитом самолёте АН-26, который в действительности оказался пассажирским Boeing 777^[39]^[40]. В мае 2021 года издание Bellingcat выяснило, что находящиеся в Европе американские военные использовали для хранения засекреченных данных детские мобильные приложения для запоминания информации. Из-за неправильно установленных настроек приватности другие пользователи получили доступ к секретной информации. После обнаружения утечки информации военные удалили все карточки, но они остались в сервисе Wayback Machine^[41].

Правовой статусПравить

«Архив Интернета» не запрашивает разрешения на копирование веб-сайтов перед удалённым сбором данных, однако удаляет или ограничивает доступ к архивным материалам по запросу. Ранее владельцам веб-сайтов предоставлялась возможность «отказаться» от архивирования через стандартный файл robots.txt, который исключает веб-сайты или их отдельные страницы, каталоги, из списка порталов для веб-краулеров^[8]^[42]. По состоянию на 2022 год, заявки на удаление сайтов или их страниц из архива принимаются только после прямого запроса от администрации удаляемого сайта. Однако из-за сохранения других данных «Архив Интернета» находится в уязвимом юридическом положении^[43]. Так, в 2005 году Wayback Machine оказался втянутым в спор о товарных знаках между компаниями Healthcare Advocates и Health Advocate. Последняя использовала Wayback Machine для доступа к веб-страницам Healthcare Advocates, датируемым 1999 годом, в попытке найти информацию, которая поддержала бы дело. В ответ Healthcare Advocates подала в суд как на Health Advocate, так и на «Архив», утверждая что архив нарушил Закон об авторском праве в цифровую эпоху. Впоследствии дело было урегулировано в досудебном порядке^[44].

В 2002 году «Архив» удалил из своей системы ссылки на архивные копии портала Xenu.net, принадлежащего критику церкви Андреасу Хельдал-Лунду. Удаление произошло по требованию юристов Церкви саентологии, заявивших, что владеют правом собственности на выдержки из документов Церкви, опубликованные на сайте^[45]^[46].

ОграниченияПравить

Исследователи и активисты критикуют Wayback Machine и деятельность «Архива Интернета» за попытку сохранить все онлайн-материалы, многие из которых не представляют должной ценности. По мнению отдельных исследователей, это связано с устаревшей политикой «Архива», который был основан в конце 1990-х годов — тогда, на заре создания интернет-архивов, считалось, что данные интернета должны сохраняться в полном объёме. Однако с созданием множества однодневных сайтов многие исследователи и активисты поменяли своё мнение^[47]. Другие критические замечания относятся к техническим ограничениям сервиса — Wayback Machine не позволяет сохранять и обрабатывать определённые элементы JavaScript, а также может создавать заархивированные страницы, содержащие неработающие ссылки, отсутствующую графику или являющиеся неполными по иным причинам^[48]. Сканеры захватывают только статический снимок сайта — функции порталов на основе Java или Flash работать не будут. Это означает, что бо́льшая часть функциональных возможностей исходной веб-страницы теряется^[8].

БлокировкиПравить

В 2015 году Роскомнадзор принял решение заблокировать Wayback Machine за копию страницы текста «Одиночный джихад в России», содержащего информацию о «теории и практике партизанского сопротивления». Соответствующая страница в «Архиве Интернета» была добавлена в официальный реестр запрещённых веб-сайтов в России 23 июня 2015 года, из-за чего некоторые российские интернет-провайдеры были вынуждены полностью заблокировать сайт «Архива»^[49]^[50]^[51]. Доступ к Wayback Machine был заново открыт в 2016 году, после того как запрещённые ролики удалили с портала^[52].

В 2019 году представители «Ассоциации по защите авторских прав в интернете» (АЗАПИ) подали серию исков против сервиса Wayback Machine за нарушение авторских прав. Представители АЗАПИ запросили Мосгорсуд вынести решение о вечной блокировке портала на территории России, однако на август 2020 года «Архив Интернета» по-прежнему продолжал свою работу^[53]^[54]^[55]^[56].

В 2017 году портал был заблокирован в Индии и Киргизии за содержание «экстремистских материалов»^[57]^[58]^[59]. По данным на 2021 год, сайт заблокирован в Китае^[60].

В июне 2022 года Таганский райсуд Москвы оштрафовал «Архив Интернета» на 800 тыс. рублей за неудаление из WayBack Machine видео о способах изготовления коктейля Молотова^[61].

ПримечанияПравить

↑ ^а ^б ^в Arora, 2015
↑ ^а ^б ^в ^г ^д Lerner, 2017, pp. 1741—1755
↑ ^а ^б ^в ^г ^д Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).
↑ ^а ^б "Wayback Machine" (англ.). Wayback Machine. Дата обращения: 7 июня 2021.
↑ Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).
↑ ^а ^б ^в ^г ^д Odgen, 2017
↑ Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).
↑ ^а ^б ^в ^г ^д Price, 2011
↑ Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).
↑ ^а ^б Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).
↑ Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).
↑ ^а ^б ^в Rogers, 2017, pp. 160—172
↑ Hartelius, 2020, p. 378
↑ ^а ^б ^в ^г ^д Bowyer, 2021, pp. 43—57
↑ Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).
↑ ^а ^б ^в ^г Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).
↑ ^а ^б O'Connor, 2008, p. 64
↑ Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).
↑ A. Rossi (5 октября 2010). "Worldwide Web Crawls" (англ.). Internet Archive. Дата обращения: 5 июня 2021.
↑ Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).
↑ Maemura, 2018
↑ Notess, 2002
↑ ^а ^б Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).
↑ Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).
↑ Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).
↑ Eltgroth, 2009
↑ Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).
↑ Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).
↑ Pearce, 2009, p. 875
↑ Milligan, 2016
↑ Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).
↑ Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).
↑ Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).
↑ Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).
↑ Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).
↑ Acker, 2020
↑ Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).
↑ Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).
↑ Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).
↑ Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).
↑ Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).
↑ Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).
↑ Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).
↑ Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).
↑ Lisa M. Bowman (24 сентября 2002). "Net archive silences Scientology critic" (англ.). CNET. Дата обращения: 10 июня 2021.
↑ Ernest Miller (24 сентября 2002). "Features: Sherman, Set the Wayback Machine for Scientology" (англ.). LawMeme. Дата обращения: 10 июня 2021.
↑ Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).
↑ Crudo, 2014
↑ Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).
↑ Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).
↑ Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).
↑ Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).
↑ Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).
↑ Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).
↑ Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).
↑ Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).
↑ Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).
↑ Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).
↑ Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).
↑ Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).
↑ "Машину времени увезли на штрафстоянку". Коммерсантъ. 28 июня 2022. Дата обращения: 1 июля 2022.

ЛитератураПравить

Acker, A., & Chaiet, M. «The weaponization of web archives: Data craft and COVID-19 publics.» // Harvard Kennedy School (HKS) Misinformation Review. — 2020.
Anat Ben-David, Adam Amram «The Internet Archive and the socio-technical construction of historical facts» // Internet Histories. — 2018.
Arora S., Li Y., Youtie J., Shapira P. «Using the wayback machine to mine websites in the social sciences: A methodological resource». — 2015. — Т. 67. — С. 1904—1915.
Bowyer S. «The Wayback Machine: notes on a re‑enchantment» // Archival Science. — 2021. — Т. 21. — С. 43—57.
Deborah R. Eltgroth «Best Evidence and the Wayback Machine: Toward a Workable Authentication Standard for Archived Internet Evidence» // Fordham L. Rev.. — 2009. — Т. 78.
Greg R. Notess «The Wayback Machine: The Web's Archive» // Online. — 2002. — Т. 26.
Hartelius J. «The anxious flâneur: Digital archiving and the Wayback Machine» // Quarterly Journal of Speech. — 2020. — Т. 106. — С. 377—398.
James L. Quarles III and Richard A. Crudo «[Way]Back to the Future: Using the Wayback Machine in Patent Litigation» // Landslide. — 2014. — Т. 6.
Lerner A., Kohno T., Roesner F. «Rewriting History: Changing the Archived Web from the Present» // Association for Computing Machinery. — 2017.
Maemura E., Worby N., Milligan I., Becker C. «If These Crawls Could Talk: Studying and Documenting Web Archives Provenance» // Journal of the association for information science and technology. — 2018. — Т. 69. — С. 1223—1233.
Milligan I. «Lost in the Infinite Archive: The Promise and Pitfalls of Web Archives» // International Journal of Humanities and Arts Computing. — 2016.
Murphy J., Hashim N., O’Connor P. «Take Me Back: Validating the Wayback Machine» // Journal of Computer-Mediated Communication. — 2008. — С. 60—75.
Odgen J., Halford S., Carr L. «Observing Web Archives» // WebSci. — 2017. — С. 299—308.
Pearce D., Charlton B. «Plagiarism of online material may be proven using the Internet Archive Wayback Machine (archive.org)» // Medical Hypothesis. — 2009. — С. 875.
Price «Internet Archiving – The Wayback machine» // MLA Commons. — 2011.
Phyllis Holman Weisbard «Oldies but Goodies: Archiving WebBased Information» // Feminist Collections. — 2011. — Т. 32.
Rogers R. «Doing Web history with the Internet Archive: screencast documentaries» // Internet Histories. — 2017. — Т. 1. — С. 160—172.

Первоисточник этой статьи был признан «хорошей статьёй» русского раздела Википедии.

[Arora—2015——-1] а ^б ^в Arora, 2015

[Lerner—2017——1741—1755-2] а ^б ^в ^г ^д Lerner, 2017, pp. 1741—1755

[Bryant-3] а ^б ^в ^г ^д Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).

[web-4] а ^б "Wayback Machine" (англ.). Wayback Machine. Дата обращения: 7 июня 2021.

[5] Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).

[Odgen—2017——-6] а ^б ^в ^г ^д Odgen, 2017

[7] Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).

[Price—2011——-8] а ^б ^в ^г ^д Price, 2011

[9] Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).

[McKinnon-10] а ^б Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).

[11] Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).

[Rogers—2017——160—172-12] а ^б ^в Rogers, 2017, pp. 160—172

[Hartelius—2020——378-13] Hartelius, 2020, p. 378

[Bowyer—2021——43—57-14] а ^б ^в ^г ^д Bowyer, 2021, pp. 43—57

[Vox-15] Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).

[Forbes-16] а ^б ^в ^г Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).

[O'Connor—2008——64-17] а ^б O'Connor, 2008, p. 64

[Kahle-18] Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).

[19] A. Rossi (5 октября 2010). "Worldwide Web Crawls" (англ.). Internet Archive. Дата обращения: 5 июня 2021.

[20] Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).

[Maemura—2018——-21] Maemura, 2018

[Notess—2002——-22] Notess, 2002

[Graham-23] а ^б Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).

[24] Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).

[VC-25] Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).

[Eltgroth—2009——-26] Eltgroth, 2009

[27] Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).

[28] Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).

[Pearce—2009——875-29] Pearce, 2009, p. 875

[Milligan—2016——-30] Milligan, 2016

[31] Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).

[32] Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).

[33] Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).

[34] Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).

[35] Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).

[Acker—2020——-36] Acker, 2020

[37] Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).

[38] Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).

[39] Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).

[40] Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).

[41] Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).

[42] Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).

[43] Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).

[44] Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).

[45] Lisa M. Bowman (24 сентября 2002). "Net archive silences Scientology critic" (англ.). CNET. Дата обращения: 10 июня 2021.

[46] Ernest Miller (24 сентября 2002). "Features: Sherman, Set the Wayback Machine for Scientology" (англ.). LawMeme. Дата обращения: 10 июня 2021.

[47] Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).

[Crudo—2014——-48] Crudo, 2014

[49] Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).

[50] Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).

[51] Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).

[52] Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).

[53] Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).

[54] Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).

[55] Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).

[56] Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).

[57] Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).

[58] Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).

[59] Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).

[60] Ошибка Lua в Модуль:Citation/CS1 на строке 4511: bad argument #1 to 'pairs' (table expected, got nil).

[61] "Машину времени увезли на штрафстоянку". Коммерсантъ. 28 июня 2022. Дата обращения: 1 июля 2022.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]

[29]

[30]

[31]

[32]

[33]

[34]

[35]

[36]

[37]

[38]

[39]

[40]

[41]

[42]

[43]

[44]

[45]

[46]

[47]

[48]

[49]

[50]

[51]

[52]

[53]

[54]

[55]

[56]

[57]

[58]

[59]

[60]

[61]