Архив Интернета

Шаблон:Сайт

Wayback Machine (с англ. — «Машина времени») — бесплатный онлайн-архив некоммерческой библиотеки «Архив Интернета». С помощью поисковых роботов Wayback Machine архивирует и делает общедоступной бо́льшую часть «открытого» интернета[1]. Вход в архив - через сайт web.archive.org, где указать доменное имя того сайта, который когда-то был активным, но уже перестал действовать; или - актуального сайта, по каким-то причинам удалившего нужную страницу.

Сервис был запущен в 1996 году, однако стал доступен для общественности только в 2001.

За первые 20 лет существования Wayback Machine каталогизировал и сохранил коллекцию из более чем 286 млрд веб-страниц. Архивные снимки отображаются в формате HTML, JavaScript и CSS[2]. Благодаря сохранённым в Wayback Machine документам пользователи могут отслеживать происходящие на сайтах изменения и сравнивать разные версии правок[3]. По состоянию на январь 2023 года Wayback Machine предоставляет доступ к более чем 767 миллиардам сохранённых веб-страниц[4].

СозданиеПравить

 
Серверы «Архива Интернета», 2008 год
 
Брюстер Кейл в 2009 году

В 1989 году английский учёный Тим Бернерс-Ли создал всемирную паутину — систему, позволяющую передавать данные через подключённые к интернету компьютеры. Однако с распространением всемирной паутины были выявлены две основные проблемы. Первая состояла в нехватке мест для хранения всех данных, из-за чего многие документы и веб-страницы удалялись. Другая проблема заключалась в том, что после редактирования веб-страницы (например, по юридическим причинам) пользователи не могли посмотреть её изначальную версию. Решить эти недостатки стремилась американская цифровая библиотека «Архив Интернета» — некоммерческая организация, созданная программистами Брюстером Кейлом и Брюсом Галлиатом[en] в 1996 году. При сотрудничестве с Alexa Internet (дочерней компанией Amazon, занимающейся веб-индексированием) «Архив» инициировал создание и хранение копий существующих сайтов для развития «универсального доступа к знанию». Организация предоставляла бесплатный публичный доступ к оцифрованным материалам, таким как веб-страницы, книги, аудиозаписи, включая живые концерты, видео, изображения и программное обеспечение. На 2021 год штаб-квартира «Архива Интернета» находится в Сан-Франциско, в здании бывшей христианской церкви, расположенной в районе Ричмонд. Журналист местной радиостанции Kawl[en] в 2019 году сравнивал офис «Архива» с римским храмом[5][6][7]. Организация ставит перед собой цель спасти интернет от исчезновения[8].

Wayback Machine стал самым известным проектом «Архива». Онлайн-сервис был назван в честь машины времени из мультсериала 1960-х годов «Шоу Рокки и Буллвинкля». Он предоставляет доступ к цифровой коллекции из более чем 550 млрд веб-страниц[3][9][10]. Проект Wayback Machine был задуман как решение проблемы ошибки 404, означающей, что сервер не может найти данные по запрошенному адресу. Это связано с так называемым вымиранием ссылок — нарастающей недоступностью некогда опубликованных данных. Так, в 1997 году средняя продолжительность жизни веб-страницы составляла 44 дня. В 2003 году этот показатель составил 100 дней.

Проведённый в 2008 году анализ ссылок на 2700 цифровых ресурсов, большинство из которых не имеет печатных аналогов, показал, что около 8 процентов ссылок переставали работать через год. К 2011 году, по прошествии трёх лет, 30 процентов ссылок в коллекции были неработающими[11]. Благодаря интеграции с Alexa, столкнувшийся с сообщением об ошибке пользователь мог получить доступ к заархивированной версии страницы через внедрённую в браузер панель инструментов. Если копия недоступной страницы присутствовала в базе данных Wayback Machine, то загоралась специальная кнопка. При этом пользователи могли предоставить браузеру разрешение на просмотр и регистрацию активности — в таком случае все посещаемые сайты архивировались на портале[12].

Wayback Machine был запущен в мае 1996 года, однако стал доступным для общественности только в 2001 г. — до этого вся записанная на цифровых магнитных лентах информация была открыта только для ограниченного числа учёных и исследователей[13]. К моменту «открытия» архив содержал более 10 млрд заархивированных страниц[3]. К декабрю 2014 года руководство Wayback Machine сообщило, что сохранило 435 млрд веб-страниц по всему миру[1]. С технической точки зрения программное обеспечение Wayback Machine не является архивом, а скорее общедоступным интерфейсом к ограниченному подмножеству всех хранилищ[14]. Так, Wayback Machine нельзя считать поисковой системой коллекции организации, так как она не осуществляет поиск по базе данных другой крупной виртуальной библиотеки — Open Library, позволяющей пользователям бесплатно получать доступ к цифровым копиям книг, которые загружаются и архивируются в рамках проекта[15][16].

ХарактеристикаПравить

С запуском Wayback Machine «Архив Интернета» стал одним из самых популярных и узнаваемых онлайн-порталов и главным сервисом веб-архивирования[3][8].

В 1999 году «Архив» начал расширять коллекцию за пределы архивного веб-контента, чтобы обеспечить статус как к оцифрованным, так и изначально цифровым ресурсам, в том числе книгам, аудио, фильмам, изображениям, документам, программному обеспечению и видеоиграм[6]. Некоторые сканирования выполняются поисковыми роботами самого архива, а другие — партнёрскими организациями. Отдельные базы данных могут приобретаться за счёт пожертвований пользователей и целевых приобретений[16]. Сами создатели организации сравнивали свою коллекцию с Александрийской библиотекой[6].

На 2021 год Wayback Machine содержал более 424 млрд веб-страниц[14] — больше, чем документов в Библиотеке Конгресса[17][6][16].

Принцип работыПравить

Платформа Wayback Machine функционирует за счёт двух основных элементов — поисковых роботов (или веб-краулеров) и интерфейса. Веб-краулеры занимаются посещением, извлечением, загрузкой и архивацией веб-страниц. В свою очередь, через интерфейс пользователи получают доступ к онлайн-коллекциям[2].

Поисковые роботыПравить

Шаблон:Bar chart Изначально коллекция архива пополнялась за счёт браузерного плагина от Alexa Internet, который автоматически фиксировал и сохранял каждую веб-страницу по мере её посещения, затем передавая всю собранную информацию в «Архив Интернета». Пользователи также могли установить бесплатную панель инструментов, позволявшую проверять статус архивирования выбранного веб-сайта[16].

В 2002 году «Архив» запустил собственного поискового робота с открытым исходным кодомHeritrix[en]. Коды краулеров записаны с помощью комбинации программных языков Си и Perl. Помимо этого, «Архив Интернета» также принимает данные сканирования от других доноров[6]. Отсканированные копии веб-сайтов автоматически конвертируются в файлы размером около 100 МБ, которые затем сохраняются на серверах. В 2002 году общая скорость пополнения архива составляла около 10 терабайт в месяц[18].

Веб-краулеры запечатляют версию сайта такой, какой она была сохранена на момент доступа к ней через URL. Роботы регулярно сканируют большое количество веб-страниц, рекурсивно загружая, анализируя и отображая HTML-, JavaScript- и CSS-страницы[2]. Механизм работы краулеров похож на работу поисковых систем — роботы самостоятельно ищут порталы для архивирования через систему поиска путей, сканируя страницы и связанные с ними сайты, таким образом формируя сеть порталов. На момент создания «Архива Интернета» всемирная сеть была настолько маленькой, что веб-краулеры могли совершить обход всех сайтов за один сеанс. Однако со временем постоянный рост онлайн-порталов и их изменчивость сделали полный обход всей сети практически невозможным. Таким образом, не все изменения на сайтах зафиксированы в Wayback Machine[8]. Руководство «Архива Интернета» не уточняет то, как роботы находят и выбирают страницы для сканирования, однако заявляет, что чаще всего краулеры направляются на те сайты, которые имеют перекрёстные ссылки с других порталов и находятся в открытом доступе. Сканер начинает с веб-страницы, а затем следует по каждой гиперссылке на этой веб-странице, чтобы перейти на новые сайты. На каждой из новых веб-страниц поисковый робот повторяет процесс[14]. Он будет продолжаться до того момента, пока архивация не будет остановлена или не достигнет установленного скриптом лимита[19]. Помимо этого, каждый пользователь может использовать специальную форму на портале и вызвать краулер, который сохранит страницу в текущем состоянии[2]. Wayback Machine сканирует только общедоступные веб-страницы и не может получить доступ к контенту, защищённому паролем или расположенному на частном сервере[10][14][3].

ИнтерфейсПравить

Интерфейс Wayback Machine позволяет пользователям осуществить два основных действия — получить доступ к истории изменений сайта и просмотреть все сделанные на порталах правки. Также доступна функция сравнения разных версий сайтов[12][20][17][21]. Для этого в специальное окно поиска вводится URL интересующего портала, после чего Wayback Machine выдаёт список дат архивации. Звёздочка после некоторых дат используется для обозначения обнаруженных на странице изменений. URL-адрес заархивированной страницы начинается с web.archive.org[22][14].

Любой пользователь может сохранить URL-адреса для архивирования, а с бесплатной учётной записью в архиве можно создать и заархивировать любые исходящие или внешние ссылки на исходной странице и получить обзорный отчёт[23][23].

ХранениеПравить

На 2018 год коллекция «Архива Интернета» составляла более 40 петабайт или 40 млн гигабайт данных, Wayback Machine предоставлял доступ к примерно 63 % всех имеющихся материалов[24]. На февраль 2020 года в архиве Wayback Machine числилось более 900 млрд URL-адресов и более 400 млрд веб-страниц[25]. На июнь 2021 года Wayback Machine предоставлял доступ к более чем 581 млрд сохранённых веб-страниц[4].

ИспользованиеПравить

Портал Wayback Machine зачастую применяют в правовой сфере — юристы используют сервис для поиска информации по гражданским искам, уголовным делам, в административном делопроизводстве и патентных процессах. Полученные через Wayback Machine архивные версии сайтов могут использоваться для решения вопросов о патентном праве или установлении наказания за публикацию материалов, которые впоследствии были удалены из сети[2][12]. Несмотря на широкое использование коллекции «Архива Интернета» для предоставления доказательств, некоторые суды США отказывались принимать скриншоты веб-страниц, ссылаясь на юридическую сложность отождествления оригинала документа и его заархивированной версии[26]. В 2018 году Апелляционный суд США по второму федеральному апелляционному округу постановил, что скрины с архива веб-страниц Wayback Machine относятся к законным доказательствам, которые могут быть использованы в судебных разбирательствах; ранее аналогичное решение вынес Апелляционный суд США по третьему федеральному апелляционному округу[27]; позднее Апелляционный суд США по седьмому федеральному апелляционному округу также признал скриншоты веб-архивов допустимыми электронными доказательствами[28].

Благодаря архивированным в Wayback Machine статьям авторы могут устанавливать право на открытие или на публикацию[29]. Для социологов и историков Wayback Machine предлагает ценный крупномасштабный источник данных для анализа поведения компаний, стратегий продаж, социальных практик[1][30]. Также Wayback Machine позволяет получать доступ к журналам открытого доступа. Так, с начала 2000-х годов из интернета исчезло 84 журнала ОД по естественным наукам и ещё около 100 — по социальным и гуманитарным[31][32][33].

Активисты и исследователи используют портал для борьбы с дезинформацией, особенно усилившейся после избрания президента Дональда Трампа в США. В ответ на участившиеся противоречивые заявления со стороны администрации президента «Архив» создал отдельную коллекцию под названием «Архив Трампа», содержащую выступления президента на телевидении и твиты. «Архив» надеется, что его хранилище поможет другим выявлять ложную информацию и проверять подозрительный контент[34][35]. Однако в некоторых случаях отдельные активисты утверждали, что заархивированные Wayback Machine ресурсы наоборот способствовали распространению дезинформации. Так, с началом пандемии коронавируса сторонники конспиративных теорий использовали сохранённые порталом скриншоты для распространения ложной информации о коронавирусе[36]. В качестве контрмер в ноябре 2020 года «Архив» внедрил в Wayback Machine инструменты проверки информации на достоверность. Для этого некоммерческая организация начала сотрудничать с различными компаниями, занимающимися проверкой фактов, чтобы предоставлять пользователям причины удаления той или иной страницы из коллекции. При открытии заархивированной версии сайта Wayback Machine предоставляет пользователям сведения о причине её удаления в виде жёлтого баннера вверху экрана. При подозрении на причастность веб-страницы к кампании по дезинформации Wayback Machine предоставляет данные об организации, проводившей проверку на достоверность, и ссылку на её отчёт[37].

В отдельных случаях полученная через Wayback Machine информация фигурировала в крупных скандалах. Так, с помощью портала было выяснено, что официальный представитель Министерства здравоохранения и социальных служб США Майкл Капуто[en] в серии уже удалённых твитов публиковал расистские и уничижительные комментарии о китайском народе[38]. Помимо этого, Wayback Machine хранит копию удалённого сообщения со страницы, озаглавленной «Сводки от Стрелкова Игоря Ивановича» в социальной сети «ВКонтакте», о сбитом самолёте АН-26, который в действительности оказался пассажирским Boeing 777[39][40]. В мае 2021 года издание Bellingcat выяснило, что находящиеся в Европе американские военные использовали для хранения засекреченных данных детские мобильные приложения для запоминания информации. Из-за неправильно установленных настроек приватности другие пользователи получили доступ к секретной информации. После обнаружения утечки информации военные удалили все карточки, но они остались в сервисе Wayback Machine[41].

Правовой статусПравить

«Архив Интернета» не запрашивает разрешения на копирование веб-сайтов перед удалённым сбором данных, однако удаляет или ограничивает доступ к архивным материалам по запросу. Ранее владельцам веб-сайтов предоставлялась возможность «отказаться» от архивирования через стандартный файл robots.txt, который исключает веб-сайты или их отдельные страницы, каталоги, из списка порталов для веб-краулеров[8][42]. По состоянию на 2022 год, заявки на удаление сайтов или их страниц из архива принимаются только после прямого запроса от администрации удаляемого сайта. Однако из-за сохранения других данных «Архив Интернета» находится в уязвимом юридическом положении[43]. Так, в 2005 году Wayback Machine оказался втянутым в спор о товарных знаках между компаниями Healthcare Advocates и Health Advocate. Последняя использовала Wayback Machine для доступа к веб-страницам Healthcare Advocates, датируемым 1999 годом, в попытке найти информацию, которая поддержала бы дело. В ответ Healthcare Advocates подала в суд как на Health Advocate, так и на «Архив», утверждая что архив нарушил Закон об авторском праве в цифровую эпоху. Впоследствии дело было урегулировано в досудебном порядке[44].

В 2002 году «Архив» удалил из своей системы ссылки на архивные копии портала Xenu.net, принадлежащего критику церкви Андреасу Хельдал-Лунду. Удаление произошло по требованию юристов Церкви саентологии, заявивших, что владеют правом собственности на выдержки из документов Церкви, опубликованные на сайте[45][46].

ОграниченияПравить

Исследователи и активисты критикуют Wayback Machine и деятельность «Архива Интернета» за попытку сохранить все онлайн-материалы, многие из которых не представляют должной ценности. По мнению отдельных исследователей, это связано с устаревшей политикой «Архива», который был основан в конце 1990-х годов — тогда, на заре создания интернет-архивов, считалось, что данные интернета должны сохраняться в полном объёме. Однако с созданием множества однодневных сайтов многие исследователи и активисты поменяли своё мнение[47]. Другие критические замечания относятся к техническим ограничениям сервиса — Wayback Machine не позволяет сохранять и обрабатывать определённые элементы JavaScript, а также может создавать заархивированные страницы, содержащие неработающие ссылки, отсутствующую графику или являющиеся неполными по иным причинам[48]. Сканеры захватывают только статический снимок сайта — функции порталов на основе Java или Flash работать не будут. Это означает, что бо́льшая часть функциональных возможностей исходной веб-страницы теряется[8].

БлокировкиПравить

В 2015 году Роскомнадзор принял решение заблокировать Wayback Machine за копию страницы текста «Одиночный джихад в России», содержащего информацию о «теории и практике партизанского сопротивления». Соответствующая страница в «Архиве Интернета» была добавлена в официальный реестр запрещённых веб-сайтов в России 23 июня 2015 года, из-за чего некоторые российские интернет-провайдеры были вынуждены полностью заблокировать сайт «Архива»[49][50][51]. Доступ к Wayback Machine был заново открыт в 2016 году, после того как запрещённые ролики удалили с портала[52].

В 2019 году представители «Ассоциации по защите авторских прав в интернете» (АЗАПИ) подали серию исков против сервиса Wayback Machine за нарушение авторских прав. Представители АЗАПИ запросили Мосгорсуд вынести решение о вечной блокировке портала на территории России, однако на август 2020 года «Архив Интернета» по-прежнему продолжал свою работу[53][54][55][56].

В 2017 году портал был заблокирован в Индии и Киргизии за содержание «экстремистских материалов»[57][58][59]. По данным на 2021 год, сайт заблокирован в Китае[60].

В июне 2022 года Таганский райсуд Москвы оштрафовал «Архив Интернета» на 800 тыс. рублей за неудаление из WayBack Machine видео о способах изготовления коктейля Молотова[61].

ПримечанияПравить

  1. а б в Arora, 2015
  2. а б в г д Lerner, 2017, pp. 1741—1755
  3. а б в г д Michael Bryant (2021-04-22). "What is the Wayback Machine and Why is it Useful?". Groovy Post. Archived from the original on 2021-05-18. Retrieved 2021-05-29.  Unknown parameter |deadlink= ignored (help); Unknown parameter |lang= ignored (help)
  4. а б "Wayback Machine". Wayback Machine. Retrieved 2021-06-07.  Unknown parameter |lang= ignored (help)
  5. "Dominic Cummings: how the internet knows when you’ve updated your blog". The Conversation. 2020-05-28. Archived from the original on 2021-07-25. Retrieved 2021-06-03.  Unknown parameter |deadlink= ignored (help); Unknown parameter |lang= ignored (help)
  6. а б в г д Odgen, 2017
  7. "In An Old Church, The Internet Archive Stores Our Digital History". Kalw. San Francisco local public radio. 2019-09-11. Archived from the original on 2021-05-06. Retrieved 2021-06-03.  Unknown parameter |deadlink= ignored (help); Unknown parameter |lang= ignored (help)
  8. а б в г д Price, 2011
  9. Jack Schofield (2007-11-19). "The Time Machine". The Guardian. Archived from the original on 2021-04-19. Retrieved 2021-06-01.  Unknown parameter |deadlink= ignored (help); Unknown parameter |lang= ignored (help)
  10. а б Jenni McKinnon (2017-05-25). "Using the Wayback Machine to Archive (and Backup) WordPress". WPMudev. Archived from the original on 2021-04-13. Retrieved 2021-05-29.  Unknown parameter |deadlink= ignored (help); Unknown parameter |lang= ignored (help)
  11. Adrienne LaFrance (2015-10-14). "Raiders of the Lost Web". The Atlantic. Archived from the original on 2017-05-07. Retrieved 2021-06-07.  Unknown parameter |deadlink= ignored (help); Unknown parameter |lang= ignored (help)
  12. а б в Rogers, 2017, pp. 160—172
  13. Hartelius, 2020, p. 378
  14. а б в г д Bowyer, 2021, pp. 43—57
  15. Aja Romano (2020-01-23). "A lawsuit is threatening the Internet Archive — but it’s not as dire as you may have heard". Vox. Archived from the original on 2021-08-18. Retrieved 2021-05-29.  Unknown parameter |deadlink= ignored (help); Unknown parameter |lang= ignored (help)
  16. а б в г Kalev Leetaru (2016-01-18). "The Internet Archive Turns 20: A Behind The Scenes Look At Archiving The Web". Forbes. Archived from the original on 2021-08-15. Retrieved 2021-06-05.  Unknown parameter |deadlink= ignored (help); Unknown parameter |lang= ignored (help)
  17. а б O'Connor, 2008, p. 64
  18. Richard Koman (2002-01-21). "How the Wayback Machine Works". Xml.com. Archived from the original on 2021-05-28. Retrieved 2021-06-05.  Unknown parameter |deadlink= ignored (help); Unknown parameter |lang= ignored (help)
  19. A. Rossi (2010-10-05). "Worldwide Web Crawls". Internet Archive. Retrieved 2021-06-05.  Unknown parameter |lang= ignored (help)
  20. Laura Bohannon (2017-12-07). "Wayback Machine archives websites for over 20 years". Spartan News Room. Archived from the original on 2021-06-24. Retrieved 2021-06-05.  Unknown parameter |deadlink= ignored (help); Unknown parameter |lang= ignored (help)
  21. Maemura, 2018
  22. Notess, 2002
  23. а б Mark Graham (2021-05-05). "Tips for Using the Internet Archive’s Wayback Machine in Your Next Investigation". Global Investigative Journalism Network. Archived from the original on 2021-05-29. Retrieved 2021-05-29.  Unknown parameter |deadlink= ignored (help); Unknown parameter |lang= ignored (help)
  24. Zachary Crockett (2018-09-28). "Inside Wayback Machine, the internet’s time capsule". The Hustle. Archived from the original on 2018-10-02. Retrieved 2021-05-29.  Unknown parameter |deadlink= ignored (help); Unknown parameter |lang= ignored (help)
  25. Евгений Делюкин (2020-02-26). "Браузер Brave от сооснователя Mozilla стал предлагать копии из «архива интернета» вместо удалённых веб-страниц". vc.ru. Archived from the original on 2021-06-24. Retrieved 2021-06-01.  Unknown parameter |deadlink= ignored (help); Unknown parameter |lang= ignored (help)
  26. Eltgroth, 2009
  27. Kieren McCarthy (2018-09-04). "Archive.org's Wayback Machine is legit legal evidence, US appeals court judges rule". The Register. Archived from the original on 2021-06-02. Retrieved 2021-06-04.  Unknown parameter |deadlink= ignored (help); Unknown parameter |lang= ignored (help)
  28. Маргарита Сазонова (2020-10-26). "Электронные доказательства в спорах в сфере интеллектуальной собственности". Гарант. Archived from the original on 2021-06-24. Retrieved 2021-06-05.  Unknown parameter |deadlink= ignored (help); Unknown parameter |lang= ignored (help)
  29. Pearce, 2009, p. 875
  30. Milligan, 2016
  31. Jeffrey Brainard (2020-09-08). "Dozens of scientific journals have vanished from the internet, and no one preserved them". Science. Archived from the original on 2020-10-15. Retrieved 2021-06-01.  Unknown parameter |deadlink= ignored (help); Unknown parameter |lang= ignored (help)
  32. Diana Kwon (2020-09-10). "More than 100 scientific journals have disappeared from the Internet". Nature. Archived from the original on 2020-10-03. Retrieved 2021-06-01.  Unknown parameter |deadlink= ignored (help); Unknown parameter |lang= ignored (help)
  33. avouner (2020-09-10). "Десятки научных журналов исчезли из интернета за последние 20 лет и никто их не сохранил". Хабр. Archived from the original on 2021-06-24. Retrieved 2021-06-05.  Unknown parameter |deadlink= ignored (help); Unknown parameter |lang= ignored (help)
  34. Camilla Hodgson (2019-09-17). "How the Internet Archive is waging war on misinformation". Financial Times. Archived from the original on 2021-06-28. Retrieved 2021-06-03.  Unknown parameter |deadlink= ignored (help); Unknown parameter |lang= ignored (help)
  35. Mary Kay Magistad (2017-02-23). "Where to find what's disappeared online, and a whole lot more: the Internet Archive". PRI.org. Archived from the original on 2017-03-28. Retrieved 2021-06-07.  Unknown parameter |deadlink= ignored (help); Unknown parameter |lang= ignored (help)
  36. Acker, 2020
  37. "Wayback Machine теперь проверяет информацию на достоверность для архивных веб-страниц". Trash Box. 2020-11-02. Archived from the original on 2021-06-24. Retrieved 2021-06-05.  Unknown parameter |deadlink= ignored (help); Unknown parameter |lang= ignored (help)
  38. "Журналисты припомнили расистские высказывания пресс-секретаря Минздрава США". Красная весна. 2020-04-24. Archived from [rossaprimavera.ru/news/3d93baba the original] Check |url= scheme (help) on 2021-06-24. Retrieved 2021-06-05.  Unknown parameter |deadlink= ignored (help); Unknown parameter |lang= ignored (help)
  39. "Did the Wayback Machine Catch Russian-Backed Rebels Claiming Responsibility for Malaysian Airlines Flight MH17?". Open Culture. 2014-07-19. Archived from the original on 2021-06-24. Retrieved 2021-06-03.  Unknown parameter |deadlink= ignored (help); Unknown parameter |lang= ignored (help)
  40. Jil Lepore (2015-01-19). "The Cobweb". New Yorker. Archived from the original on 2015-01-25. Retrieved 2021-06-07.  Unknown parameter |deadlink= ignored (help); Unknown parameter |lang= ignored (help)
  41. Дамир Камалетдинов (2021-05-30). "В сеть попали секретные данные об американском ядерном оружии — военные записывали их в школьных приложениях". TJournal. Archived from the original on 2021-06-24. Retrieved 2021-06-05.  Unknown parameter |deadlink= ignored (help); Unknown parameter |lang= ignored (help)
  42. Carolyn Wimbly Martin (2020-05-15). "Internet Archive’s Open Library and Copyright Law". Lutzker. Archived from the original on 2021-06-24. Retrieved 2021-06-04.  Unknown parameter |deadlink= ignored (help); Unknown parameter |lang= ignored (help)
  43. Nate Anderson (2011-05-01). "Copy some webpages, owe more than the national debt". Ars Technica. Archived from the original on 2021-06-24. Retrieved 2021-06-05.  Unknown parameter |deadlink= ignored (help); Unknown parameter |lang= ignored (help)
  44. Eric Bangeman (2006-08-31). "Internet Archive settles suit over Wayback Machine". Ars Technica. Archived from the original on 2007-11-05. Retrieved 2021-06-07.  Unknown parameter |deadlink= ignored (help)
  45. Lisa M. Bowman (2002-09-24). "Net archive silences Scientology critic". CNET. Retrieved 2021-06-10.  Unknown parameter |lang= ignored (help)
  46. Ernest Miller (2002-09-24). "Features: Sherman, Set the Wayback Machine for Scientology". LawMeme. Retrieved 2021-06-10.  Unknown parameter |lang= ignored (help)
  47. Nora Caplan-Bricker (2018-12). "Preservation Acts". Harper's Magazine. Archived from the original on 2021-05-05. Retrieved 2021-06-02.  Unknown parameter |deadlink= ignored (help); Unknown parameter |lang= ignored (help); Check date values in: |date= (help)
  48. Crudo, 2014
  49. Mike Masnick (2015-06-26). "Russia Blocks The Internet Archive's Wayback Machine Over A Single Page". Tech dirt. Archived from the original on 2021-06-04. Retrieved 2021-06-03.  Unknown parameter |deadlink= ignored (help); Unknown parameter |lang= ignored (help)
  50. "Роскомнадзор заблокировал архив интернета из-за "Одиночного джихада"". Московский комсомолец. 2015-06-25. Archived from the original on 2021-06-24. Retrieved 2021-06-05.  Unknown parameter |deadlink= ignored (help); Unknown parameter |lang= ignored (help)
  51. "Роскомнадзор заблокировал страницу «архива интернета» за экстремизм". Lenta. 2015-06-25. Archived from the original on 2021-09-22. Retrieved 2021-06-05.  Unknown parameter |deadlink= ignored (help); Unknown parameter |lang= ignored (help)
  52. Дмитрий Шестоперов, Анастасия Евтушенко (2016-04-18). "«Архив интернета» снова в сети". Газета.ru. Archived from the original on 2021-05-03. Retrieved 2021-12-09.  Unknown parameter |deadlink= ignored (help); Unknown parameter |lang= ignored (help)
  53. "АЗАПИ хочет навечно заблокировать «Архив Интернета»". Роскомсвобода. 2019-08-22. Archived from the original on 2021-06-04. Retrieved 2021-06-05.  Unknown parameter |deadlink= ignored (help); Unknown parameter |lang= ignored (help)
  54. "«Архив интернета» могут навечно заблокировать в России". CNews. 2019-08-23. Archived from the original on 2021-06-24. Retrieved 2021-06-07.  Unknown parameter |deadlink= ignored (help); Unknown parameter |lang= ignored (help)
  55. "Россияне потребовали запретить в Европе Telegram, YouTube и Mail.ru". CNews. 2020-08-19. Archived from the original on 2021-06-24. Retrieved 2021-06-07.  Unknown parameter |deadlink= ignored (help); Unknown parameter |lang= ignored (help)
  56. "Американские издатели книг подали в суд на Internet Archive". Ведомости. 2020-06-02. Archived from the original on 2021-06-24. Retrieved 2021-06-05.  Unknown parameter |deadlink= ignored (help); Unknown parameter |lang= ignored (help)
  57. "Access to Internet Archive’s Wayback Machine Blocked in India". The Wire. 2017-08-08. Archived from the original on 2021-06-24. Retrieved 2021-06-03.  Unknown parameter |deadlink= ignored (help); Unknown parameter |lang= ignored (help)
  58. "Wayback Machine has been blocked in India". The Verge. 2017-08-09. Archived from the original on 2021-06-24. Retrieved 2021-06-05.  Unknown parameter |deadlink= ignored (help); Unknown parameter |lang= ignored (help)
  59. "Kyrgyzstan Blocks Archive.org on ‘Extremism’ Grounds". Global Voices. Archived from the original on 2021-05-18. Retrieved 2021-06-05.  Unknown parameter |deadlink= ignored (help); Unknown parameter |lang= ignored (help)
  60. Anna Kramer (2021-03-10). "The internet is splitting apart. The Internet Archive wants to save it all forever". Protocol. Archived from the original on 2021-06-01. Retrieved 2021-06-09.  Unknown parameter |deadlink= ignored (help); Unknown parameter |lang= ignored (help)
  61. "Машину времени увезли на штрафстоянку". Коммерсантъ. 2022-06-28. Retrieved 2022-07-01. 

ЛитератураПравить

  • Acker, A., & Chaiet, M. «The weaponization of web archives: Data craft and COVID-19 publics.» // Harvard Kennedy School (HKS) Misinformation Review. — 2020.
  • Anat Ben-David, Adam Amram «The Internet Archive and the socio-technical construction of historical facts» // Internet Histories. — 2018.
  • Arora S., Li Y., Youtie J., Shapira P. «Using the wayback machine to mine websites in the social sciences: A methodological resource». — 2015. — Т. 67. — С. 1904—1915.
  • Bowyer S. «The Wayback Machine: notes on a re‑enchantment» // Archival Science. — 2021. — Т. 21. — С. 43—57.
  • Deborah R. Eltgroth «Best Evidence and the Wayback Machine: Toward a Workable Authentication Standard for Archived Internet Evidence» // Fordham L. Rev.. — 2009. — Т. 78.
  • Greg R. Notess «The Wayback Machine: The Web's Archive» // Online. — 2002. — Т. 26.
  • Hartelius J. «The anxious flâneur: Digital archiving and the Wayback Machine» // Quarterly Journal of Speech. — 2020. — Т. 106. — С. 377—398.
  • James L. Quarles III and Richard A. Crudo «[Way]Back to the Future: Using the Wayback Machine in Patent Litigation» // Landslide. — 2014. — Т. 6.
  • Lerner A., Kohno T., Roesner F. «Rewriting History: Changing the Archived Web from the Present» // Association for Computing Machinery. — 2017.
  • Maemura E., Worby N., Milligan I., Becker C. «If These Crawls Could Talk: Studying and Documenting Web Archives Provenance» // Journal of the association for information science and technology. — 2018. — Т. 69. — С. 1223—1233.
  • Milligan I. «Lost in the Infinite Archive: The Promise and Pitfalls of Web Archives» // International Journal of Humanities and Arts Computing. — 2016.
  • Murphy J., Hashim N., O’Connor P. «Take Me Back: Validating the Wayback Machine» // Journal of Computer-Mediated Communication. — 2008. — С. 60—75.
  • Odgen J., Halford S., Carr L. «Observing Web Archives» // WebSci. — 2017. — С. 299—308.
  • Pearce D., Charlton B. «Plagiarism of online material may be proven using the Internet Archive Wayback Machine (archive.org)» // Medical Hypothesis. — 2009. — С. 875.
  • Price «Internet Archiving – The Wayback machine» // MLA Commons. — 2011.
  • Phyllis Holman Weisbard «Oldies but Goodies: Archiving WebBased Information» // Feminist Collections. — 2011. — Т. 32.
  • Rogers R. «Doing Web history with the Internet Archive: screencast documentaries» // Internet Histories. — 2017. — Т. 1. — С. 160—172.
Первоисточник этой статьи был признан «хорошей статьёй» русского раздела Википедии.

Шаблон:Спам-ссылки