Архив Интернета (Gj]nf Numyjuymg)
Internet Archive | |
---|---|
![]() | |
![]() | |
URL | archive.org |
Коммерческий | нет |
Тип сайта | универсальная электронная библиотека |
Язык(-и) | английский |
Расположение сервера |
![]() ![]() ![]() |
Владелец | Internet Archive |
Автор | Брюстер Кейл[1] |
Начало работы | 24 января 1996 года |
Текущий статус | работает |
Оборот | |
Число сотрудников |
|
Слоган | universal access to all knowledge |
Рейтинг Alexa | |
![]() |
Архи́в Интерне́та (англ. Internet Archive) — некоммерческая организация, основанная в 1996 году в Сан-Франциско Брюстером Кейлом. Архив собирает копии веб-страниц, графические материалы, видео- и аудиозаписи и программное обеспечение. Архив обеспечивает долгосрочное архивирование собранного материала и бесплатный доступ к своим базам данных для широкой публики. Декларируемой целью Архива является сохранение культурно-исторических ценностей цивилизации в эпоху интернет-технологий, создание и поддержка электронной библиотеки. По состоянию на октябрь 2012 года размер Архива — 10 петабайт[4], на октябрь 2016 года — 15 петабайт[5], на март 2019 года — 45 петабайт[6]. По состоянию на август 2016 года содержит 502 млрд копий веб-страниц. Сервер Архива расположен в Сан-Франциско, зеркала — в Новой Александрийской библиотеке и в Амстердаме. С 2007 года Архив имеет юридический статус библиотеки[7].
История[править | править код]
Архив был создан Брюстером Кейлом в 1996 году примерно в то же время, когда он основал компанию Alexa Internet, занимающуюся сбором статистики о посещаемости веб-сайтов. В октябре того же года организация начала архивировать и хранить копии веб-страниц[8]. Сохранённые копии не были доступны для широкой публики до создания в 2001 году веб-сервиса Wayback Machine. С конца 1999 года Архив начал расширение за пределы веб-архива и в настоящее время, помимо копий веб-сайтов, включает в себя тексты, видео, звукозаписи, программное обеспечение и изображения.
Проекты[править | править код]
Wayback Machine[править | править код]
The Wayback Machine — веб-сервис Архива. Содержание веб-страниц время от времени фиксируется c помощью бота или при ручном указании посетителем сайта адреса страницы для фиксации. Таким образом, можно посмотреть, как выглядела та или иная страница раньше, даже если она больше не существует.
Легальность[править | править код]
На сервис не раз подавались судебные иски в связи с тем, что публикация контента может быть нелегальной. По этой причине сервис удаляет материалы из публичного доступа по требованию их правообладателей или, если доступ к страницам сайтов не разрешён в файле robots.txt владельцами этих сайтов.
В 2002 году часть архивных копий веб-страниц, содержащих критику саентологии, была удалена из архива[9] с пояснением, что это было сделано по «просьбе владельцев сайта»[10]. В дальнейшем выяснилось, что этого потребовали юристы Церкви саентологии, тогда как настоящие владельцы сайта не желали удаления своих материалов[11]. Некоторые пользователи сочли это проявлением интернет-цензуры.
Сервис веб-архива может использоваться в качестве меры борьбы с блокировками доступа к сайтам: как и сервис кэшированных копий страниц от поисковых систем, Архив Интернета позволяет ознакомиться с более ранними копиями популярных страниц. Однако использование Архива и кэшей в таких целях требует специальных усилий от пользователя и позволяет получить доступ не ко всем сайтам[12].
Open Library[править | править код]
Open Library — общественный проект по сканированию всех книг в мире, к которому приступила Internet Archive в октябре 2005 года. На февраль 2010 года библиотека содержит в открытом доступе 1 миллион 165 тысяч книг, в каталог библиотеки занесено больше 22 млн изданий. По данным на 2008 год, Архиву принадлежат 13 центров оцифровки в крупных библиотеках. По оценке Internet Archive на ноябрь 2008 года, коллекция составила более 0,5 петабайта, включая изображения и документы в формате PDF[13]. Коллекция постоянно растёт, так как библиотека сканирует около 1000 книг в день.
Scan-on-demand — бесплатная оцифровка желаемых публикаций из фондов Бостонской общественной библиотеки, относится к проекту «Открытая библиотека».
Собрание фильмов, аудио, текстов и программного обеспечения, которые являются общественным достоянием или распространяются под лицензией Creative Commons.
Награды[править | править код]
23 марта 2010 года Архив Интернета назван победителем в номинации Project of Social Benefit ежегодной премии Free Software Awards, организованной некоммерческим фондом Free Software Foundation (FSF)[14][15].
Блокировка Архива Интернета[править | править код]
В России[править | править код]
В октябре 2014 года Роскомнадзор заблокировал на территории РФ доступ к некоторым страницам Архива Интернета за видеоролик «Звон мечей» экстремистской группировки «Исламское государство Ирака и Леванта» (нынешнее название — «Исламское государство»). Ранее блокировались только ссылки на отдельные материалы в архиве, однако 24 октября 2014 года в реестр запрещённых сайтов временно был включён сам домен и его IP-адрес[16][17][18].
16 июня 2015 года на основании статьи 15.3 закона «Об информации, информационных технологиях и о защите информации» генпрокуратура РФ приняла решение о блокировке страницы «Одиночный джихад в России», содержащей, по её мнению, «призывы к массовым беспорядкам, осуществлению экстремистской деятельности, участию в массовых мероприятиях, проводимых с нарушением установленного порядка»[18][19][20], в действительности на территории России был заблокирован доступ ко всему сайту, кроме The Wayback Machine.
С апреля 2016 года Роскомнадзор решил убрать сайт из блокировок, и он доступен в России.
По состоянию на 22 августа 2019 года в Мосгорсуде находятся на рассмотрении иски Ассоциации по защите авторских прав в интернете (АЗАПИ), в которых заявлено требование о блокировке интернет-портала archive.org на территории России в связи с нарушениями авторских прав[21].
В других странах СНГ[править | править код]
Архив Интернета был заблокирован на территории Казахстана в 2015 году[22] (по состоянию на 25 февраля 2021 года сайт остаётся недоступным для казахстанцев).
Также в 2017 году сообщалось о блокировках Архива Интернета в Киргизии[23].
archive.org также заблокирован на территории Таджикистана[источник не указан 51 день].
В Индии[править | править код]
В Индии Архив был частично заблокирован судебным решением в августе 2017 года. Решение Madras High Court перечисляло 2,6 тыс. адресов в сети Интернет, которые способствовали пиратскому распространению ряда фильмов двух местных кинокомпаний[24][25]. Представители проекта безуспешно пытались связаться с министерствами[26][27].
См. также[править | править код]
Примечания[править | править код]
- ↑ Internet Archive: Bios (англ.) — IA.
- ↑ archive.org Competitive Analysis, Marketing Mix and Traffic - Alexa (англ.). Alexa Internet. — Глобальный рейтинг сайта archive.org. Дата обращения: 20 июня 2020.
- ↑ https://projects.propublica.org/nonprofits/organizations/943242767
- ↑ 10,000,000,000,000,000 bytes archived! . Архивировано 28 ноября 2012 года.
- ↑ Defining Web pages, Web sites and Web captures .
- ↑ Donate to the Internet Archive! (англ.). archive.org. Дата обращения: 28 марта 2019.
- ↑ Internet Archive officially a library . Internet Archive (7 мая 2007). Дата обращения: 31 августа 2016.
- ↑ Internet Archive: In the Collections (недоступная ссылка). Wayback Machine (6 июня 2000). Дата обращения: 1 сентября 2016. Архивировано 6 июня 2000 года.
- ↑ Bowman, Lisa M. Net archive silences Scientology critic, CNET News.com (24 сентября 2002). Архивировано 16 июля 2012 года. Дата обращения 4 января 2007.
- ↑ Jeff. exclusions from the Wayback Machine (Blog). Wayback Machine Forum. Internet Archive (23 сентября 2002). Дата обращения: 4 января 2007. Архивировано 25 августа 2011 года. Author and Date indicate initiation of forum thread
- ↑ Miller, Ernest Sherman, Set the Wayback Machine for Scientology (Blog). LawMeme. Yale Law School (24 сентября). Дата обращения: 4 января 2007. Архивировано 25 августа 2011 года. The posting is billed as a 'feature' and lacks an associated year designation; comments by other contributors appear after the 'feature'
- ↑ Maximillian Dornseif. Government mandated blocking of foreign Web content (англ.). preprint cs/0404005 16. arXiv (2004). Дата обращения: 26 ноября 2017.
- ↑ Bulk Access to OCR for 1 Million Books, via Open Library Blog, by raj, 24 ноября 2008. . Архивировано 28 ноября 2012 года.
- ↑ Free Software Awards Announced . Архивировано 28 ноября 2012 года.
- ↑ Стали известны номинанты ежегодной награды Free Software Awards (недоступная ссылка). Дата обращения: 17 сентября 2017. Архивировано 18 июля 2011 года.
- ↑ Производится блокировка экстремистского видео террористической организации «Исламское государство Ирака и Леванта» в сети Интернет . Роскомнадзор (24 октября 2014).
- ↑ Роскомнадзор внёс «архив интернета» в реестр запрещённых сайтов // Meduza. — 2014. — 25 октября.
- ↑ 1 2 Роскомнадзор заблокировал архив интернета // РБК. 25 июня 2015 года.
- ↑ Роскомнадзор заблокировал страницу «архива интернета» за экстремизм // Lenta.ru. 25 июня 2015 года.
- ↑ Роскомнадзор заблокировал архив интернета из-за «Одиночного джихада» // Московский комсомолец. 25 июня 2015 года.
- ↑ АЗАПИ хочет навечно заблокировать «Архив интернета» // РосКомСвобода. — 2014. — 22 августа.
- ↑ Xenia Voronina. Experts explain reason for websites blocking in Kazakhstan (англ.), Республиканская газета «Казахстанская правда» (21 October 2015). Дата обращения 26 ноября 2017.
- ↑ Kyrgyzstan Blocks Archive.org on ‘Extremism’ Grounds (англ.), Global Voices advox (21 July 2017). Дата обращения 26 ноября 2017.
- ↑ 'Bollywood blocks the Internet Archive' - BBC News
- ↑ Access to Internet Archive’s Wayback Machine Blocked in India
- ↑ Statement and Questions Regarding an Indian Court’s Order to Block archive.org | Internet Archive Blogs
- ↑ Update: Internet Archive contacted Indian govt regarding the block, but got no response - MediaNama
Литература[править | править код]
- Алексей Кутовенко. Всё прошлое интернета // UPgrade : журнал. — 2011. — № 21 (525). — С. 40—41. — ISSN 1680-4694.
- Алексей Кутовенко. Интернет-летописцы. Сервисы кэширования веб-ресурсов // Мир ПК : журнал. — 2011. — № 6. — С. 58—61. — ISSN 02353520.
Ссылки[править | править код]
- Архив Интернета . Архивировано 28 ноября 2012 года.
- Оцифровка книг: общественный проект (недоступная ссылка). webplanet.ru (27 октября 2005). Архивировано 12 апреля 2012 года.
- Крупнейший интернет-архив обзавёлся новым дата-центром . Lenta.ru (20 марта 2009).
Зеркала
- Зеркало в Александрии . Архивировано 28 ноября 2012 года.