Архив интернета в Сан-Франциско: здесь хранится всё

В Архиве интернета в Сан-Франциско хранится все-все-все, что происходит во Всемирной паутине. В том числе «видео с котиками», позорные фотки с вечеринок и признательные показания преступников.

Это по-настоящему круто — или по-настоящему ужасно? Вот вопрос, который наверняка возникнет у человека, попавшего в интернет-архив. Здесь, в монументальном сооружении в стиле неоклассицизма на севере Сан-Франциско, которое до 2009 года принадлежало Четвертой церкви Христа, «обитает» один из самых амбициозных проектов в истории человечества: это должна быть безумная по своим масштабам «коллекция» знаний, цифровая Александрийская библиотека, доступная любому желающему в любое время дня и ночи.

В помещении, где раньше проводились богослужения, теперь располагаются не церковные реликвии, а сотня керамических фигур сотрудников примерно метровой высоты. Внутри них нет никаких свечек, но зато есть огромные серверы. На подставках больше не псалмы, а десятичные разряды числа Пи. Вот уж поистине удивительная метафора: технологии в наше время превратились в настоящую религию!

300 миллиардов сайтов, 12 миллионов книг, 4 миллиона баз аудиоданных

В Архиве интернета на данный момент содержатся 30 петабайтов информации, что соответствует 300 миллиардам веб-сайтов, 12 миллиардам книг, четырем миллионам баз аудиозаписей, 3,3 миллиона видеороликов, 1,5 миллионам фотографий и 170 тысячам программ ПО.

Общественная организация хочет стать не просто «памятью» интернета и сохранить, по возможности, максимальное количество версий всех веб-сайтов мира, но и сделать общедоступными цифровые версии книг, песен и кинофильмов.

«Миллионы людей потратили массу времени и усилий, чтобы разделить с другими то, что мы знаем в виде интернета. Мы хотим создать библиотеку для этой новой платформы для публикаций», — сказал основатель Архива интернета Брюстер Кале (Brewster Kahle), немного похожий на чудаковатого профессора из фильма «День независимости», что, впрочем, лишь подчеркивает его крутизну. 25 лет назад он разработал поисковую машину и продал ее затем провайдеру AOL, а его онлайн-служба Alexa в 1999 году была приобретена компанией Amazon за 250 миллионов долларов. Вот уже 20 лет он руководит этой библиотекой, амбициозную цель которой можно сформулировать пятью словами: «универсальный доступ ко всем знаниям».

Попасть в виртуальную библиотеку может любой желающий по адресу archive.org, а ее «сердцем» является Wayback Machine, которая позволит совершить цифровое путешествие в прошлое и вновь попасть в 1996 год. Задача библиотеки состоит в том, чтобы перманентно «шерстить» весь интернет и не реже чем каждые два месяца архивировать последнюю версию каждого из 300 миллиардов сайтов.

Самые популярные, по версии разработанной Кале интернет-рейтинга Alexa, сайты архивируются по несколько раз в день. Так, посетитель может обнаружить здесь как версию страницы New York Times, вышедшую 11 сентября 2001 года, так и какую-нибудь забавную страничку товарища по работе, посвященную футбольному сезону 2001-2002 годов, которую тот сам уже давно стер. Это чем-то напоминает рытье в чулане, где все еще хранятся чьи-то любимые грампластинки.

Сто сотрудников и тысяча добровольных помощников

Кстати, о грампластинках. В этом архиве можно найти, к примеру, запись живого концерта рок-группы Grateful Dead, который она дала в 1971 году в концертном зале Hollywood Palladium. А также видеозапись, сделанную членами экипажа космического корабля «Аполлон» в момент восхода Солнца над Землей. А также серию радиоспектакля «Новые приключения Неро Вульфа» 1950 года. Или сценарий фильма «Касабланка». Или фотографию Мэрилин Монро. Или компьютерные игры вроде The Oregon Trail, 64-битную симуляцию Winter Games или любимую всеми подростками 1980-х годов карточную игру Strip Poker 2 Plus от компании Amiga.

Тот, кто не считает, что это круто. Либо родился после 2000 года, либо большую часть своей жизни провел в деревянном ящике. Не исключено, что кто-то может провести подряд три дня и три ночи, постоянно «кликая» по ссылкам, которые найдет в библиотеке, и объяснить это тем, что занимается важными поисками и что тем же самым ежедневно занимаются еще более 500 тысяч человек. Цифровая библиотека входит в число 300 наиболее посещаемых веб-страниц в мире, а за ее «контент» отвечают около ста сотрудников и более тысячи добровольных помощников. Так, недавно коллекция пополнилась, к примеру, музыкой Hillbilly 1970-х годов.

Конечно, многие не преминут спросить: зачем нужен этот Архив интернета? Кого, собственно, могут заинтересовать веб-страницы давно минувших дней? Неужели действительно кому-то нужны все эти дурацкие «видео с котиками».

Не это ли одна из причин, по которым социальная сеть Snap сейчас оценивается в 24 с лишним миллиарда долларов, потому что ее содержимое не сохраняется?

Архив борется, в частности, против гегемонии Google

Слыша подобные вопросы, Кале лишь улыбается. Он считает себя наследником фараона Птолемея III, который когда-то стремился наполнить основанную его отцом Александрийскую библиотеку наибольшим количеством рукописей, будь то трудами Софокла или Еврипида или счетами, конфискованных у судовладельцев или рассказами о путешествиях в дальние страны.

«Мы не знаем, что может оказаться важным, когда люди будущего будут оценивать наше настоящее. Кому-то любительская видеозапись или фотоснимок могут рассказать настолько же много, как целый роман. Мы хотим знать все — абсолютно все», — сказал Кале и указал на серверы: «Каждый раз, когда они мигают, сюда что-то загружается или скачивается отсюда». А мигают эти серверы так часто, будто идет настоящий метеоритный дождь.

Кале спускается в свой офис, где повсюду можно увидеть прекрасные артефакты вроде игрушки Game Boy первого поколения или оригинальное издание классической видеоигры Duke Nuke’em. Его сотрудники как раз отмечают выход новой программы для Macintosh или говорят о том, что какой-то их коллега в Гонконге собирается оцифровать азиатские телепередачи.

Архивом интересуются историки и криминалисты

Архив борется против того, чтобы та или иная информация оказалась предана забвению, а также против того, чтобы полным гегемоном в сфере хранения информации стал Google. Архив должен стать «отражением» всей Всемирной паутины — нефильтрованной и неразорванной. Так, к примеру, лидер сепаратистов на востоке Украины Игорь Гиркин 17 июля 2014 года написал на своей странице в российской социальной сети ВКонтакте: «Мы только что сбили самолет — Ан-26.

Мы предупреждали о том, чтобы они не летали в нашем воздушном пространстве. Эта „Птичка” упала на гору мусора, у нас есть видео-доказательства».

Когда стало известно, что речь идет не о военном самолете, а о пассажирском самолете авиакомпании Malaysia Airlines, Гиркин стер эту запись. И эта запись исчезла бы навсегда, если бы сотрудники Архива интернета своевременно не сделали ее скриншот.

Однако библиотека представляет интерес не только для историков, но также и для криминалистов. Так, в частности, сотрудники уже получили несколько запросов от ФБР. При этом также понятно: есть конфликт между правом на информацию и правом на забвение. Ведь если хорошенько покопаться в архиве, то можно найти фотографии с собственных «диких» студенческих вечеринок, хотя, казалось бы, они давно уже были безвозвратно утеряны. Или, например, свадебные фотографии друзей, которые давно уже развелись и думали, что все их воспоминания о совместно прожитых горах также стерты навсегда. Или, например, записи в «гостевых книгах» сайтов, которые давно уже прекратили свое существование.

Интернет, какой он есть

«Мы ежедневно получаем новые электронные письма с просьбами что-нибудь удалить. И, конечно, мы идем навстречу этим пожеланиям», — сказал Кале. Правда, тем, кто не знает, что сохранено в библиотеке, жаловаться не приходится. А те, кто имеет достаточно времени, чтобы проверить, чего только не сохранила цифровая библиотека о тех или иных людях? В наше время информация стала очень ценной валютой. Кале с этим не спорит, но именно поэтому он считает Архив Интернета гигантской библиотекой, содержание которой не должно попасть во власть многомиллиардных корпораций, а должно оставаться доступным сотням миллионов простых пользователей.

Кале считает Архив интернета (и в ходе нашего визита мы убедились в этом) не только «классной штукой». По его мнению, было бы очень печально, если бы его не было. Эта общественная организация, финансируемая за счет пожертвований и имеющая бюджет лишь немногим больше десяти миллионов долларов, отражает, по его мнению, интернет таким, какой он есть на самом деле. Разве мы сами не жалуемся постоянно, что интернет-гиганты вроде Alphabet, Amazon, Apple, Facebook или Microsoft узурпировали доступ к информации? И разве не прекрасно, что есть такая цифровая библиотека, целью которой является не заработать как можно больше денег, а просто сохранить как можно больше информации?

Поэтому многие считают происходящее сейчас в бывшей церкви в Сан-Франциско просто прекрасным. Наряду с недостатком денег, от чего страдает, пожалуй, каждая библиотека в мире, у Кале есть лишь одна забота: «Почти все библиотеки в мире рано или поздно становились жертвами власть имущих. Это не политическое заявление, а лишь констатация факта. Если бы люди в Александрии успели сделать копии рукописей до того, как библиотека была разрушена, мы бы, возможно, сейчас имели возможность читать Аристотеля в оригинале».

Поэтому Архив интернета размножил каждую отдельную базу данных и распространил по миру. Версии архива есть в калифорнийском Ричмонде, в Амстердаме, а вскоре аналогичная версия появится в Канаде. А есть еще копия этих данных — это действительно так — в новой Александрийской библиотеке.

Юрген Шмидер, Sueddeutsche Zeitung

Перевод InoSmi

Комментируйте новости на странице DiasporaNews в Facebook | Ставьте LIKE и мы будем сообщать вам о важном и интересном.

ЧИТАЙТЕ ТАКЖЕ:

7 новостей, которые вы могли пропустить на этой неделе

ОСТАВЬТЕ ОТВЕТ