К сожалению, на просторах глобальной сети, как и в реальном мире, ничего не вечно. Представьте себе такую ситуацию: сегодня вы посещаете сайт и находите информацию там для себя важной и интересной. Но вот наступило завтра, и вместо любимого ресурса в своём браузере вы видите такую картину:
То же самое может случиться и со страницей в социальной сети:
При этом абсолютно не ясно: закрылся ли сайт ненадолго или он уже никогда больше не порадует своих посетителей. Да и причины, по которым веб-ресурс теперь не отображается, могут быть самыми различными. Например, начиная с того, что хозяин сайта просто не успел оплатить те или иные услуги (хостинг, домен и т.д.) и, заканчивая тем, что его ресурс подвергся атаке.
В свою очередь, в социальных сетях страницу легко может заблокировать как администрация, так и сам пользователь, который при желании стирает любую свою личную информацию или даже может удалить всю страницу целиком, если ресурс предоставляет ему такую возможность.
Простой посетитель же в это время поставлен перед фактом: информация, которая ему нужна и интересна, теперь недоступна. Но на самом деле всё не так безвыходно, как может показаться на первый взгляд.
Дело в том, что у львиной доли веб-страниц, размещённых в глобальной сети, есть практически полноценные копии. Кто же занимается их созданием? Ответов на этот вопрос можно дать сразу несколько. Мы сегодня рассмотрим два наиболее солидных их них.
В роли первого выступают поисковые системы. Да, вы не ослышались, хорошо знакомые всем нам Яндекс и Google не только индексируют сайт для того, чтобы его потом можно было легко отыскать, но и создают копии его страниц. Храниться эти резервные версии могут около одного месяца. Таким образом, сайт, который уже несколько недель как отключён и недоступен, в кэше поисковых машин находится всё ещё в своём истинном виде.
Вероятно, всем знакома пословица «слово не воробей, вылетит — не поймаешь». Существование кэша поисковых систем превращает это уже весьма старое выражение в реальность современной глобальной сети.
Допустим, человек написал что-то на своей странице в социальной сети. Потом основательно подумал, счёл свои собственные слова слишком несдержанными, чтобы выставлять их на всеобщее обозрение и удалил. Однако в кэше поисковой системы с большей долей вероятности могла сохраниться именно та версия его страницы, где данная запись ещё цела и невредима.
Впрочем, хоть всё это, казалось бы, и мелочи, но иногда вокруг функции сохранения всего и вся поисковиком в свои базы данных разгорались настоящие скандалы. Один из них произошёл совсем недавно с абонентами сотового оператора Мегафон.
Тогда в кэш Яндекса попали более 8000 сообщений абонентов, которые вводили их в специальную форму на сайте компании. Разумеется, сохранён был не только текст, но и конкретные номера получателей. Возможно, о случившемся узнали бы лишь немногие.… Однако желание средств массовой информации выдать «горяченькую» новость в очередной раз взяло вверх над простой человечностью и поэтому уже через несколько дней те SMS смотрели все, кому это было интересно.
А между тем среди восьми тысяч сообщений помимо стандартных «привет/пока» были и весьма серьёзные сведения, включая пароли и реквизиты финансовых документов. Сейчас вся эта информация, разумеется, удалена, но копии, сделанные уже простыми пользователями, до сих пор болтаются по сети.
Как посмотреть кэш поисковой системы? На самом деле всё достаточно просто: нужно лишь пройти по специальной ссылке в поисковой выдаче.
Вот эта ссылка в Яндексе:
А вот в Google:
Если в качестве примера приводить наш собственный сайт, то в кэше Google на момент написания этих строк была его версия почти недельной давности.
Быстрый доступ к кэшу поисковика №1 можно получить, набрав в строке поиска адрес нужного сайта и добавив к нему префикс «cache:» без кавычек. Существуют и специализированные расширения для веб-браузеров, позволяющие взаимодействовать с сохранёнными поисковиком данными более наглядно и удобно.
Отметим также, что и создателям сайтов, и пользователям некоторых социальных сетей доступны опции, чтобы закрывать свои страницы от индексирования поисковиками. Разумеется, копий тогда не будет, но и через поиск найти вас, к сожалению, скорее всего другие люди, тоже уже не смогут.
На что не способны поисковики? Самый главный недостаток заключается в том, что перед вами всё время лишь одна сохранённая версия страницы. Согласитесь, это весьма неудобно и непрактично.
Вот именно здесь, как нам кажется, и стоит рассказать о необычном ресурсе, для которого архивирование глобальной сети является не дополнительной задачей, как в случае с тем же Google, а основной.
Именно такую услугу готов предоставить, по сути единственный в своём роде, сайт Internet Archive. Данный проект основан ещё в далёком 1996 году, когда глобальная сеть была совершенно иной по сравнению с тем, какой мы видим её сейчас. Так, например, более 10 лет назад выглядела заглавная страница Google (скриншоты получены с помощью Internet Archive):
А так начинал свою работу привычный и хорошо всем знакомый Яндекс:
За долгие годы своего существования сайт, архивирующий интернет, умудрился занести в свою базу миллиарды веб-страниц, общим объёмом в несколько петабайт и, несмотря на это, сохранил за собой некоммерческий статус (то есть не требует денег со своих посетителей за доступ к любой сохранённой у него информации).
Как пользоваться ресурсом? На самом деле всё весьма просто. Открыв в браузере главную страницу проекта, вам достаточно лишь написать адрес желаемого сайта или странички в любой социальной сети (если она была хотя бы когда-нибудь открыта для всеобщего просмотра) в поле «Wayback Machine».
После этого на экране появятся два раздела, с помощью которых можно осуществлять навигацию по времени существования искомого объекта. В первом разделе вы выбираете год, а во втором, соответственно, месяц и дату. Разумеется, выбирать можно только те временные отрезки, где хоть что-нибудь сохранено. В разделе с годами такие отрезки отмечаются вертикальными чёрными столбцами, в календаре же соответствующие даты выделены синими кружками.
Стоит отметить, что чем популярнее страница, тем чаще её сохраняет Internet Archive. К примеру, сайт компании Microsoft за последний год был сохранён более двух сотен раз (копии создавались почти каждый день).
С рядовыми же сайтами, к сожалению, далеко не всё так радужно. Некоторые из них даже не попадают в архив ресурса, другие архивируются, но редко и не полностью.
Несмотря на это реальная польза в Internet Archive, безусловно, есть. Не так давно мы и сами были читателями весьма милого сайта demoblog (сейчас его адрес перебрасывает совершенно на другую страничку). Там публиковались обзоры превосходных программ, но совершенно неожиданно проект был закрыт. Вместе с ним исчезли и обзоры.
Однако все названия рассмотренных там приложений вместе с их детальным описанием благополучно попали в базу данных Internet Archive, благодаря чему мы по сей день имеем к ним доступ и вскоре задействуем даже в собственных статьях.
УХ ТЫ!!!
Вот это ТЕМА!!!!!!
Сколько в мире вещей мы не видим через своё незнание (ведь каждый день мы с таким сталкиваемся)
СПАСИБО АФФФТАРАМ за открытие глаз:))))))
Нравится лентяйничать и читать про