Google перешел на Caffeine - новую систему индексирования веб-сайтов.
По словам программного инженера Google Кэрри Граймза (Carrie Grimes), Caffeine обеспечивает на 50% более свежие результаты поиска и представляет собой самую большую коллекцию веб-страниц. Что бы вы ни искали — новости, сообщения в блогах или на форумах, — нужные вам страницы теперь еще быстрее попадут в индекс, а вы сможете их быстрее найти.
Сaffeine позволяет анализировать информацию в Интернете «по частям» и непрерывно обновлять поисковый индекс. Это значит, что результаты поиска будут отображать максимально свежую информацию, вне зависимости от времени и места публикации.
Каждую секунду система обрабатывает сотни тысяч страниц. Если мы представим себе, что эти страницы бумажные, стопка из них росла бы со скоростью около 5 км в секунду. В базе данных Caffeine содержится порядка 100 млн. гигабайт данных, а новая информация добавляется со скоростью нескольких сотен тысяч гигабайт в день. Вам бы понадобилось 625 тысяч iPod-ов с самым большим объемом памяти, чтобы сохранить такой массив информации.
Создатели Caffeine ориентировались на будущее Интернета. Эта система является отличной основой для построения других, более быстрых и объемных индексов, так как она способна лучше адаптироваться к развитию сети.
источник
Теги: Caffeine, новая система индексирования сайтов, Гугл, будущее интернета, поиск, индекс, веб-страницы, информация, новости,