Любая поисковая система состоит из основных
компонентов: 1.1.
Spider (паук) - браузероподобная программа, которая скачивает
веб-страницы в базу поисковой ситемы. 1.2.
Crawler (краулер, "путешествующий" паук) - программа, которая
автоматически проходит по всем ссылкам, найденным на странице которую
посещает и заносит ссылки в базу посиковой ситемы. 1.3.
Indexer (индексатор) - программа, которая анализирует веб-страницы,
скаченные пауками и строит индексные файлы для ускорения сортировки ( у
любой базы есть индексные файлы, обеспечивающие ускоренную сортировку
или выборку) 1.4.
Database (база данных) - хранилище скачанных и обработанных страниц. 1.5.
Search engine results engine (система выдачи результатов) - извлекает
результаты поиска из базы данных. 1.6.
Web server (веб-сервер) - веб-сервер, который осуществляет
взаимодействие между запросами пользователя и остальными компонентами
поисковых систем.
Детальная реализация поисковых механизмов может отличаться друг от друга.
Например, связка - пункт 1.7. 1.7. Spider+Crawler+Indexer может быть выполнена в виде
единой программы, которая скачивает какие то найденые веб-страницы,
подвергает анализу их и ищет на них ссылки на новые ресурсы), однако
всем поисковым системам присущи описанные общие черты. 1.8.
Spider (Паук) - это программа, которая скачивает веб-страницы тем же
способом, что и браузер пользователя. Отличие состоит в том, что браузер
отображает информацию, содержащуюся на странице (текстовую, графическую
и т.д.), паук же не имеет никаких визуальных компонент и работает
напрямую с html-текстом страницы (вы можете сделать "просмотр html-кода"
в вашем браузере, чтобы увидеть "сырой" html-текст). 1.9.
Crawler - Выделяет все ссылки, присутствующие на странице. Его задача -
определить, куда дальше должен идти паук, основываясь на ссылках или
исходя из заранее заданного списка адресов. Краулер, следуя по найденным
ссылкам, осуществляет поиск новых документов, еще неизвестных поисковой
системе. 2.0
Indexer - Индексатор разбирает страницу на составные части и
анализирует их. Выделяются и анализируются различные элементы страницы,
такие как текст, заголовки, структурные и стилевые особенности,
специальные служебные html-теги и многие другие параметры. 2.1.
Database - База данных - это хранилище всех данных, которые поисковая
система скачивает и анализирует. Иногда базу данных называют индексом
поисковой системы. 2.2.
Search Engine Results Engine - Система выдачи результатов занимается
ранжированием страниц. Она решает, какие страницы удовлетворяют запросу
пользователя, и в каком порядке они должны быть отсортированы. Это
происходит согласно алгоритмам ранжирования поисковой системы. Эта
информация является наиболее ценной и интересной для нас - именно с этим
компонентом поисковой системы взаимодействует оптимизатор, пытаясь
улучшить позиции сайта в выдаче, поэтому в дальнейшем мы подробно
рассмотрим все факторы, влияющие на ранжирование результатов. 2.3.
Web server - Для запросов на сервере присутствует html-страница с полем
ввода для запроса, в котором пользователь может задать интересующий его
поисковый термин или запрос. Веб-сервер, также отвечает за выдачу
результатов поиска пользователю в виде html-страницы или другого
диалогова окна.
Ключевые слова (фразы) должны встречаться в тексте
как минимум 3-4 раза. Верхняя граница зависит от общего объема страницы
- чем больше общий объем, тем больше повторений можно сделать.
Пример тега ключевых слов: <meta name="keywords" content="Интересные статьи
заметки по продвижению сайтов, вырезки из статей и блогов, интерсная
информация и рецепты по программированию и продвижению сайтов">. Пример тега ключевых фраз:<meta name="keyphrases" content="Интересные
статьи заметки по продвижению сайтов, вырезки из статей и блогов,
интерсная информация и рецепты по программированию и продвижению сайтов">.
Отдельно следует рассмотреть ситуацию с поисковыми
фразами, то есть словосочетаниями из нескольких ключевых слов. Наилучшие
результаты наблюдаются, если фраза встречается в тексте несколько раз
именно как фраза (т.е. все слова вместе в нужном порядке), а кроме того,
слова из фразы попадаются в тексте несколько раз поодиночке. Также
должно существовать некоторое различие (разбалансировка) между числом
вхождений каждого из слов, составляющих фразу.
Рассмотрим ситуацию на примере. Допустим, мы оптимизируем страницу под
фразу "SEO продвижение". Хороший вариант -
фраза "SEO продвижение">
встречается в тексте 11 раз, кроме того, слово "SEO" встречается
отдельно еще 8 раз, слово "продвижение" еще 6 раз. Все цифры в примере
естественно
условны, но очень хорошо показывают общую идею.
Очень короткое для всех правило - чем ближе ключевое слово или
ключевая фраза к началу
документа (html файла), тем больший вес оно получает в глазах поисковой системы
и поискового робота.
Есть также и другое очень простое правило - используйте ключевые слова в тексте
исходящих ссылок с ваших страниц (как на другие страницы
вашего сайта, и даже на другие ресурсы сети), это может добавить Вам
небольшое преимущество при ранжировании при посещении робота и обработки
вашей страницы Indexer-ом.
Плотность ключевого слова на странице показывает относительную частоту
содержания слова в тексте. Плотность измеряется в процентах. Например,
если заданное слово встретилось 6 раз на странице из 100 слов, то
плотность этого слова равна 6%. Однако слишком низкая плотность приведет к
тому, что поисковая система не придаст должного значения этому слову.
Но, слишком высокая плотность способна включить спам-фильтр поисковой
системы (то есть страница будет искусственно понижена в результатах
поиска из-за чрезмерно частого употребления ключевой фразы).
Оптимальной считается плотность ключевого текста 5-7%. В случае фраз,
состоящих из нескольких слов, следует посчитать суммарную плотность всех
ключевых слов, составляющих фразу и убедиться, что она укладывается в
указанные пределы.
Практика показывает, что плотность ключевого текста более 7-8%, хотя и
не ведет к каким-либо отрицательным последствиям, но и смысла особого в
большинстве случаев также не имеет. Поэтому если Вы хотите повысить
количество ключевых слов на станице (не повышая плотности), то
располагайте на странице как можно больше текста.
Поисковые системы ценят сайты и ресурсы, богатые информационным содержанием,
чем больше, тем лучше. И поэтому следует стремиться к увеличению текстового наполнения сайта.
Оптимальными следует считать страницы, содержащие 500-3000 слов или 2-20
килобайт текста (от 2 до 30 тысяч символов).
Страница, состоящая всего лишь из нескольких предложений, имеет меньше
шансов попасть в топ поисковых систем.
Поэтому, большее количество текста на странице увеличивает видимость
страницы в поисковых системах за счет редких или случайных поисковых
фраз, что в некоторых случаях может давать неплохой приток посетителей.
Кроме того, количество ссылок исходящих на внутренние страницы
сайта или на внешние, должно быть намного меньше, чем количество текста.
И еще раз, тексты должны быть уникальные, но: 1. -тексты должны быть
предназначены для людей, т.е хорошо читаемы и понятны, 2. - попробуйте
описать например "карандаш" и Вы поймете что у Вас максимум 10
предложений (можно конечно и больше, но получится туфта, краткость
сестра таланта) и вариантов ну пускай так 20. И все. Остальные тексты
будут просто не уникальны (просто перестановка слов). 3.- а как быть с
песнями, крылатыми фразами, поговорками, афоризмами??? о какой
уникальности можно здесь говорить??? Подумайте на досуге.
Данный материал собран из различных источников в
сети.