Очередной блог о SEO и о том, как заработать в интернете.
RSS иконка Домашняя иконка
  • Яндекс. Апдейты. Позиции.

    Написано Октябрь 1st, 2010 grigorka Нет комментариев

    В данный момент для своих целей пишу сервис по сбору статистики по позициям Яндекса. Как обычно хочется реализовать как можно больше функций и всевозможных срезов статистики. Собрать такую статистику может каждый школьник маломальски знакомый с web-программированием. Но что делать с полученной статистикой? Как ее обрабатывать? Как ее хранить? Вот тут как не пляши, простого знания коддинга будет не достаточно. Да и вообще, какую статистику собирать, а какую нет?

    Во-первых, нужно понимать, что адекватная статистика должна следить не только за твоими сайтами, но и сайтами — конкурентами по твоим запросам. Тут можно прибегнуть к небольшой хитрости: собирая позиции, сниппеты и заголовки для своего сайта по каким-либо запросам, Вы так же можете параллельно запоминать эти параметры у остальных сайтов, которые попадаются Вам при сборе. Тем самым отдельно собирать статистику по конкурентам не требуется. Вы экономите свое время, кол-во запросов ( а если делать это через XML.Yandex, то кол-во запросов ограниченно).

    Во-вторых, хранение статистики тоже довольно сложный процесс. Сразу продумайте какова будет структура базы данных. Попробуйте выбрать такое решение, чтобы хранимая информация не занимала слишком много места, и Вам бы не приходилось делать по несколько тысяч запросов, чтобы получить нужную Вам информацию по нужному Вам срезу. Задача не из легких. Оптимальное хранение данных — это не минимум данных в таблице, а еще и не очень большая сложность алгоритма выборки данных. Тут есть несколько хитростей. Старайтесь хранить только ту информацию, которая изменилась. Чаще всего промежуточные данные хранить не имеет смысла. Старайтесь продумывать алгоритм выборки данных на бумаге, а не сразу реализовывайте его в код, т.к. всегда можно упустить тонкости, которые Вы не учли, но которые влияют на результат. Если функция выборки слишком сложна, то постарайтесь немного расширить количество хранимой информации. Возможно это в разы упростит работу с этой базой данных.

    А теперь маленький интересный факт по аналогичным сервисам, вернее по сервисам, которые содержат в себе индикаторы апдейтов Яндекс. Я честно перед написанием статьи просмотрел несколько сервисов и понял, что сервис, который рекламируется на серче один из самых неадекватных, по одной простой причине: среди такого большого количества просматриваемых запросов у них случаются дни, когда апдейт – 0%. Возможно ли такое? Быстробот не существует? Или они собирают информацию только в дни апдейтов? Вот такие мысли к размышлению, о том какой адекватный ресурс серч и какие люди на нем сидят.


    Оставить комментарий

    *