neudor

log

Entries Comments



Category: seo

Умный поиск в гугле

5 September, 2008 (11:53) | PHP, seo | By: neudor

Сегодня после обеда в качестве отвлечения от кодинга больших скриптов решил наваять кое-чего небольшое, то, что мне всегда нехватало.

Вам никода не хотелось заняться сбором в гугле толстых сайтов? Чтоб указываешь запрос, указываешь порог PR, а скрипт парсит выдачу и собирает подходящие по весу ссылки? Применений у этой штуки может быть много, но я для себя определил одно — сбор жирных страниц, на которые разрешён trackback. Проще говоря, много толстых халявных бэков,по которым можно спамить. И к вам тоже начнуть заглядывать посетители. Крутота?

Не буду долго томить — всю эту красоту уже можно качать. Всё свободно и бесплатно.

Схема работы предельно проста. В начале скрипта есть три конфигурационные переменные, отвечающие за запрос к гуглу (я использовал “TrackBack URI -intitle:trackback -intitle:uri”), минимальное значение PR, с которым искать ссылки и количество ссылок, которые нужно найти. Скрипт собственно парсит выдачу и затем смотрит PR страниц. Дальше 50 страниц выдачи не опускается, ибо страшно =). Нужные результаты сохраняет. Можно потом смотреть в файле. Вот вам, например, список толстых страниц, у которых указан Trackback URI:

7 : http://wordpress.org/development/2008/05/birthday-party/
6 : http://www.arnebrachhold.de/projects/wordpress-plugins/google-xml-sitemaps-generator/
5 : http://the-notebook.org/12/01/2006/openid-comments-for-wordpress/
5 : http://www.pinktentacle.com/2008/06/21-leaf-clover/
5 : http://www.isoc-ny.org/?p=214
5 : http://segala.com/blog/emerging-technology-presentation-on-powder/
5 : http://content.ksg.harvard.edu/blog/jeff_frankels_weblog/2008/05/12/white-house-confidence-that-us-is-not-in-recession-is-misplaced/
5 : http://scobleizer.com/2007/12/12/first-look-semantic-web-app-twine/
6 : http://www.alternet.org/rights/87665/
5 : http://www.der-prinz.com/2008/01/20/wordpress-magazine-style-theme-branfordmagazine/

Собственно всё волшебство заключено в строке запроса, с которой нужно играться и искать ту золотую жилу, которая принесёт максимально релевантные ссылки.

Сейчас подумал, что логично было бы проводить ещё и поиск на сайтах, где уже нашлись подходящие ссылки. Но сейчас большой надобности нет. Если народ откликнется — напишу.
А ещё можно парсить страницу и смотреть ставится ли в каментах nofollow. Информацию об этом тоже включать в отчёт.

Короче много чего ещё можно. Но где бы время на всё это взять?

Интересный бэклинк

3 September, 2008 (21:42) | seo | By: neudor

Любопытно, а вот такую ссылку яндекс считает за XSS или нет? А гугл?
neudor

PR 5, ТИЦ 20000, нет nofollow — такие ссылки на дороге не валяются…
А вот на фейсбуке такой приколюхи нет.