URL-овые
Данный вид признака являет включенным в URL. Как таковой может быть любое слово которое так или иначе несёт в себе смысловую часть и является кеем для какой либо страницы. На пример в данном случае это может быть такие слова:
Guestbook, gbook, guest, book и так далее.
Для того чтоб сделать запрос гуглу чтоб он выдал результаты только по этому признаку мы делаем вот такие запросы:

inurl: Guestbook
inurl: gbook
inurl: guest
inurl: book

Текстовые. ( CMS-ные )
К данному типу относятся стандартные “высказывания” какой либо КМС системы. Все настолько просто что просто ужас: Ну вот на пример я дам вам дам 2 примера на 2 очень популярные CMS системы и вы увидите как легко отпарсить сайты что на одном и том же движке. А для этого нам нужно сделать вот такой банальный запрос:

1)”Регистрация на сайте Напомнить пароль?” – ( набирать запрос с кавычками )Да, да тут будут процентов так 90 одни сайты на DataLife.
2) “Powered by WordPress” – ( опять же брать с кавычками ) Ну тут уже из запроса всё ясно что в серпе будет одни сайты на WordPress.

Также работает это принцип и для гестов, ну как получается база для хрумера?

Региональные:
• По доменым зонам.
Тут идёт классификация уже по зонам. Как бы просто идет парсинг для базы в одной или другой зоне. Я вам тут подготовил списочек зон а пользоваться надо вот так.

site:.com
site:.net
site:.biz
и тп.
Список можете скачать тут : Список зон by Maiami
• По языкам.
Не составит труда узнать как будет слово Регистрация на различных языках. Ну, вы думаю, уже уловили мысль. Для этого просто комбинируйте это слово с запросом из пункта 1 и всё! У вас совсем другой серп.
Запрос будет иметь такой формат:
Intext: Sing Up
Intext: Регистрация
Для ленивых прошу:
Регистрация – русский
Inregistrare – Румынский
Sing Up – Английский
Join– Английский
Registration– Английский
Registro – Испанский
Registrierung – Немецкий

А ведь есть еще вот этот крутой список с языками мира :) А скачать его можно вот тут: Список языков by Maiami

Время-ные:
• Годовые — по дате отзыва.
Так тут уже будет просто фильтровать по первому или последнему посту. Ну, просто вводим какой либо формат даты и ждём. Очень узко уточняющий признак.
Вот примеры:


inurl:guestbook intext:20/06/2008
inurl:guestbook intext:20.06.2008

• Годовые — по Копирайту.

Когда был основан сайт. Тут тоже все просто. Просто делаем что-то типа такого.

inurl:guestbook «Copyright © 2009»
inurl:guestbook «Copyright 2009»
inurl:guestbook «Copyright © 2007—2009»

И опять же чем больше фантазий тем лучше. Можете изменять цифры и формат как хотите.

Титловые:
• Буквеные
Просто в Титле будем искать одну из букв. Это нам будет сужать очень сильно поиск и выдавать все новые гостевые книги, которые до этого Гугл нам не хотел выдавать.
Ну и как всегда примеры:

inurl:guestbook +intitle:b
inurl:guestbook +intitle:q
inurl:guestbook +intitle:r

Как видите все равно результатов много, потому как гостевые книги очень часто делают певцы, актёры и так далее и в Титл домена они прописывают свои инициалы. Всё гениально и просто. А такие гесты в спам базе для хремера очень пиаристные иногда.
• Символьные
Всё также как и смотрим верх ( о как сказал ) но тут уже типа такого:

inurl:guestbook +intitle:&
inurl:guestbook +intitle:’s
– ну тут и буква. Просто так уточняется кому принадлежит
гостевая книга. Многие и забыли про них, а мы нет!
• Словесные
Тут уже слова что относятся к странице постинга. Нужны примеры? Прошу!

inurl:guestbook +intitle:add
inurl:guestbook +intitle:post
inurl:guestbook +intitle:write

И т.п

Так Coffee Break:
Генеральный спонсор банки кофе которую я выпиваю пока пишу этот мануал является: Stimul Cash – Теория парстинга Бабала?

Тематические:
White List key
Очень хорошие гостевые книги как я говорил у актёров или у певцов, на пример. Также можно и спортсменов сюда подключить. Так вот род их деятельности очень часто указывается в Титле. Мы же будем копать в Гугле пока он не выдаст нам всё!

inurl:guestbook +intitle:music
inurl:guestbook +intitle:films
inurl:guestbook +intitle:dance

И т.п
• Black List key
Всё тоже самое но только уже мы убираем то что выше. Так как певцов и актёров у нас много, то наша база для хрумера станет ещё больше.

inurl:guestbook -intitle:music
inurl:guestbook -intitle:films
inurl:guestbook -intitle:dance

Url access:
Url Yes — Где уже есть ссылка.
Тут мы будем выбирать гостевые книги где уже есть ссылки. Это очень важно потому как просто в одном или другом типе может быть запрещено использовать УРЛ. И так я бы разделил этот пункт ещё на 2 пункта.
1) Ссылки от людей
Это ссылки, которые люди оставили, так сказать гостевая книга чистая и если там и есть ссылки, то они только человеческие. Не поверите, до чего иногда бывают гениальные мысли у меня, и до чего гугл любезно нам предоставит информацию.
Пример запросов:


inurl:guestbook +intext:http://myspace
inurl:guestbook +intext:http://flickr
inurl:guestbook +intext:http://flickr
inurl:guestbook +intext:http://facebook.com

2) Ссылки от спама


inurl:guestbook +intext:http://viagra
inurl:guestbook +intext:http://Cialis

А можно и так ещё:


inurl:guestbook +intext: inurl:guestbook +intext:url=http://

Как вы видите у нас получается отличная база для хрумера.
• Url No — Где уже нет ссылка.
Чистые, без ссылок гостевые. Но тут есть вероятность, что и вы не можете оставить ссылку. А может быть и то, что вы со своим креативам вытащили из гула такие гостевые которые не кто раньше и не смог достать, и потому вы будите первый и все сливки будут за вами!

inurl:guestbook -intext:http://
inurl:guestbook -intext:<a href="http://&lt;br"></a> inurl:guestbook -intext:[url=http://

Струкрутные:
• Цепочный УРЛ.
В каком разделе находится гостевая книга, в том разделе и будем её парсить. Разные вебмастера ставят её в разные суб-категорий и потому мы откопали ещё один признак! :)


inurl:guestbook/guestbook.html
inurl:gbook/guestbook.html
inurl:book/guestbook.html


• Раздельный УРЛ ( или простые )


inurl: Guestbook.html

Ну и последнее, но не менее важными, это:

Языки разметки станиц:

• Html

Тольго гостевые на Html
inurl: Guestbook.html
inurl: Gbook.html
inurl: Guest.html

• Php

Тольго гостевые на PHP

inurl: Guestbook.php
inurl: Gbook.php
inurl: Guest.php

• Другие если конечно они есть :)

Все с креативной частью мы уже завязали и все наши признаки для парсинга базы данных для хрумера сохраняем в TXT файл.

Для того чтоб не пропустить следующий мануал подпишитесь на RSS.

Так теперь идём в программу Агрессора и там есть уже загрузить список запросов что мы сделали, для этого есть кнопка Из Файла ( я на скрине отметил ).

Ставим галку автосохранение и выбираем поисковик Google.txt

Спам база для хрумера.

Так не забываем подписаться на Rss ленту так как скоро я буду писать про то как работает парсер самый элементарный при помощи которого вы сможете себе собрать отличную базу практически с любого сайта!

Ну а с спам базой для хрумера мы завизали. Желаю вам удачи и жду ваши комментарий.

Republished by Blog Post Promoter