Подскажите, а по какой фразе парсили и как авто распознавали – на примере существующих или вручную?
Господа! Всего лишь умение пользоваться гуглом =))
Для примера возьмём “Каталог для обмена ссылками Veton”:

Смотрите какие особенности этого каталога в плане адреса: links_ex.php
Забиваем в google и в яндекс:

inurl:”links_ex.php”

В итоге получаем-
Цитата:
Яндекс- Нашлось 2916 страниц
Google – примерно 10 700
Поисковики не дадут нам выпарсить все результаты, т.к. есть ограничения ~1000
Соответственно нужно опять выё….я. Применяем тот же запрос, но прибавив разделение по региональным зонам урла.
Получается:


inurl:”links_ex.php” inurl:com
inurl:”links_ex.php” inurl:net

и т.д.
Когда даёшь такие запросы, то бывает что серч выдаёт ещё больше, тогда применяем ещё и текстовый запрос. Известно, что польза от ссылок будет с тематических ресурсов, соответственно будем искать тематические….


inurl:”links_ex.php” inurl:com Строительство
inurl:”links_ex.php” inurl:com Недвижимость

Ну и всё в таком духе…. Я если и пользуюсь паблик базами, то только о которых были нормальные отзывы. Делаю прогон какого нибудь “левенького сателитика” и по тем, которые попали в успешно прогоняю нормальный сайт.
Это было что касается “примет” ссылок. Но бывает, что ссылки можно изменять…. НО! Ведь 80% движков сделаны по-определённой схеме и структуре, да и с последующими версиями ОПИСАНИЕ мало меняется….
Соответственно применяем “вариант поиска дублей”. Заходим в понравившуюся CMS и смотрим “примечательные фразы” в описании и т.д.(на примере того же движка Veton):
Цитата:
Делаем запрос:
Обмен ссылками URL вашего сайта*: URL где стоит ссылка на: E-mail*: Раздел*: Url баннера 88×31: (можно flash) Название ссылки: Описание для ссылки*: (Только текст, НЕ html код)

И получаем
Цитата:
Яндекс- Нашлось 4123 страниц
Google – примерно 14 000

Конечно попадается много мусора, НО… Мне пох…. =))
Дальше прогоняем на полуавтомате ~20-30 каталогов и те из которых получился автомат, используем для ЭТАЛОНА АВТО
Если мозги есть и руки под клаву заточены, а не под х… то после 2-3 парсов и деланий авто, у Вас всё будет на авто… =)))
В качестве парсера использую Аллсаб 5.9 лиц. Если у кого нет лицухи, то пользуйте Агресс Парсер. Агресс прекрасно работает с серчами, но нужно настроить.(Я умудрялся им даже тексты парсить=)) )

Re:
Кроме выше описанного, могу порекомендовать перевести некоторые поисковые запросы на укр. и бел. языки. К примеру, “Добавить объявление” – “Додати оголошення” и т. д. Пару сотен новых точно найдёте.

Republished by Blog Post Promoter

Tags:

Related posts