Archive for Декабрь 23rd, 2007

Гугль и inurl

Перед тем как спамить форумы нужно собрать ссылки. Обычно, для сбора используется следующая конструкция
inurl:phpbb key word

Однако, гугль внес ограничение на подобные запросы.

Я вышел из ситуации простым образом.
Разместил скрипт парсинга гугля на нескольких IP, а потом стал вызывать эти скрипты в случайном порядке. Между запросами ввел паузу 2 секунды. Собирает результаты парсинга десктопная программа.

Кстати, может быть вы не знаете, что для получения обратных ссылок иногда достаточно зарегистрировать пользователя в форуме. Даже если вы не спамите форум, то в случаях, когда, хозяин форума не запретил индексацию каталога пользователей на форуме вы можете получить обратную ссылку.

Массовая проверка ссылок

Каждому спамщику интересно размещать посты по возможности только в те ресурсы, которые не помечены nofollow.

Вот скрипт, который решит вашу проблему:

< ***?php

set_time_limit(0);

$file_ok = 'found.txt';
$file_bad = 'not_found.txt';

if (($fh_ok = fopen($file_ok, 'w')) === FALSE)
exit("error open file $file_ok\n");

if (($fh_bad = fopen($file_bad, 'w')) === FALSE)
exit("error open file $file_bad\n");

$fp=fopen("urls.txt", "r");
while($url=trim(fgets($fp)))
{
$data=file_get_contents($url);
$params ='/nofollow/';
if (preg_match_all ($params, $data, $match, PREG_SET_ORDER))
fwrite($fh_ok, "$url\n");
else
fwrite($fh_bad, "$url\n");
}

fclose($fp);

fclose($fh_ok);
fclose($fh_bad);

?***>

В urls.txt - ссылки для проверки.
В found.txt и not_found.txt будет записываться результат

Читайте по теме:
http://www.nulled.ws/showthread.php?t=40313

Кстати, если вы хотите проверить, есть ли форма на странице, то можно вместо «nofollow» написать «form»