Archive for the 'PHP' Category

Как поменять «2007 год» на «2008 год» на PHP

Так повелось, что львиную долю своих проектов я делю в HTML формате. Что оказывается, несколько неудобным, когда нужно исправить определенную ошибку в текстовых файлах или требуется поменять год копирайта, например, с 2007 на 2008

Ниже привожу код PHP программы которая решает эту проблему. Если кому не понятен код, то задавайте вопросы.

Read the rest of this entry »

Подбор синонимов на PHP – это очень просто

Привожу кусок PHP программы, которая позволяет менять одни слова на другие (делать подбор синонимов). Сам написал код за 30 минут. Думаю и вам не составит труда понять что к чему, поэтому комментарии опускаю.

Структура файла для синонимов vocabulary.txt следующая:
Исходное Слово | Слово Замены

Скрипт производит три файла: один с заменой синонимов, другие с выделением жирным шрифтом заменяемых слов.

В предыдущих постах ищите словари английского языка.

Может быть у вас есть мысли о том, как часто нужно заменять слова (подбор синонимов), чтобы гугль не понял подлога. Мне кажется, что нужно заменять каждое пятое слово. Потому что гугль слабо понимает конструкции из пяти и большего количества слов.

Кусок программы “подбора синонимов”

Read the rest of this entry »

Как сделать задержку времени на PHP

В настоящее время стало не так то просто парсить (скачивать, анализировать) чужие ресурсы. Умные люди ввели бан за слишком частое обращение к их ресурсам.

Хорошо бы иметь в арсенале PHP команду, типа wait (подождать). Но, такой команды, на сколько я знаю, нет.

Выход из ситуации двух вариантный:
- выстроить очередь из запросов, а запросы выполнять по команде crone
- написать свою команду задержки времени.

Я пошел вторым путем и там где нужно вставить задержку добавляю следующую конструкцию:
Read the rest of this entry »

Гугль и inurl

Перед тем как спамить форумы нужно собрать ссылки. Обычно, для сбора используется следующая конструкция
inurl:phpbb key word

Однако, гугль внес ограничение на подобные запросы.

Я вышел из ситуации простым образом.
Разместил скрипт парсинга гугля на нескольких IP, а потом стал вызывать эти скрипты в случайном порядке. Между запросами ввел паузу 2 секунды. Собирает результаты парсинга десктопная программа.

Кстати, может быть вы не знаете, что для получения обратных ссылок иногда достаточно зарегистрировать пользователя в форуме. Даже если вы не спамите форум, то в случаях, когда, хозяин форума не запретил индексацию каталога пользователей на форуме вы можете получить обратную ссылку.

Массовая проверка ссылок

Каждому спамщику интересно размещать посты по возможности только в те ресурсы, которые не помечены nofollow.

Вот скрипт, который решит вашу проблему:

< ***?php

set_time_limit(0);

$file_ok = 'found.txt';
$file_bad = 'not_found.txt';

if (($fh_ok = fopen($file_ok, 'w')) === FALSE)
exit("error open file $file_ok\n");

if (($fh_bad = fopen($file_bad, 'w')) === FALSE)
exit("error open file $file_bad\n");

$fp=fopen("urls.txt", "r");
while($url=trim(fgets($fp)))
{
$data=file_get_contents($url);
$params ='/nofollow/';
if (preg_match_all ($params, $data, $match, PREG_SET_ORDER))
fwrite($fh_ok, "$url\n");
else
fwrite($fh_bad, "$url\n");
}

fclose($fp);

fclose($fh_ok);
fclose($fh_bad);

?***>

В urls.txt - ссылки для проверки.
В found.txt и not_found.txt будет записываться результат

Читайте по теме:
http://www.nulled.ws/showthread.php?t=40313

Кстати, если вы хотите проверить, есть ли форма на странице, то можно вместо «nofollow» написать «form»

Бредогенератор своими руками

Для работы скрипта требуется файл с фразами (На каждую строку одно предложение). Скрипт будет перемешивать фразы. На выходе получается * файлов с бредоподобным текстом. Результат будет более читабельный, чем если бы делали Марковым. Хотя я Марковские тексты не создавал, но, интуитивно понятно, что человек напишет текст более понятный, чем напишет машина.

Где взять исходный материал для бредогенератора? Можно пойти в гугль и взять его снипы. Можно взять тексты конкурентов и перемешать их.

Где употреблять бредогенератор? Например, говорят, что для десяти схожих программ невозможно придумать 10 уникальных описаний. Враки! Расскажу как получить «качественный результат». Берете тексты по теме. Перемешиваете бредогенератором. И получаете 10 уникальных текстов. Полученные тексты в свою очередь нужно лишь пробежать глазами и поправить.

Как вы думаете, нужен такой сервис? Представьте. Вы задаете ключевые слова, а на выходе получаете уникальный читабельный бредо-текст по теме! Здорово, правда?

Нужно ли публиковать тексты? Или идея и так понятна?

Пишу утилиту для переиначивания текстов

Ищу средство для переписывания текстов. А это отчет о найденных словарях синонимов.

Обратите внимание на вот это http://wordweb.info/free/ - программулина ищет отдельные английские синонимы, антонимы, близкие слова. Средство хорошо для ручного подбора слов и вдумчивой работой над англоязычным текстом.

База русскоязычных синонимов вот здесь:
http://rapidshare.com/files/70146189/RusSyn.rar - 10мб синонимов. Готовая для использования штука.

База синонимов русская
http://slovari.yandex.ru/dict/abramov/
http://depositfiles.com/ru/files/2491717 - а это как я понял рузультат парсинга. 100кб.

http://wordnet.princeton.edu/ - Nouns, verbs, adjectives and adverbs are grouped into sets of cognitive synonyms (synsets), each expressing a distinct concept. Synsets are interlinked by means of conceptual-semantic and lexical relations. The resulting network of meaningfully related words and concepts can be navigated with the browser.
http://www.englspace.com/dl/files/oxfrd_s.zip - база синонимов 5мб в развернутом виде

Read the rest of this entry »

Random articles для сайта с 1000 страницами

Известно, что гугль без особой охоты индексирует сложные каталоги. Очевидное решение сделать карту сайта. Но, это слабо помогает, если на сайте под тысячи страниц. Гугль просто не ходит по многоуровневым подкаталогам.

Решить проблему может добавка раздела «Random 10 articles from this site». Скрипт занимает 100 строчек команд.

Вот самая необходимая часть скрипта:
Read the rest of this entry »

Наезд на Блогоферму

Прочитал в аналах Интернета наезды на тебя по поводу БлогоФермы. Не буду говорить о том плоха или хороша ферма - я ее не использовал. А вот с автором фермы имею шапочное знакомство.

На сколько понял, автор взял несколько PHP классов, объединил их оболочкой из 10-50 php строк и стал это дело продавать.

Нашлись охотники доказать, что автор крипта продает воздух. Потому что все это пишется за раз-два-три. Вот молодцы! Почему сами не написали?

Мда. На ошибках учатся. Нельзя раздавать скрипты. Чтобы его каждый школьник мог оплевать.

Спасибо за науку. Если буду продавать, то только сервис. Только сервис! у меня была мысль продавать программу для формирования бредо каталогов. Теперь буду думать только о сервисах!

Странно, основная битва была на хаккерском сайте нуллед.

Помешательство на общении

У меня есть группа http://vkontakte.ru/club603532
По популярности группа дает 1000 очков вперед специально созданному форуму www.makeself.ru

Любители общаться концентрируются на определенных сервисах?

Вот что нашел не тему общения:

Twitter.com. Это сервис для любителей пообщаться, который с каждым днём становится популярнее на Западе, и все его функции направлены на поддержание динамики жизни, на быструю связь со знакомыми.
“Твиттер” - это блоговый движок, который с самого начала связывает пользователя по рукам и ногам. Начать стоит с того, что длина постинга ограничена 140 символами, а постинги друзей можно получать в виде SMS на мобильный телефон.
Читайте дальше http://www.computerra.ru/online/files/316235/

А вот специальный класс для работы с twitter
http://www.phpclasses.org/browse/package/4216.html
This class can be used to update the status of a Twitter user. It accesses the Twitter site and authenticates on behalf of a given user. The class can post a new message with the status of the authenticated user.

Набор классов для работы с социальными сетями
http://www.phpclasses.org/browse/class/97.html

http://www.phpclasses.org/browse/class/152.html - классы по работе с блогами.

http://www.phpclasses.org/browse/package/3761.html - импорт сообщений с блогера на сайт.