The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



Индекс форумов
Составление сообщения

Исходное сообщение
"Группировка сайтов в LightSquid"
Отправлено lightsquid, 18-Дек-08 20:18 
>и еще: как сделать так, что бы сайты с www и без,
>показывались как один?

ищем в lightparser.pl
    #simplified some common banner system & counters
    $url=$Lurl;
    $url =~ s/([a-z]+:\/\/)??.*\.(spylog\.com)/$1www.$2/o;
    $url =~ s/([a-z]+:\/\/)??.*\.(yimg\.com)/$1www.$2/o;
    $url =~ s/([a-z]+:\/\/)??.*\.(adriver\.ru)/$1www.$2/o;
    $url =~ s/([a-z]+:\/\/)??.*\.(bannerbank\.ru)/$1www.$2/o;
    $url =~ s/([a-z]+:\/\/)??.*\.(mail\.ru)/$1www.$2/o;
    $url =~ s/([a-z]+:\/\/)??.*\.(adnet\.ru)/$1www.$2/o;
    $url =~ s/([a-z]+:\/\/)??.*\.(rapidshare\.de)/$1www.$2/o;
    $url =~ s/([a-z]+:\/\/)??.*\.(rapidshare\.com)/$1www.$2/o;

ну и по шаблону дописуем нужное ...
c колличеством надо смотреть, что нужно, и как оно повлияет на скорость парсинга


        $site=~ s{(.*?)\.vkontakte\.ru}{vkontakte\.ru}o;
        $site=~ s{(.*?)\.vkadre\.ru}{www\.vkadre\.ru}o;
        $site=~ s{(.*?)\.top\.list\.ru}{1\.top\.list\.ru}o;
        $site=~ s{(.*?)\.myspacecdn\.com}{www\.myspacecdn\.com}o;
        $site=~ s{(.*?)\.youtube\.com}{www\.youtube\.com}o;
        $site=~ s{(.*?)\.imageshack\.us}{www\.imageshack\.us}o;
        $site=~ s{(.*?)\.photobucket\.com}{www\.photobucket\.com}o;
        $site=~ s{u\d+\.eset\.com}{updates\.eset\.com}o;
        $site=~ s{ts\d+\.eset\.com}{updates\.eset\.com}o;
        $site=~ s{89\.202\.157\.13[5-9]}{updates\.eset\.com}o;
        $site=~ s{(.*?)\.depositfiles\.com}{www\.depositfiles\.com}o;
        $site=~ s{(.*?)\.odnoklassniki\.ru}{www\.odnoklassniki\.ru}o;
        $site=~ s{(.*?)\.facebook\.com}{www\.facebook\.com}o;
        $site=~ s{download\d+\.avast\.com}{download\.avast\.com}o;
        $site=~ s{.\d+\.radikal\.ru}{cdn\.radikal\.ru}o;
        $site=~ s{.*?\.foto\.radikal\.ru}{cdn\.foto\.radikal\.ru}o;
        $site=~ s{khm\d+\.google.com}{maps\.google\.com}o;
        $site=~ s{kh\d+\.google.com}{maps\.google\.com}o;
        $site=~ s{mt\d+\.google.com}{maps\.google\.com}o;
        $site=~ s{tbn\d+\.google.com}{tbn\.google\.com}o;
        $site=~ s{mlt\d+\.google.com}{mlt\.google\.com}o;
        $site=~ s{(.*?)\.ifolder\.ru}{www\.ifolder\.ru}o;
        $site=~ s{(.*?)\.mystat-in\.net}{www\.mystat-in\.net}o;
        $site=~ s{(.*?)\.photosight\.ru}{www\.photosight\.ru}o;
        $site=~ s{(.*?)\.mylivepage\.com}{www\.mylivepage\.com}o;
        $site=~ s{(.*?)\.imagevenue\.com}{www\.imagevenue\.com}o;
        $site=~ s{(.*?)\.adskape\.ru}{www\.adskape\.ru}o;
        $site=~ s{(.*?)\.tbn\.ru}{www\\.tbn\.ru}o;
        $site=~ s{(.*?)\.fotki\.com}{www\.fotki\.com}o;
        $site=~ s{(.*?)\.deviantart\.com}{www\.deviantart\.com}o;
        $site=~ s{(.*?)\.rutube\.ru}{rutube\.ru}o;


список из текущих экспериментов, так что смотрите внимательно
будет утиль для построцессига, чтоб можно было в уже существующем отчете объеденить такие сайты ...

 

Ваше сообщение
Имя*:
EMail:
Для отправки новых сообщений в текущей нити на email укажите знак ! перед адресом, например, !user@host.ru (!! - не показывать email).
Более тонкая настройка отправки ответов производится в профиле зарегистрированного участника форума.
Заголовок*:
Сообщение*:
  Введите код, изображенный на картинке: КОД
 
При общении не допускается: неуважительное отношение к собеседнику, хамство, унизительное обращение, ненормативная лексика, переход на личности, агрессивное поведение, обесценивание собеседника, провоцирование флейма голословными и заведомо ложными заявлениями. Не отвечайте на сообщения, явно нарушающие правила - удаляются не только сами нарушения, но и все ответы на них. Лог модерирования.

На сайте действует частичное премодерирование - после публикации некоторые сообщения от анонимов могут автоматически скрываться ботом. После проверки модератором ошибочно скрытые сообщения раскрываются. Для ускорения раскрытия можно воспользоваться ссылкой "Сообщить модератору", указав в качестве причины обращения "скрыто по ошибке".



Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру