The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

TextCat - implementation of the text categorization algorithm

15 Sep 2004
TextCat - implementation of the text categorization algorithm
Реализация алгоритма "N-Gram-Based Text Categorization" (на Perl) статистического анализа текста для автоматического определения языка на котором написан текст (для русского языка производится также определение кодировки).
  • Статья отражающая суть алгоритма (на русском языке).
  • http://odur.let.rug.nl/~vannoord/TextCat/
    Полезные Perl модули.
    Преобразование из одной кодировки в другую

     Добавить ссылку
     
     Поиск ссылки (regex):
     

    Последние заметки
    << Предыдущие 15 записей




    Партнёры:
    PostgresPro
    Inferno Solutions
    Hosting by Hoster.ru
    Хостинг:

    Закладки на сайте
    Проследить за страницей
    Created 1996-2025 by Maxim Chirkov
    Добавить, Поддержать, Вебмастеру