The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



Индекс форумов
Составление сообщения

Исходное сообщение
"Первый релиз многопоточного HTML-парсера MyHTML"
Отправлено opennews, 13-Июл-16 20:16 
После нескольких месяцев разработки увидел свет первый релиз (https://github.com/lexborisov/myhtml/releases/tag/v1.0.1) быстрого HTML парсера MyHTML (https://github.com/lexborisov/myhtml/). Код написан на языке Си и распространяется под лицензией  LGPL v2.1.


Особенности  MyHTML:


-  Высокая производительность;
-  Асинхронная обработка токенов и построение дерева
-  Полная поддержка спецификаций HTML 5 (https://html.spec.whatwg.org/multipage/), по состоянию на 19.06.2016;
-  Возможность манипулировать элементами и их атрибутами: добавлять, удалять, изменять
-  Поддерживает 39 кодировок на входе. На выходе только UTF-8, вся работа внутри только в UTF-8
-  Автоматическое определение кодировки текста. Сейчас доступны unicode: UTF-8, UTF-16LE, UTF-16BE (+ определение по BOM) и русские: windows-1251, koi8-r, iso-8859-5, x-mac-cyrillic, ibm866
-  Может работать в Single Mode — без тредов. Так же может быть собран без потоков.
-  Возможность парсить фрагменты HTML или парсить кусками (chunks);
-  Не имеет внешних зависимостей;
-  Поддерживает C99;
-  Не испытывает проблем если на вход подать бинарный файл или не валидный HTML;

Проект также предоставляет большую подборку примеров (https://github.com/lexborisov/myhtml/tree/master/examples) по использованию и описание API (https://github.com/lexborisov/myhtml/blob/master/include/myh...). На основе данного проекта будет разрабатывается рендер HTML на "голом" Си без зависимотей. Скоро будет завершён CSS-парсер MyCSS (https://github.com/lexborisov/mycss).

URL: https://github.com/lexborisov/myhtml/releases/tag/v1.0.1
Новость: https://www.opennet.ru/opennews/art.shtml?num=44782

 

Ваше сообщение
Имя*:
EMail:
Для отправки ответов на email укажите знак ! перед адресом, например, !user@host.ru (!! - не показывать email).
Более тонкая настройка отправки ответов производится в профиле зарегистрированного участника форума.
Заголовок*:
Сообщение*:
 
При общении не допускается: неуважительное отношение к собеседнику, хамство, унизительное обращение, ненормативная лексика, переход на личности, агрессивное поведение, обесценивание собеседника, провоцирование флейма голословными и заведомо ложными заявлениями. Не отвечайте на сообщения, явно нарушающие правила - удаляются не только сами нарушения, но и все ответы на них. Лог модерирования.



Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру