The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



Индекс форумов
Составление сообщения

Исходное сообщение
"Атака Trojan Source для внедрения изменений в код, незаметны..."
Отправлено keydon, 03-Ноя-21 13:17 
>>Что ж в этом правильного?
> Юникод рационален, поэтому правилен.

От того что вы называете его рациональным, рациональнее он не становится.

> Флуд. А если по делу, то UTF-8 придумали отцы юниксоиды специально для
> англоговорящих стран, в нём неиспользуемые, или же малоиспользуемые символы кириллицы
> кодируются дополняющимися битами. Китайцы выбрали UTF-16 и UTF-32 потому-что их иероглифы
> не помещаются в 8 бит.

И что это меняет? У нас есть 3 довольно сильно отличающихся кодировки и еще 4 вариации с различным BOM.

Как мы можем определить длину последовательности?
1) Зафиксировать длину (быстро, не расширяемо)
2) Обозначить динамически символом (зато все поместится)
Что делает юникод? Он для толстого UTF-32 ФИКСИРУЕТ длину кода, а для UTF-8 и UTF-16 НЕ ФИКСИРУЕТ длину кода. Так что и в микроконтроллеры не засунешь и гигабайты текста не сэкономишь на суперкомпьютере. И не быстрый (потому что диакритические знаки, парные символы, регистр превращает в другой символ, вот это все) и не ультимативно функциональный (потому что что-то недопихали) и не простой (потому что фарша гораздо больше чем может переварить большинство разработчиков).

Немного про нейминг:
UTF-8 с динамической длинной кодирования 8 бит (вообще-то больше, но потом его ограничили. зачем?)
UTF-16 с динамической длинной кодирования 16 бит
UTF-32 с фиксированной длинной кодирования в 32 бит. WHAT? Почему же он называется также как и UTF-8 и UTF-16? Я могу решить что он тоже с динамической длиной.

Также и с BOM напрашивается 2 стратегии:
1) всегда один и тот же BOM (хорошо для стандартизации и обмена)
2) для разных архитектур разный BOM (хорошо для производительности на некоторых архитектурах, плохо для всего остального)
Что делает Юникод для UTF-16 и UTF-32? Правильно не стандартизирует и не претендует на скорость. Т.е. худшее из двух миров.

Зачем вообще нужен UTF-32 если он и не быстрый и все алфавиты не покрывает, но включает много чего ненужного? Да никто не знает. Он просто есть.

>>А еще 2 вида BOM добавим!
> Ты ошибся адресом, Юникод тут не причём. Отправляй претензию программистам текстовых редакторов.

Не знаю повлияли ли как то на это текстовые редакторы, но виды BOM зафиксированы в стандартах юникода. Если их не под пытками добавили, то я по адресу.

>>А давайте запихнем в юникод знаки вымершей цивилизации, алхимические знаки, древнеегипетский или древнепермское письмо
> Что предлагаешь? Исследователям и учёным вместо символов векторные картинки всталять,
> ты серъёзно?

А ты серьезно предлагаешь сначала на основании недостаточной длины кодирования символа придумать новые кодировки (UTF-16, 32), а потом забивать пространство "кодировки 21 века" плохоизученным древнегипетским? Завтра откопают альтарь ктулху, его символы тоже будешь добавлять? А что насчет графиков? Их тоже векторными картинками вставлять? Зачем такие полумеры? Может тогда сразу к растру перейдем - как кодируется, так и рисуется? Кроме того я не видел в научных кругах никого кто писал бы формулы юникодом (и ты тоже так не делаешь).

>>Так давайте добавим символы заставляющие текст писать справа налево
> Арабский мир щемишь? Они же с лева направо пишут.

Нет, китайцев. Они же сверху вниз пишут и для них ничего такого нет. Или древних ливийцев.  Логично что для кого-то есть а для кого-то нет?

> Ты видимо решил процитировать всю Википедию? Ешё раз тебе говорю, Юникод -
> дна из самых лучших вещей, которое сделало человечество.

Повторяй это почаще.

 

Ваше сообщение
Имя*:
EMail:
Для отправки ответов на email укажите знак ! перед адресом, например, !user@host.ru (!! - не показывать email).
Более тонкая настройка отправки ответов производится в профиле зарегистрированного участника форума.
Заголовок*:
Сообщение*:
  Введите код, изображенный на картинке: КОД
 
При общении не допускается: неуважительное отношение к собеседнику, хамство, унизительное обращение, ненормативная лексика, переход на личности, агрессивное поведение, обесценивание собеседника, провоцирование флейма голословными и заведомо ложными заявлениями. Не отвечайте на сообщения, явно нарушающие правила - удаляются не только сами нарушения, но и все ответы на них. Лог модерирования.



Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру