> Представьте себе, далеко не многим это нужно, так как фейл с недоступностью
> Xов случается очень редко.А что, ты ставишь иксы на серваки, например? Или почему на серваке должно быть нельзя по людски побраузить допустим содержимое ФС при локальном доступе?
> Проводник с поддержкой UTF с локализацией найдётся. ;)
Сдается мне что там где проводник - у тебя таки не иксы. Палишься.
>> европейская UTF8->CP437.
> Это неочевидно.
Это некромантично. Ибо уникод ну никак не трамбуется в 1-байтную кодировку. Попробуй одновременно нарисовать русский текст, английский текст и японские иероглифы. Для уникода это совершенно нормально. А вот как этот топор такое будет обрубать до 1 байта чтобы оно потом еще и читалось - вот это уже не очевидно.
> А маргиналы, да, прописывают...
Нормальные люди просто используют уникод и не имеют проблем ни с значками вопроса, ни проблем с маппингом слона в клетку для канарейки. Почему бы просто не признать что слону требуется более просторный вольер чем 2^8 = 256 вариантов? :)
> Что поделаешь — наследие Си из 1970-х
Сам по себе си нормально относится к тому же UTF-8, если работать со строками как с массивами байтов.
>, когда целые числа представлялись 16 битными
> значениями адресной шины процессора DEC
EPIC FAIL. Адресная шина пересылает только адреса ("указатели" в си - это именно адреса, в простейшем случае в классической микропроцессорной системе - запрошенный адрес влобовую выставляется на шине адреса как комбинация битов на линиях шины, в современных машинах все сложнее). При 16 битах на адрес логично что размер указателя может быть (и даже вероятно будет) 2 байта (16 битов). Потому что 2 байта адресуют любой закоулок памяти такой системы и вообще, влобовую выставляются как комбинация 16 линий шины адреса (что очень удобно для простых систем, а сложные тогда делать не умели).