Уникод
Унико́д — стандарт кодирования знаков, позволяющий представить знаки практически всех письменных языков.
Применение уникода позволяет закодировать очень большое число знаков из разных письменностей: в уникодовых документах могут соседствовать китайские иероглифы, математические знаки, буквы греческого алфавита, латиницы и кириллицы, при этом становится ненужным переключение кодовых страниц.
Уникод «Unicode»Править
В настоящее время массовое распространение имеет лишь одна реализация уникода под названием «Unicode» («Юникод»), предложенный организацией «Unicode Consortium, Unicode Inc.».
Этот стандарт предложен в 1991 году. Он состоит из двух основных разделов: универсальный набор знаков и семейство кодировок. Универсальный набор знаков задаёт однозначное соответствие знаков кодам — элементам кодового пространства, представляющим неотрицательные целые числа. Семейство кодировок определяет машинное представление последовательности кодов универсального набора знаков.
Коды в стандарте «Юникод» разделены на несколько областей. Область с кодами от U+0000 до U+007F содержит знаки набора «ASCII» с соответствующими кодами. Далее расположены области знаков различных письменностей, знаки пунктуации и технические знаки. Часть кодов зарезервирована для использования в будущем.
Вопрос нерусскостиПравить
Необходимо отметить, что этот стандарт составляется в значительной степени нерусью, которая всячески не приемлет всё, что связано с Россией. Поэтому ею отвергаются все предложения о вносе в их стандарт знаков, как-нибудь связанных с Россией (за исключением вынужденного включения кириллицы и глаголицы, совершённого с целью удовлетворять определению уникода).
Особенно наглядны здесь ответы (вероятно) некоего представителя организации, разрабатывающей «Unicode», на одной из страниц русскоязычной Википедии:
We'll NEVER add Soviet quality mark! ... 91.77.70.110 19:43, 30 августа 2011 (UTC)
(в ответ на предложение внести в стандарт государственный знак качества СССР; особенно примечательно, как яростно, в неистовстве звериной русофобии, брызгая слюной, этот комментатор визжит: «НИКОГДА!»);
Этим печатайте: 2Y̴ 91.77.91.115 14:26, 29 октября 2010 (UTC)
(в ответ на предложение внести в стандарт знак рубля).
Это при том, что в «Юникоде» имеются кучи знаков-картинок и знаков, вообще к письменности отношения не имеющих и, по идее, не должных размещаться в стандарте на уникод. Особенно здесь выделяются наборы из многих сотен символов наподобие кучи дерьма (U+1F4A9) или борделя (U+1F3E9). Или же, например, хотя советский знак качества ими отвергается, в стандарт внесено целых четыре символа частной японской почтовой компании (U+3012, U+3020, U+3036, U+1F3E3). Примечателен и символ, изображающий карту Японии (U+1F5FE), включающую несколько Курильских островов, принадлежащих России.
Кроме того, явствует изначальная направленность упорядочивания знаков и некоторых изображений знаков в этом стандарте на западного потребителя и латинский алфавит.
РешениеПравить
Единственным решением этой задачи видится лишь разработка нового ГОСТа на уникод (который одновременно заменит и старые на однобайтовые кодовые страницы) и отказ от нерусского стандарта «Unicode».