Реклама:

Таненбаум Э.- Архитектура компьютера. стр.113

Печатные ASCII-символы включают буквы верхнего и нижнего регистров, цифры, знаки пунктуации и некоторые математические символы (табл. 2.5).

Таблица 2.5. Таблица кодов для печатных ASCII-символов

 

с;

 

с;

 

с;

 

с;

 

с;

   

ело

мво

ело

мво

ело

мво

ело

мво

ело

мво

ело

MBO

S

S

S

S

S

S

S

S

S

S

s

s

т

о

т

о

т

о

т

о

т

о

X

о

(про-

@

р

«

p

 

бел)

                   

!

А

Q

а

Q

 

В

R

b

R

#

С

S

с

S

$

D

Т

d

T

%

Е

и

е

и

&

F

V

f

V

'

G

W

g

w

(

Н

X

h

X

)

I

Y

i

Y

*

ЗА

 

J

Z

i

7A

z

+

ЗВ

;

К

[

k

7B

{

 

ЗС

<

L

\

I

7C

I

2D

-

3D

=

4D

М

5D

6D

m

7D

}

 

ЗЕ

>

N

 

n

7E

~

2F

/

3F

?

4F

О

5F

 

6F

7F

DEL

UNICODE

Компьютерная промышленность развивалась преимущественно в США, что привело к появлению кода ASCII, более подходящего для английского языка, чем для других языков. Во французском языке есть надстрочные знаки, в немецком — умляуты и т. д. В некоторых европейских языках есть несколько букв, которых нет в наборе ASCII-символов. Некоторые языки имеют совершенно другой алфавит (например, русский или арабский), а у некоторых вообще нет алфавита (например, китайский). Компьютеры распространились по всему свету, и поставщики программного обеспечения хотят реализовывать свою продукцию не

только в англоязычных, но и в тех странах, где большинство пользователей не говорят по-английски и нужен другой набор символов.

Первой попыткой расширения кода ASCII стал стандарт IS 646, который добавлял к набору ASCII-символов еще 128 символов, в результате чего получился 8-разрядный набор под названием Latin-1. Добавлены были в основном латинские буквы со штрихами и диакритическими знаками. Следующей попыткой был стандарт IS 8859, который ввел понятие кодовой страницы. Кодовая страница — набор из 256 символов для определенного языка или группы языков, в IS 8859-1 это набор Latin-1. Стандарт IS 8859-2 включает славянские языки с латинским алфавитом (например, чешский, польский и венгерский), стандарт IS 8859-3 описывает символы турецкого, мальтийского и галисийского языков, эсперанто и т. д. Главным недостатком такого подхода является то, что программное обеспечение должно контролировать, с какой именно кодовой страницей оно имеет дело, при этом смешивать языки недопустимо. К тому же эта система не охватывает японский и китайский языки.

Группа компьютерных компаний разрешила эту проблему, создав новую систему кодирования под названием UNICODE, и объявила эту систему международным стандартом (IS 10646). UNICODE поддерживается некоторыми языками программирования (например, Java), некоторыми операционными системами (например, Windows NT) и многими приложениями. Вероятно, эта система будет распространяться по всему миру.

Основная идея UNICODE — приписать каждому символу единственное постоянное 16-разрядное значение, которое называется указателем кода. Многобайтные символы и символы-заменители не используются. Поскольку каждый символ состоит из 16 бит, писать программное обеспечение гораздо проще.


⇐ Предыдущая страница| |Следующая страница ⇒