Кожен символ займає два байти та кодується певним числом. У C# використовується кодування Unicode.
Всього у двох байтах можна закодувати 65536 символів.
Коди всіх символів містяться у спеціальних кодувальних таблицях і збігаються з їх порядковими номерами у цих таблицях.
Коди в стандарті Unicode зазвичай записують у шістнадцятковому форматі. Вони поділені на кілька областей.
Область з кодами від U+0000 до U+007F містить символи набору ASCII, і коди цих символів збігаються з їх кодами в ASCII.
| Код | Символ | Код | Символ | Код | Символ | Код | Символ |
|---|---|---|---|---|---|---|---|
| 0 | 32 | 64 | @ | 96 | - | ||
| 1 | ○ | 33 | ! | 65 | A | 97 | a |
| 2 | ● | 34 | " | 66 | B | 98 | b |
| 3 | ▼ | 35 | # | 67 | C | 99 | c |
| 4 | ♦ | 36 | $ | 68 | D | 100 | d |
| 5 | ♣ | 37 | % | 69 | E | 101 | e |
| 6 | ♦ | 38 | & | 70 | F | 102 | f |
| 7 | • | 39 | ' | 71 | G | 103 | g |
| 8 | ■ | 40 | ( | 72 | H | 104 | h |
| 9 | 41 | ) | 73 | I | 105 | i | |
| 10 | ✅ | 42 | * | 74 | J | 106 | j |
| 11 | ✅ | 43 | + | 75 | K | 107 | k |
| 12 | ○ | 44 | , | 76 | L | 108 | l |
| 13 | ✅ | 45 | - | 77 | M | 109 | m |
| 14 | ♫ | 46 | . | 78 | N | 110 | n |
| 15 | ☆ | 47 | / | 79 | O | 111 | o |
| 16 | ► | 48 | 0 | 80 | P | 112 | p |
| 17 | ✅ | 49 | 1 | 81 | Q | 113 | q |
| 18 | ↑ | 50 | 2 | 82 | R | 114 | r |
| 19 | !! | 51 | 3 | 83 | S | 115 | s |
| 20 | ¶ | 52 | 4 | 84 | T | 116 | t |
| 21 | § | 53 | 5 | 85 | U | 117 | u |
| 22 | — | 54 | 6 | 86 | V | 118 | v |
| 23 | ↑ | 55 | 7 | 87 | W | 119 | w |
| 24 | ↑ | 56 | 8 | 88 | X | 120 | x |
| 25 | ↓ | 57 | 9 | 89 | Y | 121 | y |
| 26 | › | 58 | : | 90 | Z | 122 | z |
| 27 | < | 59 | ; | 91 | [ | 123 | { |
| 28 | ⊥ | 60 | < | 92 | \ | 124 | | |
| 29 | < > | 61 | = | 93 | ] | 125 | } |
| 30 | ▲ | 62 | > | 94 | ^ | 126 | ~ |
| 31 | ▼ | 63 | ? | 95 | _ | 127 | ◇ |
Далі розташовані області символів інших систем письма та технічні символи. Частина кодів зарезервована для використання у майбутньому.
Під символи кирилиці виділені області знаків з кодами: від U+0400 до U+052F, від U+2DE0 до U+2DFF, від U+A640 до U+A69F
У кодуванні Unicode як латиниця, так і кирилиця розташовані компактно. Малі літери в кодуванні безпосередньо слідують за великими літерами.
Unicode має кілька форм подання: UTF-8, UTF-16 та UTF-32
Таке подання Unicode забезпечує компактність і сумісність із системою ASCII. Текст, що складається лише з символів з номерами менше 128, при записі, наприклад, у UTF-8 перетворюється на звичайний текст, тобто кожен символ займає 1 байт, що економить пам'ять.