Guest User

соответствие кодировок СР1251, СР866, UTF-8, UNICODE

a guest
Oct 4th, 2024
50
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
text 27.26 KB | Source Code | 0 0
  1. Управляющие символы и их шестнадцатеричные коды:
  2.  
  3. NUL 00 NULL, пусто. Используется во многих языках программирования как конец строки (строка понимается как последовательность символов). В некоторых операционных системах NUL - последний символ любого текстового файла.
  4. SOH 01 Start Of Heading, начало заголовка.
  5. STX 02 Start of Text, начало текста. Текстом называлась часть сообщения телетайпа, предназначенная для печати.
  6. ETX 03 End of Text, конец текста. Здесь телетайп прекращал печатать. Отсюда происходит использование символа Ctrl-C, имеющего код 03, для прекращения работы чего-то (обычно программы).
  7. EOT 04 End of Transmission, конец передачи. В системе UNIX Ctrl-D, имеющий тот же код, означает конец файла при вводе с клавиатуры.
  8. ENQ 05 Enquire, "прошу подтверждения".
  9. ACK 06 Acknowledgement, "подтверждаю".
  10. BEL 07 Bell, звонок. Часто используется для подачи звукового сигнала.
  11. BS 08 Backspace, возврат на один символ.
  12. TAB 09 Табуляция. Обозначается также HT - Horizontal Tabulation, горизонтальная табуляция. Во многих языках программирования обозначается \t.
  13. LF 0A Line Feed, перевод строки. Сейчас в конце каждой строчки текстового файла ставится либо этот символ, либо CR, либо и тот и другой (CR, затем LF), в зависимости от операционной системы. Во многих языках программирования этот символ обозначается \n и при выводе текста приводит к переводу строки.
  14. VT 0B Vertical Tab, вертикальная табуляция.
  15. FF 0C Form Feed, новая страница.
  16. CR 0D Carriage Return, возврат каретки. Во многих языках программирования этот символ, обозначаемый \r, можно использовать для возврата в начало строчки без перевода строки. В некоторых операционных системах этот же символ, обозначаемый Ctrl-M, ставится в конце каждой строчки текстового файла перед LF.
  17. SO 0E Shift Out, начало использования национальной кодировки.
  18. SI 0F Shift In, обратно к Shift Out.
  19. DLE 10 Data Link Escape, следующие символы имеют специальный смысл.
  20. DC1 11 Device Control 1, 1-й символ управления устройством - включить устройство чтения перфоленты.
  21. DC2 12 Device Control 2, 2-й символ управления устройством - включить перфоратор.
  22. DC3 13 Device Control 3, 3-й символ управления устройством - выключить устройство чтения перфоленты.
  23. DC4 14 Device Control 4, 4-й символ управления устройством — выключить перфоратор.
  24. NAK 15 Negative Acknowledgment, "не подтверждаю". Обратно к Acknowledgment.
  25. SYN 16 Synchronization. Этот символ передавался, когда для синхронизации было необходимо что-нибудь передать.
  26. ETB 17 End of Text Block, конец текстового блока.
  27. CAN 18 Cancel, отмена (того, что было передано ранее).
  28. EM 19 End of Medium, например, "кончилась перфолента"
  29. SUB 1A Substitute, подставить. Следующий символ — другого цвета или из дополнительного набора символов.
  30. ESC 1B Escape. Следующие символы — что-то специальное.
  31. FS 1C File Separator, разделитель файлов.
  32. GS 1D Group Separator, разделитель групп.
  33. RS 1E Record Separator, разделитель записей.
  34. US 1F Unit Separator, разделитель юнитов. Когда-то поддерживалось 4 уровня структуризации данных: сообщение могло состоять из файлов, файлы из групп, группы из записей, записи из юнитов.
  35. SP 20 Space, пробел.
  36. DEL 7F Delete, стереть (последний символ).
  37.  
  38. NSBP A0 Non-breaking space. Неразрывный пробел, отображающийся внутри строки подобно обычному пробелу, но не позволяющий программам отображения и печати разорвать в этом месте строку.
  39. SHY AD Soft hyphen. Непечатный символ, мягкий перенос/дефис. Он разрывает слово и отображается в виде символа переноса только тогда, когда часть слова до переноса умещается на конце строки; в остальных случаях слово выглядит цельным.
  40.  
  41. <err> 98 Данного символа в кодировке CP1251 почему-то изначально нет. Его невозможно как-то использовать.
  42. все "подсказки" относительно смысла блока выводятся относительно их смысла для кодировки СР1251
  43. они выводятся вроде как "в столбце UTF-8", но конечно же к нему не относятся.
  44. ————————————————————————————————————————————————————————————
  45. Символ Unicode UTF-8 CP1251 CP866
  46. Непечатные символы
  47. ————————————————————————————————————————————————————————————
  48. NUL U+0000 0x00 0x00 NUL
  49. SOH U+0001 0x01 0x01 SOH
  50. STX U+0002 0x02 0x02 STX
  51. ETX U+0003 0x03 0x03 ETX
  52. EOT U+0004 0x04 0x04 EOT
  53. ENQ U+0005 0x05 0x05 ENQ
  54. ACK U+0006 0x06 0x06 ACK
  55. BEL U+0007 0x07 0x07 BEL
  56. BS U+0008 0x08 0x08 BS
  57. HT U+0009 0x09 0x09 HT
  58. LF U+000A 0x0A 0x0A LF
  59. VT U+000B 0x0B 0x0B VT
  60. FF U+000C 0x0C 0x0C FF
  61. CR U+000D 0x0D 0x0D CR
  62. SO U+000E 0x0E 0x0E SO
  63. SI U+000F 0x0F 0x0F SI
  64. DLE U+0010 0x10 0x10 DLE
  65. DC1 U+0011 0x11 0x11 DC1
  66. DC2 U+0012 0x12 0x12 DC2
  67. DC3 U+0013 0x13 0x13 DC3
  68. DC4 U+0014 0x14 0x14 DC4
  69. NAK U+0015 0x15 0x15 NAK
  70. SYN U+0016 0x16 0x16 SYN
  71. ETB U+0017 0x17 0x17 ETB
  72. CAN U+0018 0x18 0x18 CAN
  73. EM U+0019 0x19 0x19 EM
  74. SUB U+001A 0x1A 0x1A SUB
  75. ESC U+001B 0x1B 0x1B ESC
  76. FS U+001C 0x1C 0x1C FS
  77. GS U+001D 0x1D 0x1D GS
  78. RS U+001E 0x1E 0x1E RS
  79. US U+001F 0x1F 0x1F US
  80.  
  81. ————————————————————————————————————————————————————————————
  82. Символ Unicode UTF-8 CP1251 CP866
  83. Специальные символы
  84. ————————————————————————————————————————————————————————————
  85. SP U+0020 0x20 0x20 SP
  86. ! U+0021 0x21 0x21 !
  87. " U+0022 0x22 0x22 "
  88. # U+0023 0x23 0x23 #
  89. $ U+0024 0x24 0x24 $
  90. % U+0025 0x25 0x25 %
  91. & U+0026 0x26 0x26 &
  92. ' U+0027 0x27 0x27 '
  93. ( U+0028 0x28 0x28 (
  94. ) U+0029 0x29 0x29 )
  95. * U+002A 0x2A 0x2A *
  96. + U+002B 0x2B 0x2B +
  97. , U+002C 0x2C 0x2C ,
  98. - U+002D 0x2D 0x2D -
  99. . U+002E 0x2E 0x2E .
  100. / U+002F 0x2F 0x2F /
  101.  
  102. ————————————————————————————————————————————————————————————
  103. Символ Unicode UTF-8 CP1251 CP866
  104. Цифры
  105. ————————————————————————————————————————————————————————————
  106. 0 U+0030 0x30 0x30 0
  107. 1 U+0031 0x31 0x31 1
  108. 2 U+0032 0x32 0x32 2
  109. 3 U+0033 0x33 0x33 3
  110. 4 U+0034 0x34 0x34 4
  111. 5 U+0035 0x35 0x35 5
  112. 6 U+0036 0x36 0x36 6
  113. 7 U+0037 0x37 0x37 7
  114. 8 U+0038 0x38 0x38 8
  115. 9 U+0039 0x39 0x39 9
  116.  
  117. ————————————————————————————————————————————————————————————
  118. Символ Unicode UTF-8 CP1251 CP866
  119. Доп.Спец.1 символы
  120. ————————————————————————————————————————————————————————————
  121. : U+003A 0x3A 0x3A :
  122. ; U+003B 0x3B 0x3B ;
  123. < U+003C 0x3C 0x3C <
  124. = U+003D 0x3D 0x3D =
  125. > U+003E 0x3E 0x3E >
  126. ? U+003F 0x3F 0x3F ?
  127. @ U+0040 0x40 0x40 @
  128.  
  129. ————————————————————————————————————————————————————————————
  130. Символ Unicode UTF-8 CP1251 CP866
  131. Прописные латинские буквы
  132. ————————————————————————————————————————————————————————————
  133. A U+0041 0x41 0x41 A
  134. B U+0042 0x42 0x42 B
  135. C U+0043 0x43 0x43 C
  136. D U+0044 0x44 0x44 D
  137. E U+0045 0x45 0x45 E
  138. F U+0046 0x46 0x46 F
  139. G U+0047 0x47 0x47 G
  140. H U+0048 0x48 0x48 H
  141. I U+0049 0x49 0x49 I
  142. J U+004A 0x4A 0x4A J
  143. K U+004B 0x4B 0x4B K
  144. L U+004C 0x4C 0x4C L
  145. M U+004D 0x4D 0x4D M
  146. N U+004E 0x4E 0x4E N
  147. O U+004F 0x4F 0x4F O
  148. P U+0050 0x50 0x50 P
  149. Q U+0051 0x51 0x51 Q
  150. R U+0052 0x52 0x52 R
  151. S U+0053 0x53 0x53 S
  152. T U+0054 0x54 0x54 T
  153. U U+0055 0x55 0x55 U
  154. V U+0056 0x56 0x56 V
  155. W U+0057 0x57 0x57 W
  156. X U+0058 0x58 0x58 X
  157. Y U+0059 0x59 0x59 Y
  158. Z U+005A 0x5A 0x5A Z
  159.  
  160. ————————————————————————————————————————————————————————————
  161. Символ Unicode UTF-8 CP1251 CP866
  162. Доп.Спец.2 символы
  163. ————————————————————————————————————————————————————————————
  164. [ U+005B 0x5B 0x5B [
  165. \ U+005C 0x5C 0x5C \
  166. ] U+005D 0x5D 0x5D ]
  167. ^ U+005E 0x5E 0x5E ^
  168. _ U+005F 0x5F 0x5F _
  169. ` U+0060 0x60 0x60 `
  170.  
  171. ————————————————————————————————————————————————————————————
  172. Символ Unicode UTF-8 CP1251 CP866
  173. Строчные латинские буквы
  174. ————————————————————————————————————————————————————————————
  175. a U+0061 0x61 0x61 a
  176. b U+0062 0x62 0x62 b
  177. c U+0063 0x63 0x63 c
  178. d U+0064 0x64 0x64 d
  179. e U+0065 0x65 0x65 e
  180. f U+0066 0x66 0x66 f
  181. g U+0067 0x67 0x67 g
  182. h U+0068 0x68 0x68 h
  183. i U+0069 0x69 0x69 i
  184. j U+006A 0x6A 0x6A j
  185. k U+006B 0x6B 0x6B k
  186. l U+006C 0x6C 0x6C l
  187. m U+006D 0x6D 0x6D m
  188. n U+006E 0x6E 0x6E n
  189. o U+006F 0x6F 0x6F o
  190. p U+0070 0x70 0x70 p
  191. q U+0071 0x71 0x71 q
  192. r U+0072 0x72 0x72 r
  193. s U+0073 0x73 0x73 s
  194. t U+0074 0x74 0x74 t
  195. u U+0075 0x75 0x75 u
  196. v U+0076 0x76 0x76 v
  197. w U+0077 0x77 0x77 w
  198. x U+0078 0x78 0x78 x
  199. y U+0079 0x79 0x79 y
  200. z U+007A 0x7A 0x7A z
  201.  
  202. ————————————————————————————————————————————————————————————
  203. Символ Unicode UTF-8 CP1251 CP866
  204. что-то расширенное
  205. ————————————————————————————————————————————————————————————
  206. { U+007B 0x7B 0x7B {
  207. | U+007C 0x7C 0x7C |
  208. } U+007D 0x7D 0x7D }
  209. ~ U+007E 0x7E 0x7E ~
  210. DEL U+007F 0x7F 0x7F DEL
  211. Ђ U+0402 0xD0 0x82 0x80 А
  212. Ѓ U+0403 0xD0 0x83 0x81 Б
  213. ‚ U+201A 0xE2 0x80 0x9A 0x82 В
  214. ѓ U+0453 0xD1 0x93 0x83 Г
  215. „ U+201E 0xE2 0x80 0x9E 0x84 Д
  216. … U+2026 0xE2 0x80 0xA6 0x85 Е
  217. † U+2020 0xE2 0x80 0xA0 0x86 Ж
  218. ‡ U+2021 0xE2 0x80 0xA1 0x87 З
  219. € U+20AC 0xE2 0x82 0xAC 0x88 И
  220. ‰ U+2030 0xE2 0x80 0xB0 0x89 Й
  221. Љ U+0409 0xD0 0x89 0x8A К
  222. ‹ U+2039 0xE2 0x80 0xB9 0x8B Л
  223. Њ U+040A 0xD0 0x8A 0x8C М
  224. Ќ U+040C 0xD0 0x8C 0x8D Н
  225. Ћ U+040B 0xD0 0x8B 0x8E О
  226. Џ U+040F 0xD0 0x8F 0x8F П
  227. ђ U+0452 0xD1 0x92 0x90 Р
  228. ‘ U+2018 0xE2 0x80 0x98 0x91 С
  229. ’ U+2019 0xE2 0x80 0x99 0x92 Т
  230. “ U+201C 0xE2 0x80 0x9C 0x93 У
  231. ” U+201D 0xE2 0x80 0x9D 0x94 Ф
  232. • U+2022 0xE2 0x80 0xA2 0x95 Х
  233. – U+2013 0xE2 0x80 0x93 0x96 Ц
  234. — U+2014 0xE2 0x80 0x94 0x97 Ч
  235. <err> U+???? 0x???? 0x98 Ш
  236. ™ U+2122 0xE2 0x84 0xA2 0x99 Щ
  237. љ U+0459 0xD1 0x99 0x9A Ъ
  238. › U+203A 0xE2 0x80 0xBA 0x9B Ы
  239. њ U+045A 0xD1 0x9A 0x9C Ь
  240. ќ U+045C 0xD1 0x9C 0x9D Э
  241. ћ U+045B 0xD1 0x9B 0x9E Ю
  242. џ U+045F 0xD1 0x9F 0x9F Я
  243. NSBP U+00A0 0xC2 0xA0 0xA0 а
  244. Ў U+040E 0xD0 0x8E 0xA1 б
  245. ў U+045E 0xD1 0x9E 0xA2 в
  246. Ј U+0408 0xD0 0x88 0xA3 г
  247. ¤ U+00A4 0xC2 0xA4 0xA4 д
  248. Ґ U+0490 0xD2 0x90 0xA5 е
  249. ¦ U+00A6 0xC2 0xA6 0xA6 ж
  250. § U+00A7 0xC2 0xA7 0xA7 з
  251. Ё U+0401 0xD0 0x81 0xA8 и
  252. © U+00A9 0xC2 0xA9 0xA9 й
  253. Є U+0404 0xD0 0x84 0xAA к
  254. « U+00AB 0xC2 0xAB 0xAB л
  255. ¬ U+00AC 0xC2 0xAC 0xAC м
  256. SHY U+00AD 0xC2 0xAD 0xAD н
  257. ® U+00AE 0xC2 0xAE 0xAE о
  258. Ї U+0407 0xD0 0x87 0xAF п
  259. ° U+00B0 0xC2 0xB0 0xB0 ░
  260. ± U+00B1 0xC2 0xB1 0xB1 ▒
  261. І U+0406 0xD0 0x86 0xB2 ▓
  262. і U+0456 0xD1 0x96 0xB3 │
  263. ґ U+0491 0xD2 0x91 0xB4 ┤
  264. µ U+00B5 0xC2 0xB5 0xB5 ╡
  265. ¶ U+00B6 0xC2 0xB6 0xB6 ╢
  266. · U+00B7 0xC2 0xB7 0xB7 ╖
  267. ё U+0451 0xD1 0x91 0xB8 ╕
  268. № U+2116 0xE2 0x84 0x96 0xB9 ╣
  269. є U+0454 0xD1 0x94 0xBA ║
  270. » U+00BB 0xC2 0xBB 0xBB ╗
  271. ј U+0458 0xD1 0x98 0xBC ╝
  272. Ѕ U+0405 0xD0 0x85 0xBD ╜
  273. ѕ U+0455 0xD1 0x95 0xBE ╛
  274. ї U+0457 0xD1 0x97 0xBF ┐
  275.  
  276. ————————————————————————————————————————————————————————————
  277. Символ Unicode UTF-8 CP1251 CP866
  278. Прописные русские буквы
  279. ————————————————————————————————————————————————————————————
  280. А U+0410 0xD0 0x90 0xC0 └
  281. Б U+0411 0xD0 0x91 0xC1 ┴
  282. В U+0412 0xD0 0x92 0xC2 ┬
  283. Г U+0413 0xD0 0x93 0xC3 ├
  284. Д U+0414 0xD0 0x94 0xC4 ─
  285. Е U+0415 0xD0 0x95 0xC5 ┼
  286. Ж U+0416 0xD0 0x96 0xC6 ╞
  287. З U+0417 0xD0 0x97 0xC7 ╟
  288. И U+0418 0xD0 0x98 0xC8 ╚
  289. Й U+0419 0xD0 0x99 0xC9 ╔
  290. К U+041A 0xD0 0x9A 0xCA ╩
  291. Л U+041B 0xD0 0x9B 0xCB ╦
  292. М U+041C 0xD0 0x9C 0xCC ╠
  293. Н U+041D 0xD0 0x9D 0xCD ═
  294. О U+041E 0xD0 0x9E 0xCE ╬
  295. П U+041F 0xD0 0x9F 0xCF ╧
  296. Р U+0420 0xD0 0xA0 0xD0 ╨
  297. С U+0421 0xD0 0xA1 0xD1 ╤
  298. Т U+0422 0xD0 0xA2 0xD2 ╥
  299. У U+0423 0xD0 0xA3 0xD3 ╙
  300. Ф U+0424 0xD0 0xA4 0xD4 ╘
  301. Х U+0425 0xD0 0xA5 0xD5 ╒
  302. Ц U+0426 0xD0 0xA6 0xD6 ╓
  303. Ч U+0427 0xD0 0xA7 0xD7 ╫
  304. Ш U+0428 0xD0 0xA8 0xD8 ╪
  305. Щ U+0429 0xD0 0xA9 0xD9 ┘
  306. Ъ U+042A 0xD0 0xAA 0xDA ┌
  307. Ы U+042B 0xD0 0xAB 0xDB █
  308. Ь U+042C 0xD0 0xAC 0xDC ▄
  309. Э U+042D 0xD0 0xAD 0xDD ▌
  310. Ю U+042E 0xD0 0xAE 0xDE ▐
  311. Я U+042F 0xD0 0xAF 0xDF ▀
  312.  
  313. ————————————————————————————————————————————————————————————
  314. Символ Unicode UTF-8 CP1251 CP866
  315. Строчные русские буквы
  316. ————————————————————————————————————————————————————————————
  317. а U+0430 0xD0 0xB0 0xE0 р
  318. б U+0431 0xD0 0xB1 0xE1 с
  319. в U+0432 0xD0 0xB2 0xE2 т
  320. г U+0433 0xD0 0xB3 0xE3 у
  321. д U+0434 0xD0 0xB4 0xE4 ф
  322. е U+0435 0xD0 0xB5 0xE5 х
  323. ж U+0436 0xD0 0xB6 0xE6 ц
  324. з U+0437 0xD0 0xB7 0xE7 ч
  325. и U+0438 0xD0 0xB8 0xE8 ш
  326. й U+0439 0xD0 0xB9 0xE9 щ
  327. к U+043A 0xD0 0xBA 0xEA ъ
  328. л U+043B 0xD0 0xBB 0xEB ы
  329. м U+043C 0xD0 0xBC 0xEC ь
  330. н U+043D 0xD0 0xBD 0xED э
  331. о U+043E 0xD0 0xBE 0xEE ю
  332. п U+043F 0xD0 0xBF 0xEF я
  333. р U+0440 0xD1 0x80 0xF0 Ё
  334. с U+0441 0xD1 0x81 0xF1 ё
  335. т U+0442 0xD1 0x82 0xF2 Є
  336. у U+0443 0xD1 0x83 0xF3 є
  337. ф U+0444 0xD1 0x84 0xF4 Ї
  338. х U+0445 0xD1 0x85 0xF5 ї
  339. ц U+0446 0xD1 0x86 0xF6 Ў
  340. ч U+0447 0xD1 0x87 0xF7 ў
  341. ш U+0448 0xD1 0x88 0xF8 °
  342. щ U+0449 0xD1 0x89 0xF9 ∙
  343. ъ U+044A 0xD1 0x8A 0xFA ·
  344. ы U+044B 0xD1 0x8B 0xFB √
  345. ь U+044C 0xD1 0x8C 0xFC №
  346. э U+044D 0xD1 0x8D 0xFD ¤
  347. ю U+044E 0xD1 0x8E 0xFE ■
  348. я U+044F 0xD1 0x8F 0xFF NSBP
  349.  
  350. ————————————————————————————————————————————————————————————
  351.  
Advertisement
Add Comment
Please, Sign In to add comment