KOI8-U
| 言語 | ウクライナ語、ロシア語、ブルガリア語 |
|---|---|
| 分類 | 8ビットKOI、拡張ASCII |
| 拡張 | KOI8-B |
| に基づく | KOI8-R |
| その他の関連エンコーディング | KOI8-RU、KOI8-F |
KOI8-U (RFC 2319) は、キリル文字を使用するウクライナ語をカバーするために設計された8ビット文字エンコーディングです。ロシア語とブルガリア語をカバーするKOI8-Rをベースにしていますが、8つのボックス描画文字を、大文字と小文字の両方で ウクライナ語のҐ、Є、І、Їの4文字に置き換えています。
KOI8-RUは近縁ですが、ベラルーシ語のЎが追加されています。どちらの言語も、 KOI8-Eの文字割り当てと一致していますが、 KOI8-FにはҐが追加されています。
Microsoft Windowsでは、KOI8-Uにコードページ番号21866が割り当てられています。IBMでは、 KOI8-Uにコードページ/ CCSID 1168が割り当てられています。 [1] [2] [3]
KOI8は、普及しなかったISO 8859-5よりもはるかに広く使用されています。 [要出典] キリル文字の一般的なエンコーディングとして、Windows-1251もあります。将来的には、どちらもUnicodeに取って代わられる可能性があります。
KOI8 は、Kod Obmena Informatsiey、8 ビット(ロシア語: Код Обмена Информацией、8 бит )の略で、「情報交換用のコード、8 ビット」を意味します。
KOI8文字セットは、キリル文字がISO 8859-5のキリル文字順ではなく、擬似ラテン文字順になっているという特性を持っています。この特性により、8ビット目を削除し、KOI8セット自体を含むASCIIベースの任意の文字セットでテキストを表記した場合でも、大文字と小文字を逆にした翻字として、人間が十分に読めるテキストになります。例えば、「KOI」の頭字語「Код Обмена Информацией」は「kOD oBMENA iNFORMACIEJ 」になります。
文字セット
次の表はKOI8-Uエンコーディングを示しています。[1] [4]各文字は対応するUnicodeコードポイントで示されています。
| 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | あ | B | C | D | E | F | |
| 0x | ||||||||||||||||
| 1倍 | ||||||||||||||||
| 2倍 | SP | ! | 「 | # | $ | % | & | ' | ( | ) | * | + | 、 | - | 。 | / |
| 3倍 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
| 4倍 | @ | あ | B | C | D | E | F | G | H | 私 | J | K | L | M | 北 | お |
| 5倍 | P | 質問 | R | S | T | あなた | V | W | X | はい | Z | [ | \ | ] | ^ | _ |
| 6倍 | ` | 1つの | b | c | d | e | f | グラム | h | 私 | j | け | l | メートル | n | o |
| 7倍 | p | q | r | s | t | あなた | v | わ | × | y | z | { | | | } | 〜 | |
| 8倍 | ─ 2500 | │ 2502 | ┌ 250℃ | ┐ 2510 | └ 2514 | ┘ 2518 | ├ 251C | ┤ 2524 | ┬ 252C | ┴ 2534 | ┼ 253C | ▀ 2580 | ▄ 2584 | █ 2588 | ▌ 258C | ▐ 2590 |
| 9倍 | ░ 2591 | ▒ 2592 | ▓ 2593 | ⌠ 2320 | ■ 25A0 | ∙ 2219 | √221A | ≈ 2248 | ≤ 2264 | ≥ 2265 | NBSP | ⌡ 2321 | ° 00B0 | ² 00B2 | · 00B7 | ÷ 00F7 |
| 斧 | ═ 2550 | ║ 2551 | ╒ 2552 | ё 0451 | є 0454 | ╔ 2554 | і 0456 | ї 0457 | ╗ 2557 | ╘ 2558 | ╙ 2559 | ╚ 255A | ╛ 255B | ґ 0491 | ╝ 255D | ╞ 255E |
| バックス | ╟ 255F | ╠ 2560 | ╡ 2561 | Ё 0401 | Є 0404 | ╣ 2563 | І 0406 | Ї 0407 | ╦ 2566 | ╧ 2567 | ╨ 2568 | ╩ 2569 | ╪ 256A | Ґ 0490 | ╬ 256C | © 00A9 |
| センチ | 044E | 0430 | б 0431 | ц 0446 | д 0434 | е 0435 | ф 0444 | г 0433 | х 0445 | 0438 年 | © 0439 | к 043A | л 043B | м 043C | 043D | о 043E |
| 診断 | п 043F | я 044F | р 0440 | 0441 | 0442 | у 0443 | ж 0436 | 0432年 | ь 044C | ы 044B | з 0437 | ш 0448 | э 044D | щ 0449 | ч 0447 | ъ 044A |
| 元 | Ю 042E | А 0410 | Б 0411 | Ц 0426 | Д 0414 | Е 0415 | Ф 0424 | Г 0413 | Х 0425 | И 0418 | Й 0419 | К 041A | Л 041B | М 041C | Н 041D | О 041E |
| FX | П 041F | Я 042F | Р 0420 | С 0421 | 0422 | У 0423 | Ж 0416 | В 0412 | Ь 042C | Ы 042B | З 0417 | Ш 0428 | Э 042D | Щ 0429 | Ч 0427 | Ъ 042A |
RFC 2319 では文字 0x95 は U+2219 (∙) である必要があるとされていますが、 Windows-1251の箇条書き文字と一致させるために U+2022 (•) になる場合もあります。
一部の参考文献には誤植があり、文字0xB4は正しいU+0404ではなくU+0403であると誤って記載されています。この誤植はRFC 2319の付録Aにも記載されています(ただし、RFC本文の表には正しいマッピングが示されています)。
参照
参考文献
- ^ ab 「SBCS コードページ情報 - CPGID: 01168 / 名称: ウクライナ語 KOI8-U」。IBMソフトウェア: グローバリゼーション: コード化文字セットおよび関連リソース: CPGID 別コードページ: コードページ識別子. IBM . CH 3-3220-050. 2017年2月18日時点のオリジナルよりアーカイブ。 2017年2月18日閲覧。[1] [2]
- ^ 「CCSID情報文書; CCSID 1168; KOI8-U」。IBM。2017年2月18日時点のオリジナルよりアーカイブ。 2017年2月18日閲覧。
- ^ 国際Unicodeコンポーネント(ICU)、ibm-1168_P100-2002.ucm、2002年12月3日
- ^ Verdy, Philippe; Richter, Helmut (2016-01-04) [2008-10-13]. "KOI8-U.TXT". 2.0 . 2016年12月9日閲覧。
さらに読む
- Flohr, Guido (2016) [2006]. 「Locale::RecodeData::KOI8_U - KOI8-U 用変換ルーチン」. CPAN libintl-perl . 1.1. 2017年1月15日時点のオリジナルよりアーカイブ。 2017年1月15日閲覧。
- RFC 2319
- 「KOI8-U (RFC 2319)」.カーミット.コロンビア大学. 2020年6月24日閲覧。
- Leishner, Mark (2008) [1999-12-20]. 「KOI8-U ベラルーシ語/ウクライナ語キリル文字からUnicode 2.1へのマッピング表 - RFC 2319に基づく」. ニューメキシコ州立大学数学科学部. 2017年2月19日時点のオリジナルよりアーカイブ。 2017年2月19日閲覧。
- アンドラス州コルナイ。バーンバウム、デヴィッド J.ダ・クルーズ、フランク。デイビス、バール。ファウラー、ジョージ。ペイン、リチャード B.スラヴァ、ペーパーノ。シモンセン、ケルド J.トーブ、グレン E.ヴリス、ディミトリ。ファン・ウィンゲン、ヨハン・W. (1993-03-13)。 「キリル文字エンコーディング FAQ バージョン 1.3」。 1.3. 2017 年 2 月 18 日にオリジナルからアーカイブされました。2020年6月24日に取得。
外部リンク
- Czyborra, Roman (1998-11-30) [1998-05-25]. 「キリル文字セットスープ」. 2016年12月3日時点のオリジナルよりアーカイブ。 2016年12月3日閲覧。
- Hohlov, Yu. E.「電子形式でのキリル文字情報表現 - 文字セット(コードページ)表」。2016年12月5日時点のオリジナルよりアーカイブ。 2016年12月5日閲覧。
- Nechayev, Valentin (2013) [2001]. 「8ビットキリル文字エンコーディングの世界のレビュー」。2016年12月5日時点のオリジナルよりアーカイブ。 2016年12月5日閲覧。
- https://web.archive.org/web/20050206230944/http://www.net.ua/KOI8-U/