| エイリアス | cp878(コードページ878) |
|---|---|
| 言語 | ロシア語、ブルガリア語 |
| 分類 | 8ビットKOI、拡張ASCII |
| 拡張 | KOI8-B |
| に基づく | KOI-8 |
| その他の関連エンコーディング | KOI8-U、KOI8-RU |
KOI8-R (RFC 1489) は、1993 年にプログラマのAndrei ChernovによるKOI-8エンコーディングから派生した8 ビットの文字エンコーディングで、キリル文字のロシア語サブセットを使用するロシア語をカバーするように設計されています。KOI-8 は、 MTK-2テレタイプコードからロシア語とラテン文字の音声対応を継承したKOI-7エンコーディングの 8 ビット拡張です。結果として、KOI8-R のロシア語キリル文字は、ISO 8859-5のような通常のキリル文字順ではなく、疑似ラテン アルファベット順になっています。これは不自然に思えるかもしれませんが、8 番目のビットを削除しても、大文字と小文字を逆にした翻字として、任意のASCIIベースのエンコーディング (KOI8-R 自体を含む) でテキストが部分的に判読可能になるという便利な効果があります。たとえば、「Код для обмена и обработки информации」 (「KOI」の頭字語のロシア語の意味) は、kOD DLQ OBMENA I OBRABOTKI INFORMACIIになります。
KOI-8 は8-bitnyy kod dlya obmena i obrabotki informatsii (ロシア語: 8-битный код для обмена и обработки информации ) の略で、「情報交換用の 8 ビット コード」を意味します。[ 1 ] Microsoft Windows では、KOI8-R にはコード ページ番号 20866 が割り当てられます。IBM では、 KOI8-R にはコード ページ 878 が割り当てられます。[ 2 ] [ 3 ] KOI8-R はブルガリア語 もカバーしています。
これらの言語では、適切な引用符が欠落しています。「...」とブルガリア語の「...」です。Windows -1251はこれらの文字とその他の文字をサポートしているため、より普及しています。KOI8-Rは、主にロシア語とブルガリア語のウェブサイトの0.004%未満で使用されています。[要出典]現代のアプリケーションでは、シングルバイトのキリル文字エンコーディングよりも UnicodeとUTF-8が優先されます。Unicodeには、古キリル文字を含めて436のキリル文字が含まれています。
文字セット
[編集]以下の表はKOI8-Rエンコーディングを示しています。各文字は対応するUnicodeコードポイントで示されています。
| 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | あ | B | C | D | E | F | |
| 0x | ||||||||||||||||
| 1倍 | ||||||||||||||||
| 2倍 | SP | ! | 「 | # | $ | % | & | ' | ( | ) | * | + | 、 | - | 。 | / |
| 3倍 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
| 4倍 | @ | あ | B | C | D | E | F | G | H | 私 | J | K | L | M | 北 | お |
| 5倍 | P | 質問 | R | S | T | あなた | V | W | X | はい | Z | [ | \ | ] | ^ | _ |
| 6倍 | ` | 1つの | b | c | d | e | f | グラム | h | 私 | j | け | l | メートル | n | o |
| 7倍 | p | q | r | s | t | あなた | v | わ | × | y | z | { | | | } | 〜 | |
| 8倍 | ─ 2500 | │ 2502 | ┌ 250℃ | ┐ 2510 | └ 2514 | ┘ 2518 | ├ 251C | ┤ 2524 | ┬ 252C | ┴ 2534 | ┼ 253C | ▀ 2580 | ▄ 2584 | █ 2588 | ▌ 258C | ▐ 2590 |
| 9倍 | ░ 2591 | ▒ 2592 | ▓ 2593 | ⌠ 2320 | ■ 25A0 | ∙ 2219 | √221A | ≈ 2248 | ≤ 2264 | ≥ 2265 | NBSP | ⌡ 2321 | ° 00B0 | ² 00B2 | · 00B7 | ÷ 00F7 |
| 斧 | ═ 2550 | ║ 2551 | ╒ 2552 | ё 0451 | ╓ 2553 | ╔ 2554 | ╕ 2555 | ╖ 2556 | ╗ 2557 | ╘ 2558 | ╙ 2559 | ╚ 255A | ╛ 255B | ╜ 255℃ | ╝ 255D | ╞ 255E |
| バックス | ╟ 255F | ╠ 2560 | ╡ 2561 | Ё 0401 | ╢ 2562 | ╣ 2563 | ╤ 2564 | ╥ 2565 | ╦ 2566 | ╧ 2567 | ╨ 2568 | ╩ 2569 | ╪ 256A | ╫ 256B | ╬ 256C | © 00A9 |
| センチ | 044E | 0430 | б 0431 | ц 0446 | д 0434 | е 0435 | ф 0444 | г 0433 | х 0445 | 0438 年 | © 0439 | к 043A | л 043B | м 043C | 043D | о 043E |
| 診断 | п 043F | я 044F | р 0440 | 0441 | 0442 | у 0443 | ж 0436 | 0432年 | ь 044C | ы 044B | з 0437 | ш 0448 | э 044D | щ 0449 | ч 0447 | ъ 044A |
| 元 | Ю 042E | А 0410 | Б 0411 | Ц 0426 | Д 0414 | Е 0415 | Ф 0424 | Г 0413 | Х 0425 | И 0418 | Й 0419 | К 041A | Л 041B | М 041C | Н 041D | О 041E |
| FX | П 041F | Я 042F | Р 0420 | С 0421 | 0422 | У 0423 | Ж 0416 | В 0412 | Ь 042C | Ы 042B | З 0417 | Ш 0428 | Э 042D | Щ 0429 | Ч 0427 | Ъ 042A |
参照
[編集]- KOI8-B、文字サブセットのみを実装した KOI8-R の派生
- KOI8-U 、ウクライナ文字を追加した別の派生エンコーディング
- KOI文字エンコーディング
- レルコム
- Windows-1251、別の一般的なキリル文字エンコード
参考文献
[編集]- ^ (ロシア語) ГОСТ 19768-74 (СТ СЭВ 358-76)。 Мазины вычислительные и система обработки данных。 8-битные для обмена и обработки информации.
- ^ 「SBCSコードページ情報 - CPGID: 00878 / 名前: Russian internet koi8-r」。IBMソフトウェア:グローバリゼーション:コード化文字セットおよび関連リソース:CPGID別コードページ:コードページ識別子。IBM。CH 3-3220-050 。2017年2月18日時点のオリジナルからアーカイブ。 2017年2月18日閲覧。
- ^ 「CCSID情報文書; CCSID 878; KOI8-Rキリル文字」 IBM . 2017年2月18日閲覧。
- ^ Richter, Helmut (2016-01-04) [1999-08-18]. 「KOI8-R.TXT」 . 2.0 . 2016年12月9日閲覧。
- ^ コードページ CPGID 00878 (pdf) (PDF)、IBM
- ^ コードページ CPGID 00878 (txt)、IBM
- ^ 国際Unicodeコンポーネント(ICU)、ibm-878_P100-1996.ucm、2002年12月3日
さらに読む
[編集]- フローア、グイド。キスして、ガボール。チェルノフ、アンドレイ A. (2016) [2006]。「Locale::RecodeData::KOI8_R - KOI8-R の変換ルーチン」。CPAN libintl-perl。 1.0。2017-01-15 のオリジナルからアーカイブ。2017 年 1 月 15 日に取得。
- Kostis, Kosta. 「koi8-r (ロシア語U*IXエンコーディング、RELCOMでも使用)」 1.20. 2017年1月16日時点のオリジナルよりアーカイブ。2017年1月16日閲覧。
- RFC 1489
- 「KOI8-R (RFC 1489)」 .カーミット.コロンビア大学. 2020年6月24日閲覧。
- アンドラス州コルナイ。バーンバウム、デヴィッド J.ダ・クルーズ、フランク。デイビス、バール。ファウラー、ジョージ。ペイン、リチャード B.スラヴァ、ペーパーノ。シモンセン、ケルド J.トーブ、グレン E.ヴリス、ディミトリ。ファン・ウィンゲン、ヨハン・W. (1993-03-13)。「キリル文字エンコーディング FAQ バージョン 1.3」。 1.3 。2020年6月24日に取得。
外部リンク
[編集]- ユニバーサル キリル文字デコーダーは、壊れた KOI8-R またはその他の文字エンコードを持つキリル文字テキストの復元に役立つオンライン プログラムです。
- 「1995年以来のKOI8-Rの本拠地」 1995年. 2016年12月5日閲覧。
- Czyborra, Roman (1998-11-30) [1998-05-25]. 「キリル文字セットスープ」 . 2016年12月3日時点のオリジナルよりアーカイブ。 2016年12月3日閲覧。
- Hohlov, Yu. E. 「電子形式でのキリル文字情報表現 - 文字セット(コードページ)表」。2016年12月5日時点のオリジナルよりアーカイブ。 2016年12月5日閲覧。
- Nechayev, Valentin (2013) [2001]. 「8ビットキリル文字エンコーディングの世界のレビュー」 . 2016年12月5日時点のオリジナルよりアーカイブ。 2016年12月5日閲覧。