ISO/IEC 8859-2
| MIME / IANA | ISO-8859-2 |
|---|---|
| エイリアス | iso-ir-101、csISOLatin2、latin2、l2、IBM1111 |
| 言語 | (以下を参照してください) |
| 標準 | ECMA-94 :1986、ISO/IEC8859 |
| 分類 | 拡張ASCII、ISO/IEC 8859 |
| 拡張 | US-ASCII |
| に基づく | ISO-8859-1 |
| その他の関連エンコーディング | Windows-1250、Macクロアチア語 |
ISO/IEC 8859-2:1999、「情報技術 - 8ビットシングルバイトコード化グラフィック文字セット - パート2:ラテンアルファベット第2号」は、1987年に初版が発行された、 ASCIIベースの標準文字エンコーディングのISO/IEC 8859シリーズの一部です。非公式には「Latin-2」と呼ばれます。これは通常、ラテン文字で記述される中央[ 1 ]または「東ヨーロッパ」の言語を対象としています。ISO/IEC 8859-2は、チェコ共和国とスロバキア地域で「Latin-2」とも呼ばれるコードページ852(MS-DOS Latin 2、PC Latin 2)とは大きく異なることに注意してください。[ 2 ]このエンコーディングの使用のほぼ半分はポーランド語で、これはポーランド語の主要なレガシーエンコーディングですが、事実上すべての使用がUTF-8(Web上)に置き換えられました。
ISO-8859-2は、 ISO/IEC 6429のC0およびC1制御コードが追加された場合の、この標準に対するIANA推奨の文字セット名です。2022年10月現在、すべてのウェブページの0.04%未満がISO-8859-2を使用しています。 [ 3 ] [ 4 ] Microsoftは、 Windowsのコードページ28592(別名Windows-28592)をISO-8859-2に割り当てています。IBMは、1999年にそのコードページが拡張されるまで、コードページ912をISO 8859-2に割り当てました。[5]コードページ1111は似ていますが、バイトB0°(度記号)をU+02DA˚(上記のリング)に置き換えています 。
Windows-1250は ISO-8859-2 に似ており、ISO-8859-2 のすべての印刷可能文字に加え、さらに多くの文字が含まれています。ただし、一部の文字は配置が変更されています(ISO-8859-1のすべての印刷可能文字を同じ場所に 保持するWindows-1252とは異なります)。
言語範囲
これらのコード値は、次の言語で使用できます。
- ^欠けている文字「Å」は正式にはフィンランド語のアルファベットの一部ですが、ネイティブの用途はなく、使用は外国人名にのみ限定されています。
- ^ 2017年にドイツ語正書法協議会は正式に大文字のẞを追加しましたが、代わりに SS を使用できるため、実際には必要ありません。
- ^この文字セットは、ȘとȚ(SとT、下にカンマ)をŞとŢ(SとT、セディーユ)と統合しており、これはMicrosoftのWindows-1250やUnicodeの最初のバージョン。しかし、Unicodeはその後これらを非統合化したため、既存のデータや入力メソッドに古いセディーユのコードポイントが残っているため、ルーマニア語データの処理が複雑になっている。
コードページレイアウト
ISO-8859-1との違いは、その下に Unicode コード ポイント番号が示されています。
| 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | あ | B | C | D | E | F | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0x | ||||||||||||||||
| 1倍 | ||||||||||||||||
| 2倍 | SP | ! | 「 | # | $ | % | & | ' | ( | ) | * | + | 、 | - | 。 | / |
| 3倍 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
| 4倍 | @ | あ | B | C | D | E | F | G | H | 私 | J | K | L | M | 北 | お |
| 5倍 | P | 質問 | R | S | T | あなた | V | W | X | はい | Z | [ | \ | ] | ^ | _ |
| 6倍 | ` | 1つの | b | c | d | e | f | グラム | h | 私 | j | け | l | メートル | n | o |
| 7倍 | p | q | r | s | t | あなた | v | わ | × | y | z | { | | | } | 〜 | |
| 8倍 | ||||||||||||||||
| 9倍 | ||||||||||||||||
| 斧 | NBSP | Ą 0104 | ˘ 02D8 | 0141ポンド | ¤ | Ľ 013D | Ś 015A | § | ¨ | Š 0160 | Ş 015E | Ť 0164 | Ź 0179 | シャイ | Ž 017D | Ż 017B |
| バックス | ° | ± 0105 | ˛ 02DB | ł 0142 | ´ | ľ 013E | ś 015B | ˇ 02C7 | ¸ | š 0161 | シュ015F | ť 0165 | ź 017A | ˝ 02DD | ž 017E | ż 017C |
| センチ | Ŕ 0154 | ア | Â | Ă 0102 | Ä | Ĺ 0139 | Ć 0106 | Ç | Č 010C | エ | Ę 0118 | Ë | Ě 011A | 私 | 私 | Ď 010E |
| 診断 | Đ 0110 | Ń 0143 | Ň 0147 | Ó | Ô | Ő 0150 | オー | × | Ř 0158 | Ů 016E | Ú | Ű 0170 | Ü | Ý | Ţ 0162 | ß |
| 元 | ŕ 0155 | á | â | ă 0103 | ä | ĺ 013A | ć 0107 | ç | č 010D | é | ę 0119 | ë | ě 011B | 私 | 私 | ď 010F |
| FX | đ 0111 | ń 0144 | ň 0148 | ó | ô | ő 0151 | ö | ÷ | ř 0159 | ů 016F | ú | ű 0171 | ü | ý | ţ 0163 | ˙ 02D9 |
参照
参考文献
- ^ 「Microsoft Outlook メッセージ エンコーディング」。2017年1月10日。
- ^ 「チェコ語とスロバキア語の文字エンコードの混乱の解説」 luki.sdf-eu.org . 2022年2月27日閲覧。
- ^ 「ウェブサイトにおけるISO-8859-2の使用統計と市場シェア、2022年10月」w3techs.com . 2022年10月23日閲覧。
- ^ 「ウェブサイトの文字エンコーディングの使用統計の歴史的傾向、2022年2月」。
- ^「Icu-data/Charset/Data/XML/Ibm-912_P100-1995.XML at main · unicode-org/Icu-data」。GitHub 。
- ^「Icu-data/Charset/Data/Ucm/Ibm-912_P100-1999.ucm at main · unicode-org/Icu-data」。GitHub 。
外部リンク
- ISO/IEC 8859-2:1999
- 標準 ECMA-94 : 8 ビット シングル バイト符号化グラフィック文字セット - ラテン アルファベット No. 1 から No. 4第 2 版 (1986 年 6 月)
- ISO-IR 101ラテンアルファベットの右側部分 No.2 (1986年2月1日)
- ISO 8859-2 (ラテン2) リソース