ISO/IEC 8859-9

コンテンツへジャンプ
フリー百科事典『ウィキペディア(Wikipedia)』より
(コードページ920からリダイレクト
ISO/IEC 8859-9
MIME / IANAISO-8859-9
エイリアスiso-ir-148、latin5、l5、csISOLatin5 [ 1 ]
規格TS 5881、ECMA-128、ISO/IEC 8859
分類ISO 8859 (拡張ASCIIISO 4873レベル1)
拡張US-ASCII
に基づくISO/IEC 8859-1
以前のものISO/IEC 8859-3
その他の関連エンコーディングWindows-1254

ISO/IEC 8859-9:1999情報技術 - 8ビットシングルバイト符号化グラフィック文字セット - パート9:ラテンアルファベットNo.5は、 1989年に初版が発行されたASCIIベースの標準文字エンコーディングであるISO/IEC 8859シリーズの一部です。ECMA InternationalではECMA-128トルコ語規格としてTS 5881に指定されています。 [ 2 ]非公式にはLatin-5またはTurkishと呼ばれます。トルコ語をカバーするように設計されており(他の言語にも使用できますが、大多数のユーザーはトルコ語に使用しています)、 ISO/IEC 8859-3エンコーディングよりも有用となるように設計されていますISO/IEC 8859-1と同一ですが、アイスランド語の6文字(Ð ð、Ý ý、Þ þ)がトルコ語アルファベット固有の文字(Ğ ğ、İıŞ ş)に置き換えられています。また、 iの大文字İ 、 Iの小文字はıです

ISO-8859-9は、 ISO/IEC 6429C0およびC1制御コードが追加された場合の、この規格のIANA推奨文字セット名です。現代のアプリケーションではUnicodeとUTF-8が推奨されており、新しいウェブページの作成者や新しいプロトコルの設計者は、代わりにUTF-8を使用するように指示されています。[ 3 ] 2023年以降、すべてのウェブページのうち0.05%未満がISO-8859-9を使用しており、[ 4 ] [ 5 ]トルコにあるウェブページの2.1%がISO-8859-9の使用を宣言しています。[ 6 ]しかし、HTML5で許可され、準拠ブラウザがサポートしなければならない文字エンコーディングを指定するWHATWGエンコーディング標準では、 [ 7 ] ISO-8859-9としてマークされたウェブページはWindows-1254として処理することを要求しています[ 3 ]これは、ISO-8859-9が追加のグラフィカル文字のC1制御コード用に予約しているCR範囲を使用する点でISO-8859-9とは異なります( ISO-8859-1Windows-1252の関係に類似しています)。

MicrosoftはWindowsのコードページ28599(別名Windows-28599)をISO-8859-9に割り当てています。IBMはコードページ920CCSID 920)をISO-8859-9に割り当てています。[ 8 ] [ 9 ]これはEcma InternationalによってECMA-128として公開されています[ 10 ]

コードページレイアウト

[編集]

ISO-8859-1との相違点は、文字の下にUnicodeコードポイント番号があることです

ISO/IEC 8859-9 [ 11 ] [ 12 ] [ 13 ]
0123456789ABCDEF
0倍
1倍
2倍 SP "#$%'*
3倍0123456789;<
4倍@ABCDEFGHIJKLMNO
5倍PQRSTUVWXYZ[\]^_
6倍`abcdefghjklmn
7倍tuvwxyz{|}~
8倍
9x
NBSP¡セント£¤¥¦§¨©ª«¬シャイ®¯
Bx°±²³´µ·¸¹º»1/41/23/4¿
CxÂオーÆÇÈÉÊËÌÍÎÏ
DxĞ
011E
ÑÒÓÔÕÖרÙÚÛÜİ
0130
Ş
015E
ß
àáâãäåæçèéêëìíîï
Fxğ
011F
ñòóôõö÷øùúûüı
0131
ş
015F
ÿ

参照

[編集]

参考文献

[編集]
  1. ^ 文字セットインターネット割り当て番号局(IANA)、2018年12月12日
  2. ^ 「Latin-5:トルコを含むLatin-5クライアントおよびサーバーCCSIDのリスト」IBM。 2022年2月13日時点のオリジナルよりアーカイブ
  3. ^ a b ヴァン・ケステレン、アン「名前とラベル」エンコーディング標準なんてことだ
  4. ^ 「ウェブサイトにおける文字エンコーディングの使用に関する歴史的傾向」w3techs.com
  5. ^ 「よくある質問」 . w3techs.com .
  6. ^ 「トルコ語を使用するウェブサイト間の文字エンコーディングの分布」w3techs.com
  7. ^ 「8.2.2.3. 文字エンコーディング」 . HTML 5.1 第2版. W3C .ユーザーエージェントは、WHATWGエンコーディング標準で定義されたエンコーディングをサポートする必要があります。これには[…]が含まれますが、これに限定されません。
  8. ^ 「コードページ920情報文書」 。2017年1月16日時点のオリジナルよりアーカイブ
  9. ^ 「CCSID 920情報文書」 。2016年3月27日時点のオリジナルよりアーカイブ
  10. ^ 標準 ECMA-128: 8 ビット シングルバイトコード化グラフィック文字セット - ラテン アルファベット No. 5 (第 2 版)。1999 年。この Ecma 出版物は ISO 8859-9 としても承認されています。
  11. ^ コードページ CPGID 00920 (pdf) (PDF)、IBM
  12. ^ コードページ CPGID 00920 (txt)、IBM
  13. ^ 国際Unicodeコンポーネント(ICU)、ibm-920_P100-1995.ucm、2002年12月3日
[編集]
  • ISO/IEC 8859-9:1999
  • 標準 ECMA-128:8 ビット シングルバイト符号化グラフィック文字セット - ラテンアルファベット No. 5第 2 版(1999 年 12 月)
  • ISO-IR 148ラテンアルファベット第5番の右側部分(1988年10月1日)
    ISO/IEC 8859-9
    MIME / IANAISO-8859-9
    エイリアス標準
    規格TS 5881、ECMA-128、ISO/IEC 8859
    分類ISO 8859 (拡張ASCIIISO 4873レベル1)
    拡張US-ASCII
    に基づくISO/IEC 8859-1
    以前のものISO/IEC 8859-3
    その他の関連エンコーディングWindows-1254

    ISO/IEC 8859-9:1999「情報技術 - 8ビットシングルバイトコード化グラフィック文字セット - パート9:ラテンアルファベットNo.5」は、 ASCIIベースの標準文字エンコーディングのISO/IEC 8859シリーズの一部で、初版は1989年に発行されました。これは、Ecma InternationalによってECMA-128トルコ語規格としてTS 5881に指定されています。 [2]これは非公式にラテン5またはトルコ語と呼ばれています。これはトルコ語をカバーするように設計されており(他の言語にも使用できますが、大多数のユーザーはトルコ語に使用しています)、ISO/IEC 8859-3エンコーディングよりも使いやすいように設計されています。ISO/IEC 8859-1と同一ですが、アイスランド語の6文字(Ð ð、Ý ý、Þ þ)がトルコ語アルファベット固有の文字(Ğ ğ、İıŞ ş)に置き換えられています。また、 iの大文字İ 、 Iの小文字はıです

    ISO-8859-9は、 ISO/IEC 6429C0およびC1制御コードを追加した場合の、この規格のIANA推奨文字セット名です。現代のアプリケーションではUnicodeとUTF-8が推奨されており、新しいウェブページの作成者や新しいプロトコルの設計者は、代わりにUTF-8を使用するように指示されています。[3] 2023年以降、すべてのウェブページのうち0.05%未満がISO-8859-9を使用していますが、[4] [5]トルコにあるウェブページの2.1%がISO-8859-9の使用を宣言しています。[6]しかし、HTML5で許可され、準拠ブラウザがサポートしなければならない文字エンコーディングを指定するWHATWGエンコーディング標準では、 [7] ISO-8859-9としてマークされたウェブページはWindows-1254として処理することを要求しています[3]これは、ISO-8859-9が追加のグラフィカル文字用のC1制御コード用に予約しているCR範囲を使用する点でISO-8859-9とは異なります( ISO-8859-1Windows-1252の関係に類似しています)。

    MicrosoftはWindowsのコードページ28599(別名Windows-28599)をISO-8859-9に割り当てています。IBMはコードページ920CCSID 920)をISO-8859-9に割り当てています。[8] [9]これはEcma InternationalによってECMA-128として公開されています[10]

    コードページレイアウト

    ISO-8859-1との相違点は、文字の下にUnicodeコードポイント番号があることです

    ISO/IEC 8859-9 [11] [12] [13]
    0123456789ABCDEF
    0倍
    1倍
    2倍 SP "#$%'*
    3倍0123456789;<
    4倍@ABCDEFGHIJKLMNO
    5倍PQRSTUVWXYZ[\]^_
    6倍`abcdefghjklmn
    7倍tuvwxyz{|}~
    8倍
    9x
    NBSP¡セント£¤¥¦§¨©ª«¬シャイ®¯
    Bx°±²³´µ·¸¹º»1/41/23/4¿
    CxÂオーÆÇÈÉÊËÌÍÎÏ
    DxĞ
    011E
    ÑÒÓÔÕÖרÙÚÛÜİ
    0130
    Ş
    015E
    ß
    àáâãäåæçèéêëìíîï
    Fxğ
    011F
    ñòóôõö÷øùúûüı
    0131
    ş
    015F
    ÿ

    参照

    参考文献

    1. ^ 文字セット、インターネット割り当て番号局(IANA)、2018年12月12日
    2. ^ 「Latin-5:Latin-5クライアントおよびサーバーCCSIDのリスト(トルコを含む)」IBM。2022年2月13日時点のオリジナルよりアーカイブ。
    3. ^ アブ ・ファン・ケステレン、アン。 「名前とラベル」。エンコーディング標準なんてことだ
    4. ^ 「ウェブサイトにおける文字エンコーディングの使用に関する歴史的傾向」w3techs.com
    5. ^ 「よくある質問」. w3techs.com .
    6. ^ 「トルコ語を使用するウェブサイト間の文字エンコーディングの分布」w3techs.com
    7. ^ 「8.2.2.3. 文字エンコーディング」。HTML 5.1 第2版。W3C 。ユーザーエージェントはWHATWGエンコーディング標準で定義されたエンコーディングをサポートしなければならない。これには[…]が含まれるが、これに限定されるわけではない。
    8. ^ 「コードページ920情報文書」。2017年1月16日時点のオリジナルよりアーカイブ。
    9. ^ 「CCSID 920 情報文書」。2016年3月27日時点のオリジナルよりアーカイブ。
    10. ^ 標準 ECMA-128: 8 ビット シングルバイトコード化グラフィック文字セット - ラテン アルファベット No. 5 (第 2 版)。1999 年。この Ecma 出版物は ISO 8859-9 としても承認されています。
    11. ^ コードページ CPGID 00920 (pdf) (PDF)、IBM
    12. ^ コードページ CPGID 00920 (txt)、IBM
    13. ^ 国際Unicodeコンポーネント(ICU)、ibm-920_P100-1995.ucm、2002年12月3日
    • ISO/IEC 8859-9:1999
    • 標準 ECMA-128: 8 ビット シングルバイト符号化グラフィック文字セット - ラテンアルファベット No. 5第 2 版 (1999 年 12 月)
    • ISO-IR 148 ラテンアルファベット第5番の右側部分(1988年10月1日)
    Retrieved from "https://en.wikipedia.org/w/index.php?title=ISO/IEC_8859-9&oldid=1266626432"
    Original text
    Rate this translation
    Your feedback will be used to help improve Google Translate