CJK互換漢字

CJK互換漢字
範囲U+F900..U+FAFF
(512コードポイント)
飛行機BMP
スクリプトハン
割り当て済み472コードポイント
未使用40個の予約済みコードポイント
ソース標準KS X 1001
Big5
IBM 32
JIS X 0213
ARIB STD-B24
KPS 10721-2000
Unicodeのバージョン履歴
1.0.1 (1992)302 (+302)
3.2 (2002年)361 (+59)
4.1 (2005年)467 (+106)
5.2 (2009)470 (+3)
6.1 (2012)472 (+2)
Unicodeドキュメント
コードチャート ∣ ウェブページ
: [1] [2]範囲は当初Unicode 1.0.0の私的使用領域
の一部でしたが、 [3] Unicode 1.0.1でそこから削除されました。

CJK互換表意文字は、 Unicodeと他の既存の文字エンコーディング間の相互互換性を維持するために、 CJK統合表意文字の割り当て加えて、他の既存の文字エンコーディングで複数の場所でエンコードされていた漢字を主に含むように作成されたUnicodeブロックです。ただし、 IBMの日本語文字セットに由来する12個の統合表意文字も含まれています

このブロックには、Unicode表意文字異体字データベース(IVD)に登録された数十の表意文字異体字シーケンスが含まれています。[4] [5]これらのシーケンスは、特定のUnicode文字に必要なグリフ異体を指定します。

キャラクターのソース

CJK 互換表意文字のオリジナルコレクションのソースは次のとおりです。

  • 韓国語KS X 1001 (U+F900–U+FA0B、268文字。説明については該当ページを参照)
  • 台湾語Big5(U+FA0C~U+FA0D、2文字)
  • 「IBM 32」:IBMの32個の日本語文字(U+FA0E~U+FA2D、下記参照)

標準のその後のバージョンでは、次の文字がブロックに追加されました。

  • 韓国語 KS X 1001 (U+FA2E–U+FA2F、2文字)
  • 日本語JIS X 0213 (U+FA30–U+FA6A、59文字)
  • 日本語ARIB STD-B24(U+FA6B~U+FA6D、3文字)
  • 北朝鮮KPS 10721-2000(U+FA70~U+FAD9、106文字)

「IBM 32」の文字

IBM 日本語 2 バイト EBCDICには、 JIS X 0208に存在しない、または JIS X 0208 からラウンドトリップしない漢字がいくつか含まれています。これらは、 IBM (コード ページ 942など)、NECOpen Software Foundation、およびMicrosoft ( Windows コード ページ 932など)によるShift JISおよびEUC-JPの拡張で外字として含まれていました。ただし、これらは元のUnified Repertoire and Ordering (URO)のソースとしては使用されませんでした。その代わりに、他のソースからの URO に含まれていなかった 32 個の IBM 拡張漢字が、U+FA0E から U+FA2D の範囲の CJK 互換表意文字ブロックに含まれていました。

これらの 32 文字のうち:

  • 19 は URO の文字と統合可能であり、したがって厳密な意味では互換表意文字です。
  • 一つ(U+FA20 CJK互換字画-FA20)は、URO(U+8612CJK統一字画-8612)に拡張された新字体が存在する国字旧字体である。どちらも表意漢字で、人名用漢字U+8429CJK統一字画-8429(すなわちKummerowia )の異体である。U+FA20はU+8612に正規化されたが、龜と亀はどちらも部首213の形であるにもかかわらず、通常は統一可能とは考えられていない。[6]
  • 残りの12文字は、実際には統合表意文字である国字である( というUnified_Ideograph特性を持ち、正規化によって変化しない)。これらはCJK互換表意文字ブロックに含まれており、アルゴリズムによって生成された文字名が「 」で始まるにもかかわらず、元のCJK統合表意文字CJK COMPATIBILITY IDEOGRAPHブロックの文字とはまったく重複していない[7] [8]これらの12文字のうち11文字は完全に重複していないが、U+FA23CJK互換表意文字-FA23は、後にCJK統合表意文字拡張BでU+27EAF�CJK統合表意文字-27EAFとして意図せず重複した。これらは以下の通りである。
  • U+FA0E CJK互換表意文字-FA0E
  • U+FA0F CJK互換表意文字-FA0F
  • U+FA11 CJK互換表意文字-FA11
  • U+FA13 CJK互換表意文字-FA13
  • U+FA14 CJK互換表意文字-FA14
  • U+FA1F CJK互換表意文字-FA1F
  • U+FA21 CJK互換表意文字-FA21
  • U+FA23 CJK互換表意文字-FA23
  • U+FA24 CJK互換表意文字-FA24
  • U+FA27 CJK互換表意文字-FA27
  • U+FA28 CJK互換表意文字-FA28
  • U+FA29 CJK互換表意文字-FA29

ブロック

CJK互換表意文字[1] [2] [3]公式Unicodeコンソーシアムコード表(PDF)
 0123456789BCDEF
U+F90xさらに見る滑る誓い
U+F91x燃える
U+F92xさあオオカミ
U+F93xκ祿
U+F94x鹿漏れ蓄積する
U+F95x稜線ひし承諾
U+F96x怒り便ない泌尿器科ロープ妨害
U+F97x拾う
U+F98x濾す貯蓄
U+F99x撚り
U+F9Ax亀裂安いひねり
U+F9Bxゼロν尿
U+F9Cx流れ溜めるαβ
U+F9Dx二十Φ恐怖履く
U+F9Exμg罹ったDM
U+F9Fxリン孤独臨臨γいち
U+FA0x程度糖類降下
U+FA1x岡崎
U+FA2xだい隷属
U+FA3xそれに僧侶勉強する嘆く悔しい問題憎い
U+FA4x暑さ
U+FA5x災い穀物臭い
U+FA6x褐色謹んで贈与頻繁𤋮
U+FAAx墳墓奄美ボル
U+FA8x憎い
U+FA9x流れチャールズ
U+FAAx
U+FABx荒い覆う調承諾謹んで
U+FACx贈与頻繁𢡊
U+FADx𢡄𣏕𥉉𥳐𧻓
U+FAEx
U+FAFx
注記
1. ^ Unicodeバージョン17.0時点
2.灰色の部分未割り当てのコードポイントを示す
3. ^黄色の領域は、このブロックでエンコードされた 12 個の統合 CJK 文字を示します。

歴史

次の Unicode 関連ドキュメントには、CJK 互換表意文字ブロック内の特定の文字を定義する目的とプロセスが記録されています。

参照

参考文献

  1. ^ 「Unicode文字データベース」。Unicode標準。 2023年7月26日閲覧
  2. ^ 「Unicode標準の列挙バージョン」Unicode標準. 2023年7月26日閲覧
  3. ^ 「3.5: 私的使用領域」(PDF) . Unicode標準、バージョン1.0、第1巻. Unicodeコンソーシアム. 1991年. pp.  118– 119. ISBN 0-201-56788-1
  4. ^ 「表意文字異体データベース」。Unicodeコンソーシアム。
  5. ^ 「UTS #37、Unicode表意文字異体データベース」。Unicodeコンソーシアム。
  6. ^ 表意文字研究グループ(2024年11月19日). 「UCS 表意文字の非統一的構成要素バリエーション概要リスト (NUCV)」. UCV & NUCV リスト(PDF) . ISO/IEC JTC1 / SC2 /WG2/ IRG N2746.
  7. ^ "PropList.txt". Unicodeコンソーシアム.
  8. ^ Freytag, Asmus; McGowan, Rick; Whistler, Ken (2021-06-14). 「Unicode文字名における既知の異常」. Unicodeコンソーシアム. Unicodeテクニカルノート #27.これらの12文字は、名前にもかかわらず、CJK表意文字の統合であり、互換表意文字ではありません。
「https://en.wikipedia.org/w/index.php?title=CJK_Compatibility_Ideographs&oldid=1310496910」より取得