コードページ949（IBM）

IBMコードページ934および944
言語	韓国語
拡張	Nバイトハングルコード
変換／エンコード	コードページ933
後継	IBMコードページ949

IBMコードページ949
	IBM-949コードページのレイアウト
別名	IBM-949、x-IBM949; ASCIIベース：IBM-949C、x-IBM949C、cp949c; UHCで曖昧：949、cp949;
言語	韓国語
作成者	IBM
分類	拡張 ISO 646、可変幅エンコーディング、CJKエンコーディング
拡張	EUC-KR
以前の	コードページ944

IBMコードページ949（IBM-949）は、IBMがコンピュータ上で韓国語のテキストを表現するために使用してきた文字エンコーディングです。韓国規格KS X 1001で定義された万城コードの文字をEUC-KRと互換性のある形式で表現する可変幅エンコーディングですが、追加の漢字、追加の合成ハングル音節、およびユーザー定義文字のためのIBM拡張機能が追加されています

16進数で値を指定すると、バイト0x00から0x7FはシングルバイトのKS X 1003（ISO 646 :KR）文字に使用されます。これはASCIIに似ていますが、バックスラッシュではなくウォン記号を使用します。バイト0x80から0x84はIBMシングルバイト拡張文字に使用されます。リードバイト0x8Fから0xA0はIBMダブルバイト拡張文字に使用されます。リードバイト0xA1から0xFEはWansungコード（ EUC-KR形式のKS X 1001文字、ダブルバイト）に使用されますが、ユーザー定義の用途のために未使用のスペースがいくつか確保されています

どちらも「cp949」と呼ばれることもありますが、IBM-949はWindowsコードページ949 （IBM-1363）とは異なります。Windowsコードページ949はMicrosoftの統一ハングルコードであり、EUC-KRの別の拡張です。また、IBMのプレーンEUC-KR実装（ IBM-970 ）と混同しないでください。OS /2のコードページ949はIBMコードページですが、これを変更するためのサードパーティ製パッチが存在します。^[1]

用語とエンコーディングラベル

IBM-949と統合ハングルコード（Windows-949）はどちらも「コードページ949」（または「cp949」）として知られていますが、共通するのはEUC-KRサブセットのみです。どちらにも、識別するための標準化されたIANA登録ラベルはありません。UHCは WHATWGエンコーディング標準^[2]に含まれており、「windows-949」を含むラベルがありますが、^[3] IBM-949は含まれていません。したがって、IBM-949はHTML5では許可されていません。

これらのラベルがサポートされている場合、「ibm-949」（および逆に「windows-949」と「ms949」）というラベルの意味は明確ですが、エンコーディングラベル「949」と「cp949」の解釈は実装によって異なります例えば、International Components for UnicodeではIBM-949を指すのに「cp949」、「949」、「ibm-949」、「x-IBM949」が使用され、^[4]また、 0x20～7EにASCIIマッピングをそのまま使用する（バックスラッシュのマッピングが重複する）バリアントを指すのに「cp949c」、「ibm-949c」、「x-IBM949C」というラベルが使用されています^[5]一方、コードページ番号949を含むラベルのうち、UHCに割り当てられているのは「ms949」と「windows-949」のみです^[6]これはPythonとは対照的です。Pythonは「cp949」と「949」（より明示的な「ms949」と「uhc」に加えて「windows-949」は認識しません）の両方をUHCのラベルとして認識し、IBM-949コーデックは含まれていません。^[7]OS/2の韓国語版で使用されるコードページ949はIBMコードページです。韓国語音節のUnicodeセット全体をサポートするために、これをMicrosoftコードページに置き換えるサードパーティ製のパッチが存在します。^[1]

IBM-949は、シングルバイトのコードページ1088とダブルバイトのコードページ951という2つの固定幅コードページの組み合わせとして定義された可変幅エンコーディングです。^[8]^[9]^[10]

歴史

IBM-949 の 2 バイト構成要素であるコードページ 951 (DBCS-PC、すなわち 2 バイトの非EUC非EBCDICコード) のバージョンは、コードページ 933 の 2 バイト構成要素であるコードページ 834 (DBCS-Host、すなわち 2 バイトの EBCDIC コード) と共に、1992 年 9 月の IBM 企業仕様書 CH 3-3220-125 の改訂版で定義されています。^[11]このバージョンのコードページ 949/951 では、先頭バイト範囲 0x8F–A0 全体をユーザ定義領域と見なし、標準の Wansung 割り当てとユーザ定義領域のみを含めたため、コードページ 933/834 に含まれていた一部の文字は含まれていませんでした。[ ^11]International Components for Unicode (ICU)によって実装されたものなど、それ以降のバージョンでは、ユーザ定義領域を縮小してこれらの文字を拡張機能として含めています。^[12]

1989年10月のCH 3-3220-125の改訂では、コードページ926がDBCS-PCコードとして定義されました。これは、IBM-834と同じ文字を、IBM-951およびIBM-834とは異なるレイアウトでエンコードしていました。IBM-951およびIBM-834は、リードバイト範囲が異なり、EUC-KR拡張ではありませんでした。^[11] IBM-926は、コードページ891またはコードページ1040（それぞれ8ビットNバイトハングルコードとその拡張。シフトJISが8ビットJIS X 0201を拡張する方法と比較してください）と結合され、それぞれIBM-934またはIBM-944を形成しました。^[13]^[14]

コードページ944/926は現在、 IBM-949に置き換えられ、非推奨となっています。1992年の改訂では、コードページ926は「制限付き」（「登録されている特定の環境に限定される」）と指定されており、他のコードページとの対応表やマッピングは提供されていません。^[11]また、CCSID 944は「共存および移行」に分類されています。 ^[14]（CCSID 949の「相互運用可能」とは対照的です）。^[8]国際Unicode構成要素（International Components for Unicode）には、IBM-949 ^[4]^[12]とIBM-933のUnicodeマッピングが含まれていますが、IBM-944のマッピングは2001年に削除されました。 ^[15]

シングルバイトコード

IBMコードページ949（シングルバイト構成要素：1088）^[16]^{[17 ]}^[4^{] [5]}^[12]
	0	1	2	3	4	5	6	7	8	9	A	B	C	D	E	F
0x	NUL	┌	┐	└	┘	│	─	•	◘	○	◙	♂	♀	♪	♫	☼
1x	┼	◄	↕	‼	¶	┴	┬	┤	↑	├	→	←	∟	↔	▲	▼
2x	SP	！	"	#	$	%	&	'	（	）	*	+	,	-	。	／
3倍	0	1	2	3	4	5	6	7	8	9	：	;	<	＝	＞	？
4倍	@	A	B	C	D	E	F	G	H	I	J	K	L	M	N	O
5倍	P	Q	R	S	T	U	V	W	X	Y	Z	[	₩	]	^	_
6倍	`	a	b	c	d	e	f	g	h	i	j	k	l	m	n	o
7倍	p	q	r	s	t	u	v	w	x	y	z	{	\|	}	~	⌂
8倍	¢	¬	\	‾<extra_id_1> U+00A6 破線	UDC											9倍
90	91	92	93	94	95	96	97	98	99	9A	9B	9C	9D	9E	9F	Ax
A0	1-_	2-_	3-_	4-_	5-_	6-_	7-_	8-_	9-_	10-_	11-_	12-_	13-_	14-_	15-_	Bx
16-_	17-_	18-_	19-_	20-_	21-_	22-_	23-_	24-_	25-_	26-_	27-_	28-_	29-_	30-_	31-_	Cx
32-_	33-_	34-_	35-_	36-_	37-_	38-_	39-_	40-_	41-_	41-_	42-_	43-_	44-_	45-_	46-_	47-_
48-_	48-_	49-_	50-_	51-_	52-_	53-_	54-_	55-_	56-_	57-_	58-_	59-_	60-_	61-_	62-_	63-_
64-_	64-_	65-_	66-_	67-_	68-_	69-_	70-_	71-_	72-_	73-_	74-_	75-_	76-_	77-_	78-_	79-_
80-_	80-_	81-_	82-_	83-_	84-_	85-_	86-_	87-_	88-_	89-_	90-_	91-_	92-_	93-_	94-_

ダブルバイトコード

先頭バイト 0x8F～99、0xC9、0xFE（ユーザー定義の範囲）

IBM-949は、最大1880個のUDC（ユーザー定義文字）をサポートするように設計されています。 [ 8 ]これには、Wansungプレーンのユーザー定義行（リードバイト0xC9と0xFE）と、Wansungプレーン外の範囲が含まれます。このバージョンでは、リードバイト0x8F～A0には最大1692個のUDCが含まれ、リードバイト0xC9と0xFEにはそれぞれ最大94個のUDCが含まれます（つまり、トレイルバイト0xA1～FEが含まれます）。 [ 11 ]ただし、 IBM-933の2バイトレパートリー全体をサポートするための拡張機能が実装されると、リードバイト0x9A～A0が使用されるため、ユーザー定義に残される最大文字数は少なくなります。 [ 4 ] [ 12 ]

IBM-949は、最大1880個のUDC（ユーザー定義文字）をサポートするように設計されています。^[8]これには、Wansungプレーンのユーザー定義行（リードバイト0xC9と0xFE）と、Wansungプレーン外の範囲が含まれます。このバージョンでは、リードバイト0x8F～A0には最大1692個のUDCが含まれ、リードバイト0xC9と0xFEにはそれぞれ最大94個のUDCが含まれます（つまり、トレイルバイト0xA1～FEが含まれます）。^{[11]ただし、}IBM-933の2バイトレパートリー全体をサポートするための拡張機能が実装されると、リードバイト0x9A～A0が使用されるため、ユーザー定義に残される最大文字数は少なくなります。^[4]^[12]

Unicodeにマッピングすると、0xC9A1～C9FE（音節と漢字の範囲の間）はUnicode私用領域のコードポイントU+E000～E05Dにマッピングされ、0xFEA1～FEFE（漢字の範囲の終わりと文字面の終わりの間）はU+E05E～E0BBにマッピングされます。万声面の外側では、0x8FA0～9AA5（2バイト目が0xA1～FEの範囲にある）は私用領域のコードポイントU+E0BC～E4CAにマッピングされます。^[4]これらの範囲の最後の部分は、0x9A行の先頭に重なります（下図参照）。

これらの私用範囲は、コードポイントU+E000～E4CAを総称してカバーし、1227 UDCをIBM-949からUnicodeにマッピングすることを可能にします。^[12]独立した私用領域範囲U+F843～F86Eは、IBMによって拡張漢字範囲内の一部の文字をマッピングするために使用されます。^[12]これは、企業文字はU+F8FFから下方に割り当てられ、ユーザー定義文字はU+E000から上方に割り当てられるという、Unicodeコンソーシアムの初期の勧告に従っており、^[18] IBMによって内部的に定義された、より大規模な企業私用領域スキームの一部であり、U+F83D～F8FFの範囲を使用します。^[19]^[20]

リードバイト0x9A～9D（拡張記号と漢字）

1992年の仕様によると、この範囲全体はユーザー定義です。^[11]しかし、IBMがICUに寄贈したコーデックに実装されているように、0x9AA1から0x9AA5がユーザー定義範囲の終わりです。この範囲の残りの部分には、コードページ933に含まれるが万成コードには含まれない、ハングル以外の文字が含まれます。0x9AA6から0x9AABには、さまざまな技術記号または数学記号が含まれます。残りの部分には、 KS X 1001に含まれるものに加えて漢字が含まれますが、一部はIBMによって私用領域にマッピングされています。^[12]

IBMコードページ949（拡張記号と漢字）^[12]^[22]
	0	1	2	3	4	5	6	7	8	9	A	B	C	D	E	F
9AAx							ǂ ^[a]	U+2267 〜より大きい〜より大きい〜に等しい	U+212A ケルビン記号	K	U+02BA 修飾文字ダブルプライム	U+F843 私用 / U+5580 CJK 表意文字	喀	擱	羯	酣
9ABx	醵	骼	蒹	哽	扃	檠	熲	畊	稧	雞	杲	瞽	詁	栱	槓	箜
9ACx	蝌	霍	盥	鸛	鉸	佝	傴	媾	嫗	晷	甌	覯	颶	掬	跪	巹
9ADx	漌	岌	笈	覇	鰭	唜	糯	喃	曩	距離	佞	獰	孥	鬧	靼	怛
9AEx	闥	韃	党	蟷	碓	菟	咄	垌	肚	蚪	滕	灯	鐙	犖	幱	埓
9AFx	榔	涼	魎	癘	膂	蠡	鑢	櫟	鬣	昤	泠	苓	蛉	潦	艫
9BAx		轤	漉	祿	轆	籟	蕾	誄	寥	僂	髏	窿	凛	廩	提	漓
9BBx	去	螭	魑	痳	岦	媽	蟇	謾	鏝	鬘	魍	眛	苺	脉	俛	耄
9BCx	鉾	濛	矇	瀰	糜	閩	婆	欂	牔	胖	髣	魴	潘	翻	辟	汴
9BDx	辮	遍在	駢	彆	遠く	鴇	黼	蝠	丰	葑	仆	罘	苻	蜉	頫	鮒
9BEx	吟	蕡	巿	髴	黻	妣	沙	沘	睥	篦	腓	轡	髀	擯	蘋	贇
9BFx	顰	鬢	姒	麝	楂	槎	笥	槊	鑠	歃	鍤	霎	殤	鰓	噬
9CAx		婿	齟	射	單	尠	愃	洗う	燹	霰	偰	契	挈	艘	霄	蟀
9CBx	瑣	変	宿	晬	溲	祟	雎	鶉	虱	啻	寺	緦	矧	瑟	萼	贋
9CCx	鴈	戞	遏	嵒	諳	黯	鞅	欸	皚	礙	靉	阨	射	篛	籥	羘
9CDx	敔	恚	射	羨望	臙	蠕	讌	塩	饜	嬰	睨	翳	蕋	遨	媼	薀
9CEx	鰮	蕘	舂	蛹	吁	熨	蜿	幃	衞	庭	バンド	蕤	黝	鬻	檼	珢
9CFx	齦	挹	栮	頣	仞	眥	粢	耔	見る	赭	柞	潜む	蚕	嶂	瘴
9DAx		装い	纔	柢	蛆	豬	糴	庭	巓	磚	翦	窃盗	椄	梃	晢	瑅
9DBx	踶	吊り	噪	皁	竈	笊	糶	絛	鯛	樅	蹤	蔟	肘	隼	則	証
9DCx	痣	湌	慚[b]	悵	気	簀	蜴	躑	濺	簷	蜻	砌	靆	峭	綃	9DDx
鈔	鞘	數	躅	髑	怱	葱	摧	槌	甃	箒	鞦	麁	麤	杻	舳	9DEx
冲	橇	贅	巵	徴	鵄	忱	拆	橐	駄	幀	蝙	庖	炮	舖	鉋	9DFx
鞄	分	蓖	蹕	瘧	邯	鷳	炕	廨	慊	篋	陜	皞	皞	醐	鶻

先頭バイト 0x9E–A0 (拡張漢字とハングル音節)

1992年の仕様によると、この範囲全体はユーザー定義です。^[11] IBMがICUに寄贈したコーデックに実装されているように、0x9EA1から0x9EACには拡張漢字の残りが含まれています。残りの範囲には、純粋なEUC-KRでは事前合成形式では利用できない、いくつかの追加のハングル音節が含まれています。統合ハングルコードとは異なり、これは万声コードにはないすべての非部分的Johab音節をサポートするには不十分です。^[12]

これらの中で重要なのは、뢔（0x9EFC）、쌰（0x9FE6）、쎼（0x9FED）、쓔（0x9FF3）、쬬（0xA0C1）で、これらは入力方式エディタで部分的に入力された場合、それぞれ標準の万声文字である뢨、썅、쏀、쓩、쭁の先頭に対応します。

IBMコードページ949（拡張漢字およびハングル音節）^[12]
	0	1	2	3	4	5	6	7	8	9	A	B	C	D	E	F
9EAx		鑊	圜	懽	鬟	媓	怳	囂	猴	篌	忻	まで	頡	갂	갋	걹
9EBx	겇	겓	곩	곺	괙	괨	괫	궛	귕	귬	긂	긏	긑	긧	긼	깄
9ECx	깉	깢	꺠	꼄	꼳	꽌	꽘	꽛	꽨	꾓	꾲	꾿	꿘	ギ	ン	ン
9EDx	ン	ン	ン	ン	ン	ン	ン	ン	ン	ン	ン	ン	ン	ン	ン	ン
ン	ン	ン	ン	ン	ン	ン	ン	ン	ン	ン	ン	ン	ン	ン	ン	ン
ン	ン	럐	렏	뢔	룜	뤗	9FAx	릐	맟	맻	먜	멫	멭	몀	몯
뫃		뫠	믁	믕	믜	믠	밎	9FBx	밨	밷	뱜	뱨	벘	벜	벹	볌
볒	볓	볔	봣	붗	붴	븘	븡	9FCx	븨	빋	뺜	뺴	뻭	뻰	뻴	뻿
뼤	뽜	뽸	뿀	뿕	뿝	뿨	쀄	9FDx	쀠	쁙	쁴	삮	삷	삻	샃	샇
샏	섥	섿	셑	셗	솓	솻	슌	9FEx	슳	싀	섿	셑	셗	솓	솻	슌
9FEx	슳	싀	싦	쌂	쌋	쌧	쌰	썃	썌	썻	쎅	쎙	쎠	쎼	쏼	쐿
9FFx	쑷	쒓	쓓	쓔	씼	씿	앏	앟	얐	얫	얶	엱	엳	옝	옫
A0Ax		옺	욷	웟	윋	윶	읻	잧	잪	젇	젔	젛	젹	졋	좐	좜
A0Bx	좠	좬	좰	좸	죨	죰	죱	줫	쥭	즤	짔	쨰	쩗	쩰	쪗	쪠
A0Cx	쫒	쬬	쮀	쯥	쯰	찟	찦	찯	찿	챂	챱	챼	쳣	쳥	쵀	췃
A0Dx	츼	칻	캗	캩	컈	컽	켙	쾍	쾐	쾟	쾬	쾽	킈	턔	텠	텩
A0Ex	ピン	ピン	ピン	ピン	ピン	ピン	ピン	ピン	ピン	ピン	ピン	ピン	ピン	ピン	ピン	ピン
リードバイト 0xA1～C8、0xCA～FD（標準Wansung）	参照	LMBCS-17	コードページ951	Windows-949	脚注	^これはIPAサポートのために含まれていません。コードページ933では、 SO 0x4160はスラッシュで表示される不等号であり、IBM-933 SO 0x418Dはバックスラッシュで表示される不等号です（つまり=⃥）。 [11]通常の不等号GCGID SA540080（ SA540000の全角）にマッピングされているのはIBM-933 SO 0x4160ですが、EUC-KRおよびIBM-949 0xA1C1にマッピングされているのはIBM-933 SO 0x418Dです。 [11]これは、KS C 5601-1987の不等号の参照グリフでもバックスラッシュで示されているためです[23]したがって、EUC-KR、つまりIBM-949 0xA1C1にマッピングされるU+2260はIBM-933 SO 0x418Dにマッピングされ、IBM-933 SO 0x4160（つまりIBM-949 0x9AA6）は視覚的に類似した文字であるU+01C2にマッピングされます。 [24]	^ IBMからのマッピングはU+5231 刱ですが、IBM文書CH 3-3220-125 1992-09のグリフはU+5259 剙（ホストコード62D5）に近いです。 [11]	参考文献	^ ab Borgendale, Ken. "OS/2 Codepage and Keyboard Display Tools".	^ van Kesteren, Anne 、「5. インデックス（§ インデックス EUC-KR）」、エンコード標準、WHATWG。これは、KS X 1001標準および統合ハングルコード（一般的にはWindowsコードページ949として知られている）と一致します。	^ van Kesteren, Anne 、「4.2. 名前とラベル」、エンコード標準、WHATWG。	^ abcde 「コンバーター・エクスプローラー：ibm-949_P110-1999（エイリアス x-IBM949）」、 International Components for Unicode 、 Unicode Consortium	^ ab 「コンバーター・エクスプローラー：ibm-949_P11A-1999（エイリアス x-IBM949C）」、 International Components for Unicode 、 Unicode Consortium	これはIBM-949のASCIIベースバージョンです	^ 「windows-949-2000」、 Converter Explorer 、International Components for Unicode

^ 「codecs — コーデックレジストリと基本クラス § 標準エンコーディング」。Python 3.7.2 ドキュメント。Python Software Foundation。

^ 「コード化文字セット識別子：CCSID 949」。IBM Globalization。IBM 。 2014年11月29日時点のオリジナルからのアーカイブ。

Footnotes

^ This is not included for IPA support. Rather, in Code page 933, SO 0x4160 is a not-equals sign displayed with a slash, while IBM-933 SO 0x418D is one displayed with a backslash (i.e. =⃥).^[11] Although it is IBM-933 SO 0x4160 which is mapped to the usual not-equals GCGID SA540080 (fullwidth of SA540000), it is IBM-933 SO 0x418D which is mapped to EUC-KR and IBM-949 0xA1C1,^[11] due to the reference glyph for the not-equals sign in KS C 5601-1987 also showing it with a backslash.^[23] Hence, U+2260, which is mapped to EUC-KR and therefore IBM-949 0xA1C1, is mapped to IBM-933 SO 0x418D, leaving IBM-933 SO 0x4160 (and therefore IBM-949 0x9AA6) to be mapped to the visually similar character at U+01C2.^[24]
^ The mapping from IBM is U+5231 刱, but the glyph in the IBM document C-H 3-3220-125 1992-09 is closer to U+5259 剙 (host code 62D5).^[11]

参考文献

^ a b Borgendale, Ken. "OS/2 Codepage and Keyboard Display Tools".
^ van Kesteren, Anne, "5. Indexes (§ index EUC-KR)", Encoding Standard, WHATWG, This matches the KS X 1001 standard and the Unified Hangul Code, more commonly known together as Windows Codepage 949.
^ van Kesteren, Anne. "4.2. Names and labels". Encoding Standard. WHATWG.
^ a b c d e "Converter Explorer: ibm-949_P110-1999 (alias x-IBM949)", International Components for Unicode, Unicode Consortium
^ a b "Converter Explorer: ibm-949_P11A-1999 (alias x-IBM949C)", International Components for Unicode, Unicode Consortium. これはIBM-949のASCIIベースバージョンです。
^ "windows-949-2000", Converter Explorer, International Components for Unicode
^ "codecs — Codec registry and base classes § Standard Encodings". Python 3.7.2 documentation. Python Software Foundation.
^ a b c "Coded character set identifiers: CCSID 949". IBM Globalization. IBM. Archived from the original on 2014-11-29.
^ "CCSID 1088 information document". Archived from the original on 2016-03-26.
^ 「コードページ951情報文書」。2017年1月16日時点のオリジナルからアーカイブ。
^ abcdefghijk 「IBM Korean Graphic Character Set: DBCS-Host and DBCS-PC」(PDF)。IBM 。2001 [1992]。CH 3-3220-125 1992年9月。
^ abcdefghij International Components for Unicode (ICU)、ibm-949_P110-1999.ucm、2002年12月3日。
^ 「コード化文字セット識別子：CCSID 934」。IBM Globalization。IBM 。 2014年12月2日時点のオリジナルからアーカイブ。
^ ab 「コード化文字セット識別子：CCSID 944」。IBM Globalization。IBM 。 2014年12月1日時点のオリジナルからアーカイブ
^ Viswanadha, Ram (2001-11-01). 「ICU-1281 不要なucmfilesの削除」. International Components for Unicode .
^ コードページ CPGID 01088 (pdf) (PDF) , IBM
^ コードページ CPGID 01088 (txt), IBM
^ 「2.0：Unicode 1.0の変更点」(PDF) . Unicode標準バージョン1.1 . Unicodeコンソーシアム. pp. 3– 4. UTR #4
^ ab "CPGID 01449: IBM デフォルト PUA". IBM グローバリゼーション：コードページ識別子. IBM . 2015年9月16日にオリジナルからアーカイブ。IBMは、U+F83DからU+F8FFまでの195の位置をIBMコーポレートゾーンとして使用するために指定しており、IBM文字のラウンドトリップ整合性を維持する必要があるときはいつでも、IBM社内で一貫して使用することを意図しています。
^ IBM (1997). unicode.nam: Unicode文字をIBMまたはPostScriptのような名前で指定できるようにします。( Borgendale, Ken, OS/2 Codepage and Keyboard Display Toolsに含まれています）
^ "ibm-933_P110-1995.ucm". International Components for Unicode
^ 私的使用領域にマッピングされた漢字は、コードチャートから識別されます。IBM文書CH 3-3220-125 1992-09には、コードページ933およびこれらの拡張機能のない旧バージョンのコードページ949の2バイト要素として使用されるコードページのコードチャートが記載されています。ただし、このセクションの漢字は、表7の「PCコード」が記載されていないサブセットに対応しており（順序も同じです）、そのサブセットと同じ順序になっています。^[11]企業私的使用領域のマッピングは、コードページ933を含む他のコードページ^[19]とも連携しており、 ^[21]特定の企業私的使用領域マッピングの「ホストコード」を取得するために使用できます。
^ 韓国標準局 (1988-10-01). 韓国語情報交換用グラフィック文字セット(PDF) . ITSCJ/ IPSJ . ISO-IR -149.
^ "ibm-933_P110-1995 (リードバイト 0E41)". Converter Explorer . Unicodeの国際コンポーネント.

[25] This is not included for IPA support. Rather, in Code page 933, SO 0x4160 is a not-equals sign displayed with a slash, while IBM-933 SO 0x418D is one displayed with a backslash (i.e. =⃥).^[11] Although it is IBM-933 SO 0x4160 which is mapped to the usual not-equals GCGID SA540080 (fullwidth of SA540000), it is IBM-933 SO 0x418D which is mapped to EUC-KR and IBM-949 0xA1C1,^[11] due to the reference glyph for the not-equals sign in KS C 5601-1987 also showing it with a backslash.^[23] Hence, U+2260, which is mapped to EUC-KR and therefore IBM-949 0xA1C1, is mapped to IBM-933 SO 0x418D, leaving IBM-933 SO 0x4160 (and therefore IBM-949 0x9AA6) to be mapped to the visually similar character at U+01C2.^[24]

[26] The mapping from IBM is U+5231 刱, but the glyph in the IBM document C-H 3-3220-125 1992-09 is closer to U+5259 剙 (host code 62D5).^[11]

[borgendale949-1] Borgendale, Ken. "OS/2 Codepage and Keyboard Display Tools".

[2] van Kesteren, Anne, "5. Indexes (§ index EUC-KR)", Encoding Standard, WHATWG, This matches the KS X 1001 standard and the Unified Hangul Code, more commonly known together as Windows Codepage 949.

[3] van Kesteren, Anne. "4.2. Names and labels". Encoding Standard. WHATWG.

[icu-4] "Converter Explorer: ibm-949_P110-1999 (alias x-IBM949)", International Components for Unicode, Unicode Consortium

[icuc-5] "Converter Explorer: ibm-949_P11A-1999 (alias x-IBM949C)", International Components for Unicode, Unicode Consortium. これはIBM-949のASCIIベースバージョンです。

[icums949-6] "windows-949-2000", Converter Explorer, International Components for Unicode

[7] "codecs — Codec registry and base classes § Standard Encodings". Python 3.7.2 documentation. Python Software Foundation.

[ccsid949-8] "Coded character set identifiers: CCSID 949". IBM Globalization. IBM. Archived from the original on 2014-11-29.

[9] "CCSID 1088 information document". Archived from the original on 2016-03-26.

[10] 「コードページ951情報文書」。2017年1月16日時点のオリジナルからアーカイブ。

[ch3320125-1992-11] 「IBM Korean Graphic Character Set: DBCS-Host and DBCS-PC」(PDF)。IBM 。2001 [1992]。CH 3-3220-125 1992年9月。

[ucm-12] International Components for Unicode (ICU)、ibm-949_P110-1999.ucm、2002年12月3日。

[ccsid934-13] 「コード化文字セット識別子：CCSID 934」。IBM Globalization。IBM 。 2014年12月2日時点のオリジナルからアーカイブ。

[ccsid944-14] 「コード化文字セット識別子：CCSID 944」。IBM Globalization。IBM 。 2014年12月1日時点のオリジナルからアーカイブ

[15] Viswanadha, Ram (2001-11-01). 「ICU-1281 不要なucmfilesの削除」. International Components for Unicode .

[16] コードページ CPGID 01088 (pdf) (PDF) , IBM

[17] コードページ CPGID 01088 (txt), IBM

[18] 「2.0：Unicode 1.0の変更点」(PDF) . Unicode標準バージョン1.1 . Unicodeコンソーシアム. pp. 3– 4. UTR #4

[ibmpua-19] "CPGID 01449: IBM デフォルト PUA". IBM グローバリゼーション：コードページ識別子. IBM . 2015年9月16日にオリジナルからアーカイブ。IBMは、U+F83DからU+F8FFまでの195の位置をIBMコーポレートゾーンとして使用するために指定しており、IBM文字のラウンドトリップ整合性を維持する必要があるときはいつでも、IBM社内で一貫して使用することを意図しています。

[20] IBM (1997). unicode.nam: Unicode文字をIBMまたはPostScriptのような名前で指定できるようにします。( Borgendale, Ken, OS/2 Codepage and Keyboard Display Toolsに含まれています）

[21] "ibm-933_P110-1995.ucm". International Components for Unicode

[puaid-22] 私的使用領域にマッピングされた漢字は、コードチャートから識別されます。IBM文書CH 3-3220-125 1992-09には、コードページ933およびこれらの拡張機能のない旧バージョンのコードページ949の2バイト要素として使用されるコードページのコードチャートが記載されています。ただし、このセクションの漢字は、表7の「PCコード」が記載されていないサブセットに対応しており（順序も同じです）、そのサブセットと同じ順序になっています。^[11]企業私的使用領域のマッピングは、コードページ933を含む他のコードページ^[19]とも連携しており、 ^[21]特定の企業私的使用領域マッピングの「ホストコード」を取得するために使用できます。

[23] 韓国標準局 (1988-10-01). 韓国語情報交換用グラフィック文字セット(PDF) . ITSCJ/ IPSJ . ISO-IR -149.

[24] "ibm-933_P110-1995 (リードバイト 0E41)". Converter Explorer . Unicodeの国際コンポーネント.

v t e 文字エンコーディング
初期の電気通信	電信符号ニードルモールス非ラテン文字和文/かな中国語音節ボドットとマレーフィールダータ ASCII ISO/IEC 646 BCDIC テレテックスとビデオテックス/テレテキスト T.51/ISO/IEC 6937 ITU T.61 ITU T.101 世界方式テレテキスト背景セットトランスコード
ISO/IEC 8859	承認部分 -1 (西ヨーロッパ) -2 (中央ヨーロッパ) -3（マルタ語／エスペラント語） -4（北ヨーロッパ） -5（キリル文字） -6（アラビア語） -7（ギリシャ語） -8（ヘブライ語） -9（トルコ語） -10（北欧） -11（タイ語） -13（バルト諸国） -14（ケルト諸語） -15（新西ヨーロッパ） -16（ルーマニア語）廃止された部分 -12（デーバナーガリー文字）提案されたが承認されなかった KOI-8 キリル文字サーミ語翻案ウェールズ語エストニア語ウクライナ語キリル文字
書誌的使用	MARC-8 ANSEL CCCII/EACC ISO 5426 5426-2 5427 5428 6438 6862
国家規格	ArmSCII Big5 BraSCII BSCII CNS 11643 DIN 66003 ELOT 927 GOST 10859 GB 2312 GB 12345 GB 12052 GB 18030 HKSCS ISCII JIS X 0201 JIS X 0208 JIS X 0212 JIS X 0213 KOI-7 KPS 9566 KS X 1001 KS X 1002 LST 1564 LST 1590-4 PASCII シフトJIS SI 960 TIS-620 TSCII VISCII VSCII YUSCII
ISO/IEC 2022	ISO/IEC 8859 ISO/IEC 10367 拡張Unixコード/EUC
Mac OSコードページ（スクリプト）	アルメニア語アラビア語バレンツ・キリル文字ケルト語中央ヨーロッパ語クロアチア語音節デーバナーガリー文字ペルシア語フォントX（カーミット）ゲール語グルジア語ボックスグジャラート語グルムキー語ヘブライ語アイスランド語イヌイット語キーボードラテン語（カーミット）マルタ語/エスペラント語オガム語ローマ字ルーマニア語サーミ語トルコ語トルコ系キリル文字ウクライナ語 VT100
DOSコードページ	437 737 850 858 861 862 863 864 865 866 867 868 869 899 904 932 936 942 949 950 951 1040 1043 1046 1098 1115 1116 1117 1118 1127 ABICOMP CS 指示語 CSX 指示語 CSX+ 指示語 CWI-2 イランシステムカメニツキーマゾフシェ MIK
IBM AIX コードページ	895 896 912 915 921 922 1006 1008 1009 1010 1012 1013 1014 1015 1016 1017 1018 1019 1046 1133
Windowsコードページ	CER-GS 932 936 ( GBK ) 950 拡張 Latin-8 1250 1251 1252 1253 1254 1255 1256 1257 1258 1270 キリル文字 + フランス語キリル文字 + ドイツ語多音ギリシャ語
EBCDICコードページ	EBCDIC の日本語 DKOI
DEC端末 ( VTx )	多国籍語 (MCS) 国内置換 (NRCS) カナダフランス語スイススペイン語イギリスオランダ語フィンランド語フランス語ノルウェー語とデンマーク語スウェーデン語ノルウェー語とデンマーク語 (代替) 8ビットギリシャ語 8ビットトルコ語 SI 960 ヘブライ語特殊グラフィックステクニカル (TCS)
プラットフォーム固有	1052 1053 1054 1055 1058 Acorn RISC OS Amstrad CPC Apple II ATASCII Atari ST BICS カシオ電卓 CDC コンピュカラー 8001 コンピュカラー II CP/M+ DEC RADIX 50 DEC MCS / NRCS DGインターナショナルガラクシヤ GEM GSM 03.38 HP Roman HP FOCAL HP RPL SQUOZE LICS LMBCS MSX NEC APC NeXT PETSCII PostScript Standard PostScript Latin 1 SAM Coupé セガ SC-3000 シャープ電卓シャープ MZ シンクレア QL テレテキスト TI電卓 TRS-80 ベンチュラインターナショナル WISCII XCCS ZX80 ZX81 ZXスペクトラム
Unicode / ISO/IEC 10646	UTF-1 UTF-7 UTF-8 UTF-16 UTF-32 UTF-EBCDIC GB 18030 DIN 91379 BOCU-1 CESU-8 SCSU TACE16 Unicodeエンコーディングの比較
TeX組版システム	Cork LY1 OML OMS OT1
その他のコードページ	ABICOMP ASMO 449 APL記号のデジタルエンコーディング ISO-IR-68 ARIB STD-B24 フィールダータ HZ IEC-P27-1 INIS 7ビット 8ビット ISO-IR-169 ISO 2033 KOI KOI8-R KOI8-RU KOI8-U 文字鏡 SEASCII スタンフォード/ITS ISO646 TRON 統一ハングルコード
制御文字	モールス信号 C0およびC1制御コード ISO/IEC 6429 JIS X 0211 Unicode制御文字、書式文字、および区切り文字空白文字
関連トピック	CCSID HTMLの文字エンコーディング文字セット検出漢字統合ハードウェアコードページ MICRコード文字化け可変長エンコード
文字

IBM-949コードページのレイアウト
別名	IBM-949、x-IBM949 ASCIIベース：IBM-949C、x-IBM949C、cp949c UHCで曖昧：949、cp949
言語	韓国語
作成者	IBM
分類	拡張 ISO 646、可変幅エンコーディング、CJKエンコーディング
拡張	EUC-KR
以前の	コードページ944