情報交換のためのインド文字コード

フリー百科事典『ウィキペディア（Wikipedia）』より

この記事にはインド語のテキストが含まれています。適切なレンダリングサポートがないため、インド語のテキストではなく、疑問符やボックス、母音の位置の誤り、接続詞の欠落が表示される場合があります

インド標準情報交換コード（ISCII ）は、インドのさまざまな表記体系を表すためのコード体系です。主要なインド諸語の文字とローマ字翻字をエンコードします。サポートされている文字体系は、ベンガル語（アッサム語）、デーバナーガリー語、グジャラート語、グルムキー語、カンナダ語、マラヤーラム語、オディア語、タミル語、テルグ語です。ISCII はペルシア語に基づくインドの表記体系はエンコードしませんが、表記体系切り替えコードはカシミール語、シンド語、ウルドゥー語、ペルシア語、パシュトー語、アラビア語に対応しています。ペルシア語に基づく表記体系はその後、PASCIIエンコードでエンコードされました。

ISCIIは一部の政府機関以外では広く使用されていませんが、 ATR機構のない変種がクラシックMac OS、Mac OS Devanagariで使用されていました^{[ 1 ]}。現在ではUnicodeによってほぼ廃止されています。Unicodeはインド諸語の表記体系ごとに別々のブロックを使用し、各ブロック内ではISCIIのレイアウトをほぼそのまま維持しています^{[ 2 ]}^。462

背景

ブラーフミー文字由来の表記体系も同様の構造を持つ。^{[ 2 ]}^{: 462}そのため、ISCIIは同じ音声値を持つ文字を同じコードポイントにエンコードし、様々な文字体系を重ね合わせている。例えば、ISCIIコード0xB3 0xDBは[ki]を表す。これはマラヤーラム語ではകി、デーヴァナーガリー語ではकि、グルムキー語ではਕਿ、タミル語ではகிと表示される。表記体系は、リッチテキストではマークアップによって、プレーンテキストでは後述するATRコードによって選択できる。

単一のエンコード方式を採用する理由の一つは、ある表記体系から別の表記体系への翻字が容易になるという点である。^{[ 2 ]}^{: 462}しかし、互換性がない部分が多いため、これは現実的ではない。

ISCIIは8ビットのエンコーディングです。^{[ 3 ]}^{: 4}下位128コードポイントはプレーンASCIIで、上位128コードポイントはISCII固有のものです。文字を表すコードポイントに加えて、ISCIIはニーモニックATRを持つコードポイントを使用します。ATRは、後続のバイトに2種類の情報のいずれかが含まれていることを示します。1つの値セットは、次の書記体系インジケータまたは行末までの書記体系を変更します。もう1つの値セットは、太字や斜体などの表示モードを選択します。ISCIIはデフォルトの書記体系を示す手段を提供していません。

コードページレイアウト

次の表はデーヴァナーガリー文字の文字セットを示しています。アッサム語、ベンガル語、グジャラート語、グルムキー語、カンナダ語、マラヤーラム語、オリヤー語、タミル語、テルグ語のコードセットは類似しており、各デーヴァナーガリー文字は各表記体系の同等の文字に置き換えられています^{[ 2 ]}^{: 462。}各文字は、10進コードとUnicodeの同等文字とともに示されています

ISCIIデーヴァナーガリー文字^{[ 3 ]}^:14
	0	1	2	3	4	5	6	7	8	9	A	B	C	D	E	F
0x	ヌル	SOH	STX	ETX	EOT	ENQ	ACK	ベル	BS	HT	LF	VT	FF	CR	SO	SI
1x	DLE	DC1	DC2	DC3	DC4	NAK	SYN	ETB	缶	EM	サブ	ESC	FS	GS	RS	US
2倍	SP	！	"	#	$	%	＆	'	（	）	*	＋	、	－	。	/
3倍	0	1	2	3	4	5	6	7	8	9	：	；	＜	＝	＞	？
4倍	@	A	B	C	D	E	F	G	H	I	J	K	L	M	N	O
5倍	P	Q	R	S	T	U	V	W	X	Y	Z	[	\	]	^	_
6倍	'	a	b	c	d	e	f	g	h	i	j	k	l	m	n	o
7倍	p	q	r	s	t	u	v	w	x	y	z	{	\|	}	~	デリート
8倍
9倍
斧		ँ	ं	ः	अ	आ	इ	ई	उ	ऊ	ऋ	ऎ	ए	ऐ	ऍ	ऒ
Bx	ओ	औ	ऑ	क	ख	ग	घ	ङ	च	छ	ज	झ	ञ	ट	ठ	ड
Cx	ढ	ण	त	थ	द	1	2	3	4	5	6	भ	म	य	य़	र
Dx	ऱ	ल	ळ	ऴ	व	श	ष	स	ह	INV	ा	ि	1	2	3	4
例	5	1	2	3	4	5	6	1	्	1	1					ATR
為替	内線	1	2	3	4	5	1	2	3	4	5

未定義

リードバイト

特殊コードポイント

INV文字 - コードポイントD9 (217): INV（不可視子音）文字は、結合要素を単独で表示するための擬似子音として使用されます。例えば、क (ka) + ् (halant) + INV = क्‍ (half ka) です。UnicodeではU+200D ZERO WIDTH JOINER ( ZWJ ) です。しかし、後述するように、 ISCII halant文字を重複させたり、ISCII nuktaと組み合わせたりすることで、 UnicodeのZWNJまたはZWJによって生成される効果を実現できます。このため、AppleはISCII INV文字をUnicodeの左から右への記号にマッピングし、ラウンドトリップを保証しています。^[¹^]
ATR文字 - コードポイントEF（239）: ATR（属性）文字にバイトコードが続く文字は、次のATRシーケンスまたは行末まで、異なるフォント属性（太字など）または異なるISCII言語またはPASCII言語（ベンガル語など）に切り替えるために使用されます。フォント属性はUnicodeの一部ではなく、各スクリプトには独自のコードポイントセットがあるため、これに直接対応するUnicode文字はありません。

プレゼンテーション属性^{[ 3 ]}^{: 31}
ATR + バイト	ニーモニック	フォーマットオプション
0x30	BLD	太字
0x31	ITA	斜体
0x32	UL	下線
0x33	経験値	拡張
0x34	HLT	ハイライト
0x35	OTL	アウトライン
0x36	SHD	シャドウ
0x37	TOP	文字の上半分（LOWと組み合わせて2倍高の文字を作成するために使用）
0x38	LOW	文字の下半分（TOPと組み合わせて2倍高の文字を作成するために使用）
0x39	DBL	行全体を2倍幅・2倍高にする

ISCIIスクリプトにシフト^{[ 3 ]}^{: 31}
ATR + バイト	ニーモニック	ISCIIスクリプト
0x40	DEF	デフォルトのスクリプト（改行後に元のスクリプトに戻るスクリプト）
0x41	RMN	ローマ字表記
0x42	DEV	デーヴァナーガリー文字
0x43	BNG	ベンガル文字
0x44	TML	タミル文字
0x45	TLG	テルグ語
0x46	ASM	アッサム語
0x47	ORI	オディア文字
0x48	KND	カンナダ文字
0x49	MLM	マラヤーラム語
0x4A	GJR	グジャラート文字
0x4B	PNJ	グルムキー文字

PASCIIにシフト
ATR + バイト	ニーモニック	PASCIIロケール
0x71	ARB	アラビア語アルファベット
0x72	PES	ペルシア語アルファベット
0x73	URD	ウルドゥー語アルファベット
0x74	SND	シンディー語アルファベット
0x75	KSM	カシミール文字
0x76	PST	パシュトゥー文字

EXT文字 - コードポイント F0 (240): EXT（ヴェーダ語の拡張）文字にバイトコードが続く文字は、ヴェーダ語のアクセントを表します。ヴェーダ語のアクセントはそれぞれ異なるコードポイントに割り当てられているため、Unicodeには直接対応する文字がありません。
ハラント文字्—コードポイントE8（232）: ハラント文字は子音から暗黙の母音を削除し、子音の間に挿入されて結合子音を表すために使用されます。例えば、क (ka) + ् (halant) + त (ta) = क्त (kta) です。् (halant) + ् (halant) というシーケンスは、明示的なハラントを含む結合子音を表します。例えば、क (ka) + ् (halant) + ् (halant) + त (ta) = क्‌त です。् (halant) + ़ (nukta) というシーケンスは、半子音を含む結合子音を表します（可能な場合）。例えば、क (ka) + ् (halant) + ़ (nukta) + त (ta) = क्‍त です。

ISCII と Unicode のhalent/virama動作の対応関係
ISCII		ユニコード
単一のハラント	`E8`	ハラント	`094D`
ハラント + ハラント	`E8 E8`	ハラント + ZWNJ	`094D 200C`
ハラント + ヌクタ	`E8 E9`	ハラント + ZWJ	`094D 200D`

ヌクタ文字 ़ — コードポイント E9 (233): 他のISCII文字の後に続くnukta文字は、ISCIIのメインセットに存在しないいくつかの珍しい文字を表すために使用されます。例えば、क (ka) + ़ (nukta) = क़ (qa) です。これらの文字は、次の表に示すように、Unicodeで合成済み形式を持っています。

ISCII nuktaシーケンスに対応する単一のUnicode文字
ISCII コードポイント	オリジナルキャラクター	ヌクタのキャラクター	Unicode コードポイント
A1 (161)	ँ	ॐ	9時50分
A6 (166)	इ	ऌ	090C
A7 (167)	ई	ॡ	0961
AA (176)	ऋ	1	0960
B3 (179)	キャ	キャ	0958
B4 (180)	ख	ख़	0959
B5 (181)	ग	ग़	095A
BA (186)	ज	ज़	095B
BF (191)	ड	ड़	095C
C0 (192)	ढ	ढ़	095D
C9 (201)	फ	फ़	095E
DB (219)	ि	ॢ	0962
DC (220)	1	1	0963
DF (223)	1	1	944
EA (234)	1	1	093D

ISCII変換用のコードページ

Unicode (UTF-8) から ISCII/ANSI コーディングに変換するには、次のコードページを使用できます。

57002: デヴァナーガリー (ヒンディー語、マラーティー語、サンスクリット語、コンカニ語)
57003: ベンガル語
57004: タミル語
57005: テルグ語
57006: アッサム語
57007: オディア語
57008: カンナダ語
57009: マラヤーラム語
57010: グジャラート語
57011: パンジャブ語（グルムキー語）

すべての言語のコードポイント

ISCII ^{[ 4 ]を使用したすべてのアブギダのコードセット}
16進数	公式リスト	ISO 15919	デーヴァナーガリー文字		ベンガル語		アッサム語		グルムキー語		グジャラート語		オリヤー語		タミル語		テルグ語		カンナダ語		マラヤーラム語
A0	サインOM	オム	ॐ	0950							ૐ	0AD0
A1	母音修飾語CHANDRABINDU	m̐	ँ	9:01	ঁ	9:81	ঁ	9:81	ਁ	0A01	ઁ	0A81	ଁ	0B01			ఁ	0C01
A2	母音修飾語ANUSWARAM	ṁ	ं	9:02	ং	9:82	ং	0982	ਂ	0A02	ં	0A82	ଂ	0B02	ஂ	0B82	ం	0C02	ಂ	0C82	ം	0D02
A3	母音修飾語VISARGAM	ḥ	ः	09:03	ঃ	09:83	ঃ	0983	ਃ	0A03	ઃ	0A83	ଃ	0B03	ஃ	0B83	ః	0C03	ಃ	0C83	ഃ	0D03
A4	母音A	a	1	9:05	2	9:85	2	9:85	ਅ	0A05	અ	0A85	ଅ	0B05	அ	0B85	అ	0C05	ಅ	0C85	അ	0D05
A5	母音AA	ā	आ	9時06分	1	9時86分	1	9時86分	1	0A06	આ	0A86	ଆ	0B06	ஆ	0B86	ఆ	0C06	ಆ	0C86	ആ	0D06
A6	母音 I	i	इ	0907	ই	0987	ই	0987	ਇ	0A07	ઇ	0A87	ଇ	0B07	இ	0B87	ఇ	0C07	ಇ	0C87	ഇ	0D07
A6*	母音LI（サンスクリット語）	ḷ	ऌ	090C	ঌ	098C	ঌ	098C			ઌ	0A8C	ଌ	0B0C			ఌ	0C0C	ಌ	0C8C	ഌ	0D0C
A7	母音 II	ī	ई	0908	ঈ	0988	ঈ	0988	ਈ	0A08	ઈ	0A88	ଈ	0B08	ஈ	0B88	ఈ	0C08	ಈ	0C88	ഈ	0D08
A7*	母音 LII（サンスクリット語）	ḹ	ॡ	0961	1	09E1	1	09E1			ૡ	0AE1	ୡ	0B61			ౡ	0C61	ೡ	0CE1	ൡ	0D61
A8	母音 U	u	1	9:09	1	9:89	1	0989	ਉ	0A09	ઉ	0A89	ଉ	0B09	உ	0B89	ఉ	0C09	ಉ	0C89	ഉ	0D09
A9	母音UU	ū	ऊ	090A	ঊ	098A	ঊ	098A	ਊ	0A0A	ઊ	0A8A	ଊ	0B0A	ஊ	0B8A	ఊ	0C0A	ಊ	0C8A	ഊ	0D0A
AA	母音RI	r̥	ऋ	090B	ঋ	098B	ঋ	098B			ઋ	0A8B	ଋ	0B0B			ఋ	0C0B	ಋ	0C8B	ഋ	0D0B
AA*	母音 RII（サンスクリット語）	ṝ	1	960	1	9E0	1	9E0			ૠ	0AE0	ୠ	0B60			ౠ	0C60	ೠ	0CE0	ൠ	0D60
AB	母音E（南部文字）	e	ऎ	090E											எ	0B8E	ఎ	0C0E	ಎ	0C8E	എ	0D0E
AC	母音 EY	ē	ए	90F	এ	98F	এ	098F	ਏ	0A0F	એ	0A8F	ଏ	0B0F	ஏ	0B8F	ఏ	0C0F	ಏ	0C8F	ഏ	0D0F
AD	母音AI	あい	ऐ	9:10	ঐ	9:90	ঐ	0990	ਐ	0A10	ઐ	0A90	ଐ	0B10	ஐ	0B90	ఐ	0C10	ಐ	0C90	ഐ	0D10
AE	母音 AYE（デーヴァナーガリー文字）	ê	ऍ	090D							ઍ	0A8D
AF	母音 O（南部文字）	o	ऒ	0912											ஒ	0B92	ఒ	0C12	ಒ	0C92	ഒ	0D12
B0	母音 OW	ō	ओ	0913	ও	0993	ও	0993	ਓ	0A13	ઓ	0A93	ଓ	0B13	ஓ	0B93	ఓ	0C13	ಓ	0C93	ഓ	0D13
B1	母音 AU	au	औ	9:14	ঔ	9:94	ঔ	0994	ਔ	0A14	ઔ	0A94	ଔ	0B14	ஔ	0B94	ఔ	0C14	ಔ	0C94	ഔ	0D14
B2	母音AWE（デーヴァナーガリー文字）	ô	ऑ	0911							ઑ	0A91
B3	子音 KA	k	キャ	0915	ক	0995	ক	0995	ਕ	0A15	ક	0A95	キ	0B15	キ	0B95	キ	0C15	ಕ	0C95	ക	0D15
B3*	子音 QA（ウルドゥー語）	q	キャ	0958
B4	子音 KHA	kh	ख	9時16分	2	9時96分	3	0996	ਖ	0A16	ખ	0A96	ଖ	0B16			ఖ	0C16	ಖ	0C96	ഖ	0D16
B4*	子音 KHHA（ウルドゥー語）	kh	ख़	0959					ਖ਼	0A59
B5	子音 GA	g	ग	9時17分	গ	9時97分	গ	9時97分	ਗ	0A17	ગ	0A97	ଗ	0B17			గ	0C17	ಗ	0C97	ഗ	0D17
B5*	子音GHHA（ウルドゥー語）	ġ	ग़	095A					ਗ਼	0A5A
B6	子音 GHA	gh	1	9時18分	2	9時98分	2	9時98分	ਘ	0A18	ઘ	0A98	ଘ	0B18			ఘ	0C18	ಘ	0C98	ഘ	0D18
B7	子音 NGA	ṅ	ङ	0919	ঙ	0999	ঙ	0999	ਙ	0A19	ઙ	0A99	ଙ	0B19	ங	0B99	ఙ	0C19	ಙ	0C99	ങ	0D19
B8	子音 CHA	c	च	091A	চ	099A	চ	099A	ਚ	0A1A	ચ	0A9A	ଚ	0B1A	ச	0B9A	చ	0C1A	ಚ	0C9A	ച	0D1A
B9	子音 CHHA	ch	छ	091B	ছ	099B	ছ	099B	ਛ	0A1B	છ	0A9B	ଛ	0B1B			ఛ	0C1B	ಛ	0C9B	ഛ	0D1B
BA	子音 JA	j	ज	091C	জ	099C	জ	099C	ਜ	0A1C	જ	0A9C	ଜ	0B1C	ஜ	0B9C	జ	0C1C	ಜ	0C9C	ജ	0D1C
BA*	子音 ZA（ウルドゥー語）	z	ज़	095B					ਜ਼	0A5B
BB	子音 JHA	jh	झ	091D	ঝ	099D	ঝ	099D	ਝ	0A1D	ઝ	0A9D	ଝ	0B1D			ఝ	0C1D	ಝ	0C9D	ഝ	0D1D
BC	子音 JNA	ñ	ञ	091E	ঞ	099E	ঞ	099E	ਞ	0A1E	ઞ	0A9E	ଞ	0B1E	ஞ	0B9E	ఞ	0C1E	ಞ	0C9E	ഞ	0D1E
BD	子音ハードTA	ṭ	ट	91F	ট	99F	ট	099F	ਟ	0A1F	ટ	0A9F	ଟ	0B1F	ட	0B9F	ట	0C1F	ಟ	0C9F	ട	0D1F
BE	子音ハードTHA	ṭh	ठ	0920	ঠ	09A0	ঠ	09A0	ਠ	0A20	ઠ	0AA0	ଠ	0B20			ఠ	0C20	ಠ	0CA0	ഠ	0D20
BF	子音ハードDA	ḍ	ड	0921	ড	09A1	ড	09A1	ਡ	0A21	ડ	0AA1	ଡ	0B21			డ	0C21	ಡ	0CA1	ഡ	0D21
BF*	子音フラップDA	ṛ	ड़	095C	ড়	09DC	ড়	09DC	ੜ	0A5C			ଡ଼	0B5C
C0	子音硬DHA	ḍh	ढ	0922	ঢ	09A2	ঢ	09A2	ਢ	0A22	ઢ	0AA2	ଢ	0B22			ఢ	0C22	ಢ	0CA2	ഢ	0D22
C0*	子音フラップDHA	ṛh	ढ़	095D	ঢ়	09DD	ঢ়	09DD					ଢ଼	0B5D
C1	子音ハード NA	ṇ	ण	0923	ণ	09A3	ণ	09A3	ਣ	0A23	ણ	0AA3	ଣ	0B23	ண	0BA3	ణ	0C23	ಣ	0CA3	ണ	0D23
C2	子音ソフトTA	t	त	0924	ত	09A4	ত	09A4	ਤ	0A24	ત	0AA4	ତ	0B24	த	0BA4	త	0C24	ತ	0CA4	ത	0D24
C3	子音の軟音THA	th	1	0925	1	09A5	1	09A5	1	0A25	2	0AA5	ଥ	0B25			థ	0C25	ಥ	0CA5	ഥ	0D25
C4	子音ソフト DA	d	द	0926	দ	09A6	দ	09A6	ਦ	0A26	દ	0AA6	ଦ	0B26			ద	0C26	ದ	0CA6	ദ	0D26
C5	子音軟音DHA	dh	ध	9時27分	1	9時A7分	1	9時A7分	1	0A27	ધ	0AA7	ଧ	0B27			ధ	0C27	1	0CA7	2	0D27
C6	子音軟音NA	n	न	0928	ন	09A8	ন	09A8	ਨ	0A28	ન	0AA8	ନ	0B28	ந	0BA8	న	0C28	ನ	0CA8	ന	0D28
C7	子音NA（タミル語）	ṉ	ऩ	0929											ன	0BA9
C8	子音 PA	p	प	092A	প	09AA	প	09AA	ਪ	0A2A	પ	0AAA	ପ	0B2A	ப	0BAA	ప	0C2A	ಪ	0CAA	പ	0D2A
C9	子音 PHA	ph	फ	092B	ফ	09AB	ফ	09AB	ਫ	0A2B	ફ	0AAB	ଫ	0B2B			ఫ	0C2B	ಫ	0CAB	ഫ	0D2B
C9*	子音FA（ウルドゥー語）	f	फ़	095E					ਫ਼	0A5E									ೞ	0CDE
CA	子音 BA	b	ब	092C	ব	09AC	ব	09AC	ਬ	0A2C	બ	0AAC	ବ	0B2C			బ	0C2C	ಬ	0CAC	ബ	0D2C
CB	子音 BHA	bh	भ	092D	ভ	西暦09年	ভ	西暦09年	ਭ	0A2D	ભ	0AAD	ଭ	0B2D			భ	0C2D	ಭ	0CAD	ഭ	0D2D
CC	子音MA	m	म	092E	ম	09AE	ম	09AE	ਮ	0A2E	મ	0AAE	ମ	0B2E	ம	0BAE	మ	0C2E	ಮ	0CAE	മ	0D2E
CD	子音YA	y	य	092F	য	09AF	য	09AF	ਯ	0A2F	ય	0AAF	ଯ	0B2F	ய	0BAF	య	0C2F	ಯ	0CAF	യ	0D2F
CE	子音 JYA（ベンガル語、アッサム語、オリヤー語）	ẏ	य़	95F	য়	9DF	য়	09DF					ୟ	0B5F
CF	子音RA	r̥	र	9時30分	র	9時09分	ৰ︎	09F0	ਰ	0A30	ર	0AB0	ର	0B30	ர	0BB0	ర	0C30	ರ	0CB0	ര	0D30
D0	子音硬RA（南部文字）	ṟ	ऱ	0931											ற	0BB1	ఱ	0C31	ಱ	0CB1	റ	0D31
D1	子音LA	l	ल	0932	ল	09B2	ল	09B2	ਲ	0A32	લ	0AB2	ଲ	0B32	ல	0BB2	ల	0C32	ಲ	0CB2	ല	0D32
D2	子音ハードLA	ḷ	ळ	0933					ਲ਼	0A33	ળ	0AB3	ଳ	0B33	ள	0BB3	ళ	0C33	ಳ	0CB3	ള	0D33
D3	子音 ZHA (タミル語およびマラヤーラム語)	ḻ	ऴ	0934											ழ	0BB4					ഴ	0D34
D4	子音VA	v	व	9時35分	ব	09AC	1	9F1	1	0A35	1	0AB5	ଵ	0B35	வ	0BB5	వ	0C35	ವ	0CB5	വ	0D35
D5	子音 SHA	ś	श	0936	শ	09B6	শ	09B6	ਸ਼	0A36	શ	0AB6	ଶ	0B36	ஶ	0BB6	శ	0C36	ಶ	0CB6	ശ	0D36
D6	子音ハードSHA	ṣ	ष	0937	ষ	09B7	ষ	09B7			ષ	0AB7	ଷ	0B37	ஷ	0BB7	ష	0C37	ಷ	0CB7	ഷ	0D37
D7	子音SA	s	स	0938	স	09B8	স	09B8	ਸ	0A38	સ	0AB8	ସ	0B38	ஸ	0BB8	స	0C38	ಸ	0CB8	സ	0D38
D8	子音ハ	h	ह	0939	হ	09B9	হ	09B9	ਹ	0A39	હ	0AB9	ହ	0B39	ஹ	0BB9	హ	0C39	ಹ	0CB9	ഹ	0D39
D9	子音見えない
だ	母音記号AA	ā	ア	093E	া	09BE	া	09BE	ਾ	0A3E	ા	0ABE	ା	0B3E	ா	0BBE	ా	0C3E	ಾ	0CBE	ാ	0D3E
DB	母音記号 I	i	ि	093F	ি	09BF	ি	09BF	ਿ	0A3F	િ	0ABF	ି	0B3F	ி	0BBF	ి	0C3F	ಿ	0CBF	ി	0D3F
DB*	母音記号LI（サンスクリット語）	ḷ	ॢ	0962	1	09E2	1	09E2			1	0AE2	ୢ	0B62			ౢ	0C62	ೢ	0CE2	ൢ	0D62
DC	母音記号 II	ī	1	9時40分	1	9時0分	1	09C0	ੀ	0A40	ી	0AC0	ୀ	0B40	ீ	0BC0	ీ	0C40	ೀ	0CC0	ീ	0D40
DC*	母音記号 LII（サンスクリット語）	ḹ	1	0963	1	09E3	1	09E3			ૣ	0AE3	ୣ	0B63			ౣ	0C63	ೣ	0CE3	ൣ	0D63
DD	母音記号U	u	1	0941	1	09C1	1	09C1	1	0A41	1	0AC1	ୁ	0B41	ு	0BC1	ు	0C41	ು	0CC1	ു	0D41
DE	母音記号 UU	ū	1	0942	1	09C2	1	09C2	ੂ	0A42	ૂ	0AC2	ୂ	0B42	ூ	0BC2	ూ	0C42	ೂ	0CC2	ൂ	0D42
DF	母音記号RI	r̥	1	943	1	9C3	1	09C3			ૃ	0AC3	ୃ	0B43			ృ	0C43	ೃ	0CC3	ൃ	0D43
DF*	母音記号RII（サンスクリット語）	ṝ	1	944	1	9C4	1	09C4			ૄ	0AC4	ୄ	0B44			ౄ	0C44	ೄ	0CC4	ൄ	0D44
E0	母音記号E（南部文字）	e	1	0946											1	0BC6	1	0C46	ೆ	0CC6	െ	0D46
E1	母音記号 EY	ē	1	0947	1	09C7	1	09C7	1	0A47	1	0AC7	େ	0B47	ே	0BC7	ే	0C47	ೇ	0CC7	േ	0D47
E2	母音記号 AI	あい	1	0948	1	09C8	1	09C8	1	0A48	1	0AC8	ୈ	0B48	ை	0BC8	ై	0C48	ೈ	0CC8	ൈ	0D48
E3	母音記号 AYE (デーヴァナーガリー文字)	ê	1	9時45分							2	0AC5
E4	母音記号 O（南部文字）	o	1	094A											1	0BCA	1	0C4A	ೊ	0CCA	ൊ	0D4A
E5	母音記号 OW	ō	ो	094B	ো	09CB	1	09CB	1	0A4B	1	0ACB	ୋ	0B4B	ோ	0BCB	ో	0C4B	ೋ	0CCB	ോ	0D4B
E6	母音記号 AU	au	1	094C	1	09CC	1	09CC	1	0A4C	1	0ACC	ୌ	0B4C	ௌ	0BCC	ౌ	0C4C	ೌ	0CCC	ൌ	0D4C
E7	母音記号AWE（デーヴァナーガリー文字）	ô	1	949							1	0AC9
E8	母音省略記号（ハラント）		्	094D	1	09CD	1	09CD	੍	0A4D	્	0ACD	୍	0B4D	்	0BCD	్	0C4D	್	0CCD	്	0D4D
E9	発音区別符号（ヌクタム）		़	093C	়	紀元前9年	়	紀元前9年	਼	0A3C	઼	0ABC	଼	0B3C					಼	0CBC
EA	フルストップ（Viram、ノーザンスクリプト）		1	0964
EA*	母音の強勢記号AVAGRAH		1	093D	ঽ	09BD	ঽ	09BD			ઽ	0ABD	ଽ	0B3D			ఽ	0C3D	ಽ	0CBD	ഽ	0D3D
EB	未使用
EC	未使用
ED	未使用
EE	未使用
EF	属性コード
F0	内線コード
F1	数字0		1	0966	1	09E6	1	09E6	1	0A66	૦	0AE6	୦	0B66	௦	0BE6	౦	0C66	೦	0CE6	൦	0D66
F2	数字1		1	0967	1	09E7	1	09E7	1	0A67	1	0AE7	୧	0B67	௧	0BE7	౧	0C67	೧	0CE7	൧	0D67
F3	数字2		1	968	1	9E8	1	9E8	੨	0A68	૨	0AE8	୨	0B68	௨	0BE8	౨	0C68	೨	0CE8	൨	0D68
F4	数字3		1	0969	1	09E9	1	09E9	1	0A69	૩	0AE9	୩	0B69	௩	0BE9	౩	0C69	೩	0CE9	൩	0D69
F5	数字4		1	096A	1	09EA	1	09EA	1	0A6A	1	0AEA	୪	0B6A	௪	0BEA	౪	0C6A	೪	0CEA	൪	0D6A
F6	数字5		1	096B	1	09EB	1	09EB	੫	0A6B	૫	0AEB	୫	0B6B	௫	0BEB	౫	0C6B	೫	0CEB	൫	0D6B<extra_id_1> F7
数字6	६		096C	1	09EC	1	09EC	1	0A6C	૬	0AEC	୬	0B6C	௬	0BEC	౬	0C6C	೬	0CEC	൬	0D6C	F8
数字7	1		096D	1	09ED	1	09ED	1	0A6D	1	0AED	୭	0B6D	௭	0BED	౭	0C6D	೭	0CED	൭	0D6D	F9
数字8	1		096E	1	09EE	1	09EE	੮	0A6E	૮	0AEE	୮	0B6E	௮	0BEE	౮	0C6E	೮	0CEE	൮	0D6E	FA
数字9	1		096F	1	09EF	1	09EF	1	0A6F	૯	0AEF	୯	0B6F	௯	0BEF	౯	0C6F	೯	0CEF	൯	0D6F	FB
FC	未使用
FD	未使用
FE	未使用
FF	未使用
FF	未使用

[編集]

^ ^a ^b c d Unicode標準v15.0第12章(PDF) . Unicodeコンソーシアム. 閲覧
^ ^a ^b ^c ^d e IS13194:1991 (ソフトコピー) (PDF) . インド規格協会. 1999年.
^
^
- 外部リンク

ISCIIと各種フォント間のコンバータ

この記事にはインド語のテキストが含まれています。適切なレンダリングサポートがないため、インド語のテキストではなく、疑問符やボックス、母音の位置の誤り、接続詞の欠落が表示される場合があります

インド標準情報交換コード（ISCII ）は、インドのさまざまな表記体系を表すためのコード体系です。主要なインド諸語の文字とローマ字翻字をエンコードします。サポートされている文字体系は、ベンガル語（アッサム語）、デーバナーガリー語、グジャラート語、グルムキー語、カンナダ語、マラヤーラム語、オディア語、タミル語、テルグ語です。ISCII はペルシア語に基づくインドの表記体系はエンコードしませんが、表記体系切り替えコードはカシミール語、シンド語、ウルドゥー語、ペルシア語、パシュトー語、アラビア語に対応しています。ペルシア語に基づく表記体系はその後、PASCIIエンコードでエンコードされました。

ISCIIは一部の政府機関以外では広く使用されていませんが、 ATR機構のない変種がクラシックMac OS（Mac OS Devanagari）で使用されていました^{[1] 。現在では}Unicodeによってほぼ廃止されています。Unicodeはインド諸語の表記体系ごとに別々のブロックを使用し、各ブロック内ではISCIIのレイアウトをほぼそのまま維持しています。^[2]^{: 462}

背景

ブラーフミー文字由来の表記体系は類似した構造を持っています。^[2]^：462そのため、ISCIIは同じコードポイントで同じ音声値を持つ文字をエンコードし、様々な文字体系を重ね合わせます。例えば、ISCIIコード0xB3 0xDBは[ki]を表します。これはマラヤーラム語ではകി、デーヴァナーガリー語ではकि、グルムキー語ではਕਿ、タミル語ではகிと表示されます。表記体系は、マークアップによるリッチテキスト、または後述するATRコードによるプレーンテキストで選択できます

単一のエンコード方式を採用する理由の一つは、ある表記体系から別の表記体系への翻字が容易になるという点である。^[2]^{: 462}しかし、互換性がない部分が多々あるため、これは現実的ではない。

ISCIIは8ビットのエンコーディングです。^[3]^{: 4}下位128コードポイントはプレーンASCIIで、上位128コードポイントはISCII固有のものです。文字を表すコードポイントに加えて、ISCIIはニーモニックATRを持つコードポイントを使用します。ATRは、後続のバイトに2種類の情報のいずれかが含まれていることを示します。1つの値セットは、次の書記体系インジケータまたは行末までの書記体系を変更します。もう1つの値セットは、太字や斜体などの表示モードを選択します。ISCIIはデフォルトの書記体系を示す手段を提供していません。

コードページレイアウト

次の表はデーヴァナーガリー文字の文字セットを示しています。アッサム語、ベンガル語、グジャラート語、グルムキー語、カンナダ語、マラヤーラム語、オリヤー語、タミル語、テルグ語のコードセットは類似しており、各デーヴァナーガリー文字は各表記体系の同等の文字に置き換えられています^[2]^{: 462。}各文字は、10進コードとUnicodeの同等文字とともに示されています

ISCIIデーヴァナーガリー文字^[3]^：14
	0	1	2	3	4	5	6	7	8	9	A	B	C	D	E	F
0x	ヌル	SOH	STX	ETX	EOT	ENQ	ACK	ベル	BS	HT	LF	VT	FF	CR	SO	SI
1x	DLE	DC1	DC2	DC3	DC4	NAK	SYN	ETB	缶	EM	サブ	ESC	FS	GS	RS	US
2倍	SP	！	"	#	$	%	＆	'	（	）	*	＋	、	－	。	/
3倍	0	1	2	3	4	5	6	7	8	9	：	；	＜	＝	＞	？
4倍	@	A	B	C	D	E	F	G	H	I	J	K	L	M	N	O
5倍	P	Q	R	S	T	U	V	W	X	Y	Z	[	\	]	^	_
6倍	'	a	b	c	d	e	f	g	h	i	j	k	l	m	n	o
7倍	p	q	r	s	t	u	v	w	x	y	z	{	\|	}	~	デリート
8倍
9倍
斧		ँ	ं	ः	अ	आ	इ	ई	उ	ऊ	ऋ	ऎ	ए	ऐ	ऍ	ऒ
Bx	ओ	औ	ऑ	क	ख	ग	घ	ङ	च	छ	ज	झ	ञ	ट	ठ	ड
Cx	ढ	ण	त	थ	द	1	2	3	4	5	6	भ	म	य	य़	र
Dx	ऱ	ल	ळ	ऴ	व	श	ष	स	ह	INV	ा	ि	1	2	3	4
例	5	1	2	3	4	5	6	1	्	1	1					ATR
為替	内線	1	2	3	4	5	1	2	3	4	5

未定義