テレテキスト文字セット

この記事では、ワールド システム テレテキストの標準であり、ヨーロッパのVideotexのViewdataおよびTeletextバリアントで使用されている、 ETSIの ETS 300 706 で定義された文字エンコードシステムの技術的な詳細について説明します。

文字セット

以下の表は、テレテキストの様々な文字セットを示しています。各文字は、Unicodeで同等の文字が存在する場合は、それと対応して表示されます。スペース文字と制御文字は、それぞれの文字名の略称で表されています。

制御文字

制御文字は、前景色と背景色(黒、赤、緑、黄、青、マゼンタ、シアン、白、フラッシュ)、文字の高さ(通常、倍幅、倍高、倍)、現在のデフォルト文字セット、その他の属性を設定するために使用されます。[1] [2]

ECMA-48C0制御コード( TABLFなど)との互換性が要求されないフォーマットでは、これらの制御コードはUnicodeのC0制御コード範囲(U+0000からU+001F)に透過的にマッピングされることがあります。 [3] C1制御コードセットの中で、 ITU T.101の「シリアル」データ構文2のC1制御コード[4]は、0x9BにCSIが含まれている点を除けば、ほとんどがテレテキストのスペーシング制御の転置です

テレテキストの間隔属性[2]
0123456789BCDEF
0xABKANRアンどれでもANBANMオーストラリア国民会議ANWFSH性感染症EBXSBXNSZ胸囲DBWDBS
1倍MBKMSRMSGMSYMSB主流メディアMSC廃棄物CDYSPL[あ]STL[b]ESC[c]BBD大したことないHMSRMS
  1. ^ この制御コードのETS 300 706名は「連続モザイクグラフィックス」であり、モザイク文字を連続表示に切り替える。[2]「ストップライニング」という別名は、他のフォーマットから来ており、モザイク文字を連続表示に切り替えるために使用されるほか、英数字を下線なしの表示に切り替えるために使用される。[4]
  2. ^ この制御コードのETS 300 706名は「Separated Mosaic Graphics」であり、モザイク文字を分離表示に切り替える。[2]「Start Lining」という別名は、他のフォーマットから来ており、モザイク文字を分離表示に切り替えるだけでなく、英数字を下線付き表示に切り替えるのにも使用される。[4]
  3. ^ ESCはETS 300 706によって「スイッチ」という別名も与えられています。これは特定の状況において、専用パケットによって以前に指定された2つのG0セット間の切り替えとして使用されます。[2]

ラテン

G0

テレテキスト(ラテン語G0)[5] [6]
0123456789BCDEF
2倍 SP !#¤%'*+-/
3倍0123456789:;<>?
4倍@BCDEFGHJKLM
5倍P質問RSTあなたVWXはいZ[\]^_
6倍`1つのbcdefグラムhjlメートルno
7倍pqrstあなたv×yz{|}
  国別オプションサブセット(下の表を参照)


ラテンG0国別オプションサブセット[7]
2324405B5C5D5E5階607B7C7D7E
プライマリセット#¤@[\]^_`{|}
チェコ語/スロバキア語#ůčťžýřéáěúš
英語£$@1/2# / ¼¾÷
エストニア語#õシュÄオーŽÜÕšäöžü
フランス語éàëêù#èâôûç
ドイツ語#$§ÄオーÜ^_°äöüß
イタリア語£$é°ç#ùàòè
ラトビア語/リトアニア語#$シュėęŽčšąųž
研磨#ńąƵŚŁćóężśłź
ポルトガル語/スペイン語ç$¡áéóú¿üñèà
ルーマニア語#¤Ţ / ȚÂŞ / ȘĂţ / țâş / șă
セルビア語/クロアチア語/スロベニア語#ËČĆŽĐシュëčćžđš
スウェーデン語/フィンランド語/ハンガリー語#¤ÄオーオーÜ_éäöåü
トルコ語ğŞオーÇÜĞシュöçü

G2

テレテキスト(ラテンG2)[8] [9]
0123456789BCDEF
2倍 SP ¡¢£$¥#§¤'
3倍°±²³×µ·÷'»¼1/2¾¿
4倍NBSP̧̨̣̲̀́̂̃̆̇̈̊̋̌
5倍¹®©α
6倍ΩÆÐªĦIJĿŁØŒºÞŦŊʼn
7倍ĸæđðħŀłøœßþŧŋ
  G0文字で使用する分音記号

ギリシャ語

G0

テレテキスト(ギリシャ語G0)[10]
0123456789BCDEF
2倍 SP !#$%'*+-/
3倍0123456789:;»?
4倍ΐΑΒΓΔΕΖΗΘΚΛΜΝΞΟ
5倍ΠΡʹΣΤΥΦΧΨΩΪΫάέήί
6倍ΰαβγδεζηθικλμνξο
7倍πρςστυφχψωϊϋόύώ

G2

テレテキスト(ギリシャ語G2)[11]
0123456789BCDEF
2倍 SP 1つのb£eh§:'
3倍°±²³×メートルnp÷'t¼1/2¾×
4倍̧̨̣̲̀́̂̃̆̇̈̊̋̌
5倍?¹®©ɑΊΎΏ
6倍CDFGJL質問RSあなたVWはいZΆΉ
7倍cdfグラムjlqrsあなたvyzΈ
  G0文字で使用する分音記号

キリル

G0

テレテキスト(キリル文字G0、ロシア語/ブルガリア語[12]
0123456789BCDEF
2倍 SP !#$%ы'*+-/
3倍0123456789:;<>?
4倍ЮБЦДЕФГХИЍКЛМН
5倍ПЯРСТУЖВЬЪЗШЭЩЧЫ
6倍юああбцдфгхѝклмно
7倍прстужвьъзшэщч
テレテキスト(キリル文字G0、セルビア語/クロアチア語[13]
0123456789BCDEF
2倍 SP !#$%'*+-/
3倍0123456789:;<>?
4倍ЧБЦДЕФГХИЈКЛМН
5倍ПЌРСТУВЃЉЊЗЋЖЂШЏ
6倍чああбцдфгхјклмно
7倍пќрстувѓљњзћжђш
テレテキスト(キリル文字G0、ウクライナ語[14]
0123456789BCDEF
2倍 SP !#$%ї'*+-/
3倍0123456789:;<>?
4倍ЮБЦДЕФГХИЍКЛМН
5倍ПЯРСТУЖВЬІЗШЄЩЧЇ
6倍юああбцдфгхѝклмно
7倍прстужвьізшєщч

G2

テレテキスト(キリル文字G2)[15]
0123456789BCDEF
2倍 SP ¡¢£$¥§'
3倍°±²³×µ·÷'»¼1/2¾¿
4倍̧̨̣̲̀́̂̃̆̇̈̊̋̌
5倍¹®©αŁłβ
6倍DEFGJKL質問RSあなたVWZ
7倍defグラムjlnqrsあなたvz
  G0文字で使用する分音記号

アラビア語

以下の表にあるアラビア語の文脈/位置文字はそれぞれ、可能な場合には非位置 Unicode の同等文字とともに表示されることに注意してください。

G0

テレテキスト(アラビア語 G0)[16]
0123456789BCDEF
2倍 SP !£$%*+-/
3倍0123456789:؛><؟
4倍
5倍ﺿ#
6倍ـ
7倍

G2

テレテキスト(アラビア語G2)[17]
0123456789BCDEF
2倍 SP 
3倍٠١٢٣٤٥٦٧٨٩
4倍àBCDEFGHJKLM
5倍P質問RSTあなたVWXはいZëêù
6倍é1つのbcdefグラムhjlメートルno
7倍pqrstあなたv×yzâôûç


ヘブライ語

テレテキスト(ヘブライ語 G0)[18]
0123456789BCDEF
2倍 SP !£$%'*+-/
3倍0123456789:;<>?
4倍@BCDEFGHJKLM
5倍P質問RSTあなたVWXはいZ1/2#
6倍אבגדהוזחטיךכלםמן
7倍נסעףפץצקרשת¾÷

グラフィックス文字セット

G1ブロックモザイク

テレテキスト(G1)[19] [20]
0123456789BCDEF
2倍 SP 🬀🬁🬂🬃🬄🬅🬆🬇🬈🬉🬊🬋🬌🬍🬎
3倍🬏🬐🬑🬒🬓🬔🬕🬖🬗🬘🬙🬚🬛🬜🬝
4倍
5倍
6倍🬞🬟🬠🬡🬢🬣🬤🬥🬦🬧🬨🬩🬪🬫🬬
7倍🬭🬮🬯🬰🬱🬲🬳🬴🬵🬶🬷🬸🬹🬺🬻

上記と同じ表をビットマップでレンダリングしたもの:

0123456789BCDEF
2NBSP
3
6
7

G3スムーズモザイクと線画

テレテキスト(G3)[21] [22]
0123456789BCDEF
2倍🬼🬽🬾🬿🭀🭁🭂🭃🭄🭅🭆🭨🭩🭰
3倍🭇🭈🭉🭊🭋🭌🭍🭎🭏🭐🭑🭪🭫🭵
4倍🮤🮥🮦🮧🮠🮡🮢🮣
5倍NBSP
6倍🭒🭓🭔🭕🭖🭗🭘🭙🭚🭛🭜🭬🭭
7倍🭝🭞🭟🭠🭡🭢🭣🭤🭥🭦🭧🭮🭯

参考文献

  1. ^ 「4. テレテキストとミニテル」(PDF)L2/19-025:レガシーコンピュータとテレテキストの文字をUCSに追加する提案、2019年1月4日、p. 2
  2. ^ abcde 「12.2 Spacing attribute」(PDF)Enhanced Teletext specification 、欧州電気通信標準化機構(ETSI)、1997年5月、 76~ 80ページ 、 2020年4月4日閲覧。
  3. ^ Ewell, Doug (2020-10-16). 「テレテキスト分離モザイクグラフィック」. Unicodeメーリングリストアーカイブ. Unicodeコンソーシアム.
  4. ^ abc 英国規格協会(1982-06-01). UK Videotex の属性制御セット(PDF) . ITSCJ/ IPSJ . ISO-IR -56.
  5. ^ 「15.6.1, 15.6.2」(PDF)拡張テレテキスト仕様、欧州電気通信標準化機構(ETSI)、1997年5月、pp.  114– 115 、 2020年4月4日閲覧。
  6. ^ "TELTXTG0.TXT" (PDF)L2/19-025: レガシーコンピュータとテレテキストの文字を UCS に追加するための提案、2019-01-04
  7. ^ 「15.6.2 Latin National Option Sub-Sets」(PDF)拡張テレテキスト仕様、欧州電気通信標準化機構(ETSI)、1997年5月、p. 115 、 2020年4月4日閲覧。
  8. ^ 「15.6.3 Latin G2 Set」(PDF)拡張テレテキスト仕様、欧州電気通信標準化機構(ETSI)、1997年5月、p.116 、 2020年4月4日閲覧。
  9. ^ "TELTXTG2.TXT" (PDF)L2/19-025: レガシーコンピュータとテレテキストの文字を UCS に追加するための提案、2019年1月4日
  10. ^ 「15.6.8 ギリシャ語 G0 セット」(PDF)拡張テレテキスト仕様、欧州電気通信標準化機構(ETSI)、1997年5月、p. 121 、 2020年4月4日閲覧。
  11. ^ 「15.6.9 ギリシャ語 G2 セット」(PDF)拡張テレテキスト仕様、欧州電気通信標準化機構(ETSI)、1997年5月、p. 122 、 2020年4月4日閲覧。
  12. ^ 「15.6.5 キリル文字 G0 セット - オプション 2 - ロシア語/ブルガリア語」(PDF)拡張テレテキスト仕様、欧州電気通信標準化機構(ETSI)、1997年5月、p. 118 2020年4月4日閲覧。
  13. ^ 「15.6.4 キリル文字 G0 セット - オプション 1 - セルビア語/クロアチア語」(PDF)拡張テレテキスト仕様、欧州電気通信標準化機構(ETSI)、1997年5月、p. 117 2020年4月4日閲覧。
  14. ^ 「15.6.6 キリル文字 G0 セット - オプション 3 - ウクライナ語」(PDF)拡張テレテキスト仕様、欧州電気通信標準化機構(ETSI)、1997年5月、p. 119 、 2020年4月4日閲覧。
  15. ^ 「15.6.7 キリル文字G2セット」(PDF)拡張テレテキスト仕様、欧州電気通信標準化機構(ETSI)、1997年5月、p.120 、 2020年4月4日閲覧。
  16. ^ 「15.6.10 アラビア語 G0 セット」(PDF)拡張テレテキスト仕様、欧州電気通信標準化機構(ETSI)、1997年5月、p. 123 、 2020年4月4日閲覧。
  17. ^ 「15.6.11 アラビア語 G2 セット」(PDF)拡張テレテキスト仕様、欧州電気通信標準化機構(ETSI)、1997年5月、p. 124 、 2020年4月4日閲覧。
  18. ^ 「15.6.12 ヘブライ語 G0 セット」(PDF)拡張テレテキスト仕様、欧州電気通信標準化機構(ETSI)、1997年5月、p. 125 、 2020年4月4日閲覧。
  19. ^ 「15.7.1 G1ブロックモザイクセット」(PDF)拡張テレテキスト仕様、欧州電気通信標準化機構(ETSI)、1997年5月、p.126 、 2020年4月4日閲覧。
  20. ^ "TELTXTG1.TXT" (PDF)L2/19-025: レガシーコンピュータとテレテキストの文字を UCS に追加するための提案、2019年1月4日
  21. ^ 「15.7.2 G3スムーズモザイクおよび線画セット」(PDF)拡張テレテキスト仕様、欧州電気通信標準化機構(ETSI)、1997年5月、p.127 、 2020年4月4日閲覧。
  22. ^ "TELTXTG3.TXT" (PDF)L2/19-025: レガシーコンピュータとテレテキストの文字を UCS に追加するための提案、2019年1月4日
「https://en.wikipedia.org/w/index.php?title=Teletext_character_set&oldid=1189075327」より取得