コルクエンコーディング
コーク(T1またはECとも呼ばれる)エンコーディングは、フォントのグリフをエンコードするために使用される文字エンコーディングです。[ 1 ]これは、アイルランドのコーク市にちなんで名付けられました。1990年のTeXユーザーグループ(TUG)会議で、LaTeXの新しいエンコーディングが導入されました。[1]コークには、ラテンアルファベットを使用するほとんどの西ヨーロッパおよび東ヨーロッパ言語をサポートする256文字が含まれています。[2]
詳細
8ビットTeXエンジンでは、フォントエンコーディングは、このエンコーディングが最も一般的に使用されるハイフネーションパターンのエンコーディングと一致する必要があります。 [3] LaTeXでは でこのエンコーディングに切り替えることができますが、 ConTeXt\usepackage[T1]{fontenc} MkIIではこれが既にデフォルトのエンコーディングになっています。XeTeXやLuaTeXなどの最新のエンジンではUnicodeが完全にサポートされており、8ビットフォントエンコーディングは廃止されています。
文字セット
| 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | あ | B | C | D | E | F | |
| 0x | ` 0060 | ´ 00B4 | ˆ 02C6 | 02DC | ¨ 00A8 | ˝ 02DD | ˚ 02DA | ˇ 02C7 | ˘ 02D8 | ¯ 00AF | ˙ 02D9 | ¸ 00B8 | ˛ 02DB | ‚ 201A | ‹ 2039 | › 203A |
| 1倍 | 「 201C」 | ” 201D | 201E | 「 00AB」 | » 00BB | – 2013 | — 2014 | ZWSP[a] 200B | ₀ [b] 2080 | ı [c] 0131 | ȷ [c] 0237 | ff FB00 | フィ FB01 | fl FB02 | ffi FB03 | ffl FB04 |
| 2倍 | SP | ! | 「 | # | $ | % | & | ' 2019 | ( | ) | * | + | 、 | - | 。 | / |
| 3倍 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
| 4倍 | @ | あ | B | C | D | E | F | G | H | 私 | J | K | L | M | 北 | お |
| 5倍 | P | 質問 | R | S | T | あなた | V | W | X | はい | Z | [ | \ | ] | ^ | _ |
| 6倍 | ' 2018 | 1つの | b | c | d | e | f | グラム | h | 私 | j | け | l | メートル | n | o |
| 7倍 | p | q | r | s | t | あなた | v | わ | × | y | z | { | | | } | 〜 | シャイ[d] |
| 8倍 | Ă 0102 | Ą 0104 | Ć 0106 | Č 010C | Ď 010E | Ě 011A | Ę 0118 | Ğ 011E | Ĺ 0139 | Ľ 013D | 0141ポンド | Ń 0143 | Ň 0147 | Ŋ 014A | Ő 0150 | Ŕ 0154 |
| 9倍 | Ř 0158 | Ś 015A | Š 0160 | Ş 015E | Ť 0164 | Ţ 0162 | Ű 0170 | Ů 016E | Ÿ 0178 | Ź 0179 | Ž 017D | Ż 017B | IJ 0132 | 0130 | đ 0111 | § 00A7 |
| 斧 | ă 0103 | ± 0105 | ć 0107 | č 010D | ď 010F | ě 011B | ę 0119 | ğ 011F | ĺ 013A | ľ 013E | ł 0142 | ń 0144 | ň 0148 | ŋ 014B | ő 0151 | ŕ 0155 |
| バックス | ř 0159 | ś 015B | š 0161 | シュ 015F | ť 0165 | ţ 0163 | ű 0171 | ů 016F | ÿ 00FF | ź 017A | ž 017E | ż 017C | ij 0133 | ¡ 00A1 | ¿ 00BF | £ 00A3 |
| センチ | ア | ア | Â | Ã | Ä | オー | Æ | Ç | È | エ | Ê | Ë | 私 | 私 | 私 | 私 |
| 診断 | Ð [e] | Ñ | Ò | Ó | Ô | Õ | オー | Œ 0152 | Ø | Ù | Ú | Û | Ü | Ý | Þ | SS [f] 1E9E |
| 元 | à | á | â | ã | ä | å | æ | ç | è | é | ê | ë | 私 | 私 | 私 | 私 |
| FX | ð | ñ | ò | ó | ô | õ | ö | œ 0153 | ø | ù | ú | û | ü | ý | þ | ß 00DF |
注記
- 表内の文字の下の 16 進値は、Unicode 文字コードです。
- 最初の 12 文字は結合文字としてよく使用されます。
- ^ 0x17はCorkエンコーディングでは「複合語マーク」(CWM)と呼ばれており、この規格の革新です。これは複雑な単語(例えばドイツ語)内の複合語を区切る目に見えない文字で、複合語の境界で美的合字を禁じるために使用されます。[2]これはほぼ同時期に定義されたUnicodeの「ゼロ幅スペース」(ZWSP、U+200B)に対応しており、その目的は同一ではないにしても類似しています。
- ^ 0x18は「小文字のo」で、パーセント記号(%)の中に‰または‱(または任意の小さな数量)を入れるために使用されます。 [2]
- ^ ab ドットなしの iとドットなしの j は、マクロン (ī) 付きの i のようなアクセント付きの異形を作成するために使用できます。
- ^ 0x7F はハイフネーション文字であり、Unicode で定義されているソフトハイフン(SHY) ではありません。
- ^ 0xD0 はEth (Ð, U+00D0)としても、ストローク付きの D (Đ, U+0110) としても使用されますが、場合によっては問題が発生する可能性があります (PDF からのテキストのコピー、ハイフネーションなど)
- ^ 0xDFにはSS(2つの文字S)が含まれます。これにより、TeXはドイツ語の小文字ßを大文字に自動的に変換できます。
サポートされている言語
このエンコーディングは、ラテンアルファベットで記述されるほとんどのヨーロッパ言語をサポートしています。ただし、以下の例外があります。
サポートがやや最適ではない言語には次のものがあります:
- ガリシア語、ポルトガル語、スペイン語-小文字の「a 」と「 o」の上付き文字ではない文字「ª」と「º」がないため(上付き文字は細くなります)、下線が引かれることが多い。
- クロアチア語、ボスニア語、セルビア語-Đのスロットを共有しているため
- トルコ語-点のない「i」が他の言語とは異なる大文字と小文字の組み合わせを持つため
参考文献
- ^ ab Petrlik, Lukas (1996-06-19). 「チェコ語とスロバキア語の文字エンコーディングの混乱の解説」. cs-encodings-faq . 1.10. 2016年6月21日時点のオリジナルよりアーカイブ。 2016年6月21日閲覧。
- ^ abc ファーガソン、マイケル(1990)、「多言語活動に関する報告書」(PDF)、TUGボート、11(4):514–516
- ^ TeXハイフネーションパターン
外部リンク
- エンコードファイル
- LaTeXのエンコーディングの概要