VSCII
| エイリアス | x-viet-tcvn5712[1] |
|---|---|
| 言語 | ベトナム語、英語 |
| 作成者 | TCVN /TC1 |
| 標準 | TCVN 5712:1993 |
| 分類 | 8ビットSBCS ; 拡張ASCII (VSCII-2/-3) |
VSCII(ベトナム情報交換用標準コード)は、TCVN 5712、[2] ISO-IR -180、[3] .VN、[4] ABC [4]または単にTCVNエンコーディング、[4] [5]とも呼ばれ、ベトナム語をコンピュータで使用するための3つの密接に関連したベトナム国家標準 文字エンコーディングのセットであり、TCVN情報技術技術委員会(TCVN / TC1)によって開発され、1993年に初めて採用されました(TCVN 5712:1993として)。[2]
海外在住のベトナム人によって時々使用されていた、同様の名前を持つ非公式のVISCIIエンコードと混同しないでください。[4] VISCIIはベトナム語情報交換標準コードの略称でもありますが、VSCIIとは関係ありません。[6]
VSCII(TCVN)はベトナム北部で広く使用されていましたが、VNIは南部で人気がありました。[4]現在、 UnicodeとWindows-1258コードページは、事実上すべてのベトナム語のコンピュータデータに使用されていますが、[引用が必要]、レガシーファイルやアーカイブされたメッセージは変換が必要な場合があります。
エンコーディング
VSCII の 3 つの形式はすべて、 ASCIIの 95 個の印刷可能な文字を変更せずに保持します。
VSCII-3(TCVN 5712-3、VN3、または単にTCVN3とも呼ばれる)[7]は、割り当てが最も少ない。これは拡張ASCIIであり、ASCIIの128コードすべてを変更せずに保持している。C0とC1の制御コードは再割り当てされない。ASCIIと比較して、 75文字が追加されている。
- 67 個の小文字があり、完全な小文字のサポートが可能です。
- 7 つの大文字。声調記号のない29 の基本文字に大文字のサポートを可能にします。
- 改行不可スペース。
TCVN3では、大文字の母音の声調記号は、すべて大文字のフォントに切り替えることで実現されます。[8]
VSCII-2(TCVN 5712-2、VN2とも呼ばれる)は、VSCII-3のスーパーセットです。ASCIIの128コード全てを変更せずに保持しているため、拡張ASCIIと呼ばれています。C0およびC1制御コードの再割り当ては行われず、 96セットとしてISO 2022に準拠しています。 [2] [3] VSCII-3と比較すると、以下の文字が追加されています(合計96文字の非ASCII文字)。
- 合成済みの声調記号が付いた大文字が 16 個追加されました (合計 23 個の非 ASCII 大文字)
- 5声調記号用の結合ダイアクリティカルマーク。これにより、大文字と声調記号の他の組み合わせを表現できます。結合記号は、VNIのように基底文字[2]の後に置かれます( ANSELのように基底文字の前に置かれるのではなく)。
VSCII-1(TCVN 5712-1、VN1とも呼ばれる)は、VSCII-2の拡張であり、33個の制御文字のうち12個を合成文字に置き換えた修正ASCII文字です。VSCII-2と比較すると、VSCII-1では(合計140個の非ASCII文字)以下の点が異なります。
- 44個の大文字を追加し、小文字と同じ数にします。
- これは、12個のASCII制御文字を置き換え、32個のグラフィック文字をC1制御領域に割り当てることで実現され、ISO 2022との互換性が失われます。
VSCII-3 から VSCII-2 または VSCII-1 への変換、および VSCII-2 から VSCII-1 への変換は必須ではありませんが、ファイルのサイズが小さくなる可能性があります。
VSCII-1 から VSCII-2 または VSCII-3 への変換、および VSCII-2 から VSCII-3 への変換では、いくつかの事前合成文字の拡張が必要です。
文字セット
| 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | あ | B | C | D | E | F | |
| 0x | ヌル | Ú 00DA | Ụ 1EE4 | ETX | Ừ 1EEA | 1EEC | Ữ 1EEE | ベル | BS | HT | LF | VT | FF | CR | それで | SI |
| 1倍 | DLE | Ứ 1EE8 | Ự 1EF0 | Ỳ 1EF2 | Ỷ 1EF6 | Ỹ 1EF8 | Ý 00DD | Ỵ 1EF4 | できる | EM | サブ | ESC | FS | GS | RS | 私たち |
| 2倍 | SP | ! | 「 | # | $ | % | & | ' | ( | ) | * | + | 、 | - | 。 | / |
| 3倍 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
| 4倍 | @ | あ | B | C | D | E | F | G | H | 私 | J | K | L | M | 北 | お |
| 5倍 | P | 質問 | R | S | T | あなた | V | W | X | はい | Z | [ | \ | ] | ^ | _ |
| 6倍 | ` | 1つの | b | c | d | e | f | グラム | h | 私 | j | け | l | メートル | n | o |
| 7倍 | p | q | r | s | t | あなた | v | わ | × | y | z | { | | | } | 〜 | 削除 |
| 8倍 | À 00C0 | 1EA2 | Ã 00C3 | Á 00C1 | Ạ 1EA0 | Ặ 1EB6 | 1EAC | È 00C8 | Ẻ 1EBA | 紀元前 1年 | É 00C9 | Ẹ 1EB8 | Ệ 1EC6 | Ì 00CC | Ỉ 1EC8 | Ĩ 0128 |
| 9倍 | Í 00CD | Ị 1ECA | Ò 00D2 | 1ECE | Õ 00D5 | Ó 00D3 | 1ECC | Ộ 1ED8 | Ờ 1EDC | Ở 1EDE | Ỡ 1EE0 | Ớ 1EDA | Ợ 1EE2 | Ù 00D9 | Ủ 1EE6 | × 0168 |
| 斧 | NBSP | Ă 0102 | 00C2 | Ê 00CA | Ô 00D4 | Ơ 01A0 | Ư 01AF | Đ 0110 | ă 0103 | â00E2 | ê 00EA | ô 00F4 | ơ 01A1 | ư 01B0 | đ 0111 | 1EB0 |
| バックス | ◌̀ 0300 | ◌̉ 0309 | ◌̃ 0303 | ◌́ 0301 | ◌̣ 0323 | 00E0 | 1EA3 | ã 00E3 | á 00E1 | 1EA1 | Ẳ 1EB2 | ằ 1EB1 | ẳ 1EB3 | ẵ 1EB5 | ắ 1EAF | Ẵ 1EB4 |
| センチ | Ắ 1EAE | Ầ 1EA6 | Ẩ 1EA8 | 1EAA | 1EA4 | 1EC0 | ặ 1EB7 | ầ 1EA7 | 1EA9 | 1EAB | 1EA5 | 1EAD | è 00E8 | Ể 1EC2 | ẻ 1EBB | 1EBD |
| 診断 | é 00E9 | ẹ 1EB9 | ề 1EC1 | ể 1EC3 | ễ 1EC5 | ế 1EBF | ệ 1EC7 | ì 00EC | ỉ 1EC9 | Ễ 1EC4 | Ế 1EBE | Ồ 1ED2 | ĩ 0129 | í 00ED | 1ECB | ò 00F2 |
| 元 | Ổ 1ED4 | 1ECF | õ 00F5 | ó 00F3 | 1ECD | ồ 1ED3 | ổ 1ED5 | 1ED7 | ố 1ED1 | ộ 1ED9 | ờ 1EDD | 1EDF | ỡ 1EE1 | 1EDB | 1EE3 | ù 00F9 |
| FX | Ỗ 1ED6 | ủ 1EE7 | ũ 0169 | ú 00FA | ụ 1EE5 | ừ 1EEB | ử 1EED | ữ 1EEF | ứ 1EE9 | ự 1EF1 | ỳ 1EF3 | ỷ 1EF7 | ỹ 1EF9 | ý | ỵ 1EF5 | Ố 1ED0 |
参考文献
- ^ Sivonen, Henri (2014-09-26). 「mc の文字エンコーディングの変更には cc のアクションが必要」mozilla.dev.apps.thunderbird .
- ^ abcde "[ニュース] TCVN 5712:1993 (VSCII) -- ベトナム国家規格". 1993年6月2日. 2017年1月11日時点のオリジナルよりアーカイブ。
- ^ ab TCVN (1993). ISO-IR-180: VSCII-2コード表の右側部分(PDF) . ITSCJ/ IPSJ .
- ^ abcde Ngo, Hoc Dinh; Tran, TuBinh. 「5. なぜベトナム語の文字セット(文字コード)変換が必要なのか?」WinVNKey の特別な機能.
- ^ Nguyen、Minh T.「ベトナム語変換 (Vietnet/VIQR、VNI、VPS、VISCII、VNU、TCVN、VietWare、unicode)」。
- ^ Lunde, Ken (2009年1月13日). 「第1章 CJKV情報処理の概要(§ VISCIIとVSCIIは同一か? TCVNはどうか?)」CJKV情報処理(第2版)p.17. ISBN 978-0-596-51447-1。
- ^ 「Unicodeとベトナム語の旧文字エンコーディング」。ベトナム語Unicodeに関するFAQ。
- ^ 「Unicodeとベトナム語の旧来の文字エンコーディング」。ベトナム語Unicodeに関するよくある質問。TCVN3
は2バイトではありませんが、エンコーディングの性質上、大文字(母音)は通常の小文字フォントに似た別の大文字フォントにマッピングされます。
- ^ Lunde, Ken (2009年1月13日). 「付録L:ベトナム語文字セット」(PDF) . CJKV情報処理(第2版). ISBN 978-0-596-51447-1。
外部リンク
- Unicodeポイントと名前の表