Unicodeのラテン文字

ユニコード標準では、ラテン文字の1000を超える文字がエンコードされており、いくつかの基本ラテンブロックと拡張ラテンブロックにグループ化されています。拡張範囲には、主に合成文字と、結合分音記号でエンコードされた分音記号、およびいくつかの合字と独特の文字が含まれており、たとえば、さまざまなアフリカ言語の正書法(ラテン拡張Bのクリック記号を含む)やベトナム語アルファベット(ラテン拡張追加)で使用されています。ラテン拡張Cには、ウイグル文字クラウディオ文字の追加が含まれています。ラテン拡張Dは、主に中世学者が関心を持つ文字で構成されています。ラテン拡張Eは、主にドイツ語方言学(Teuthonista)で使用される文字で構成されています。[1]ラテン拡張Fと-Gには、音声転写用の文字が含まれています。

ブロック

Unicode規格バージョン17.0では、以下の19ブロックの1,492文字がラテン文字に分類されています。[2]

さらに、通貨記号制御ピクチャCJK互換囲み英数字囲みCJK文字と月数学英数字記号囲み英数字補足ブロックには、ラテン文字に似た文字が多数エンコードされていますが、これらはグラフィカルにはラテン文字ですが、スクリプトプロパティが共通であるため、Unicodeの用語ではラテンスクリプトには属しません。Lisu文字もほぼ完全にラテン形式で構成されていますが、独自のスクリプトプロパティを使用しています。

文字一覧

この表では、 Unicodeのスクリプトプロパティがラテン文字である文字は色で強調表示されており、導入されたUnicodeのバージョンを示しています。予約済みのコードポイント(将来文字として割り当てられる可能性があるもの)は灰色の背景で表示されます。ラテン文字に属さない文字はすべて白色の背景で表示されます(したがって、導入されたUnicodeのバージョンは示されていません)。

凡例: Unicodeバージョン
ユニコード 1.0ユニコード 6.1
ユニコード 1.1ユニコード 7.0
ユニコード 2.0ユニコード 8.0
ユニコード3.0ユニコード 9.0
ユニコード 3.2ユニコード 11.0
ユニコード4.0ユニコード 12.0
ユニコード4.1ユニコード 13.0
ユニコード 5.0ユニコード 14.0
ユニコード 5.1ユニコード 15.0
ユニコード 5.2ユニコード 16.0
ユニコード 6.0ユニコード 17.0
予約済みラテン文字ではない
ユープラス0123456789BCDEFブロック#
0040@BCDEFGHJKLMC0 制御文字と基本ラテン文字
0000~007F ( ASCII
と同一)
52
0050P質問RSTあなたVWXはいZ[\]^_
0060`1つのbcdefグラムhjlメートルno
0070pqrstあなたv×yz{|}削除
00A0 ¡¢£¤¥¦§¨©ª¬®¯C1 コントロールおよびラテン 1 補足
0080–00FF ( ISO/IEC 8859-1
と同一)
64
00B0°±²³´µ·¸¹º»¼1/2¾¿
00C0ÂÃÄオーÆÇÈÊË
00D0ÐÑÒÓÔÕオーרÙÚÛÜÝÞß
00E0àáâãäåæçèéêë
00F0ðñòóôõö÷øùúûüýþÿ
0100ĀアーĂ㥹ĆćĈĉĊċČčĎďラテン語拡張A
0100–017F
128
0110ĐđĒēĔĕĖėĘęĚěĜĝĞğ
0120ĠġĢģĤĥĦħ
0130IJĴĵĶķĸĹĺĻļĽľĿ
0140ŀŁłŃńŅņŇňʼnŊŋオーおおŎŏ
0150ŐőŒœŔŕŖŗŘřŚśŜŝŞシュ
0160シュšŢţŤťŦŧ×ũŪŬŭŮů
0170ŰűŲųŴウーŶŷŸŹźŻżŽžſ
0180ƀƁƂƃƄƅƆƇƈƉƊƋƌƍƎƏラテン語拡張B
0180–024F
208
0190ƐƑƒƓƔƕƖƗƘƙƚƛƜƝƞƟ
01A0ƠơƢƣƤƥƦƧƨƩƪƫƬƭƮƯ
01B0ưƱƲƳƴƵƶƷƸƹƺƻƼƽƾƿ
01C0ǀǁǂǃDŽDždžLJLjljNJNjnjǍǎ
01D0ああǑǒǓǔǕǖǗǘǙǚǛǜǝǞǟ
01E0ǠǡǢǣǤǥǦǧǨǩǪǫǬǭǮǯ
01F0ǰDZDzdzǴǵǶǷǸǹǺǻǼǽǾǿ
0200ȀȁȂȃȄȅȆȇȈȉȊȋȌȍȎȏ
0210ȐȑȒȓȔȕȖȗȘșȚțȜȝȞȟ
0220ȠȡȢȣȤȥȦȧȨȩȪȫȬȭȮȯ
0230ȰȱȲȳȴȵȶȷȸȹȺȻȼȽȾȿ
0240ɀɁɂɃɄɅɆɇɈɉɊɋɌɍɎɏ
0250ɐɑɒɓɔɕɖɗɘəɚɛɜɝɞɟIPA拡張
0250~02AF
96
0260ɠɡɢɣɤɥɦɧɨɩɪɫɬɭɮɯ
0270ɰɱɲɳɴɵɶɷɸɹɺɻɼɽɾɿ
0280ʀʁʂʃʄʅʆʇʈʉʊʋʌʍʎʏ
0290ʐʑʒʓʔʕʖʗʘʙʚʛʜʝʞʟ
02A0ʠʡʢʣʤʥʦʧʨʩʪʫʬʭʮʯ
02B0ʰʱʲʳʴʵʶʷʸʹʺʻʼʽʾʿ間隔修飾文字
02B0~02FF
14
02E0ˠˡˢˣˤ˥˦˧˨˩˪˫ˬ˭ˮ˯
1D00音声拡張
1D00~1D7F
111
1D10
1D20
1D30ᴿ
1D40
1D50
1D60
1D70ᵿ
1D80音声拡張補足
1D80–1DBF
63
1D90
1DA0
1DB0ᶿ
1E00ラテン語拡張追加
1E00–1EFF
256
1E10
1E20
1E30ḿ
1E40
1E50
1E60
1E70ṿ
1E80
1E90
1EA0
1EB0ế
1EC0
1ED0
1EE0
1EF0ỿ
2070  上付き文字と下付き文字
2070–209F
15
2090  
2120ΩKオー文字のようなシンボル
2100 ~ 214F
4
2130
2140
2160番号フォーム
2150~218F
41
2170
2180    
2C60ラテン語拡張C
2C60–2C7F
32
2C70Ɀ
A720ラテン拡張D
A720–A7FF
199
A730
A740
A750
A760
A770
A780
A790
A7A0
A7B0
A7C0
A7D0   
A7E0                
A7F0 
AB30ꬿラテン語拡張-E
AB30–AB6F
56
AB40
AB50
AB60    
FB00フィfl         アルファベット順のプレゼンテーションフォーム7
FF20半角および全角形式
(全角ラテン文字)
FF00~FFEF
52
FF30_
FF40いいえo
FF50
10780𐞀𐞁𐞂𐞃𐞄𐞅 𐞇𐞈𐞉𐞊𐞋𐞌𐞍𐞎𐞏ラテン語拡張F
10780–107BF
57
10790𐞐𐞑𐞒𐞓𐞔𐞕𐞖𐞗𐞘𐞙𐞚𐞛𐞜𐞝𐞞𐞟
107A0𐞠𐞡𐞢𐞣𐞤𐞥𐞦𐞧𐞨𐞩𐞪𐞫𐞬𐞭𐞮𐞯
107B0𐞰 𐞲𐞳𐞴𐞵𐞶𐞷𐞸𐞹𐞺     
1DF00𝼀𝼁𝼂𝼃𝼄𝼅𝼆𝼇𝼈𝼉𝼊𝼋𝼌𝼍𝼎𝼏ラテン拡張G
1DF00–1DFFF
37
1DF10𝼐𝼑𝼒𝼓𝼔𝼕𝼖𝼗𝼘𝼙𝼚𝼛𝼜𝼝𝼞 
1DF20     𝼥𝼦𝼧𝼨𝼩𝼪     
合計文字数1,492

参照

参考文献

  1. ^ エバーソン、マイケル、ディクルベルガー、アロイス、ペンツリン、エヴェリン (2011年6月2日). 「UCSにおける「Teuthonista」音声文字の符号化に関する改訂提案」(PDF) .
  2. ^ "Scripts-17.0.0.txt". Unicode Consortium . 2025年7月24日. 2025年9月9日閲覧
この記事を聞く4
音声ウィキペディアアイコン
この音声ファイルは、2023年11月9日付の記事の改訂版から作成されたもので、その後の編集は反映されていません。 ( 2023-11-09 )
「https://en.wikipedia.org/w/index.php?title=Latin_script_in_Unicode&oldid=1316767038」より取得