IETF言語タグ

IETF BCP 47言語タグは、インターネット上の人間の言語を識別するために使用される標準化されたコードです。 [1]タグ構造は、インターネット技術タスクフォース(IETF) [1]によってベストカレントプラクティス(BCP)47標準化されています[1]サブタグはIANA言語サブタグレジストリによって管理されています。[2] [3] [4]

国、地域、または書記体系(スクリプト)の言語バリアントを区別するために、IETF言語タグはISO 639、ISO 15924、ISO 3166-1、UN M.49などの他の標準規格のサブタグを組み合わせています。例えば、このタグenは英語、es-419ラテンアメリカスペイン語、rm-sursilvロマンシュ語(スルシルヴァ語sr-Cyrl) 、キリル文字で書かれたセルビア語、台湾で話されている伝統的な漢字を使用する閩南語、香港で話されている伝統的な漢字を使用する広東チューリッヒドイツ語を表しますnan-Hant-TWyue-Hant-HKgsw-u-sd-chzh

これはHTTP、 [5] :§8.5.1  HTML、[6] XML [7]、PNGなどのコンピューティング標準で使用されています。 [8]

歴史

IETF言語タグは、 1995年3月に発行された、 Harald Tveit Alvestrandが編集したRFC 1766 [9]で初めて定義されました。タグはISO 639の2文字言語コードとISO 3166の2文字国コードを使用し、3文字から8文字の異体またはスクリプトサブタグを含むタグ全体の登録を許可していました。

2001年1月にはRFC 3066 [10]によって更新され、 ISO 639-2の3文字コードの使用が追加され、数字を含むサブタグが許可され、言語タグのマッチングを支援するためにHTTP/1.1の言語範囲の概念が採用されました。

仕様の次の改訂は2006年9月に行われ、 Addison PhilipsとMark Davisが編集したRFC 4646 [11](仕様の主要部分)RFC 4647 [12](マッチング動作を扱う)が公開された。RFC 4646では、言語タグのより構造化されたフォーマットが導入され、ISO 15924の4文字スクリプトコードとUN M.49の3桁地理的地域コードの使用が追加され、古いタグのレジストリが新しいサブタグのレジストリに置き換えられた。新しい構造に適合しない以前に定義された少数のタグは、RFC 3066との互換性を維持するために、継承された。

仕様の現在のバージョンであるRFC 5646 [13]は、2009年9月に公開されました。この改訂の主な目的は、ISO 639とBCP 47間の相互運用性を高めるために、ISO 639-3639-5の3文字コードを言語サブタグレジストリに組み込むことでした。[14]

言語タグの構文

各言語タグは、ハイフン(-)で区切られた1つ以上の「サブタグ」で構成されます。各サブタグは、基本的なラテン文字または数字のみで構成されます。

x-プレフィックスで始まる私用言語タグと、旧言語タグ レジストリに登録されていた言語タグ ( i-プレフィックスで始まるものや、以前登録されていた言語タグを含む) を除き、サブタグは次の順序で発生します。

  • ISO 639-1 (2002)の 2 文字の言語コード、またはISO 639-2 (1998)、ISO 639-3 (2007)、または ISO 639-5 (2008)の 3 文字のコードに基づく、あるいは BCP 47 プロセスを通じて登録され、 5文字から 8 文字で構成される単一の主要言語サブタグ。
  • 最大 3 つのオプションの拡張言語サブタグ。各サブタグは 3 文字で構成され、ハイフンで区切られます。(現在、同等かつ優先されるプライマリ言語サブタグがない拡張言語サブタグは、言語サブタグ レジストリに登録されていません。言語タグのこのコンポーネントは、下位互換性と ISO 639 の将来の部分に対応するために保存されています。)
  • オプションのスクリプト サブタグ。ISO 15924の 4 文字のスクリプト コードに基づいています(通常はTitle Caseで記述されます)。
  • ISO 3166-1 alpha-2の 2 文字の国コード(通常は大文字で記述)、または地理的地域を表すUN M.49の 3 桁のコードに基づくオプションの地域サブタグ。
  • オプションのバリアント サブタグ。ハイフンで区切られ、それぞれ 5 ~ 8 文字、または数字で始まる 4 文字で構成されます (バリアント サブタグは IANA に登録されており、外部標準には関連付けられていません)。
  • オプションの拡張サブタグ。ハイフンで区切られ、それぞれ 1 つの文字(文字xを除く)とハイフンで構成され、その後に 2 ~ 8 文字の 1 つ以上のサブタグがハイフンで区切られて続きます。
  • オプションの私用サブタグ。文字xとハイフンで構成され、その後にハイフンで区切られた 1 ~ 8 文字のサブタグが続きます。

サブタグは大文字と小文字を区別しませんが、仕様では言語サブタグレジストリと同様に大文字と小文字の使用を推奨しています。つまり、地域サブタグは大文字、用字系サブタグはタイトルケース、その他のサブタグは小文字です。この大文字の使用は、基礎となるISO標準の推奨事項に従っています。

オプションの文字と地域を示すサブタグは、言語タグに識別情報を追加しない場合は省略することが望ましいです。例えば、スペイン語はラテン文字で表記されることが想定されるため、es-Latnよりもesが推奨されます。また、日本で使用されている日本語は、他の地域で使用されている日本語と大きく変わらないため 、 jaはja-JPよりも推奨されます。

すべての言語領域が有効な地域サブタグで表現できるわけではありません。主要言語の国内地域方言は、異形サブタグとして登録されます。例えば、カタロニア語のバレンシア方言を表すvalencia異形サブタグは、言語サブタグレジストリに接頭辞caで登録されています。この方言はほぼスペインでのみ話されているため、地域サブタグES は通常省略できます。

さらに、ラテン語などの伝統的な文字、または文字自体を参照しない文字タグもあり、これらは通常Zで始まります。たとえば、Zsye は絵文字Zmth数学表記Zxxxは未記載文書、Zyyyは未確定の文字を参照します

IETF言語タグは、多くのアプリケーションでロケール識別子として使用されています。RFC 4647に記載されている戦略が適切でない場合、これらのアプリケーションでは、ロケールの定義、エンコード、およびマッチングに関する独自の戦略を確立する必要があるかもしれません。

IETF言語タグの使用、解釈、およびマッチングは、現在RFC 5646およびRFC 4647で定義されています。言語サブタグレジストリには、現在有効なすべての公開サブタグがリストされています。私的利用のサブタグは実装に依存し、それらを使用する第三者間の私的合意の対象となるため、レジストリには含まれていません。これらの私的合意はBCP 47の適用範囲外です。

一般的な主要言語サブタグのリスト

以下は、よく使われる主要言語サブタグの一部です。このリストは主要言語サブタグのごく一部(2%未満)に過ぎません。詳細な情報については、言語サブタグレジストリに直接お問い合わせください。

共通言語とそのIETFサブタグ[15]
英語名ネイティブ名サブタグ
アフリカーンス語アフリカーンス語af
アムハラ語አማርኛ午前
アラビア語
アラビア語
ar
マプドゥングンマプドゥングンアーン
モロッコアラビア語
और देखें
ary
アッサム語অসমীয়াとして
アゼルバイジャン語アゼルバイカン語az
バシキール語バシュホルト
ベラルーシ語беларускаяなれ
ブルガリア語ブルガリア語背景
ベンガル語বাংলাbn
チベット語བོད་ཡིགボー
ブルトン語ブレゾネグbr
ボスニア語ボスニア語/ボサンスキーbs
カタルーニャ語カタロニア語
中央クルド人
کوردیی ناوەندی
ckb
コルシカコルス共同
チェコ語チェシュティナcs
ウェールズ語ウェールズ語サイ
デンマーク語デンマーク語
ドイツ語ドイツ語
低地ソルブ語ドルノセルブシュチナdsb
ディベヒ語
�literature
dv
ギリシャ語Ελληνικάエル
英語英語エン
スペイン語スペイン語es
エストニア語エストニア語
バスク語エウスカラ欧州連合
ペルシャ語
فارسى
ファ
フィンランド語フィンランド語フィ
フィリピン人フィリピン人フィル
フェロー語føroysktfo
フランス語フランス語fr
フリジア語フリスクfy
アイルランド語ゲール語
スコットランド・ゲール語ガイドリググッド
ギルバート語キリバスのタエタエギル
ガリシア語ガレゴ語ありがとう
スイスドイツ語スイスドイツ語gsw
グジャラート語ગુજરાતી
ハウサ語ハウサ語
ヘブライ語
עברית
ヒンディー語ヒンディー語こんにちは
クロアチア語クロアチア語時間
上ソルブ語ホルンジョセルブシュチナhsb
ハンガリー語マジャル語フー
アルメニア語Հայերենハイ
インドネシア語インドネシア語id
イボ語イボ語ig
イーꆈꌠꁱꂷii
アイスランド語イスレンスカ
イタリア語イタリア語それ
イヌクティトゥット語イヌクティトゥット/
ᐃᓄᒃᑎᑐᑦ ( ᑲᓇᑕ )
iu
日本語日本語じゃ
ジョージア語ქართული
カザフ語Қазақшаええと
グリーンランド語カラアリストkl
クメール語ខ្មែរキロ
カンナダ語ಕನ್ನಡ知っている
韓国語한국어
コンカニ語コーキコック
クルドクルディ
カルドゥシ
キルギスキルゴズky
ルクセンブルク語ルツェブルグ語ポンド
ラオスລາວ見よ
リトアニア語リトアニアlt
ラトビア語ラトビアレベル
マオリ語レオ・マオリマイル
マケドニア語Аедонски јазикメートル
マラヤーラム語മലയാളംミリリットル
モンゴル語Монгол хэл /
ᠮᠤᠨᠭᠭᠤᠯ ᠬᠡᠯᠡ
モホークカニエンケハモー
マラーティー語मराठी
マレー語マレーシア語MS
マルタ語マルティメートル
ビルマ語မြန်မာဘာသာ私の
ノルウェー語(ブークモール)ノルウェー語(ブークモール)注記
ネパール語नेपाली (नेपाल)
オランダ語オランダ語日本語
ノルウェー語(ニーノシュク)ノルウェー語(ニーノシュク)んん
ノルウェー語ノルウェー語いいえ
オック語オック語oc
オディア語ଓଡ଼ିଆまたは
パピアメント語パピアメント語パップ
パンジャブ語ਪੰਜਾਬੀ
پنجابی
研磨ポーランド語pl
ダリ語
درى
prs
パシュトー語
پښتو
追伸
ポルトガル語ポルトガル語pt
キチェ語キチェ語クック
ケチュア語ルナシミ
ロマンシュ語ルマンチュrm
ルーマニア語ルーマニア語
ロシアロシア語
キニャルワンダ語キニャルワンダ語
サンスクリットसंस्कृत
ヤクートсахаああ
サーミ語(北部)ダヴィサメギエラse
シンハラ語සිංහල
スロバキア語スロベニア語sk
スロベニア語スロベニア語sl
サーミ語(南部)åarjelsaemiengieleスマ
サーミ語(ルレ語)julevusámegiellasmj
サミ(イナリ)サミキエラsmn
サーミ語(スコルト語)sääʹmǩiõllSMS
アルバニア語シュキップ平方
セルビア語セルビア語/セルビア語シニア
セソト語セソト語st
スウェーデン語スウェーデン語sv
スワヒリ語スワヒリ語sw
シリア語
ܣܘܪܝܝܐ
syc
タミル語தமிழ்
テルグ語తెలుగు
タジク語トキキtg
タイ語ไทย番目
トルクメントルコ語ありがとう
ツワナ語セツワナ語tn
トルコ語トルコ語tr
タタール語タタルチャtt
タマジグト語タマジグト語tzm
ウイグル人
ئۇيغۇرچە
うぐい
ウクライナ語українськаイギリス
ウルドゥー語
アラドゥー
あなたの
ウズベク語ウズベクウズ
ベトナム語Tiếng Việt6
ウォロフ語ウォロフ語
コサ語イシコサ語xh
ヨルバ語ヨルバ語
中国語中国語zh
ズールー語ズールー語

他の規格との関係

一部のサブタグはISOまたはUNコア標準から派生していますが、これらの標準に完全に準拠しているわけではありません。これは、言語タグの意味が時間の経過とともに変化する可能性があるためです。特に、ISO 639ISO 15924ISO 3166、またはUN M49によって割り当てられたコードから派生したサブタグは、対応するコア標準からコードが削除された場合でも、有効な(ただし非推奨の)サブタグとして残ります。標準が後に削除されたコードに新しい意味を割り当てた場合でも、対応するサブタグは以前の意味を保持します。

この安定性は RFC 4646 で導入されました。

ISO 639-3およびISO 639-1

RFC 4646 [11]では「拡張言語サブタグ」( extlangと呼ばれることもある)の概念が定義されたが、当時はそのようなサブタグは登録されていなかった。[16] [検証失敗] [17] [検証失敗]

RFC 5645 [18]およびRFC 5646 [13]では、レジストリにまだ存在しないすべての言語について、ISO 639-3コードに対応する主要言語サブタグが追加されました。さらに、特定のマクロ言語に含まれる言語のコードは、拡張言語サブタグとして登録されました。手話も、接頭辞sgnを持つ extlang として登録されました。これらの言語は、含まれる言語のサブタグのみ(北京語の場合はcmn)または言語と extlang の組み合わせ(zh-cmn)のいずれかで表すことができます。最初のオプションは、ほとんどの目的で推奨されます。2番目のオプションは「extlang形式」と呼ばれ、RFC 5646で新しく追加されました。

RFC 4646 より前に登録され、現在では「継承」または「冗長」(新しい構文に適合するかどうかによって)に分類されているタグは、対応する ISO 639-3 ベースの言語サブタグ(存在する場合)に置き換えられ、廃止されます。いくつか例を挙げると、閩南語(閩南語)ではzh-min-nanよりもnanが、客家語(客家語)ではi-hakzh-hakkaよりも hak がアメリカ手話(アメリカ手話)ではsgn-USよりもaseが推奨されます。

Windows Vista以降のバージョンのMicrosoft WindowsはRFC 4646をサポートしています。[19]

ISO 639-5およびISO 639-1/2

ISO 639-5では、言語コレクションをアルファ3コードで定義していますが、ISO 639-2で当初エンコードされていた方法とは異なります(ISO 639-1に既に存在するコード(ISO 639-1ではbh 、ISO 639-2ではbihとして包括的にエンコードされていたビハリ語)もこれに含まれます)。具体的には、言語コレクションの一部が排他的に定義されていたのではなく、ISO 639-5ではすべて包括的に定義されています。これは、言語コレクションの適用範囲が以前よりも広くなり、場合によってはISO 639-2で既に個別にエンコードされていた言語も包含できることを意味します。

例えば、ISO 639-2のコード「afa」は以前は「アフロ・アジア語(その他)」という名称に関連付けられており、既に独自のコードを持つアラビア語などの言語は除外されていました。ISO 639-5では、この集合は「アフロ・アジア語族」と名付けられ、そのような言語をすべて含んでいます。ISO 639-2は2009年に、これらの言語をISO 639-5の包括的な名称と一致させるため、除外された名称を変更しました。[20]

これらのコレクションの古い (排他的な) 定義にまだ依存している可能性のある実装が壊れるのを避けるために、ISO 639-5 では、ISO 639-2 ですでにエンコードされているすべてのコレクションに対してグループ化タイプ属性を定義しています (このようなグループ化タイプは、ISO 639-5 でのみ追加された新しいコレクションに対しては定義されていません)。

BCP 47は、言語コレクションのサブタグを識別するための「スコープ」プロパティを定義しています。しかし、このプロパティでは、特定のコレクションが包含的か排他的かは定義されておらず、ISO 639-5のグループ化型属性も使用されていません。ただし、言語サブタグレジストリ内のこれらのサブタグの説明フィールドは、ISO 639-5(包含的)な名前と一致しています。その結果、コレクションの主要言語サブタグを含むBCP 47言語タグは、そのコレクションが包含的であるか排他的であるかが曖昧になる可能性があります。

ISO 639-5では、これらのコレクションに含まれる言語を正確に定義しておらず、これらのコレクションの包括的な定義を用いて、コレクションの階層的な分類のみが定義されています。そのため、RFC 5646では、ほとんどのアプリケーションにおいて言語コレクションにサブタグを使用することは推奨されていません。ただし、「複数言語」や「未定」など、意味がさらに限定されていないサブタグよりも、サブタグの使用が推奨されています。

対照的に、マクロ言語内の個々の言語の分類は、ISO 639-3 と言語サブタグ レジストリの両方で標準化されています。

ISO 15924、ISO/IEC 10646、Unicode

スクリプトサブタグは、 RFC 4646 [11]の公開時に、ISO 15924で定義されたコードリストから言語サブタグレジストリに初めて追加されました。スクリプトサブタグは、言語タグ内ではプライマリ言語サブタグと拡張言語サブタグの後にエンコードされますが、地域サブタグやバリアントサブタグなどの他の種類のサブタグよりも前にエンコードされます。

一部の主要言語サブタグは、「Suppress-Script」というプロパティで定義されています。これは、その言語が別の文字で記述可能であるにもかかわらず、通常はデフォルトで単一の文字体系であると想定される場合を示します。このような場合、マッチングの成功率を高めるために、文字体系サブタグを省略することが望ましいです。必要に応じて、文字体系を区別するために別の文字体系サブタグを追加することもできます。例えば、イディッシュにはヘブライ文字体系サブタグが想定されるため、ほとんどの文脈ではyiがyi-Hebrよりも推奨されます。

別の例として、zh-Hans-SG はzh-Hansと同等とみなされる可能性があります。これは、地域コードが重要ではない可能性が高いためです。シンガポールで使用される中国語の表記は、中国語が表記される他の国と同じ簡体字を使用しています。ただし、文字サブタグは重要であるため、そのまま保持されます。

ISO 15924 には、 UnicodeおよびISO/IEC 10646内で統合されているスクリプト異体 (たとえば、中国語の簡体字および繁体字を表すHansおよびHant ) のコードがいくつか含まれています。これらのスクリプト異体は、ほとんどの場合書誌目的でエンコードされますが、言語の観点からは必ずしも重要ではありません (たとえば、ラテン文字のフラクトゥール語およびゲール語の異体を表すLatfおよびLatgスクリプト コードは、Unicode および ISO/IEC 10646 ではほとんどが通常のラテン文字でエンコードされています)。これらは、言語タグで、文字、分音記号、およびデフォルトの書記素クラスターとしての二重音字/三重音字の異なる分析、または大文字と小文字のルールの違いにより、綴り方や意味の違いを明らかにするのに役立つ場合があります。

ISO 3166-1およびUN M.49

2文字の地域サブタグは、ISO 3166-1で割り当てられた、または「例外的に予約されている」コードに基づいています。ISO 3166維持機関が、以前別の国に割り当てられたコードを再割り当てする場合、そのコードに対応する既存のBCP 47サブタグの意味は保持され、新しい国に対してUN M.49に基づく新しい地域サブタグが登録されます。UN M.49は、南米などの地理的地域を表す数値地域サブタグのソースでもあります005。経済地域を表すUN M.49コードは許可されていません。

地域サブタグは、特定の地域で「使用されている」言語の変種を指定するために使用されます。変種が地域的な性質を持ち、イギリス英語( en-GB )とアメリカ英語( en-US ) を区別する場合のように、関係する国を特定することで適切に表現できる場合に適しています。簡体字繁体字のように、違いが文字または文字変種である場合は、地域サブタグではなく文字サブタグで表現する必要があります。この例では、zh-CN/zh-SG/zh-MYzh-TW/zh-HK/zh-MOの代わりに、 zh-Hanszh-Hant を使用する必要があります。

地域変種と考えられる言語に明確な言語サブタグが存在する場合、言語と地域の組み合わせではなく、より具体的なサブタグを使用する方が望ましい場合が多いです。例えば、ar-DZアルジェリアで使用されるアラビア語)は、アルジェリア口語アラビア語を表すarqと表現する方が適切です

コア基準の遵守

言語識別に関する意見の相違は、BCP 47やそれを支える中核標準にまで及ぶ可能性があります。例えば、パンジャブ語話者の中には、ISO 639-3における[pan]「パンジャブ語」と[pnb]「西パンジャブ語」の区別は誤りである(つまり、両者は同じ言語であると考えている)と考える人もいます。また、アラビア文字の亜種はISO 15924で別々に符号化されるべきである(例えば、ラテン文字のフラクトゥール文字ゲール文字のように)と考える人もいます。さらに、BCP 47はこれらの見解を反映させるか、あるいはそれらに関する中核標準を上書きすべきだと考える人もいます。

BCP 47は、この種の判断をコア標準に委任しており、コア標準を覆したり、置き換えたりしようとはしていません。異体サブタグおよび(理論上は)主要言語サブタグは個別に登録できますが、コア標準に矛盾するような方法では登録できません。[21]

拡張機能

拡張サブタグ(拡張言語サブタグと混同しないでください)を使用すると、言語タグに、必ずしも言語の識別に役立たない追加情報を付加できます。拡張サブタグの用途の一つとして、カレンダーや通貨などのロケール情報をエンコードすることが挙げられます。

拡張サブタグは、ハイフンで区切られた複数の文字列で構成され、単一の文字( x以外)で始まります。これはシングルトンと呼ばれます。各拡張は、それぞれのIETF RFCで記述されており、そのRFCでは、その拡張のデータを管理する登録機関が識別されます。シングルトンの割り当てはIANAが担当します。

2014 年 1 月現在、 2 つの延長が割り当てられています。

拡張T(変換されたコンテンツ)

拡張Tにより、言語タグに、タグ付けされたデータがどのように翻字、転写、あるいはその他の方法で変換されたかに関する情報を含めることができます。例えば、en-t-jpタグは、元の日本語から英語に翻訳されたコンテンツに使用できます。追加の部分文字列は、翻訳が機械的に行われたか、あるいは公開されている標準に従って行われたかを示すことができます。

拡張Tは、2012年2月に公開された情報RFC 6497 [22]で説明されています。登録機関はUnicodeコンソーシアムです。

拡張 U (Unicode ロケール)

拡張機能Uを使用すると、共通ロケールデータリポジトリ(CLDR)に含まれる様々なロケール属性を言語タグに埋め込むことができます。これらの属性には、国区分、暦とタイムゾーンデータ、照合順序、通貨、記数法、キーボード識別などが含まれます。

いくつかの例を以下に示します。

拡張Uは、2010年12月に公開された情報RFC 6067 [23]で説明されています。登録機関はUnicodeコンソーシアムです。

参照

参考文献

  1. ^ abc Phillips, Addison; Davis, Mark (2009年9月). 「BCP 47に関する情報 » RFCエディター」
  2. ^ 「言語サブタグレジストリ」. iana.org . Internet Assigned Numbers Authority . 2018年12月5日閲覧。
  3. ^ 「言語タグ拡張レジストリ」. iana.org . Internet Assigned Numbers Authority . 2018年12月6日閲覧。
  4. ^ 「IANA — プロトコルレジストリ」. iana.org . 2015年7月28日閲覧
  5. ^ R. Fielding、M. Nottingham、J. Reschke編(2022年6月)。HTTPセマンティクス。インターネット技術タスクフォース。doi 10.17487/ RFC9110。ISSN 2070-1721。STD  97。RFC 9110 インターネット標準 97。RFC 2818、7230、7231、7232、7233、7235、7538、7615、および 7694 を廃止します。RFC 3864 を更新します。
  6. ^ 「言語情報とテキスト方向」w3.org . 2015年7月28日閲覧
  7. ^ 「拡張マークアップ言語(XML)1.0(第5版)」w3.org . 2015年7月28日閲覧
  8. ^ 「Portable Network Graphics (PNG)仕様(第2版)」w3.org . 2015年7月28日閲覧
  9. ^ H. Alvestrand (1995年3月). 言語識別のためのタグ. ネットワークワーキンググループ. doi : 10.17487/RFC1766 . RFC 1766. 廃止。RFC 3066 および 3282 によって廃止されました。
  10. ^ H. Alvestrand (2001年1月). 言語識別のためのタグ. ネットワークワーキンググループ. doi : 10.17487/RFC3066 . BCP 47. RFC 3066. 廃止。BCP 47 でした。RFC 4646 および 4647 によって廃止されました。
  11. ^ abc A. Phillips; M. Davis編 (2006年9月). 言語を識別するためのタグ. ネットワークワーキンググループ. doi : 10.17487/RFC4646 . BCP 47. RFC 4646. 廃止。BCP 47 でした。RFC 5646 により廃止。RFC 3066 より廃止。
  12. ^ A. Phillips; M. Davis編 (2006年9月). 言語タグのマッチング. ネットワークワーキンググループ. doi : 10.17487/RFC4647 . BCP 47. RFC 4647. 現在のベストプラクティス 47。RFC 3066 を廃止します。
  13. ^ ab Phillips, A.; Davis, M.編 (2009年9月). 言語を識別するためのタグ. IETFネットワークワーキンググループ. doi : 10.17487/RFC5646 . BCP 47. RFC 5646. 現在のベストプラクティス 47。RFC 4646 を廃止します。
  14. ^ 言語タグレジストリ更新憲章 2007年2月10日アーカイブWayback Machine
  15. ^ “Letter Codes of Cultures – List”. 2022年8月7日時点のオリジナルよりアーカイブ2022年1月8日閲覧。
  16. ^ Addison Phillips、Mark Davis (2008). 「言語識別タグ(RFC 4646改訂版の旧草案、現在は廃止されており、まもなく消滅する可能性があります)」IETF WG LTRU . 2008年6月23日閲覧。
  17. ^ Doug Ewell (2008). 「言語サブタグレジストリの更新(RFC 4645改訂版の旧草案。現在は廃止されており、まもなく消滅する可能性があります)」(1MB) . IETF WG LTRU . 2008年6月23日閲覧。
  18. ^ D. Ewell編 (2009年9月). 言語サブタグレジストリの更新. IETFネットワークワーキンググループ. doi : 10.17487/RFC5645 . RFC 5645. 情報提供。
  19. ^ 「GetGeoInfoA 関数 (winnls.h) – Win32 アプリ」。
  20. ^ 「ISO 639-2 言語コードリスト – 言語名の表現コード(米国議会図書館)」. loc.gov . 2015年7月28日閲覧
  21. ^ Ewell, Doug (2022年8月12日). 「Re: [Ietf-languages] パンジャブ語のコード修正に関する推奨事項」 . 2022年8月12日閲覧
  22. ^ M. Davis 、A. Phillips、Y. Umaoka、C. Falk (2012年2月)。BCP 47 拡張T - 変換コンテンツ。インターネット技術タスクフォース。doi : 10.17487/ RFC6497。ISSN 2070-1721。RFC 6497  。 情報提供。
  23. ^ M. Davis ; A. Phillips ; Y. Umaoka (2010年12月). BCP 47 Extension U. Internet Engineering Task Force (IETF). doi : 10.17487/RFC6067 . ISSN  2070-1721. RFC 6067. 情報提供。
  • BCP 47 言語タグ – 現在の仕様
    • 異なる日付で別々に公開された 2 つの RFC が 1 つのドキュメントに連結されています。
      1. RFC 4647 –「言語タグのマッチング
      2. RFC 5646 – 「言語を識別するためのタグ
    • また、以前の情報 RFC 4645 を補完する関連情報 RFC 5645 も参照しています。また、これらの BCP 47 改訂の間にレジストリに追加または変更された言語ごとに他者によって個別に公開されたその他の個別の登録フォームも参照しています。
  • 言語サブタグレジストリ – IANAによって管理されています
  • 言語サブタグレジストリ検索 – サブタグを検索し、レジストリのエントリを表示します
  • 「HTMLとXMLの言語タグ」 – W3Cより
  • 「言語タグ」 – IETF言語タグレジストリ更新ワーキンググループより
Retrieved from "https://en.wikipedia.org/w/index.php?title=IETF_language_tag&oldid=1319979856"