主辞駆動句構造文法

主辞駆動句構造文法HPSG)は、Carl PollardIvan Sag によって開発された、高度に語彙化された制約ベースの文法です。 [ 1 ] [ 2 ][ 3 ] [ 4 ]これは、依存文法とは対照的な句構造文法の一種であり、一般化句構造文法の直接の後継です。HPSGは、コンピュータサイエンスデータ型理論知識表現)などの他の分野から着想を得ており、フェルディナン・ド・ソシュール記号の概念を使用しています。統一的な形式主義を採用し、モジュール方式で構成されているため、自然言語処理に適しています。

HPSGには、原則、文法規則、そして通常は文法に属さないと考えられる語彙項目が含まれます。その形式は語彙主義に基づいています。つまり、語彙項目は単なる項目のリストではなく、それ自体が豊かに構造化されています。個々の項目は型でマークされ、型は階層構造を形成します。初期の文法は非常に語彙化されており、文法規則(スキーマ)は少数でした。近年の研究では、より多くの、より豊富な規則が追加され、より構文文法に近いものになってきています。[ 5 ]

HPSGが扱う基本的な型は記号です。単語句は記号の異なるサブタイプです。単語には[PHON](音、音声形式)と[SYNSEM]統語的および意味的情報)という2つの素性があり、どちらもサブ素性に分割されます。記号と規則は、型付き素性構造として形式化されます。

サンプル文法

HPSGは記号を組み合わせて文字列を生成します。記号は型階層内の位置と、属性値行列(AVM)で表される内部素性構造によって定義されます。 [ 4 ] [ 6 ]素性は型または型のリストを値として取り、これらの値は独自の素性構造を持つ場合があります。文法規則は主に、記号が互いに課す制約を通じて表現されます。記号の素性構造は、音韻的、統語的、および意味的な特性を記述します。一般的な表記法では、AVMは素性を大文字で、型をイタリック体の小文字で表記します。AVM内の番号付きインデックスは、トークンの同一値を表します。

下記の単語「walks」(この場合は「nice walks for the weekend」のような名詞ではなく動詞)の簡略化された AVM では、動詞のカテゴリ情報 (CAT) が、動詞を説明する特徴 (HEAD) と、動詞の項を説明する特徴 (VALENCE) に分割されています。

散歩用のAVM
散歩用のAVM

「歩く」は、動詞型の主要部を持つ型手話です。自動詞である「歩く」は補語を持たず、主語として三人称単数名詞を必要とします。主語の意味値(CONTENT)は、動詞の唯一の項(歩いている人)と共指されています。次の「彼女」のAVMは、これらの要件を満たすSYNSEM値を持つ手話を表しています。

型の記号は、1つ以上の子と単一化し、情報を上方に伝播します。以下のAVMは、主語-主語句直接支配規則を符号化しています。この規則は、主語となる子(動詞)と、動詞の主語制約を満たす主語以外の子の2つの子を必要とします。

最終結果は、動詞のヘッド、空のサブカテゴリ化機能、および 2 つの子を順序付ける音韻値を持つ記号です。

HPSG の実際の文法は完全に特徴構造で構成されていますが、言語学者は、同等の AVM では扱いにくい記号の統合を表すためにツリーを使用することが多いです。

実装

HPSG形式に基づく様々なパーサーが書かれており、現在最適化が研究されている。ドイツ語の文章を解析するシステムの例は、ベルリン自由大学によって提供されている。[ 7 ]さらに、ベルリン自由大学の文法グループのCoreGram [ 8 ]プロジェクトは、TRALEシステムに実装されたオープンソースの文法を提供している。現在、共通のコアを共有し公開されているドイツ語[ 9 ]デンマーク語[ 10 ]中国語[ 11 ]マルタ語[ 12 ]、ペルシャ[ 13 ]の文法がある。

様々な言語の大規模なHPSG文法がDeep Linguistic Processing with HPSG Initiative ( DELPH-IN )で開発されています。[ 14 ]英語、 [ 15 ]ドイツ語、[ 16 ]日本語[ 17 ]の広範囲の文法がオープンソースライセンスで利用できます。これらの文法は、LKB、PET、[ 18 ] Ace、[ 19 ] agree など、さまざまな相互互換性のあるオープンソースHPSGパーサーで使用できます[ 20 ]これらすべて最小再帰意味論 ( MRS ) の形式で意味表現を生成します。[ 21 ] HPSG形式の宣言的な性質により、これらの計算文法は通常、構文解析と生成(意味入力から表層文字列を生成)の両方に使用できます。 DELPH-INによって配布されている Treebanks は、文法の開発とテストのほか、解析時に妥当な解釈 (または生成時に実現) を決定するランキング モデルのトレーニングにも使用されます。

Enjuは東京大学辻井研究室で開発された、無料で利用できる広範囲をカバーする英語の確率HPSGパーサである[ 22 ]

参照

参考文献

  1. ^ 「HPSG」
  2. ^ミュラー S、アベイユ A、ボルスリー RD、ケーニッヒ JP (2021)。ミュラー S、アベイユ A、ボルスリー RD、ケーニッヒ JP (編)。Head-Driven Phrase Structure Grammar: ハンドブック(pdf)。ベルリン:言語科学出版。土井10.5281/zenodo.5543318ISBN 978-3-96110-255-6
  3. ^ポラード、カール、イヴァン・A・サグ著。1987年。「情報ベースの構文と意味論」第1巻。基礎編。CLSI講義ノート13。
  4. ^ a bポラード、カール、アイヴァン・A・サグ (1994).主辞駆動句構造文法. シカゴ: シカゴ大学出版局.
  5. ^サグ、イヴァン・A. 1997.英語の関係節構文. 言語学ジャーナル. 33.2: 431-484
  6. ^サグ、イヴァン・A.、トーマス・ワソウ、エミリー・ベンダー (2003).『統語論:形式的入門』第2版. シカゴ:シカゴ大学出版局.
  7. ^バベルシステム:HPSGインタラクティブ
  8. ^ CoreGramプロジェクト
  9. ^ベルリグラム
  10. ^ダングラム
  11. ^中国語
  12. ^マルタ語
  13. ^ペルシャ語
  14. ^ DELPH-IN: オープンソースのディーププロセッシング
  15. ^英語リソース文法と語彙集
  16. ^ベルトルト・クリスマン
  17. ^ JacyTop - HPSG による深層言語処理 (DELPH-IN)
  18. ^ DELPH-IN PETパーサー
  19. ^ Ace: 回答制約エンジン
  20. ^文法工学に同意
  21. ^ Copestake, A., Flickinger, D., Pollard, C., & Sag, IA (2005).最小再帰意味論:入門. 言語と計算に関する研究, 3(2-3), 281-332.
  22. ^辻研究室: EnjuパーサホームページArchived 2010-03-07 at the Wayback Machine (retrieved Nov 24, 2009)

さらに読む