LEXICAL-FUNCTIONAL GRAMMAR  

Gramática funcional léxica

(Recop.) Justo Fernández López

 

Vgl.:

Unifikationsgrammatiken

 

Lexical-Functional Grammar [LFG] /

Lexikalisch Funktionale Grammatik = Gramática funcional léxica

Resources in Lexical Functional Grammar:  http://www-lfg.stanford.edu/lfg/

„Die Lexikal-Functional Grammar, als deren Initiatoren Joan Bresnan (1982) und Ron Kaplan gelten können. Das Modell weist gewisse Ähnlichkeiten mit der Government-Binding-Theorie (GB) auf; im Unterschied zu dieser hat aber das Lexikon eine sehr viel zentralere Rolle inne.“ [Hentschel / Weydt, S. 397]

Lexical Functional Grammar [Abk.: LFG, engl., ‘Lexikalisch Funktionale Grammatik’].

Generative Grammatik-Theorie aus der Klasse der Unifikationsgrammatiken, die Ende der siebziger Jahre von J. Bresnan und R. Kaplan entwickelt wurde. Die LFG ist in der Wahl ihrer Konzepte von der Relationsgrammatik beeinflusst. Die LFG misst den grammatischen Relationen Subjekt, direktes / indirektes Objekt u. a. große Bedeutung bei und fasst sie (zusammen mit anderen syntaktischen Rollen wie Adjunkt und freies Komplement) in einer kleinen Klasse von universellen grammatischen Funktionen zusammen. Diese grammatischen Funktionen gehören zu den primitiven Konzepten der LFG, die davon ausgeht, dass viele der syntaktischen Gesetzmäßigkeiten, die in der Transformationsgrammatik durch Transformationen beschrieben wurden, lexikalischer Natur sind und daher auch nur im Lexikon repräsentiert werden können.

Der Grammatikformalismus der LFG unterscheidet zwei Ebenen der syntaktischen Repräsentation, die C-Struktur (constituent structure) und die F-Struktur (functional structure), die parallel von den annotierten Phrasenstrukturregeln der Grammatik erzeugt werden. Ohne Annotationen sind diese Regeln Kontextfreie Ersetzungsregeln, die lokale Bäume mit atomaren Kategoriensymbolen erzeugen. Sie unterliegen einer Version der X-Bar-Theorie. Die F-Struktur einer Konstituente ist eine Merkmalstruktur im Sinne der Unifikationsgrammatik. Zu den Attributen gehören grammatische Funktionen wie SUBJ (Subjekt), OBJ2 (Indirektes Objekt) und PRED (Prädikat) sowie morphosyntaktische Merkmale wie CASE (Kasus), NUM (Numerus) und TENSE (Tempus). Ein Attribut kann als Wert ein atomares Symbol, einen semantischen Prädikatausdruck oder wiederum eine Merkmalstruktur besitzen. Die Merkmalsgleichungen in den Regeln stellen mittels zweier spezieller Variablen die Koreferenzen zwischen den Merkmalstrukturen der Knoten des lokalen Baumes her.  Die F-Struktur der Mutterkonstituente wird stets mit dem Symbol ­  bezeichnet, die F-Struktur der Tochterkonstituente, unter der die Gleichung steht, mit dem Symbol ¯. Die Gleichung (­OBJ2) = ¯ unter dem Kategoriensymbol NP in einer Verbphrasen-Regel bedeutet z. B., dass die F-Struktur der Nominalphrase mit dem Wert des Attributs OBJ2 in der F-Struktur der Verbphrase koreferent sein soll. Die Phrasenstrukturregeln der LFG erzeugen zu viele Strukturen; sie müssen drei globalen Wohlgeformheitsbedingungen genügen, die als Filter dienen:

(a)  Das Prinzip der funktionalen Eindeutigkeit (functional uniqueness) besagt, dass in einer F-Struktur jedes Attribut nur einen Wert besitzen darf.

(b)  Das Prinzip der funktionalen Vollständigkeit (functional completeness) legt fest, daß eine F-Struktur genau dann lokal vollständig ist, wenn jede ihrer Unterstrukturen alle regierbaren grammatischen Funktionen enthält, die das Prädikat der Unterstruktur regiert.

(c)  Das Prinzip der funktionalen Kohärenz (functional coherence) verlangt, daß in jeder Unterstruktur der F-Struktur alle regierbaren grammatischen Funktionen auch vom Prädikat der Unterstruktur regiert werden.

Die Subkategorisierung erfolgt über das Attribut PRED im lexikalischen Eintrag, wobei aber nur die grammatische Funktion der obligatorischen und optionalen Komplemente aufgeführt wird, nicht ihre syntaktische Beziehungen, die in der Transformationsgrammatik durch Transformationen beschrieben werden (wie z.B. die zwischen Sätzen mit Passiv-, Mittel- oder Kausativverben), werden in der LFG nicht in der Syntax, sondern im Lexikon hergestellt. Lexikalische Regeln setzen die entsprechenden Verbklassen in Beziehung und stellen die Korrespondenzen zwischen den Komplementstellen im PRED-Attribut her.

Fernabhängigkeiten, wie sie bei Konstituentenfragen und Topikalisierungen vorliegen, werden durch Merkmalsweitergabe behandelt. Eine neue Version der LFG behandelt die Fernabhängigkeiten durch Functional Uncertainty (‘funktionale Unterbestimmheit’). Die F-Struktur eines Satzes, besonders der Prädikatausdruck im Wert des Attributs PRED, ist die Eingabe für die semantische Komponente, für die Halvorsen [1983] eine semantische (der Montague-Grammatik entlehnte) Komponente vorschlägt. Fenstad u.a. [1987] verwenden die F-Struktur für die Kodierung von Situationsschemata merkmalsbasierter Bedeutungsrepräsentationen, die mit den Mitteln der Situationssemantik interpretiert werden können.

Die LFG wurde für viele einzelsprachliche Beschreibungen verwendet. Sie dient auch als Grundlage für die Implementierung zahlreicher experimenteller natürlichsprachlicher Systeme auf dem Computer.“ [Bußmann, H., S. 447-448]

Lexikalisch-Funktionale Grammatiken (LFG) wurden erstmals im Jahre 1982 durch den Informatiker (Computerlinguisten) Ronald M. Kaplan und Joan Bresnan vorgestellt und seitdem ständig weiterentwickelt. Hier möchte ich mich auf einige wesentliche Teile beschränken, die im großen und ganzen unverändert geblieben sind.

Eine LFG wird zur syntaktischen Analyse natürlicher Sprachen eingesetzt. Ihr Grundgerüst ist eine mehrdeutige kontext-freie Grammatik, mit deren Hilfe Ableitungsbäume für Eingabeketten erzeugt werden, die hier c-Strukturen genannt werden.

Die Regeln bzw. ihre terminalen und nicht terminalen Symbole können durch Annotationen erweitert werden, mit denen zusätzliche Grammatikalitätsbedingungen an die Syntax formuliert und Aussagen über die grammatischen Beziehungen in einem Satz gemachen werden können. Diese Annotationen heißen funktionale Beschreibungen (f-Beschreibung).

Die f-Beschreibungen werden mit den entsprechenden Knoten eines Ableitungsbaums assoziiert. Aus ihnen wird die funktionale Struktur (f-Struktur) für jeden Knoten erzeugt, einer Menge aus Merkmal-Wert-Paaren, die morpho-syntaktische Informationen repräsentieren. Die f-Strukturen zweier Knoten können auch kombiniert, d.h. unifiziert, oder durch eine grammatische Relation miteinander in Beziehung gesetzt werden.

Ziel einer syntaktischen Analyse mit einer LFG ist die Konstruktion einer c-Struktur zusammen mit einer entsprechenden f-Struktur. Nur wenn beide gleichzeitig existieren, ist eine Eingabekette syntaktisch korrekt.

Im ersten Abschnitt werden die für dieses Kapitel relevanten theoretischen Grundlagen wie c- und f-Strukturen, Unifikation sowie Bedingungen an die syntaktische Korrektheit einer Eingabekette beschrieben. Im zweiten Abschnitt wird ein top-down Interpretierer für LFG vorgestellt, bei dem es sich um eine Weiterentwicklung des top-down Parsers im Abschnitt handelt, der um eine Komponente zur Verarbeitung von f-Beschreibungen und -Strukturen erweitert wurde.

Grundlagen

Dieser Abschnitt gibt eine Einführung in die Theorie der Lexikalisch-Funktionalen Grammatik (LFG). Weil sich die Terminologie der Computerlinguistik und der Informatik im Bereich der Syntaxtheorie doch erheblich unterscheidet, gehe ich dabei kurz auf c-Strukturen ein, obwohl sie mit Ableitungsbäumen identisch sind. Anschließend wird erläutert, was f-Strukturen sind. Eine wichtige Operation zur Kombination von f-Strukturen ist eine Variante der Unifikation. Sie wird im dritten Abschnitt vorgestellt. Danach werden f-Beschreibungen erklärt und wie daraus f-Strukturen erzeugt werden können. Abschließend gehe ich auf zwei Bedingungen an die syntaktische Korrektheit einer Eingabekette ein. Die Behandlung von ungebundenen Abhängigkeiten wie Voranstellung oder Nachstellung von Satzkonstituenten durch funktionale Unsicherheit wird hier aus Gründen der Komplexität und des Platzes nicht behandelt.

c-Strukturen

In der Informatik werden im Vergleich zur Linguistik bzw. Computerlinguistik andere Termini in der Syntaxtheorie verwendet. Dort hei\3en kontextfreie Grammatiken Phrasenstrukturgrammatiken und Ableitungsbäume entsprechend Phrasenstrukturen oder auch Konstituentenstrukturen . Relativ ungebräuchlich ist P-Marker. Eine Phrasenstrukturregel ist folglich eine kontextfreie Regel. In der LFG wird ein Ableitungsbaum als c-Struktur (engl. constituent structure) bezeichnet.

Der Begriff Wort hat in beiden Disziplinen unterschiedliche Bedeutungen. In der Computerlinguistik bezeichnet er ein terminales Symbol, während er in der Informatik ursprünglich Ketten aus terminalen Symbolen (Eingabeketten) meint. Die wiederum hei\3en in der Linguistik Sätze . Ein nicht terminales Symbol wird in der Linguistik als (syntaktische) Kategorie oder auch als Konstituente bezeichnet.

Grammatiken in der Linguistik bestehen normalerweise aus zwei verschiedenen Arten von Regeln. Der eine Regeltyp hat auf der rechten Seite nur nicht terminale Symbole, beispielsweise Satz Nominalphrase Verbalphrase oder Verbalphrase Verb Nominalphrase. Auf der rechten Seite des anderen Regeltyps kommt nur ein terminales Symbol (Wort) vor, beispielsweise nomen kind oder Artikel das. Erstere sind strukturelle Regeln, welche die Struktur eines Satzes definieren. Letztere sind lexikalische Regeln, welche die Kategorie eines Wortes determinieren. Die Menge der lexikalischen Regeln bildet das Lexikon . Die Kategorie auf der linken Seite einer lexikalischen Regel heißt lexikalisch oder präterminal , weil sie immer ein terminales Symbol (Wort) dominiert.

Wenn ein Parser mit Hilfe einer Grammatik und eines Lexikons für einen Eingabesatz eine c-Struktur bzw. Phrasenstruktur erzeugen kann, so ist der Satz grammatisch korrekt, das Äquivalent zu syntaktisch korrekt in der Informatik. In diesem Kapitel werde ich ausschließlich die linguistische Terminologie verwenden.

Im Beispiel () ist die Phrasenstrukturgrammatik angegeben, mit der ich im Laufe dieses Kapitels die LFG exemplifiziere. Das darauf folgende Beispiel () zeigt die c-Struktur für den Satz das Kind denkt an einen Ferientag, die aus dieser Grammatik erzeugt wurde.

 

f-Strukturen

Eine funktionale Struktur (f-Struktur ) im Sinne der LFG ist eine Menge mit Merkmal-Wert-Paaren, mit der Informationen über ein Objekt repräsentiert werden können. Im Falle der LFG enthalten sie morphologische und syntaktische Informationen über Konstituenten eines Satzes bzw. über den Satz selbst.

Einen besonderen Stellenwert nehmen Begriffe wie beispielsweise Subjekt oder Objekt ein, die grammatische Relationen zwischen einer Konstituente eines Satzes und einer von ihr dominierten Konstituente bilden, in diesem Fall zwischen dem Satz und seiner Nominalphrase mit dem Kasus Nominativ bzw. dem Satz und seiner Nominalphrase mit dem Kasus Akkusativ.

Eine übersichtliche Notation für f-Strukturen sind Matrizen, in denen die Merkmal-Wert-Paare untereinander notiert werden. Anders als in der Mathematik spielt ihre Reihenfolge in der LFG keine Rolle. In der komplexen f-Struktur

sind die atomare m1 Merkmale. Die Werte w1 sind wiederum f-Strukturen, die atomar oder komplex sein können. Eine atomare f-Struktur ist ein Atom, eine ganze Zahl oder ein Term erster Ordnung. Letzterer wird Prädikat-Argument-Struktur genannt. Ihre Argumente sind grammatische Relationen. Komplexe f-Strukturen sind Mengen mit Merkmal-Wert-Paaren.

Eine f-Struktur kann auch als Funktion von Merkmalen in Werte aufgefasst werden. In diesem Fall wird normalerweise die Notation f(m1) = w1 (f(m1) = w1) verwendet. In der LFG werden Funktionsapplikationen jedoch notiert als (f m1) = w1. Diese Schreibweise übernehme ich hier, um den Wert w1 des Merkmals m1der f-Struktur f zu bezeichnen.

[Quell: http://wave.cs.tu-berlin.de/~ww/lehre/compling/skript/lfg/node4.html]

Unifikation von f-Strukturen

Weiter oben wurde bereits erwähnt, dass Phrasenstrukturregeln in einer LFG das Grundgerüst zur syntaktischen Analyse eines Satzes bilden. Dabei werden den Konstituenten eines Satzes f-Strukturen zugeordnet, die miteinander in Beziehung gesetzt oder vereinigt werden können. Dies geschieht mit Hilfe von f-Beschreibungen, die im folgenden Abschnitt beschrieben werden.

Hier möchte ich zunächst das Verfahren für die Vereinigung zweier f-Strukturen selbst vorstellen, die Unifikation genannt wird. Sie ist die Hauptoperation in allen neueren Grammatikformalismen, weshalb diese wie auch die LFG als unifikations-basiert bezeichnet werden. Sie ist genauer gesagt die konsistente Vereinigung zweier f-Strukturen, da sie nur möglich ist, wenn sich die Informationen, die beide repräsentieren, nicht widersprechen.

[Siehe weiter unter: http://wave.cs.tu-berlin.de/~ww/lehre/compling/skript/lfg/node5.html]

f-Beschreibungen

In der LFG werden den nicht lexikalischen Konstituenten eines Satzes f-Strukturen zugeordnet. Die f-Struktur wird mit Hilfe funktionaler Beschreibungen (f-Beschreibungen ) definiert. Mit f-Beschreibungen können die f-Strukturen der Konstituenten eines Satzes miteinander in Beziehung gesetzt oder vereinigt werden.

Die f-Beschreibungen werden an die Symbole auf der rechten Seite einer Phrasenstrukturregel sowie an die Kategorien im Lexikon notiert. Bei der Konstruktion der c-Struktur eines Satzes werden die f-Beschreibungen aus den Regeln der Grammatik und den Lexikoneinträgen, welche die c-Struktur legitimieren, übernommen.

In den f-Beschreibungen an den Regeln und den Lexikoneinträgen können keine konkreten Namen für f-Strukturen verwendet werden. Aus diesem Grund werden Metavariablen ^ und verwendet, denen in der entsprechenden f-Beschreibung einer c-Struktur eine f-Struktur zugeordnet wird.

Die Notation von f-Beschreibung orientiert sich an der im Abschnitt vorgestellten Notation für Funktionen. Formal ist sie definiert als:

f-Beschreibung ::= ¯ f-Ausdruck = f-Ausdruck

f-Ausdruck ::= Atom

Ganze Zahl

Prädikat-Argument-Struktur

Metavariable

(Metavariable Merkmale)

Metavariable ::=

Merkmale ::= Merkmal

Merkmal Merkmale

Merkmal ::= Atom

(Metavariable Merkmale)

Eine f-Beschreibung definiert die Identität zweier f-Strukturen, die durch die f-Ausdrücke auf der linken und rechten Seite des Gleichheitszeichens definiert werden. Ein atomarer f-Ausdruck ist ein Atom, eine ganze Zahl oder eine Prädikat-Argument-Struktur. Letzteres ist ein Term erster Ordnung mit mindestens einem Argument außer einer Liste. Atomare f-Ausdrücke sind konstante f-Strukturen, die als nullstellige Funktionen aufgefasst werden können. Ein komplexer f-Ausdruck ist eine Metavariable oder eine Funktionsapplikation der Form ( Metavariable Merkmale ). Komplexe f-Ausdrücke repräsentieren f-Strukturen.

Die Metavariable ^ repräsentiert die f-Struktur des Knotens einer c-Struktur, der die Kategorie, an der sie vorkommt, direkt dominiert (die f-Struktur der linken Seite einer Regel). Die Metavariable stellt die f-Struktur des Knotens dar, an dem sie steht.

In einem Ausdruck ( Metavariable Merkmale ) kann eine Sequenz aus atomaren Merkmalen oder f-Ausdrücken vorkommen. Kommt in der Sequenz ein f-Ausdruck vor, so handelt es sich um die Konkatenation zweier Funktionen, die f-Strukturen darstellen. In diesem Fall muss der Wert der inneren Funktion (f-Ausdruck) zunächst berechnet werden. Der Wert muss ein Atom sein, das in diesem Fall ein Merkmal der äußeren Funktion darstellt, z.B.:

Eine Sequenz von Merkmalen in einem f-Ausdruck ist eine Abkürzung für eine Kette von Funktionsapplikationen, z.B.:

Die LFG im Beispiel () ist die um f-Beschreibungen ergänzte Phrasenstrukturgrammatik aus dem Beispiel (). Dazu gehört das Lexikon im Beispiel ().

Ein typisches Beispiel für Definition einer (grammatischen) Relation zwischen zwei f-Strukturen ist die f-Beschreibung an der Nominalphrase der ersten Regel im Beispiel (). In derselben Regel führt die f-Beschreibung an der Verbalphrase zur Unifikation der f-Strukturen für den Satz und die Verbalphrase.

In einem Lexikoneintrag darf die Metavariable nicht vorkommen, da sie sich auf die f-Struktur einer lexikalischen Kategorie bezöge. Diesen wird jedoch in der LFG keine f-Struktur zugewiesen.

[http://wave.cs.tu-berlin.de/~ww/lehre/compling/skript/lfg/node1.html]