UNIFIKATIONSGRAMMATIK

Gramática de unificación

(Recop.) Justo Fernández López

 

Unifikationsgrammatik [engl. unification ‘Vereinigung’].

(1)  Oberbegriff für alle Generativen Grammatikmodelle bzw. generativen Grammatiken, die eine Unifikationsoperation in ihren Regelsystemen verwenden.

(2)  Im engeren Sinne Mitglied einer Familie von neueren Grammatikmodellen, in denen die Merkmalsunifikation (meist zusammen mit anderen Merkmalsoperationen) für die Steuerung des Informationsflusses bei der Ableitung verwendet wird. Zu diesen Grammatikmodellen gehören einflussreiche formale generative Grammatiktheorien, wie die Generalized Phrase Structure Grammar (GPSG) und die Lexical Functional Grammar (LFG), ausdrucksmächtige Grammatikformalismen für die Implementierung auf dem Computer, wie die Functional Unification Grammar (FUG) und PATR, sowie eine Reihe von neueren Modellen, die Mischformen aus bestehenden Ansätzen und Theorien darstellen wie z.B. die Head-Driven Phrase Structure Grammar (HPSG) und die Categorial Unification Grammar (CUG).

Da alle diese Modelle an der Standford Universität und benachbarten Institutionen an der San Francisco Bay entwickelt oder weiterentwickelt wurden, werden sie auch als »Bay-Area Grammars« (Abk.: BAG) bezeichnet. Andere Bezeichnungen sind Unification-based Grammars, Constraint-based Grammars und Information-based Grammars.

Die U. basiert auf einer Weiterentwicklung des linguistischen Merkmals. Jede linguistische Einheit (Wort oder Phrase) ist durch eine Merkmalstruktur gekennzeichnet, d.h. durch eine Menge von Attribut-Wert-Paaren, deren Werte entweder atomare Symbole oder wiederum Merkmalstrukturen sein können. Attributwerte innerhalb einer Merkmalstruktur können koreferent (auch koindiziert) sein, d. h. als Beschreibungen für die gleiche linguistische Einheit dienen. Merkmalstrukturen für syntaktische Einheiten werden oft auch als »komplexe Kategorien« bezeichnet. Sie werden meist als Merkmalsmatrizen (Abb. a) oder als gerichtete Merkmals-Graphen (Abb. b) repräsentiert.

In der folgenden vereinfachten Merkmalsstruktur eines Verbs wird die Koreferenz beim Merkmal [AGR] dazu verwendet, die Kongruenz zwischen Verb und Subjekt zu induzieren.

 

Abb. (b): Äquivalenter Merkmalsgraph

Phrasenstrukturregeln einer U. geben an, welche Teile der Merkmalstruktur einer syntaktischen Einheit mit welchen Teilen der Merkmalstrukturen ihrer unmittelbaren Konstituenten koreferent sind und welche Koreferenzen es zwischen den Merkmalstrukturen der unmittelbaren Konstituenten gibt. Diese Koreferenzen zwischen den Beschreibungen der Konstituenten in einem Syntaxbaum sorgen für den Informationsfluss in der syntaktischen Ableitung und werden verwendet, um Dependenzen zwischen Konstituenten (Kongruenz, Rektion, Kontrolle und Fernabhängigkeiten) zu repräsentieren. Koreferenz zweier Merkmalstrukturen bedeutet, dass ihre Inhalte »unifiziert« werden. Wenn diese Inhalte sich nicht widersprechen (d.h. mindestens einem Merkmal unverträgliche Werte zuweisen) ergibt sich das Ergebnis der Unifikation aus der Addition der Information in den beiden unifizierten Strukturen. Im Falle eines Widerspruchs schlägt die Unifikation fehl bzw. es wird eine spezielle Kategorie erzeugt, die Inkonsistenz signalisiert. Die Unifikation wird in der Regel durch eckige Klammern ausgedrückt, die die zu unifizierenden Merkmalstrukturen einschließen. Zu Abb. (a) und Abb. (b) äquivalente Notation:

Eine U. wurde erstmals von Kay [1979] vorgeschlagen. In verwandten Arbeiten auf dem Gebiet der Wissensrepräsentation in der Künstlichen Intelligenz wurden unabhängig Repräsentationsformalismen mit Merkmalsunifikation entwickelt (Ait-Kaci [1984], Smolka/Ait-Kaci [1987]). Die Semantik der Unifikationsformalismen wurde von Kaspar/Rounds [1986], Johnson [1988] und Smolka [1988] entwickelt. Das Ergebnis dieser Arbeiten ist einer Merkmalslogik mit einer mengentheoretischen Semantik. Eine besondere Eigenschaft der U. ist ihre Deklarativität. Sie resultiert aus der Monotonizität der Unifikationsoperation. Die Reihenfolge der Verarbeitungsschritte spielt keine Rolle für das Resultat einer Ableitung. Dadurch eignet sich die U. besonders für die Computerlinguistik, denn die Grammatik lässt Raum für verschiedene Verarbeitungsstrategien. Sie ist auch nicht an eine Verarbeitungsrichtung gebunden, ws es ermöglicht, die gleiche Grammatik für Parsing und Generierung zu verwenden. Modelle der U. unterscheiden sich u.a. in der Rolle, die die Phrasenstruktur in der syntaktischen Beschreibung spielt. In den meisten Modellen wird durch Syntaxregeln ein kontextfreien Phrasenstrukturbaum aufgebaut, mit dessen Knoten die Merkmalstrukturen assoziiert sind, die durch Koreferenzen untereinander verbunden sind. In anderen Modellen (wie der FUG oder der HPSG) ist die Phrasenstruktur selbst innerhalb der Merkmalstruktur repräsentiert, so dass diese zur Beschreibung ausreicht. Die Modelle unterscheiden sich auch darin, welche Erweiterungen in ihnen Verwendung finden. Oft verwendete Erweiterungen der Grammatikformalismen sind Generalisierung oder Disjunktion, Templates (Merkmalsmakros, Typ-Namen), Functional Uncertainty und Mengenwertige Merkmale. Wesentliche Unterschiede finden sich auch in der Ausdehnung der unifikationsgrammatischen Beschreibungsweise auf die grammatischen Beschreibungsebenen: während z.B. die GPSG nur syntaktische Gesetzmäßigkeiten mit Hilfe der Merkmalsstrukturen beschreibt, wird die merkmalsbasierte Beschreibung in der HPSG auch auf Semantik und Phonologie ausgedehnt.

Während es aber in Phonologie und Phonetik bislang nur wenige Untersuchungen gibt, finden sich auf dem Gebiet der Semantik mehrere Ansätze zur Integration von Situationssemantik und Diskursrepräsentationstheorie in Modelle der U. (z.B. Johnson/Klein [1986], Fenstad u.a. [1987], Pollard/Sag [1988]). Neben den Modellen der Bay-Area Grammar gehören zur U. im weiteren Sinne auch neuere Entwicklungen wie die Tree-Unification-Grammar (TUG) (Popowich [1989]). Nur bedingt hinzugezählt werden die Logikgrammatiken aus der Tradition der Logik-Programmierung, in denen die Merkmalstrukturen durch Logikterme dargestellt werden und die Termunifikation die Rolle der Merkmalsunifikation spielt.

Theoretisch ließe sich wahrscheinlich jedes formale generative Grammatikmodell zur U. erweitern. So gibt es z.B. bereits Vorschläge, bestehende Grammatikmodelle wie die Dependenzgrammatik und die Tree-Adjoining Grammar (TAG) um die Werkzeige der U. zu ergänzen.“ [Bußmann, H., S. 816-818]