Kollokationen und maschinenlesbare Korpora
| AUTHOR | Lehr, Andrea |
| PUBLISHER | de Gruyter (03/07/1996) |
| PRODUCT TYPE | Hardcover (Hardcover) |
In der Phraseologieforschung, der Fremdsprachendidaktik und der Metalexikographie werden Kollokationen zumeiste als Elemente der langue aufgefa t und im Graubereich zwischen freien Wortverbindungen und Phrasemen angesiedelt. Wenig Gemeinsamkeiten mit dieser Auffassung zeigt die kollokationstheorie des britischen Kontextualismus, die zum Ausgangspunkt der vorliegenden Arbeit genommen wurde. Kollokationen in diesem Sinne basieren, gemä dem kontextualistischen Postulat, nur den tatsächlichen Sprachgebrauch zu untersuchen, auf Elementen der parole. Sie werden zu Zwecken lexikalischer Analyse eigens gebildet und bestehen aus beliebigen Zusammenfassungen sprachlicher Einheiten, die in konkreten Texten in syntagmatischer Nähe zueinander vorkommen.
Ziel der Arbeit ist es, die Kollokationstheorie des Kontextualismus in ein operationales lexikalisches Sprachanalysenmodell, welches auch für die maschinelle Sprachverarbeitung nutzbar ist, umzusetzen. Dieses Sprachanalysemodell soll insbesondere dazu dienen, die maschinelle Disambiguierung im Falle polysemer oder homonymer Wörter sowie die maschinelle Identifizierung von Phrasemen - Aufgaben, die die maschinelle Sprachverarbeitung noch immer vor gro e Probleme stellen - handhabbarer zu machen. Bisherige Problemlösungsstrategien bestanden vor allem darin, entweder Restriktionen für die Textproduktion vorzusehen oder spezielle Basen zur Repräsentation sprachexternen Wissens zu kompilieren. Das hier entwickelte Analysemodell stützt sich dagegen auf die Annahme, da die Identifizierung und Charakterisierung sprachlicher Einheiten allein auf der Grundlage des kollokativen Verhaltens von Formativen in konkreten Texten, wie es sich anhand von Häufigkeit und Signifikanz ihres Miteinandervorkommens bestimmen lä t, geleistet werden kann. Die Miteinbeziehung von Wissen über au ersprachliche Entitäten wird somit nicht als notwendig erachtet. Endergebnis eines Analyseverfahrens der hier projektierten Form ist ein lexikalisches Netz, das im Anschlu als Datenbasis für vielerlei Arten von Textgenerierungs- und Textanalyseaufgaben genutzt werden kann.
In der Phraseologieforschung, der Fremdsprachendidaktik und der Metalexikographie werden Kollokationen zumeiste als Elemente der langue aufgefa t und im Graubereich zwischen freien Wortverbindungen und Phrasemen angesiedelt. Wenig Gemeinsamkeiten mit dieser Auffassung zeigt die kollokationstheorie des britischen Kontextualismus, die zum Ausgangspunkt der vorliegenden Arbeit genommen wurde. Kollokationen in diesem Sinne basieren, gemä dem kontextualistischen Postulat, nur den tatsächlichen Sprachgebrauch zu untersuchen, auf Elementen der parole. Sie werden zu Zwecken lexikalischer Analyse eigens gebildet und bestehen aus beliebigen Zusammenfassungen sprachlicher Einheiten, die in konkreten Texten in syntagmatischer Nähe zueinander vorkommen.
Ziel der Arbeit ist es, die Kollokationstheorie des Kontextualismus in ein operationales lexikalisches Sprachanalysenmodell, welches auch für die maschinelle Sprachverarbeitung nutzbar ist, umzusetzen. Dieses Sprachanalysemodell soll insbesondere dazu dienen, die maschinelle Disambiguierung im Falle polysemer oder homonymer Wörter sowie die maschinelle Identifizierung von Phrasemen - Aufgaben, die die maschinelle Sprachverarbeitung noch immer vor gro e Probleme stellen - handhabbarer zu machen. Bisherige Problemlösungsstrategien bestanden vor allem darin, entweder Restriktionen für die Textproduktion vorzusehen oder spezielle Basen zur Repräsentation sprachexternen Wissens zu kompilieren. Das hier entwickelte Analysemodell stützt sich dagegen auf die Annahme, da die Identifizierung und Charakterisierung sprachlicher Einheiten allein auf der Grundlage des kollokativen Verhaltens von Formativen in konkreten Texten, wie es sich anhand von Häufigkeit und Signifikanz ihres Miteinandervorkommens bestimmen lä t, geleistet werden kann. Die Miteinbeziehung von Wissen über au ersprachliche Entitäten wird somit nicht als notwendig erachtet. Endergebnis eines Analyseverfahrens der hier projektierten Form ist ein lexikalisches Netz, das im Anschlu als Datenbasis für vielerlei Arten von Textgenerierungs- und Textanalyseaufgaben genutzt werden kann.
