Knowledge Engineering

Modellierung von Wissen

Wissensmodellierung

von der Recherche, über Text Mining und Begriffs- klassifikation bis zur Ontologiemodellierung

Auch wenn Knowledge Engineering auf den ersten Blick nichts mit Datenanalyse oder Data Science zu tun hat, die Verbindung ist doch enger als man denkt. Bei der Datenanalyse und beim Data Mining geht es darum, aus strukturierten Daten, die in der Regel in Tabellenform vorliegen, neue Informationen abzuleiten. Das Knowledge Engineering hingegen wendet sich eher halb- oder unstrukturierten Texten zu, um aus extrahierten Konzepten, Eigenschaften und Beziehungen neue, von Maschinen weiter verarbeitbare Synonymlisten, Taxonomien, Thesauri oder Ontologien zu modellieren.

Texte stellen dabei eigentlich nur eine andere Form von aufzubereitender Datenstruktur dar, aus denen Begriffe und Bezeichnungen zunächst mit computerlinguistischen Werkzeugen oder Text Mining Verfahren zu extrahieren sind. Über Häufigkeitsstatistiken und Klassifikation der Begriffe und Bezeichnungen werden die Begriffe identifiziert, die für die Modellierung verwendet werden.

Bei der Datenanalyse fließen rd. 80% des Aufwands in die Aufbereitung  und ca. 20% in die Modellbildung. Beim Knowledge Engineering dreht sich dieses Verhältnis um, etwa 30% des Aufwands fließen in die Textaufbereitung und 70% in die Modellierung, bei der – wie bei der Datenanalyse – Hintergrundwissen über den Anwendungsbereich genutzt werden muss und somit eine Betrachtung des Anwendungsbereichs unumgänglich ist.

Für sich genommen stellen Synonymlisten, Taxonomien, Thesauri oder Ontologien für das Terminologiemanagement von Unternehmen oder für den Einsatz semantischer Technologie bereits einen Mehrwert und eine Voraussetzung dar. In Verbindung mit konventionellen Techniken der Datenanalyse ergeben sich jedoch neue Möglichkeiten, da Daten durch “semantische Abstandsmaße” und numerische “Relevanzkriterien”, die auf diesen semantischen Strukturen aufsetzen, nach zusätzlichen inhaltlichen Kriterien strukturierbar und aggreggierbar werden.