Computer beantworten Fragen, führen Konversation oder beraten Kunden bei Problemen. Immer mehr IT-Anwendungen greifen auf strukturiertes Wissen zurück. Das Wissen muss dazu in einer Weise aufbereitet sein, die ein Computer verarbeiten kann – in sogenannten Wissensdatenbanken. Die sind das Fachgebiet des Informatikers Simon Razniewski. Am Saarbrücker Max-Planck-Institut für Informatik hat er als erster ein Verfahren entwickelt, mit dem die Wissensvorräte um einen entscheidenden, bisher vernachlässigten Aspekt erweitert werden können. Dazu wird er von der Deutschen Forschungsgemeinschaft (DFG) mit 312.000 Euro gefördert.
Viele alltägliche Anwendungen nutzen Wissensdatenbanken: Suchmaschinen beantworten Fragen direkt, anstatt auf andere Webseiten zu verweisen. Internetshops listen die Eigenschaften von Produkten auf. Reiseportale zeigen, welche Leistungen in einer Buchung enthalten sind. Egal in welchem Kontext Wissensdatenbanken eingesetzt werden, eines haben sie gemeinsam: Die darin enthaltenen Informationen werden vornehmlich in sogenannten positiven Statements strukturiert, also in Aussagen die beschreiben, dass etwas zutrifft. Zum Beispiel: ‚Saarbrücken ist die Hauptstadt des Saarlandes‘, ‚Das Handy unterstützt 5G‘, ‚Jedes Zimmer im Hotel hat ein Bad‘.
Ihr Gegenteil, die sogenannten negativen Statements, werden von aktuellen Wissensdatenbanken ausgeblendet. Sie enthalten zwar ebenfalls wertvolle Informationen, sind jedoch aufgrund ihrer schieren Anzahl schwierig zu erfassen: „Nahezu unendlich viele Aussagen treffen nicht auf etwas zu. Die Herausforderung besteht darin zu ermitteln, welche dieser nicht-zutreffenden Informationen in eine Wissensdatenbank aufgenommen werden sollten“, sagt Simon Razniewski, promovierter Informatiker und Leiter des Forschungsbereiches ‚Knowledge Base Construction and Quality‘ in der Abteilung ‚Databases and Information Systems‘¬¬ am Saarbrücker Max-Planck-Institut für Informatik. Mit seiner Forschungsgruppe am Saarland Informatics Campus hat er nun als erster ein Verfahren entwickelt, das automatisiert negatives Wissen für Wissensdatenbanken in verschiedenen Einsatzgebieten erzeugen kann.
Dargestellt am Beispiel Steven Hawking, läuft das Verfahren folgendermaßen ab: Zuerst werden Vergleichsfälle ermittelt, die eine prominente Eigenschaft mit dem Suchobjekt teilen. Im Beispiel: Physiker. Diese Vergleichsfälle nennen die Forscher ‚Peers‘. Nun wird anhand der ‚Peers‘ eine Auswahl an positiven Annahmen über die Ausgangs-Entität erzeugt. Da die Physiker Albert Einstein und Richard Feynman den Nobelpreis gewonnen haben, könnte die Annahme Steven Hawking hat den Nobelpreis gewonnen, getroffen werden. Im Anschluss werden die neuen Annahmen mit den bereits vorhandenen Informationen über das Ausgangsobjekt in der Wissensdatenbank abgeglichen. Trifft eine Aussage auf einen ‚Peer‘, jedoch nicht auf das Suchobjekt zu, schließen die Forscher, dass es sich dabei um ein negatives Statement für das Suchobjekt handelt – also Steven Hawking hat nie den Nobelpreis gewonnen. Um die Aussagekraft der erzeugten negativen Statements zu bewerten, werden sie anhand verschiedener Parameter sortiert, zum Beispiel, wie oft sie in der Peer-Gruppe vorgekommen sind.
Als ein mögliches Anwendungsgebiet ihrer neuen Methode sehen die Forscher Empfehlungs-Systeme, wie sie in Internetshops oder auf Reiseportalen eingesetzt werden. „Bucht man online ein Hotel oder kauft ein Handy, könnte unser Ansatz verwandte Produkte miteinander vergleichen und zeigen, wie sie sich unterschieden. Also, dass es in Hotel A beispielsweise keinen Aufzug gibt, oder dass an Handy B der Kopfhöreranschluss fehlt“, sagt Simon Razniewski. „Das ist ein viel komfortabler und informativer, als wenn man diese Informationen selbst aus einer langen Liste von positiven Aussagen ableiten muss”, ergänzt Raznieswki. In Zukunft möchte seine Forschungsgruppe den Ansatz verfeinern, um nuanciertere negative Aussagen erzeugen und implizite negative Aussagen erkennen zu können.
Hintergrund Saarland Informatics Campus:
800 Wissenschaftlerinnen und Wissenschaftler und rund 2100 Studierende aus mehr als 80 Nationen machen den Saarland Informatics Campus (SIC) zu einem der führenden Standorte für Informatik in Deutschland und Europa. Fünf weltweit angesehene Forschungsinstitute, nämlich das Deutsche Forschungszentrum für Künstliche Intelligenz (DFKI), das Max-Planck-Institut für Informatik, das Max-Planck-Institut für Softwaresysteme, das Zentrum für Bioinformatik und das Cluster für „Multimodal Computing and Interaction“ sowie die Universität des Saarlandes mit drei vernetzten Fachbereichen und 21 Studiengänge decken das gesamte Themenspektrum der Informatik ab.
Förderung:
Die Deutsche Forschungsgemeinschaft (DFG) fördert das Projekt unter dem Titel „Webskalierendes negatives Wissen“ über die nächsten drei Jahre mit 312.000 Euro.