DFG-Projekt SINIR – Mit simulierten Nutzungsdaten zur Bibliothek der Zukunft
Im DFG-Projekt SINIR arbeitet ein Forschungsteam der Universität Passau gemeinsam mit der weltweit größten Spezialbibliothek für wirtschaftswissenschaftliche Literatur an Konzepten für die digitale Bibliothek der Zukunft – und zwar mit Hilfe von simulierten Nutzungsdaten.
Das DFG-Projekt SINIR (Simulating Interactive InformatIon Retrieval) ist gleich in zweierlei Hinsicht besonders: Zum einen passt sich die entwickelte Lösung an das Suchprofil der Nutzerin oder des Nutzers an. Zum anderen ist bereits der Weg dorthin außergewöhnlich. Denn die Forscherinnen und Forscher arbeiten bei der Entwicklung fast ganz ohne reale Nutzungsdaten und ohne zeitaufwendige Tests.
„Uns geht es in dem Projekt darum, die Zugänge zu digitalen Bibliotheken zu optimieren“, erklärt Prof. Dr. Michael Granitzer, Inhaber des Lehrstuhls für Data Science an der Universität Passau, der das Projekt zusammen mit Matthias Hagen, Professor für Big Data Analytics an der Martin-Luther-Universität Halle-Wittenberg und Prof. Dr. Klaus Tochtermann, Direktor des Leibniz-Informationszentrum Wirtschaft (ZBW), Kiel leitet. „Mit Hilfe unserer Methode können wir den Prozess der Entwicklung entscheidend abkürzen“, so Prof. Dr. Granitzer.
Das Forschungsteam simuliert ein Bibliothekssystem und speist in dieses System eine große Menge an künstlich generierten Nutzungsdaten ein. Diese Daten bilden möglichst viele Nutzungsvorlieben ab: „Es gibt ganz unterschiedliche Suchprofile. Manche Nutzerinnen und Nutzer suchen tagtäglich, andere kommen nur einmal und schauen dann ganz gezielt nach einem konkreten Buch“, erklärt Prof. Dr. Granitzer.
Reale Nutzungsdaten – angereichert mit künstlichen
Die Nutzermodelle simulieren also beispielsweise Anfragen, Klicks, Ergebnisinteraktionen. Ganz ohne den Einsatz vorhandener Daten geht es aber dann doch nicht: Einige Modelle trainieren die Forscherinnen und Forscher auf Basis von realen Logdaten – also jenen Dateien, die das Suchverhalten von realen Nutzerinnen und Nutzer automatisch erfassen. Diese Modelle wiederum reichern die Forscherinnen und Forscher mit künstlich generierten Daten an.
Diese Nutzungsmodelle helfen den Forscherinnen und Forschern dabei, die digitale Suche zu verbessern: Sie lassen Rückschlüsse zu, wie Bibliotheksdaten verschlagwortet werden müssen, damit sie besser gefunden werden. Außerdem geben sie Hinweise auf die beste Reihenfolge der Suchergebnisse.
Beteiligte und Förderung
Das entwickelte Verfahren evaluiert das Forschungsteam im Umfeld einer tatsächlich existierenden digitalen Bibliothek: der wirtschaftswissenschaftlichen Suchmaschine EconBiz. Denn Projektpartner ist das ZBW - Leibniz-Informationszentrum Wirtschaft, die weltweit größte Spezialbibliothek für wirtschaftswissenschaftliche Literatur. Das Ergebnis stellt das Forschungsteam auch anderen digitalen Bibliotheken in Form eines Open-Source-Frameworks zur Verfügung.
Die Deutsche Forschungsgemeinschaft (DFG) fördert das Vorhaben mit der Projektnummer GR 4277/2-1, AOBJ: 651840 über eine Laufzeit von drei Jahren.
Projektleitung an der Universität Passau | Prof. Dr. Michael Granitzer (Lehrstuhl für Data Science), Dr. Christin Seifert (Lehrstuhl für Data Science) |
---|---|
Laufzeit | 01.12.2019 - 30.11.2022 |
Mittelgeber | DFG - Deutsche Forschungsgemeinschaft > DFG - Wissenschaftliche Infrastruktur > DFG - Wissenschaftliche Infrastruktur - LIS: Wissenschaftliche Literaturversorgungs- und Informationssysteme |