Prof. Dr. Michael Granitzer (rechts im Bild), wissenschaftlicher Koordinator des EU-Projekts OpenWebSearch.EU, im Gespräch mit seinem Team an der Universität Passau.
Global dominieren vier Suchmaschinenanbieter aus den USA, Russland und China den Markt und wirken als Gatekeeper. In Europa gibt es bislang keinen unabhängigen Dienst. Denn auch „alternative Suchmaschinen“ bauen auf den Webindexen der genannten Gatekeeper auf.
Ein europaweiter Verbund unter Koordination der Universität Passau hat sich zum Ziel gesetzt, die Basis eines europäischen Open Web Index (OWI) als Grundlage für eine neue Internetsuche in Europa zu entwickeln. Das Projekt OpenWebSearch.EU läuft seit zwei Jahren und seither hat sich viel getan, wie die Nationale Kontaktstelle Digitale und Industrielle Technologien (NKS DIT) in ihrem Jahrbuch 2024 berichtet. Darin stellt sie dem Bundesministerium für Bildung und Forschung (BMBF) und der Öffentlichkeit einmal jährlich Geschichten besonders erfolgreicher EU-Projekte vor. Im aktuellen Jahrbuch ist das Projekt OpenWebSearch.EU unter den zwölf Vorzeigeprojekten.
„Das ist eine schöne Auszeichnung unserer bisherigen Arbeit“, freut sich Prof. Dr. Michael Granitzer, Inhaber des Lehrstuhls für Data Science und wissenschaftlicher Koordinator des EU-Projekts. „Ich sehe es auch als Signal, wie wichtig offene und transparente digitale Technologien für die Zukunft Europas sind. Mit unserem Webindex schaffen wir eine Grundlage, auf der neue, zukunftsträchtige KI-Anwendungen aufbauen können.“
2,7 Milliarden URLs in 185 Sprachen indexiert
Prof. Dr. Michael Granitzer, Inhaber des Lehrstuhls für Data Science, koordiniert den EU-weiten Verbund.
In den vergangenen zwei Jahren hat das interdisziplinäre Forschungsteam unter Koordination von Prof. Dr. Granitzer einen Index-Prototyp OWI (Open Web Index) entwickelt. Dieser wird aktuell über eine Infrastruktur von vier europäischen Supercomputing-Zentren gehostet und zukunftsoffen modelliert, so dass neue zukunftsträchtige Technologien wie KI-Anwendungen berücksichtigt werden können. Denkbar ist beispielsweise das Aufsetzen verschiedener Arten von Suchmaschinen, wie etwa vertikale Suchmaschinen, die sich auf spezielle Themen konzentrieren, oder eine „Argument-Suche“, die Vor- und Nachteile für bestimmte Suchanfragen liefern kann. Der Index-Prototyp hat bis dato 2,7 Milliarden URLs in 185 Sprachen „gecrawlt“, durchsucht, und umfasst 400 Tebibit, was in etwa einer Datenmenge von 191 000 Fotos entspricht.
„Die kollaborative, dezentrale und interdisziplinäre, europäische Herangehensweise leistet einen großen Beitrag zu einem fairen, offenen, vielfältigen und freien Web“, heißt es in dem Jahrbuch-Eintrag. Das von der Universität Passau koordinierte Projektkonsortium umfasst 14 Partner aus sieben europäischen Ländern. Neben Hochschulen, Forschungseinrichtungen und Unternehmen beteiligen sich auch Vereine, die sich für eine offene und freie Internetsuche und Informationsgesellschaft einsetzen. Dazu zählt die Open Search Foundation, in der sich Prof. Dr. Granitzer als Co-Moderator der Fachgruppe Tech engagiert.
Da das Vorhaben auch vielerlei rechtliche und ethische Fragen aufwirft, hat sich das Team zusätzliche Expertise von außen geholt mittels Drittpartner-Ausschreibungen (Open Calls). Diese definierten unter anderem Orientierungspunkte für die rechtlichen Rahmenbedingungen eines operativen offenen Webindex und führten Studien zur Wirtschaftlichkeitsprüfung durch.
Unsere Mission ist es, einen Beitrag zu einem fairen, offenen, vielfältigen und freien Web zu leisten. Wir stärken die europäische Wirtschaft und Gesellschaft und machen sie unabhängiger von globalen digitalen Akteuren, indem wir einen transparenten und offenen Zugang zu Webdaten ermöglichen – für unabhängige Suchmaschinen ebenso wie für die Analyse von Webdaten und den Einsatz von KI. Zudem verankern wir europäische Werte, indem wir ethische und gesellschaftliche Aspekte erforschen.“
Prof. Dr. Michael Granitzer, Universität Passau
KI-getriebene Websuche im Fokus des kommenden Projektjahrs
Das Projekt läuft noch bis August 2025. Im nächsten Jahr will das Team ethische Vorgaben für die Kuratierung und Etablierung der Hosting-Infrastruktur erarbeiten und Möglichkeiten für deren dauerhafte Finanzierung ausloten. Im Fokus steht darüber hinaus die Aufbereitung von Daten für die Nutzung von KI-getriebener Websuche. Zudem strebt das Forschungsteam eine weitere Skalierung des Index an, mit dem Ziel, einen relevanten Teil des Webs abzudecken und die Daten in Anwendungsszenarien für Websuche, KI, Webdaten-Analyse nutzbar zu machen.
„Unsere Mission ist es, einen Beitrag zu einem fairen, offenen, vielfältigen und freien Web zu leisten. Wir machen die europäische Wirtschaft und Gesellschaft unabhängiger von globalen digitalen Akteuren, indem wir einen transparenten und offenen Zugang zu Webdaten ermöglichen – für unabhängige Suchmaschinen ebenso wie für die Analyse von Webdaten und den Einsatz von KI.“, erklärt Prof. Dr. Granitzer.
Die Europäische Union fördert das Projekt im Rahmen des Forschungs- und Innovationsprogramms „Horizont Europa“ mit mehr als 8,5 Millionen Euro unter der Fördervereinbarung Nr. 101070014.
Quelle: Nationale Kontaktstelle Digitale und Industrielle Technologien – NKS DIT
Mehr Informationen
EU-Projekt OpenWebSearch.EU: Unabhängigkeit Europas bei der Internetsuche
Für das Projekt OpenWebSearch.EU hat sich die Universität Passau mit 13 anderen renommierten europäischen Forschungszentren zusammengeschlossen, um eine offene europäische Infrastruktur für die Onlinesuche zu entwickeln.
Prof. Dr. Michael Granitzer
Wie lassen sich Bedeutungszusammenhänge in einer Flut von digitalen Medien finden?
Wie lassen sich Bedeutungszusammenhänge in einer Flut von digitalen Medien finden?
Prof. Dr. Michael Granitzer ist Inhaber des Lehrstuhls für Data Science. Der Schwerpunkt seiner Forschung liegt auf der Nutzung maschineller Lerntechniken und intelligenter Mensch-Maschine Schnittstellen.
Förderhinweis
"Von der Europäischen Union finanziert. Die geäußerten Ansichten und Meinungen entsprechen jedoch ausschließlich denen des Autors bzw. der Autoren und spiegeln nicht zwingend die der Europäischen Union oder der Europäischen Exekutivagentur für Bildung und Kultur (EACEA) wider. Weder die Europäische Union noch die EACEA können dafür verantwortlich gemacht werden."