Zum Inhalt springen

"Success Story" OpenWebSearch.EU – Vom EU-Projekt zur EU-Suchmaschine

Die Nationale Kontaktstelle Digitale und Industrielle Technologien des Bundesforschungsministeriums würdigt das Vorhaben OpenWebSearch.EU als eines von zwölf besonders erfolgreichen EU-Projekten. Darin entwickelt ein europaweites Team unter Koordination von Prof. Dr. Michael Granitzer einen europäischen, offenen Webindex als Grundlage für eine unabhängige Websuche in Europa.

Prof. Dr. Michael Granitzer (rechts im Bild), wissenschaftlicher Koordinator des EU-Projekts OpenWebSearch.EU, im Gespräch mit seinem Team an der Universität Passau.

Global dominieren vier Suchmaschinenanbieter aus den USA, Russland und China den Markt und wirken als Gatekeeper. In Europa gibt es bislang keinen unabhängigen Dienst. Denn auch „alternative Suchmaschinen“ bauen auf den Webindexen der genannten Gatekeeper auf.

Ein europaweiter Verbund unter Koordination der Universität Passau hat sich zum Ziel gesetzt, die Basis eines europäischen Open Web Index (OWI) als Grundlage für eine neue Internetsuche in Europa zu entwickeln. Das Projekt OpenWebSearch.EU läuft seit zwei Jahren und seither hat sich viel getan, wie die Nationale Kontaktstelle Digitale und Industrielle Technologien (NKS DIT) in ihrem Jahrbuch 2024 berichtet. Darin stellt sie dem Bundesministerium für Bildung und Forschung (BMBF) und der Öffentlichkeit einmal jährlich Geschichten besonders erfolgreicher EU-Projekte vor. Im aktuellen Jahrbuch ist das Projekt OpenWebSearch.EU unter den zwölf Vorzeigeprojekten.  

„Das ist eine schöne Auszeichnung unserer bisherigen Arbeit“, freut sich Prof. Dr. Michael Granitzer, Inhaber des Lehrstuhls für Data Science und wissenschaftlicher Koordinator des EU-Projekts. „Ich sehe es auch als Signal, wie wichtig offene und transparente digitale Technologien für die Zukunft Europas sind. Mit unserem Webindex schaffen wir eine Grundlage, auf der neue, zukunftsträchtige KI-Anwendungen aufbauen können.“

2,7 Milliarden URLs in 185 Sprachen indexiert

Prof. Dr. Michael Granitzer, Inhaber des Lehrstuhls für Data Science an der Universität Passau; Foto: Universität Passau

Prof. Dr. Michael Granitzer, Inhaber des Lehrstuhls für Data Science, koordiniert den EU-weiten Verbund.

In den vergangenen zwei Jahren hat das interdisziplinäre Forschungsteam unter Koordination von Prof. Dr. Granitzer einen Index-Prototyp OWI (Open Web Index) entwickelt. Dieser wird aktuell über eine Infrastruktur von vier europäischen Supercomputing-Zentren gehostet und zukunftsoffen modelliert, so dass neue zukunftsträchtige Technologien wie KI-Anwendungen berücksichtigt werden können. Denkbar ist beispielsweise das Aufsetzen verschiedener Arten von Suchmaschinen, wie etwa vertikale Suchmaschinen, die sich auf spezielle Themen konzentrieren, oder eine „Argument-Suche“, die Vor- und Nachteile für bestimmte Suchanfragen liefern kann. Der Index-Prototyp hat bis dato 2,7 Milliarden URLs in 185 Sprachen „gecrawlt“, durchsucht, und umfasst 400 Tebibit, was in etwa einer Datenmenge von 191 000 Fotos entspricht.

„Die kollaborative, dezentrale und interdisziplinäre, europäische Herangehensweise leistet einen großen Beitrag zu einem fairen, offenen, vielfältigen und freien Web“, heißt es in dem Jahrbuch-Eintrag. Das von der Universität Passau koordinierte Projektkonsortium umfasst 14 Partner aus sieben europäischen Ländern. Neben Hochschulen, Forschungseinrichtungen und Unternehmen beteiligen sich auch Vereine, die sich für eine offene und freie Internetsuche und Informationsgesellschaft einsetzen. Dazu zählt die Open Search Foundation, in der sich Prof. Dr. Granitzer als Co-Moderator der Fachgruppe Tech engagiert.

Da das Vorhaben auch vielerlei rechtliche und ethische Fragen aufwirft, hat sich das Team zusätzliche Expertise von außen geholt mittels Drittpartner-Ausschreibungen (Open Calls). Diese definierten unter anderem Orientierungspunkte für die rechtlichen Rahmenbedingungen eines operativen offenen Webindex und führten Studien zur Wirtschaftlichkeitsprüfung durch.

Unsere Mission ist es, einen Beitrag zu einem fairen, offenen, vielfältigen und freien Web zu leisten. Wir stärken die europäische Wirtschaft und Gesellschaft und machen sie unabhängiger von globalen digitalen Akteuren, indem wir einen transparenten und offenen Zugang zu Webdaten ermöglichen – für unabhängige Suchmaschinen ebenso wie für die Analyse von Webdaten und den Einsatz von KI. Zudem verankern wir europäische Werte, indem wir ethische und gesellschaftliche Aspekte erforschen.“

Prof. Dr. Michael Granitzer, Universität Passau

KI-getriebene Websuche im Fokus des kommenden Projektjahrs

Das Projekt läuft noch bis August 2025. Im nächsten Jahr will das Team ethische Vorgaben für die Kuratierung und Etablierung der Hosting-Infrastruktur erarbeiten und Möglichkeiten für deren dauerhafte Finanzierung ausloten. Im Fokus steht darüber hinaus die Aufbereitung von Daten für die Nutzung von KI-getriebener Websuche. Zudem strebt das Forschungsteam eine weitere Skalierung des Index an, mit dem Ziel, einen relevanten Teil des Webs abzudecken und die Daten in Anwendungsszenarien für Websuche, KI, Webdaten-Analyse nutzbar zu machen.

„Unsere Mission ist es, einen Beitrag zu einem fairen, offenen, vielfältigen und freien Web zu leisten. Wir machen die europäische Wirtschaft und Gesellschaft unabhängiger von globalen digitalen Akteuren, indem wir einen transparenten und offenen Zugang zu Webdaten ermöglichen – für unabhängige Suchmaschinen ebenso wie für die Analyse von Webdaten und den Einsatz von KI.“, erklärt Prof. Dr. Granitzer.

Die Europäische Union fördert das Projekt im Rahmen des Forschungs- und Innovationsprogramms „Horizont Europa“ mit mehr als 8,5 Millionen Euro unter der Fördervereinbarung Nr. 101070014.

Quelle: Nationale Kontaktstelle Digitale und Industrielle Technologien – NKS DIT

EU-Projekt OpenWebSearch.EU: Unabhängigkeit Europas bei der Internetsuche

EU-Projekt OpenWebSearch.EU: Unabhängigkeit Europas bei der Internetsuche

Für das Projekt OpenWebSearch.EU hat sich die Universität Passau mit 13 anderen renommierten europäischen Forschungszentren zusammengeschlossen, um eine offene europäische Infrastruktur für die Onlinesuche zu entwickeln.

Prof. Dr. Michael Granitzer

forscht zu Data Science

Wie lassen sich Bedeutungszusammenhänge in einer Flut von digitalen Medien finden?

Wie lassen sich Bedeutungszusammenhänge in einer Flut von digitalen Medien finden?

Prof. Dr. Michael Granitzer ist Inhaber des Lehrstuhls für Data Science. Der Schwerpunkt seiner Forschung liegt auf der Nutzung maschineller Lerntechniken und intelligenter Mensch-Maschine Schnittstellen.

Förderhinweis

"Von der Europäischen Union finanziert. Die geäußerten Ansichten und Meinungen entsprechen jedoch ausschließlich denen des Autors bzw. der Autoren und spiegeln nicht zwingend die der Europäischen Union oder der Europäischen Exekutivagentur für Bildung und Kultur (EACEA) wider. Weder die Europäische Union noch die EACEA können dafür verantwortlich gemacht werden."

    In den Medien

    Bild der Wissenschaft

    Bild der Wissenschaft stellt Alternativen zu "Big Tech" vor, darunter das Projekt OpenWebSearch.EU unter der Koordination von Prof. Dr. Michael Granitzer (Data Science).

    Tagesspiegel

    Bericht des Tagesspiegel über das EU-Projekt OpenWebSearch.EU, das Prof. Dr. Michael Granitzer (Data Science) koordiniert.

    Spektrum.de

    Bericht von Spektrum.de über das EU-Projekt OpenWebsearch.EU, das von der Universität Passau koordiniert wird.

    Bluesky

    Beim Anzeigen des Videos wird Ihre IP-Adresse an einen externen Server (Vimeo.com) gesendet.

    Video anzeigen