Eine Million griechische Papyri liegen weltweit ungelesen in Archiven und Bibliotheken – darunter zehntausende Dokumente in der Österreichischen Nationalbibliothek. Was Jahrhunderte lang ein ungelö...
Eine Million griechische Papyri liegen weltweit ungelesen in Archiven und Bibliotheken – darunter zehntausende Dokumente in der Österreichischen Nationalbibliothek. Was Jahrhunderte lang ein ungelöstes Problem der Altertumswissenschaft war, könnte nun durch künstliche Intelligenz bewältigt werden. Die Österreichische Akademie der Wissenschaften (ÖAW) entwickelt gemeinsam mit den KI-Unternehmen Mistral AI und Sail Reply das weltweit erste spezialisierte Large Language Modell für Altgriechisch. "Apollo" – benannt nach dem griechischen Gott des Lichts und Schutzgott der Wissenschaften – soll die Arbeit mit antiken Texten revolutionieren und in Stunden schaffen, wofür Forscher bisher Jahre benötigten.
Das Projekt unter der Leitung von Anna Dolganov, Althistorikerin und Papyrologin am Österreichischen Archäologischen Institut der ÖAW, betritt wissenschaftliches Neuland. Bisher haben sich Large Language Modelle ausschließlich mit modernen Sprachen beschäftigt. Apollo hingegen muss mit den besonderen Herausforderungen einer historischen Sprache umgehen, die sich über Jahrhunderte gewandelt hat und oft nur in fragmentarischer Form überliefert ist.
Ein Large Language Modell (LLM) ist eine Form der künstlichen Intelligenz, die auf riesigen Textmengen trainiert wird, um menschenähnliche Sprachfähigkeiten zu entwickeln. Diese Systeme können Texte verstehen, übersetzen, zusammenfassen und sogar fehlende Textpassagen rekonstruieren. Während bekannte LLMs wie ChatGPT oder Claude auf modernen Sprachen basieren, spezialisiert sich Apollo ausschließlich auf das Altgriechische – eine Sprache, die vom 8. Jahrhundert vor Christus bis ins 6. Jahrhundert nach Christus verwendet wurde.
Apollo wird auf einem beispiellos umfangreichen Corpus trainiert, der etwa 600 Millionen Wörter aus historischen griechischen Texten sowie zehntausende publizierte Inschriften und Papyri umfasst. Dieser Datenschatz stellt die größte digitale Sammlung historischer griechischer Quellen weltweit dar. Die Herausforderung liegt nicht nur in der schieren Menge, sondern auch in der Qualität der Texte: Viele antike Dokumente sind fragmentarisch überliefert, durch Alter und Umwelteinflüsse beschädigt oder in verschiedenen regionalen Dialekten verfasst.
Die Papyrologie – die Wissenschaft von den auf Papyrus geschriebenen antiken Texten – hat in den vergangenen Jahrzehnten einen enormen Fundus an Material angesammelt. Papyri waren das wichtigste Schreibmaterial der Antike und wurden vor allem in Ägypten aufgrund der günstigen klimatischen Bedingungen in großer Zahl konserviert. Diese Dokumente enthalten nicht nur literarische Werke, sondern auch Alltagstexte wie Briefe, Verträge, Steuerunterlagen und administrative Dokumente, die einzigartige Einblicke in das Leben der Menschen vor 2000 Jahren gewähren.
In der Papyrussammlung der Österreichischen Nationalbibliothek lagern zehntausende ungelesene griechische Papyri – ein wahrer Goldschatz für die Geschichtsforschung. Diese Sammlung gehört zu den bedeutendsten ihrer Art weltweit und wurde über mehr als ein Jahrhundert systematisch aufgebaut. Die Dokumente stammen größtenteils aus dem antiken Ägypten und umfassen einen Zeitraum vom 3. Jahrhundert vor Christus bis ins 8. Jahrhundert nach Christus.
"Es gibt beispielsweise eine Million griechischer Papyri weltweit, die noch nie gelesen wurden. Zehntausende davon liegen in der Papyrussammlung der Österreichischen Nationalbibliothek. Auf solche Schätze an historischem Wissen zielen wir ab", erklärt Anna Dolganov. Die Wissenschaftlerin koordiniert nicht nur die fachliche Begleitung des Projekts, sondern sorgt auch für die Einbindung der relevanten Quellen und stellt die wissenschaftliche Qualität sicher.
Während die Österreichische Nationalbibliothek eine der bedeutendsten Papyrussammlungen Europas beherbergt, finden sich ähnlich umfangreiche Bestände in Deutschland (Universitätsbibliothek Leipzig, Staatliche Museen Berlin), der Schweiz (Universität Basel) und anderen europäischen Ländern. Die internationale Dimension des Problems wird deutlich: Allein in Deutschland lagern schätzungsweise 200.000 unbearbeitete Papyrusfragmente, in der Schweiz weitere 50.000. Apollo könnte somit nicht nur der österreichischen Forschung, sondern der gesamten europäischen Altertumswissenschaft zugutekommen.
"Alte Sprachen und Künstliche Intelligenz sind kein Widerspruch", betont ÖAW-Präsident Heinz Faßmann. "Die Zusammenarbeit unseres Archäologischen Instituts mit Mistral und Reply zeigt, wie die KI auch die geisteswissenschaftliche Forschung vorantreibt." Diese Aussage markiert einen Paradigmenwechsel in der traditionell eher technologieskeptischen Geisteswissenschaft.
Mistral AI, das französische KI-Unternehmen, hat sich als europäische Alternative zu amerikanischen Tech-Giganten etabliert und gilt als Pionier bei der Entwicklung offener und transparenter KI-Systeme. Die Zusammenarbeit mit Sail Reply, einem Spezialisten für digitale Transformation, gewährleistet die technische Umsetzung auf höchstem Niveau. Besonders wichtig ist dabei der europäische Fokus: Apollo wird auf europäischen Servern betrieben und unterliegt den strengen EU-Datenschutzbestimmungen der DSGVO.
Apollo unterscheidet sich von herkömmlichen Übersetzungsprogrammen durch seine multimodalen Fähigkeiten. Das bedeutet, die KI kann nicht nur reinen Text verarbeiten, sondern auch Bilder von Inschriften und Papyri analysieren. Diese Funktion ist entscheidend, da antike Texte oft nur als fotografierte Fragmente vorliegen, deren Entzifferung selbst für Experten eine Herausforderung darstellt.
Die KI kann verschiedene Aufgaben gleichzeitig bewältigen: Rekonstruktion fragmentarischer Inschriften und Papyri, semantische und thematische Suchen in der gesamten griechischen Textüberlieferung sowie die Entzifferung handschriftlicher Texte. Ein praktisches Beispiel: Wenn ein Papyrusfragment nur noch die Hälfte eines Vertrags enthält, kann Apollo aufgrund seiner Kenntnisse ähnlicher Dokumente die fehlenden Passagen mit hoher Wahrscheinlichkeit rekonstruieren.
Die Einsatzmöglichkeiten von Apollo sind vielfältig und reichen weit über die reine Textrekonstruktion hinaus. Historiker können künftig thematische Recherchen durchführen, die bisher unmöglich waren. Wer beispielsweise alle Erwähnungen von Handelspraktiken im antiken Ägypten finden möchte, musste bisher jeden einzelnen Papyrus manuell durchsuchen – eine Arbeit von Jahrzehnten. Apollo kann solche Suchanfragen in Minuten abarbeiten und dabei auch synonyme Begriffe und kontextuelle Zusammenhänge berücksichtigen.
Für die Archäologie bedeutet dies einen enormen Fortschritt bei der Dokumentation und Interpretation von Funden. Inschriften auf Grabsteinen, Tempeln oder öffentlichen Gebäuden können schneller und präziser erfasst werden. Auch die Datierung von Texten, die bisher aufgrund stilistischer Merkmale erfolgte, kann durch KI-gestützte Sprachanalyse verfeinert werden.
Die Entwicklung von Apollo hat weitreichende Folgen für die österreichische und internationale Forschungslandschaft. Universitäten und Forschungseinrichtungen, die bisher aufgrund personeller Engpässe nur einen Bruchteil ihrer Papyrusbestände bearbeiten konnten, erhalten nun die Möglichkeit, ihre Sammlungen systematisch zu erschließen. Dies könnte zu einer Renaissance der Altertumswissenschaften führen und neue Erkenntnisse über die antike Welt ermöglichen.
Für österreichische Studierende der Klassischen Philologie, Alten Geschichte oder Archäologie eröffnen sich neue Forschungsmöglichkeiten. Während bisher oft jahrelange Vorarbeiten nötig waren, um überhaupt zu verwertbaren Texten zu gelangen, können sie sich künftig direkt auf inhaltliche Fragen konzentrieren. Dies könnte auch die Attraktivität dieser Studienfächer steigern, die in den vergangenen Jahren mit rückläufigen Studierendenzahlen zu kämpfen hatten.
Ein besonderer Aspekt des Apollo-Projekts ist die Betonung europäischer Datensouveränität. Während viele KI-Projekte auf amerikanischen oder chinesischen Infrastrukturen basieren, setzt die ÖAW bewusst auf europäische Partner. Mistral AI wurde 2023 in Paris gegründet und verfolgt das Ziel, Europa im Bereich der künstlichen Intelligenz unabhängiger zu machen. Die Zusammenarbeit mit Sail Reply, einem italienischen Unternehmen mit starker europäischer Präsenz, unterstreicht diesen Ansatz.
Die Entscheidung für europäische Partner hat auch praktische Vorteile: Die Einhaltung der DSGVO ist gewährleistet, und die Daten verbleiben auf europäischen Servern. Dies ist besonders wichtig für Kulturinstitutionen, die oft mit einzigartigen und unwiederbringlichen historischen Dokumenten arbeiten. Der Schutz dieser digitalen Kulturgüter hat höchste Priorität.
Trotz aller Fortschritte stößt auch Apollo an Grenzen. Die KI kann zwar Textlücken mit hoher Wahrscheinlichkeit füllen, aber sie kann keine absolute Gewissheit bieten. Wissenschaftler müssen daher weiterhin kritisch prüfen und alternative Interpretationen in Betracht ziehen. Die menschliche Expertise bleibt unverzichtbar – Apollo soll sie ergänzen, nicht ersetzen.
Ein weiteres Problem liegt in der Qualität der Trainingsdaten. Viele antike Texte sind bereits in unterschiedlicher Qualität digitalisiert worden, und fehlerhafte Übertragungen könnten sich in der KI fortpflanzen. Die ÖAW muss daher erheblichen Aufwand in die Qualitätssicherung investieren. Anna Dolganov und ihr Team übernehmen dabei die kritische Rolle als fachliche Kontrollinstanz.
Obwohl die genauen Kosten des Apollo-Projekts nicht öffentlich kommuniziert wurden, handelt es sich um eine erhebliche Investition der beteiligten Partner. Die ÖAW bringt ihre wissenschaftliche Expertise und Datenbestände ein, während Mistral AI und Sail Reply die technische Entwicklung und Infrastruktur bereitstellen. Solche Kooperationsmodelle werden in der Wissenschaft zunehmend wichtiger, da einzelne Institutionen die Kosten für modernste KI-Entwicklung kaum allein tragen können.
Die Entwicklungszeit für Apollo wird auf mehrere Jahre veranschlagt. Bereits 2024 sollen erste Prototypen getestet werden, die vollständige Implementierung ist für 2025/2026 geplant. Diese Zeitspanne ist typisch für komplexe KI-Projekte und berücksichtigt umfangreiche Testphasen und Qualitätskontrollen.
Das Apollo-Projekt könnte zum Vorbild für ähnliche Initiativen in anderen Ländern werden. Bereits jetzt zeigen Institutionen in Deutschland, Italien und Griechenland Interesse an einer Zusammenarbeit. Eine europäische Allianz für KI-gestützte Altertumswissenschaft könnte entstehen, die Ressourcen bündelt und Standards definiert.
Langfristig plant die ÖAW, Apollo auch für andere historische Sprachen zu adaptieren. Latein, Koptisch oder Demotisch könnten folgen. Dies würde die Erschließung antiker Kulturen erheblich beschleunigen und neue interdisziplinäre Forschungsansätze ermöglichen.
Universitäten müssen ihre Curricula anpassen, um künftige Altertumswissenschaftler auf die Arbeit mit KI-Tools vorzubereiten. Die Universität Wien hat bereits angekündigt, entsprechende Lehrveranstaltungen zu entwickeln. Studierende lernen künftig nicht nur die klassischen Methoden der Textanalyse, sondern auch den kritischen Umgang mit KI-generierten Ergebnissen.
Diese Entwicklung spiegelt einen allgemeinen Trend in der Hochschullandschaft wider: Digitale Kompetenzen werden auch in traditionell geisteswissenschaftlichen Fächern immer wichtiger. Apollo könnte dabei als Paradebeispiel für die gelungene Integration moderner Technologie in klassische Disziplinen dienen.
Über die rein wissenschaftlichen Aspekte hinaus hat Apollo auch kulturpolitische Bedeutung. Die Erschließung antiker Texte trägt zur Bewahrung des europäischen Kulturerbes bei und macht dieses einer breiteren Öffentlichkeit zugänglich. Übersetzungen und Interpretationen, die bisher Spezialisten vorbehalten waren, könnten künftig auch interessierten Laien zur Verfügung stehen.
Museen und kulturelle Einrichtungen könnten Apollo nutzen, um ihre Sammlungen besser zu präsentieren und zu kontextualisieren. Besucher könnten beispielsweise vor einer antiken Inschrift stehen und über eine App sofort eine vollständige Übersetzung und historische Einordnung erhalten. Dies würde die Vermittlung antiker Geschichte revolutionieren und neue Zielgruppen erschließen.
Das Apollo-Projekt der ÖAW markiert einen Wendepunkt in der Erforschung der Antike. Während eine Million griechischer Papyri noch darauf wartet, gelesen zu werden, verspricht die Künstliche Intelligenz, diesen jahrhundertealten Rückstand in wenigen Jahren aufzuholen. Anna Dolganov fasst die Tragweite zusammen: "Dieses LLM ist der Beginn einer äußerst spannenden Reise für die Erforschung der Antike." Eine Reise, die nicht nur unser Verständnis der griechisch-römischen Welt vertiefen, sondern auch zeigen könnte, wie traditionelle Geisteswissenschaften und modernste Technologie symbiotisch zusammenwirken können. In einer Zeit, in der die Digitalisierung alle Lebensbereiche erfasst, beweist Apollo, dass auch die ältesten Texte der Menschheit von den neuesten Innovationen profitieren können.