
KI liest Zahlen aus Studien – Jülicher System automatisiert Datenauswertung
orschende des Forschungszentrums Jülich haben ein KI-System entwickelt, das quantitative Daten aus wissenschaftlichen Texten automatisch extrahiert und strukturiert aufbereitet. Das Framework mit dem Namen Quinex („Quantitative Information Extraction“) soll die Auswertung großer Mengen wissenschaftlicher Literatur erleichtern.
Wissenschaftliche Publikationen enthalten zahlreiche Zahlenwerte, etwa zu Wirkungsgraden, Kosten oder Messdaten. Diese Informationen sind häufig im Fließtext eingebettet und bislang nur mit erheblichem Aufwand manuell zugänglich. Quinex setzt an diesem Punkt an: Das System identifiziert Zahlen in Texten, ordnet ihnen passende Einheiten zu und erkennt den jeweiligen Kontext, etwa was gemessen wurde sowie wann, wo und unter welchen Bedingungen.
Technisch basiert Quinex auf Sprachmodellen, die speziell für die Analyse quantitativer Informationen trainiert wurden. Im Unterschied zu vielen anderen KI-Anwendungen nutzt das System vergleichsweise kompakte und offene Modelle. Laut den Entwicklern erreicht Quinex eine hohe Erkennungsgenauigkeit, insbesondere bei Zahlen und Einheiten.
In Tests wurde das System auf tausende wissenschaftliche Abstracts aus unterschiedlichen Fachgebieten angewendet. Dabei extrahierte es unter anderem Daten zu Energiekosten, medizinischen Messwerten oder Materialeigenschaften. Die Ergebnisse wurden mit Referenzdaten abgeglichen.
Das System ist als Open-Source-Projekt verfügbar und kann von Forschenden angepasst und weiterentwickelt werden. Ziel ist es, die Auswertung wissenschaftlicher Literatur zu beschleunigen und die Grundlage für strukturierte Datenbanken sowie weiterführende Analysen zu schaffen.
Nach Angaben des Entwicklerteams soll Quinex Forschende bei der Verarbeitung großer Datenmengen unterstützen, ohne die inhaltliche Bewertung der Ergebnisse zu ersetzen.


