Satellitenmissionen generieren riesige Mengen an atmosphärischen Daten, die für die Überwachung von Treibhausgasen und die Information über die Klimapolitik unerlässlich sind. Herkömmliche physikbasierte Abrufalgorithmen liefern zuverlässige Unsicherheitsschätzungen, sind jedoch rechenintensiv und können mit wachsenden Datenströmen nur schwer skaliert werden. Im Gegensatz dazu bieten Methoden des maschinellen Lernens dramatische Geschwindigkeitsverbesserungen, liefern jedoch in der Regel nur Einzelwertvorhersagen, da Unsicherheitsinformationen fehlen, die für wissenschaftliche Interpretationen und Entscheidungen erforderlich sind. Bestehende probabilistische Ansätze für maschinelles Lernen erfordern häufig umfangreiche Berechnungen, komplexe Abstimmungen oder markierte Unsicherheitsdaten, was ihren betrieblichen Einsatz einschränkt. Basierend auf diesen Herausforderungen besteht ein dringender Bedarf an der Entwicklung skalierbarer Abrufmethoden, die maschinelle Lerneffizienz mit einer strengen Unsicherheitsquantifizierung kombinieren.
Ein Forschungsteam der Shanghai Jiao Tong University berichtete über diesen Fortschritt Zeitschrift für Fernerkundung(DOI: 10.34133/remotesensing.0881) veröffentlicht Am 26. Dezember 2025. Die Studie führt ein probabilistisches maschinelles Lernframework ein, das für satellitengestützte Spurengasabrufe entwickelt wurde, wobei der Schwerpunkt auf der Kohlendioxidüberwachung liegt. Die Arbeit befasst sich mit einem kritischen Engpass in der aktuellen Satellitendatenverarbeitung: Wie man schnell umfangreiche Datensätze analysiert und gleichzeitig Unsicherheitsschätzungen liefert, die für Klimawissenschaften, Datenassimilation und politikrelevante Anwendungen erforderlich sind. Das Framework wurde anhand von Langzeitbeobachtungen der NASA-Mission Orbiting Carbon Observatory-2 (OCO-2) validiert.
Die Studie zeigt, dass unsicheres maschinelles Lernen ohne Einbußen bei der Geschwindigkeit erreicht werden kann. Durch die Modifizierung neuronaler Netze, um sowohl erwartete Werte als auch die damit verbundene Unsicherheit vorherzusagen, transformiert das Framework standardmäßige deterministische Modelle in probabilistische. Bei der Anwendung auf Satelliten-CO₂-Retrievals führte die Methode zu hochpräzisen Konzentrationsschätzungen bei gleichzeitiger Quantifizierung der Unsicherheit. Die Validierung gegenüber OCO-2-Betriebsprodukten zeigte eine starke zeitliche und räumliche Konsistenz, wobei über 99% der Referenzwerte innerhalb der vorhergesagten Unsicherheitsgrenzen lagen. Wichtig ist, dass das probabilistische Modell mit der Genauigkeit physikalisch basierter Methoden übereinstimmte und gleichzeitig tausende Male schneller arbeitete. Diese Kombination aus Geschwindigkeit, Genauigkeit und Zuverlässigkeit stellt einen erheblichen Fortschritt gegenüber bestehenden Ansätzen des maschinellen Lernens in der atmosphärischen Fernerkundung dar.
Das Framework integriert zwei Schlüsselinnovationen: Likelihood-basiertes Lernen und Snapshot-Ensemble-Modellierung. Anstatt eine einzelne Ausgabe vorherzusagen, schätzt das neuronale Netzwerk gleichzeitig den Mittelwert und die Varianz jedes Abrufs und ermöglicht so direktes Unsicherheitslernen aus vorhandenen Satellitenprodukten. Eine Gaußsche Funktion für negative Log-Likelihood-Verluste stellt sicher, dass sowohl über- als auch unterbewusste Vorhersagen bestraft werden, was gut kalibrierte Unsicherheitsschätzungen fördert.
Um modellbezogene Unsicherheit effizient zu erfassen, verwendeten die Forscher Snapshot-Ensembles, die mithilfe der zyklischen Lernratenplanung mehrere Modellinstanzen aus einem einzigen Trainingslauf extrahieren. Dadurch wird der hohe Rechenaufwand für die Schulung vieler unabhängiger Modelle vermieden.
Beim Test an OCO-2-Daten von 2017 bis 2024 erreichte das probabilistische Modell Abrufgeschwindigkeiten von Millisekunden pro Satellitensonde, verglichen mit Minuten für herkömmliche Algorithmen. Fallstudien in Großstädten zeigten, dass die vorhergesagten Unsicherheitsmuster denen aus physikbasierten Abrufen eng folgten, während sie etwas konservativer blieben und sowohl Messrauschen als auch Modellunsicherheit widerspiegelten.
