Maschinelles Lernen für energieeffiziente Gebäude: Prognose der HVAC-Kühllast
Veröffentlicht 16. Februar 2026

Quelle: Das Poster stammt von ELIAS (European Lighthouse of AI for Sustainability)
Einleitung
Moderne Gebäude sind längst nicht mehr nur Beton, Glas und Stahl. Sie verhalten sich wie lebendige Systeme, die kontinuierlich auf Wetter, Belegung und menschliches Verhalten reagieren. Im Zentrum dieser Systeme steht die HVAC-Infrastruktur (Heating Ventilation and Air Conditioning), die leise für Komfort und Produktivität sorgt und gleichzeitig für einen überraschend großen Anteil des globalen Energieverbrauchs verantwortlich ist. In der Europäischen Union sind Gebäude einer der wichtigsten Hebel für Energie- und Klimaziele: Die Europäische Kommission weist darauf hin, dass Gebäude rund 40 % des Energieverbrauchs und 36 % der Treibhausgasemissionen in der EU verursachen. Ein ähnlich eindrucksvolles Bild zeigt sich in Deutschland: das Umweltbundesamt berichtet, dass der Betrieb von Gebäuden etwa 35 % des Endenergieverbrauchs und etwa 30 % der CO2-Emissionen ausmacht.
Die Optimierung von HVAC-Anlagen ist nicht so einfach wie die Einstellung eines Thermostats. Da Wärmeenergie in der Gebäudemasse (Wände, Böden, Möbel) und in den Arbeitsflüssigkeiten der HVAC-Anlagen gespeichert wird, weisen reale Systeme eine thermische Trägheit auf: Es wird nicht sofort auf Bedarf reagiert, sondern mit Verzögerungen auf Wetter- oder Belegungsänderungen. In Kombination mit lauten, unvollständigen und zeitversetzten Telemetriedaten erschwert dies die Abstimmung traditioneller regelbasierter Steuerungen für eine gleichbleibend effiziente Leistung.
Diese Herausforderungen stehen im Mittelpunkt des Wettbewerbs „AI-Based Modeling for Energy-Efficient Buildings” (KI-basierte Modellierung für energieeffiziente Gebäude). Anhand von Messungen, die über einen Zeitraum von mehr als einem Jahr auf einem großen Bürocampus durchgeführt wurden, war die Aufgabe scheinbar einfach: die Rücklauftemperatur des gekühlten Wassers (ein Indikator für die Kühllast) unter strengen Kausalitätsbeschränkungen drei Stunden im Voraus vorherzusagen. Im weiteren Verlauf dieses Blogs werden der Ansatz, Signalanalyse, zeitkausales Feature Engineering und Modelldesign sowie die Auswirkungen der Ergebnisse auf den praktischen, energiebewussten Gebäudebetrieb erläutert.
Auf einen Blick
Diese Arbeit befasst sich mit dem Problem der Modellierung der Kühllast in einem großen, realen Bürogebäüde unter Verwendung von maschinellem Lernen. Das Ziel besteht darin, die von Sensor B205WC000.AM02 gemessene Rücklauftemperatur des Wassers im Klimaanlagenkreislauf vorherzusagen, die als direkter Indikator für den Kühlbedarf des Gebäudes dient. Der Datensatz besteht aus Hunderten von Sensorsignalen, die über einen Zeitraum von mehr als einem Jahr im 10-Minuten-Takt auf dem Bosch-Campus in Budapest erfasst wurden. Die Bewertung konzentriert sich auf die nicht erfassten Sommermonate, in denen das Zielsignal vollständig entfernt wurde und unter strengen zeitlichen Kausalitätsbeschränkungen aus anderen Messungen abgeleitet werden muss. Die Modellleistung wird anhand des mittleren quadratischen Fehlers gemessen, wobei zusätzlicher Wert auf Robustheit, Interpretierbarkeit und Eignung für die HVAC-Steuerung gelegt wird.
Projektdauer:
Der Wettbewerb selbst dauerte etwa drei Monate, aber die hier vorgestellten Arbeiten wurde in einem viel engeren Zeitrahmen abgeschlossen: Da der Wettbewerb erst spät entdeckt wurde, blieben nur etwa drei Wochen Zeit, um aus den HVAC - Rohdaten eine wettbewerbsfähige Lösung zu entwickeln. Diese Einschränkung prägte den gesamten Arbeitsablauf. Es gab keine detaillierte Systemdokumentation (keine Rohrleitungs- und Instrumentierungsdiagramme, keine Steuerungsschemata, keine Notizen zur Verkabelung der Anlage), sodass die Campus-Klimaanlage als praktische Black Box behandelt werden musste: Die Struktur aus den Signalen ableiten, die Annahmen visuell überprüfen und schnell iterieren. Der Schwerpunkt lag daher auf „intelligenter Arbeit“ statt auf roher Gewalt;schnelle Signaldiagnostik (Korrelations-/Verzögerungsprüfungen, Heatmaps und Driver-Target-Alignment-Plots), präzises zeitlich kausales Feature Engineering und eine kleine Auswahl an hochwirksamen Modellierungsoptionen, die schnell getestet und durch Plots klar kommuniziert werden konnten, anstatt langwierige Vermutungen anzustellen.
Hintergrund
Moderne HVAC-Systeme arbeiten als eng gekoppelte, dynamische Netzwerke, die kontinuierlich auf Wetterbedingungen, interne Wärmelasten, Gerätestatus und Steuerungslogik reagieren. In großen Anlagen können diese Systeme bis zur Hälfte des gesamten Energieverbrauchs ausmachen, sodass eine genaue Modellierung der Kühllast ein entscheidender Hebel für Energieeffizienz und Betriebsoptimierung ist. Die Optimierung realer HVAC-Systeme ist gekennzeichnet durch verzögerte Reaktionen, nichtlineare Wechselwirkungen und subsystemübergreifende Abhängigkeiten. Das erschwert eine manuelle Modellierung.
Die Aufgabe erfordert ein Verständnis dafür, wie die Kühllast aus den Interaktionen der Sensoren über die gesamte Kaltwasseranlage entsteht. Während des Trainings (Januar bis Mai 2025) stehen alle Variablen einschließlich des Zielwerts zur Verfügung; in der Auswertung (Juni bis Juli 2025) wird der Zielsensor vollständig zurückgehalten. Die Vorhersagen müssen daher aus verwandten Signalen mit einer Vorlaufzeit von drei Stunden abgeleitet werden, sodass ausschließlich physikalisch plausible, zeitkausale Informationen verwendet werden. Dadurch liegt der Schwerpunkt auf dem Modellieren der Anlagenzusammenhänge unter realen Betriebsbedingungen statt, auf einer reinen Kurzfristprognose.
Zielsignal
Die Abbildung zeigt das Zielsignal B205WC000.AM02 (Kaltwasser-Rücklauftemperatur) für den Zeitraum Januar 2024 bis Mai 2025. Während des größten Teils des Zeitraums liegt die Zeitreihe in einem relativ stabilen Betriebsbereich um ~9–12 °C, mit einer sichtbaren Änderung des Systemverhaltens im Früh-/Hochsommer 2024, wo die Basislinie ansteigt und die Variabilität zunimmt (etwa ~12–14 °C), was mit einer höheren Kühllast und einer aktiverenRegulierungübereinstimmt. Überlagert wird dieser Betriebszustand durch mehrere scharfe, isolierte Spitzen, insbesondere um das Frühjahr 2024, Ende Oktober/November 2024 und das Frühjahr 2025, bei denen die Temperatur kurzzeitig deutlich über den normalen Bereich steigt (mit Spitzenwerten um ~25–28 °C). Diese Ereignisse unterscheiden sich optisch von der typischen Dynamik und sollten am besten als seltene Betriebsabweichungen oder Messartefakte behandelt werden, da keine Metadaten zu Wartung/Betrieb vorliegen. Die Grafik enthält zudem kurze Diskontinuitäten bzw. Datenlücken sowie einige abrupte Einbrüche. Diese wurden in der Vorverarbeitung durch kubische Spline-Interpolation über kurze fehlende Segmente behandelt, um ein glattes, physikalisch plausibles Signal ohne Stufenartefakte zu erhalten. Insgesamt weist das Signal eine langsame saisonale Drift auf, die von regelmäßigen kleinen Transientereignissen (Regelungsmaßnahmen) überlagert wird; zusätzlich treten vereinzelt Extremereignisse auf. Dieses reale Verhaltensmuster motiviert den Einsatz einer zeitkausalen Prognose mit verzögerten bzw. rollierenden Merkmalen sowie einer robusten Behandlung von Ausreißern und fehlenden Werten.
Sensorauswahl und -screening
Um das Modell strikt kausal und regelkonform zu halten, wurde jedes Sensorsignal unter der 3-Stunden-Verfügbarkeitsregel bewertet: Bei der Vorhersage des Ziels zum Zeitpunkt t dürfen ausschließlich Informationen verwendet werden, die bis t−3 h verfügbar waren. In der Praxis wurde hierfür jede potenzielle Quelle um drei Stunden zeitlich verzögert und anschließend im 10-Minuten-Raster mit dem Zielsignal synchronisiert, d. h. Quelle(t−3 h) wurde Ziel(t) gegenübergestellt. Danach wurden die Sensorsignale mithilfe der Mutual Information (MI) gerankt. MI eignet sich besonders für HVAC-Systeme, da die Zusammenhänge häufig nichtlinear sind und Schwellenwerte, Sättigungseffekte sowie Wechsel des Betriebszustands aufweisen können.
Die folgenden Abbildungen veranschaulichen dieses Vorgehen anhand der stärksten, per Mutual Information (MI) ausgewählten Quellen. In jeder Grafik ist das Ziel die vorherzusagende Temperatur, während die Quellen (Input) der entsprechende Sensorsignal ist, das um −3 Stunden verschoben wurde. Zeigt die Quelle Veränderungen, die konsistent vor ähnlichen Änderungen im Ziel auftreten, stützt dies die Annahme, dass der Sensor unter der Kausalitätsbedingung prädiktive Information trägt. Die Diagramme dienen nicht dem Vergleich absoluter Größenordnungen zwischen Signalen (jedes Signal hat eigene Einheiten und Betriebsbereiche), sondern der Hervorhebung von zeitlicher Ausrichtung und konsistenter Mitbewegung.
Das Vorhersageziel B205WC000.AM02 wird in Grad Celsius (°C) gemessen. Unter den ausgewählten Quellen sind B205WC001.AM01 ebenfalls in °C, B205HP110.AC61 in Prozent (%) und B205HW110.AM02 in Kubikmetern pro Stunde (m³/h).
B205WC001.AM01 (°C, Vorlauftemperatur Kaltwasser).
Dieses Signal zeigt klare, stufenartige Betriebszustände und wiederkehrende Übergänge, die gut mit nachfolgenden Änderungen im Zielsignal übereinstimmen. Die wiederholten Ein/Aus-Plateaus und ereignisartigen Veränderungen liefern einen starke, strukturierte Quelle, die sich ohne Verletzung der Kausalität in prädiktive Merkmale (Verzögerungen, gleitende Mittelwerte, Änderungsraten) überführen lässt.
B205HP110.AC61 (%, Wärmepumpe, Drehzahl Kühlwasser).
Dieser Sensor zeigt klar abgegrenzte Betriebsphasen und kurze Aktivitätsspitzen, die zeitlich mit späteren Veränderungen im Zielsignal zusammenfallen. Solche Muster sind typisch für das Regelverhalten von Anlagenkomponenten: Wechselt die Wärmepumpe in ein anderes Betriebsregime, wird die Reaktion des Kühlwasserkreislaufs mit zeitlicher Verzögerung stromabwärts sichtbar. Dadurch eignet sich dieses Signal besonders gut zur Erfassung von Betriebszustandwechseln und transienten Betriebszuständen.
B205HW110.AM02 (m³/h, Durchfluss am Wärmetauscher-Ausgang).
Obwohl dieses Signal auf einer anderen physikalischen Skala arbeitet, zeigt es ein stabiles Grundniveau mit Abweichungen, die zeitlich mit späteren Veränderungen im Zielsignal übereinstimmen. Die Einbindung dieses Sensors hilft dem Modell, gekoppelte thermische Effekte zwischen Subsystemen abzubilden, beispielsweise Wechselwirkungen im Wärmeaustausch, die die Rücklauftemperatur indirekt beeinflussen.
Basierend auf dem MI-Ranking und diesen Lag-Alignment-Prüfungen wurde der endgültige Merkmalsatz so gestaltet, dass er die Sensoren mit dem stärksten Signal hervorhob und gleichzeitig kompakt und interpretierbar blieb. Anschließend wurde Feature Engineering hauptsächlich auf diese Quellen angewendet (Multi-Horizon-Lags, rollierende Statistiken und Interaktionsterme), um sicherzustellen, dass das Modell aus Signalen lernte, die sowohl prädiktiv als auch zum Zeitpunkt der Inferenz verfügbar waren.
Zeitkausales temporales Feature Engineering
HVAC-Systeme weisen eine thermische Trägheit auf: Die Rücklauftemperatur reagiert nicht unmittelbar auf eine Ventilbewegung oder eine Änderung des Durchflusses, sondern zeitverzögert. Aus diesem Grund wurden Rohsensorwerte nicht direkt verwendet. Stattdessen wurde jedes ausgewählte B205-Signal auf dem 10-Minuten-Raster zu einem zeitbewussten Feature-Set erweitert. Dieses umfasst verzögerte Werte (Lags) zur Abbildung der zeitlich verzögerten Ausbreitung, gleitende Statistiken wie Mittelwert/Standardabweichung/Minimum/Maximum über mehrere Zeitfenster zur Darstellung von Betriebszustände und Stabilität sowie Änderungsmerkmale wie erste Differenzen und prozentuale Änderungen, um Regelaktionen und abrupte Übergänge zu erfassen. Zusätzlich wurden physikalisch sinnvolle Features im Kreislauf automatisch erzeugt, indem Sensoren mit gleichem Anlagenpräfix gepaart sowie Summen und Differenzen berechnet wurden. Diese einfachen, aber wirkungsvollen Konstrukte bilden häufig Vor- und Rücklaufdifferenzen oder Zweipunkt-Konsistenzprüfungen innerhalb eines Kreislaufs ab.
Da der Gebäudebetrieb stark durch menschliche Nutzungs- und Zeitpläne geprägt ist, wurden zusätzlich Kalender-Features eingeführt, um wiederkehrende Nachfragemuster zu erfassen, die sich nicht vollständig allein aus den Sensorsignalen erklären lassen. Dazu zählen Tageszeit-Merkmale (zur Abbildung täglicher Sollwert- und Betriebspläne), Wochentagsmerkmale (Unterscheidung zwischen Werktags- und Wochenendbetrieb) sowie Indikatoren für Feiertage bzw. arbeitsfreie Tage, die häufig zu deutlich anderen HVAC-Regimen führen etwa durch reduzierte Belegung und angepasste Regelstrategien.An sinnvollen Stellen wurden zyklische Kodierungen (z. B. Sinus/Cosinus der Tageszeit) verwendet, damit das Modell glatte periodische Verläufe lernen kann, anstatt Zeitpunkte wie „23:50“ und „00:00“ als voneinander unabhängig zu behandeln.
Wichtig dabei ist, dass alle erzeugten Features strikt unter den Kausalitätsregel des kaggle - Wettbewerb einsetzbar entsprechen. Nachdem sämtliche zeitlichen und kalenderbasierten Merkmale berechnet waren, wurde die gesamte Feature-Matrix um drei Stunden nach vorne verschoben. Das bedeutet: Bei der Vorhersage des Ziels zum Zeitpunkt t sieht das Modell ausschließlich Informationen, die bis spätestens t − 3 h verfügbar gewesen wären. Diese Designentscheidung verhindert zuverlässig Future Leakage, richtet die Pipeline an realer HVAC-Betriebslogik aus und zwingt das Modell dazu, die zeitliche Ausbreitung von Systemzuständen zu lernen, anstatt zufällige Timing-Artefakte auszunutzen.
Gebäudeübergreifendes Feature Engineering: Erfassung indirekter thermischer Einflüsse
Obwohl das Vorhersageziel des Modells die Kühlwasserrücklauftemperatur in B205 ist, sind die zugrunde liegenden Dynamiken nicht rein „lokal“. Auf einem Campus verhält sich das HVAC-System wie ein gekoppeltes Gesamtsystem: Wetterbedingungen treiben die thermische Last nach oben oder unten, und benachbarte Gebäude können über gemeinsame Infrastruktur Einfluss auf Kreisläufe und Betriebsmodi nehmen. Die zentraleHerausforderungin dieser Challenge besteht darin, dass diese externen Einflüsse physikalisch fortbestehen können, selbst wenn ihre Messungen während der Evaluierung nicht als Eingangsfeatures verfügbar sind. Ein direkter Einsatz von Sensorsignalen anderer Gebäude würde daher zu einer Diskrepanz zwischen Training und Test führen: Das Modell lernt Abhängigkeiten, die es zur Vorhersage nicht mehr nutzen kann.
Um dem zu begegnen, wurden die externen Gebäude zunächst nach der Art der von ihnen gelieferten Information charakterisiert. B106 fungiert primär als Wetterstation und liefert Umgebungsgrößen wie Temperatur sowie windbedingte Effekte. B201 repräsentiert den Campus-HVAC-Betrieb mit Sensoren aus zentralen Subsystemen wie AH (Luftbehandlung), FC (Gebläsekonvektoren), RC (Kälte-/Kältekreisläufe) und WD (Wasserverteilung). Diese Signale sind starke Treiber der thermischen Nachfrage, können jedoch nicht als zwingende Eingaben behandelt werden, da ihre Verfügbarkeit im Evaluationsdatensatz strukturell nicht garantiert ist (es handelt sich also nicht nur um häufige NaN-Werte).
Die Lösung bestand darin, diese gebäudeübergreifenden Effekte indirekt über B205-exklusive Proxy-Features zu kodieren: Merkmale, die ausschließlich aus in B205 stets verfügbaren Sensoren berechnet werden, aber dennoch die „Fingerabdrücke“ externer Anregungen über verzögerte und strukturierte Reaktionen enthalten. Praktisch bedeutet dies, Features zu konstruieren, die erfassen, wie B205 auf Wetteränderungen oder auf Moduswechsel im Campus-HVAC-Netz reagiert, ohne die Signale aus B106/B201 direkt zu verwenden.
Für den Wettereinfluss (B106) wurden Proxy-Features entwickelt, die Laständerungen abbilden, die typischerweise mit kurzen Verzögerungen auf atmosphärische Störungen folgen. Innerhalb von B205 zeigen sich nach schnellen Umgebungsänderungen häufig konsistente Muster etwa charakteristische Rampen und Stabilisierungsphasen, während das Regelsystem kompensiert. Diese Reaktionen wurden mittels kurzfristiger Lags und gleitender Statistiken (ca. 1–3 Stunden) erfasst, sodass das Modell „wetterähnliche“ Anregungen aus dem eigenen beobachtbaren Zustand von B205 lernen kann.
Für die Interaktion mit Nachbargebäuden (B201) fokussierte sich das Proxy-Design auf systemweite Kopplungen, die in B205-Sensoren sichtbar werden. Im Mittelpunkt standen insbesondere Verhaltensmuster, die mit Änderungen in Kältekreisläufen, koordinierter Luftbehandlungsnachfrage und Dynamiken der Wasserschleifen konsistent sind. Hier spielen längere Zeithorizonte eine größere Rolle, da thermische Massen und gemeinsame Infrastruktur Effekte langsamer weitergeben. Entsprechend wurden längere Fensterstatistiken und verzögerte Features (bis zu mehreren Stunden) betont. Ergänzend wurde eine kleine Menge an Koordinationsindikatoren eingeführt, um synchronisierte Verschiebungen über mehrere B205-Sensoren hinweg zu erkennen. Das ist hilfreich zur Erfassung campusweiter Ereignisse, bei denen viele Subsysteme gemeinsam reagieren.
Insgesamt hält dieser gebäudeübergreifende Feature-Block die Pipeline deploybar: Er setzt keine externe Sensorverfügbarkeit voraus und berücksichtigt dennoch externe Einflüsse, indem er deren Signaturen innerhalb von B205 lernt. Das Ergebnis ist ein Modell, dass das Ziel auf Basis übergeordneter Standortdynamiken vorhersagt, anstatt B205 als isoliertes System zu behandeln.
Nachweis für Gebäudeübergreifende Kopplung (Heatmaps)
Diese Heatmap quantifiziert die gebäudeübergreifende Ausrichtung zwischen B106-Wetterstationskanälen (Zeilen: B106WS01.AM50 … B106WS01.AM57, einschließlich B106WS01.AM54_2) und drei zentralen B205-Kreis-/Zielsensoren (Spalten: B205WC000.AM02, B205HW001, B205WC001.AM71). Jede Zelle zeigt das R² (quadrierte Korrelation) über den analysierten Zeitraum; höhere Werte deuten somit auf eine stärkere lineare Mitbewegung hin.
Mehrere Wetterkanäle weisen eine klare Kopplung mit dem Verhalten von B205 auf. Beispielsweise ist B106WS01.AM53 ein Wetterstationssignal aus Gebäude B106 und repräsentiert hier die relative Luftfeuchte der Außenluft, gemessen an der Campus-Wetterstation. Dieses Signal erreicht ein R² von 0,89 mit dem Ziel B205WC000.AM02, was bedeutet, dass ein großer Anteil der Varianz des Zielsignals mit der Variabilität dieses Wettersignals übereinstimmt. Konzeptuell „steuert“ das Wetter die Anlage nicht direkt; vielmehr wirkt es als Randbedingung, die die thermische Last moduliert, welche das HVAC-System bewältigen muss.
Diese Heatmap ist besonders aufschlussreich: Mehrere B201 → B205-Paare zeigen eine sehr starke Ausrichtung, mit hohen R²-Werten (quadrierte Korrelation) über zahlreiche Zellen hinweg. Die dargestellten B201-Signale (B201AH132.AM04, B201AH164.AM13 und B201AH602.AM46) gehören zum Lüftungssubsystem (AH) in Gebäude B201. Die B205-Signale ( B205HW001, B205HWM002.AM71, B205HWM110, B205HWM110.AM04, B205WC000.AM71 und B205WC001.AM71) umfassen Messungen aus dem Heißwasserkreislauf (HW) und dem Kaltwasserkreislauf (WC) und spiegeln damit den Betriebszustand des B205-Technikraums wider.
Zellen mit hoher R² Korrelation kennzeichnen Signalpaare, die sich stabil und wiederholbar gemeinsam verändern. So weist B201AH132.AM04 eine starke Ausrichtung mit B205HWM002.AM71 (R² = 0,964) sowie mit kältewassernahen Signalen wie B205WC001.AM71 (R² = 0,920) und B205WC000.AM71 (R² = 0,850) auf. Vereinfacht gesagt verhalten sich Teile von B201 und B205 wie gekoppelte Subsysteme: Ändert sich das Lüftungssystem in B201, verschieben sich entsprechende Kreisgrößen in B205 häufig in vorhersehbarer Weise. In einer gemeinsamen HVAC-Umgebung ist dies zu erwarten. Koordinierte Zeitpläne, gemeinsamer Anlagenbetrieb und thermische Trägheit erzeugen konsistente gebäudeübergreifende Muster. Wie bei der Wetteranalyse dienen diese Zusammenhänge als diagnostischer Hinweis auf Kopplung und als Motivation für Proxy-Features, nicht als Behauptung direkter Kausalität.
Korrelationsberechnung (Vorgehensweise):
- Zeitliche Ausrichtung der Daten:
Für jedes Sensorpaar (Quelle ↔ Ziel) wurden beide Zeitreihen auf identische Zeitstempel ausgerichtet (gleiches Abtastraster). Falls die Zeitstempel nicht exakt übereinstimmten, wurden die Daten auf einen gemeinsamen Zeitindex resampelt bzw. zusammengeführt und anschließend punktweise abgeglichen. - Verwendung nur überlappender Werte:
Es wurden ausschließlich Zeitpunkte berücksichtigt, an denen beide Sensoren gültige Messwerte aufwiesen; fehlende Werte wurden für das jeweilige Paar ausgeschlossen. - Berechnung der Korrelationsstärke:
Anschließend wurde die Pearson-Korrelation zwischen den beiden ausgerichteten Signalen berechnet. Diese misst, wie konsistent sich zwei Signale linear gemeinsam verändern. - Umrechnung in einen „R²-Korrelationswert“:
Der Korrelationskoeffizient wurde quadriert, sodass ein Wert zwischen 0 und 1 entsteht:
Durch das Quadrieren wird ausschließlich die Stärke der Beziehung betrachtet, nicht deren Richtung. Eine stark negativ korrelierte Beziehung erscheint somit ebenso stark wie eine positiv korrelierte — betrachtet wird also der Betrag des Zusammenhangs. - 0 = keine kausale Beziehung
- 1 = extrem kausale Beziehung
Wie gebäudeübergreifende Einflüsse in B205-exklusive Features überführt wurden
Messungen aus B106 und B201 werden im Test-/Evaluationsdatensatz nicht als Eingangsfeatures bereitgestellt. Folglich kann das finale Modell bei der Inferenz weder Wetterstationssignale aus B106 noch Subsystemsignale aus B201 verwenden, auch wenn deren physikalischer Einfluss auf das Campus-HVAC-Verhalten weiterhin vorhanden sein kann. Die Lösung besteht daher darin, diese gebäudeübergreifenden Effekte in stabile, ausschließlich in B205 verfügbare Signale zu übersetzen: Es werden Proxy-Features aus B205-Sensoren konstruiert, die dieselben zugrunde liegenden Betriebszustände widerspiegeln (wettergetriebene Laständerungen und campusweite Betriebsmodi).
Dies erfolgt über folgende B205-only Feature-Blöcke:
- Lag-Features (zeitkausal): B205-Signale wurden verschoben und verzögert (z. B. 1–6 Stunden je nach Subsystemdynamik), um die verzögerte thermische Ausbreitung abzubilden.
- Rolling-Statistiken: Gleitende Mittelwerte/Varianzen/Quantile erfassen Lastintensität und Regimestabilität (nützlich für wetter- und nachbargebäudegetriebene Nachfrageänderungen).
- Änderungsraten und Deltas: Steigungen und kurzfristige Differenzen erfassen schnelle Transienten und Regelaktionen, die häufig auf externe Störungen folgen.
- Interaktionsfeatures: Kombinationen wie (Temperatur × Durchfluss) oder Differenzen zwischen verwandten Temperatursensoren bilden physikalisch sinnvolle Effekte ab (Mischung, Wärmeübertragung, Regelantwort).
- Regime-/Kontextindikatoren: Merkmale, die den „Betriebsmodus“ (hohe/niedrige Last, stabil/dynamisch) zusammenfassen, unterstützen die Generalisierung über Jahreszeiten hinweg ohne externe Gebäudesignale zu benötigen.
Zusammen ermöglichen diese technischen Merkmale, dass sich der endgültige Prädiktor so verhält, als würde er über das Wetter und die Kopplung benachbarter Gebäude Bescheid wissen. Während der Auswertung werden dafür keine externen Sensoren benötigt. Die relevanten Informationen sind bereits in den B205-Messungen enthalten.
Warum Feature Engineering notwendig war (nicht optional)
Diese beiden Visualisierungen (Heatmaps) begründen gemeinsam die zentrale Trainingsentscheidung: B205 darf nicht als isolierte Zeitreihe behandelt werden. Stattdessen muss es als beobachtbare Oberfläche eines gekoppelten Systems verstanden werden.Während des Trainings werden externe Einflussgrößen (z. B. Wetter) und Interaktionen mit Nachbargebäuden (B201) daher indirekt über Proxy-Features kodiert, die ausschließlich aus B205-Signalen abgeleitet sind. Dazu zählen unter anderem Lags, gleitende Statistiken, Regime-Indikatoren und Interaktionsterme, die widerspiegeln, wie das Campus-HVAC-System zeitlich reagiert.
Dieser Ansatz macht das finale Modell im Testzeitraum robuster, weil es nicht mehr von „fehlenden Gebäuden“ abhängt, sondern von B205-Messungen, die die Fingerabdrücke dieser externen Einflüsse bereits enthalten. Kurz gesagt liefern die Heatmaps den Nachweis, dass die gebäudeübergreifende Kopplung real, strukturiert und stark genug ist, um modelliert zu werden. Damit wird proxybasiertes Feature Engineering zu einer prinzipiellen Designentscheidung und nicht zu einem Workaround.
Warum XGBoost gut zu dieser HVAC-Modellierungsaufgabe passt
XGBoost ist ein Gradient-Boosting-Verfahren auf Basis von Entscheidungsbäumen, bei dem ein Ensemble vieler kleiner Bäume sequenziell aufgebaut wird; jeder Baum korrigiert die Fehler der vorherigen. Das passt sehr gut zur Modellierung von HVAC-Sensordaten, da die zugrunde liegenden Zusammenhänge häufig nichtlinear und regelbasiert sind (Regellogik, Schwellenwerte, Schaltverhalten, Regimewechsel). XGBoost kann solche Muster natürlich abbilden, ohne dass eine komplex strukturierte neuronale Architektur erforderlich ist.
Durch das Feature Engineering wird die Aufgabe faktisch zu einem tabellarischen Lernproblem: Zeitreihen werden in verzögerte Werte, gleitende Statistiken und Interaktionsfeatures überführt unter einer strikten 3-Stunden-Kausalitätsbedingung. In diesem Setting ist XGBoost oft dateneffizienter und stabiler als neuronale Netze, trainiert schnell auf der CPU und bleibt robust gegenüber typischen Praxisproblemen wie fehlenden Werten, rauschenden Sensoren und heterogenen Feature-Skalen. Zudem unterstützt XGBoost eine praxisnahe Interpretierbarkeit: Feature-Wichtigkeiten und Fehleranalysen helfen zu überprüfen, ob das Modell von physikalisch sinnvollen Signalen statt von zufälligen Korrelationen getrieben wird. Dies ist ein entscheidender Vorteil bei Hunderten von Sensoren und abgeleiteten Merkmalen.
Training: Aufbau einer verlässlichen Grundlage für die HVAC-Modellierung
Eine präzise HVAC-Modellierung beginnt lange vor dem eigentlichen Modelltraining. Die zentrale Herausforderung in dieser Competition war nicht ein Mangel an Daten, sondern die Größenordnung, Heterogenität und zeitliche Abhängigkeit der Sensordatenströme. Der Trainingsdatensatz wurde durch die Integration mehrerer Datenquellen aus 2024 sowie aus dem Zeitraum Januar bis Mai 2025 aufgebaut und bildet damit einen zusammenhängenden, saisonal vielfältigen Zeitraum ab. Der Datensatz umfasst Heiz- und Kühlbetrieb, Übergangsphasen und unterschiedliche Lastzustände, was entscheidend ist, um robuste Muster zu lernen, statt auf ein kurzes Betriebsfenster oder eine bestimmte Jahreszeit zu überfitten.
Die Integration konzentrierte sich auf Gebäude B205, in dem der Zielsensor liegt. Aus mehreren hundert Signalen wurden 28 Kernsensoren über drei Subsysteme ausgewählt, Wärmepumpen, Heißwasserkreisläufe und Kaltwassersysteme, um die dominanten physikalischen Einflussfaktoren des Kühlbedarfs abzudecken. Um informative, aber intermittierende Sensoren nicht zu verlieren, wurde ein weniger strenger Abdeckungs-Schwellenwert gewählt und durch konsequenteres Data-Quality-Handling abgesichert.
Alle Signale wurden auf ein gemeinsames 10-Minuten-Raster resampelt, wobei fehlende Werte als normaler Bestandteil operativer Telemetrie behandelt wurden. Kurze Lücken wurden interpoliert, Randbereiche infolge von Resampling und Feature-Shifts mittels Vorwärts- bzw. Rückwärtsfüllung geschlossen; verbleibende fehlende Werte wurden mit den Medianen des jeweiligen Features ergänzt, die strikt ausschließlich auf Basis des Trainingszeitraums berechnet wurden. So wird Kontinuität gewährleistet, ohne Leakage zu erzeugen.
Das Feature Engineering erzeugte gezielt Features zur Abbildung des zeitlichen Verhaltens des HVAC-Systems. Aus den Basissensoren wurde ein umfangreicher Satz zeitbewusster Merkmale abgeleitet, darunter Lags, gleitende Statistiken über mehrere Zeithorizonte sowie Änderungsmerkmale (Differenzen und prozentuale Änderungen), um Ausbreitungsverzögerungen, Betriebszustände und Regelaktionen zu erfassen. Gebäudeübergreifende Einflüsse wurden über B205-only Proxy-Features kodiert: Obwohl Wetterdaten aus B106 und Signale aus B201 im Testzeitraum nicht verfügbar sind, können sich deren Effekte über gemeinsame Infrastruktur und Randbedingungen in B205 widerspiegeln. Proxys mit unterschiedlichen Lag-Strukturen erfassten dabei sowohl schnelle, wettergetriebene Reaktionen als auch langsamere Kopplungseffekte.
Zur Sicherstellung der Deployability (operativen Einsetzbarkeit) war die gesamte Pipeline strikt zeitkausal: Alle engineered Features wurden um drei Stunden verzögert, und sämtliche Normalisierungs-, Clipping- und Scaling-Statistiken wurden ausschließlich auf den Trainingsdaten berechnet und anschließend unverändert auf Validierung und Test angewendet. Dadurch entstand ein hochdimensionaler Feature-Raum, aus dem prädiktive Merkmale mithilfe der Mutual Information ausgewählt wurden; Zeit- und Kontextfeatures wurden dabei gezielt beibehalten. Zusätzlich wurde Subsystem-Diversität erzwungen, um eine Überabhängigkeit von einzelnen Kreisen zu vermeiden. Abschließend stellten Integritätschecks sicher, dass Ausfälle und Signalaussetzer, festgefrorene Signalwerte (stuck values), eine sinnvolle Feature-Aktivierung sowie die Konsistenz zur Testverfügbarkeit berücksichtigt wurden. Damit bleibt der Datensatz der realen Systemkomplexität treu und ist zugleich konsistent, kausal und für operative Vorhersagen geeignet.
Validierung und Ergebnisse
Da die echten Test-Labels des Organisators lokal nicht verfügbar waren, wurde die Modellqualität auf zwei sich ergänzende Arten bewertet: (1) durch eine sorgfältige interne Validierung auf zurückgehaltenen Zeiträumen des historischen Datensatzes und (2) über den offiziellen Kaggle-Leaderboard-Score auf dem verdeckten Test-Split. Diese Kombination ermöglicht sowohl Interpretierbarkeit, warum sich das Modell so verhält, wie es sich verhält, sowie einen externen Realitätscheck, wie gut es auf bislang ungesehene Evaluationsdaten generalisiert.
Interne Validierung: hochpräzises Tracking in winterlichen und sommerlichen Betriebsregimen
Interne Validierung: hochpräzises Tracking in winterlichen und sommerlichen Betriebszuständen
Um die Validierung für ein HVAC-Fachpublikum nachvollziehbar zu machen, wird die Modellleistung anhand repräsentativer 48-Stunden-Fenster aus zwei deutlich unterschiedlichen saisonalen Abschnitten visualisiert: einer winterlichen und einer sommerlichen Periode. In jedem Fenster wird die gemessene Kaltwasserrücklauftemperatur (Ziel) der Modellvorhersage in Wettbewerbsauflösung gegenübergestellt (10-Minuten-Abtastung, d. h. sechs Messpunkte pro Stunde). Die Darstellung eines kompakten Zeitfensters anstelle des gesamten Jahres vermeidet unübersichtliche „Spaghetti-Plots“ und hebt das betrieblich Relevante hervor: Verfolgt das Modell die realen Dynamiken sauber, ohne Drift und ohne systematischen Bias?
Winterliches Betriebsregime (Januar)
Das Winterfenster zeigt ein stabiles, hochauflösendes Tracking: Die vorhergesagte Kurve liegt über längere Zeiträume sehr nahe am gemessenen Zielwert und folgt zugleich kurzfristigen Änderungen der Betriebsbedingungen. Dies ist besonders relevant, da der Winterbetrieb häufig aus stabilen Regimen besteht, die durch diskrete Regelaktionen unterbrochen werden; das Modell bildet diese Übergänge ab, ohne künstliche Oszillationen einzuführen. Die im Plot angegebenen Zusammenfassungsstatistiken stützen diese Interpretation (RMSE = 0,103 °C, niedriger MAE und nahezu kein Bias) und zeigen, dass das Modell das Zielsignal nicht systematisch über- oder unterschätzt.
Gleichzeitig ist es wichtig, sehr kleine Residuen im Kontext der Messunsicherheit zu interpretieren. Der Datensatz spezifiziert weder den genauen Sensortyp noch die vollständige Messkette für B205WC000.AM02. Zudem ist davon auszugehen, dass in HVAC-Wasserkreisläufen in der Regel keine teuren Hochleistungs-Temperaturfühler verbaut werden. Die reale Messgenauigkeit (Sensor, Messumformer, Einbau und Kalibrierung) liegt daher plausibel eher oberhalb als unterhalb von 0,1 °C. Ein RMSE in der Größenordnung von 0,1 °C liegt möglicherweise nahe der effektiven Messrauschgrenze des Zielsignals, sodass ein Teil des verbleibenden Fehlers auf Messunsicherheit zurückzuführen sein könnte, statt auf Modellgrenzen.
Sommerliches Betriebsregime (August)
Ein zweites Zeitfenster aus dem Spätsommer zeigt, dass dasselbe feature-engineerte Modell auch unter kühlungsdominierten Betriebsbedingungen zuverlässig bleibt. Das Sommerverhalten ist typischerweise durch stärkere externe Anregung (Wetter und Belegungspläne) sowie häufigere Laständerungen geprägt. In diesem Fenster folgt die Vorhersage dem gemessenen Zielsignal weiterhin sehr eng. Sie erfasst sowohl graduelle Rampen als auch kurze Störungen, was für eine 3-Stunden-Vorausprognose im operativen Betrieb erforderlich ist.Die Zusammenfassungsbox weist einen geringen Bias und einen RMSE von 0,238 °C aus, was darauf hindeutet, dass die Leistung nicht durch einen systematischen Offset zustande kommt, sondern durch ein echtes Nachzeichnen der zugrunde liegenden thermischen Dynamik. Wie im Winter sollten auch hier kleine Residuen im Kontext der Messunsicherheit interpretiert werden; die insgesamt gute Übereinstimmung zeigt jedoch, dass die gelernten Zusammenhänge über ein einzelnes Betriebsregime hinaus generalisieren.
Zusammen vermitteln diese beiden Zeitfenster die zentrale Validierungsbotschaft auf intuitive Weise: Das Modell verhält sich konsistent über unterschiedliche saisonale Regime hinweg, anstatt auf einen engen Satz von Betriebsbedingungen zugeschnitten zu sein.
Warum Juni-Juli anders behandelt wurden
Die Evaluation des Wettberwerbs konzentrierte sich auf die Bedingungen in Juni und Juli 2025 im verdeckten Testzeitraum des Organisators. Aus diesem Grund wurde Juni-Juli 2024 gezielt als wertvolles Trainingsmaterial genutzt und nicht als primärer Validierungsblock, um sicherzustellen, dass das Modell das kühlungsdominierte Betriebsverhalten bereits während des Lernens sieht. Die internen Validierungsfenster wurden daher aus anderen Monaten gewählt (Winter- sowie Spätsommer-Proxys), um eine saubere interne Überprüfung zu erhalten und das Modell gleichzeitig auf das für die finale Bewertung wichtigste Regime vorzubereiten.
Externe Validierung: robuste Kaggle-Testleistung
Die abschließende Bestätigung liefert das offizielle Kaggle-Scoring auf dem verdeckten Test-Split. Auf den Wettbewerbstestdaten wurde ein MSE von 0,309 auf 51 % der Samples und 0,320 auf den verbleibenden 49 % erreicht mit nur geringer Streuung zwischen beiden Teilen der Evaluation. Diese Konsistenz ist ein starkes Robustheitssignal: Die Leistung hängt weder von einem einzelnen Teilset noch von einem engen Betriebsregime ab, und es gibt keine deutliche Verschlechterung zwischen den Splits. In der Praxis deuten derart nahe beieinanderliegende Scores darauf hin, dass mittels Feature Engineering und der gewählten Lernstrategie ein gut generalisiertes Modell für das Gebäude trainiert werden konnte, das auch unter unbekannten Bedingungen zuverlässig arbeitet. Dieses Ergebnis entspricht den Anforderungen an eine robuste operative HVAC-Vorhersage.
Ausblick: von der Prognose zur Regelung
Der nächste Schritt nach der Prognose besteht darin, die 3-Stunden-Vorhersage zu nutzen, um dasHVAC-System proaktiver zu betreiben. Anstatt erst zu reagieren, wenn sich die Last bereits geändert hat, kann die Prognose als Frühwarnsignal dienen: Ein steigender Bedarf kann durch sanftere Sollwertanpassungen, Pumpensteuerung oder Kühlerstufung antizipiert werden, während ein sinkender Bedarf es dem System ermöglicht, unnötige Überkühlung und ineffiziente Zyklen zu vermeiden. Eine praktische Einführung würde im Schattenmodus beginnen, in dem das Modell Steuerungsempfehlungen generiert, ohne die Anlage aktiv zu beeinflussen, sodass ein direkter Vergleich mit bestehenden regelbasierten Strategien vor einer schrittweisen Einführung möglich ist.
Fazit
Dieses Projekt zeigt, dass die Kombination aus Domänenwissen und sorgfältig konstruierten, zeitkausalen Machine-Learning-Modellen eine zuverlässige und physikalisch plausible HVAC-Prognose ermöglicht. Dies gilt selbst unter realen Datenrestriktionen. Darüber hinaus verdeutlicht es, wie datengetriebene Ansätze eine robuste Brücke von Monitoring und Vorhersage hin zu intelligenter, energieeffizienter Gebäudebetriebsführung schlagen können.
Gerne unterstützen und beraten wir bei ähnlichen KI-basierten Modellierungs- und Optimierungsprojekten für Energiesysteme und den Gebäudebetrieb – Kontaktieren Sie uns hierfür am besten über unser Kontaktformular.