In dieser Arbeit wird die Prognoseg¨ute der Machine Learning Modelle von Kassandra
analysiert und optimiert. Im Fokus stand dabei das Gebiet Corviglia, auf welchem die Modelle
signifikante Schw¨achen zeigten, was eine zuverl¨assige Ressourcenplanung erschwerte.
Durch explorative Datenanalysen und gezielte Modelloptimierung wurden Schwachstellen
des Modells und des Workflows identifiziert und adressiert. Dadurch konnte eine deutliche
Reduktion des mittleren absoluten Fehlers (MAE) und eine Verbesserung des Determinationskoeffizienten
(R2) erreicht werden. Die Arbeit zeigt auf, in welchen Bereichen
Optimierungspotential besteht und wie gross dieses ausf¨allt. Abschliessend werden Handlungsempfehlungen
zur Weiterf¨uhrung dieser Arbeit gegeben.
In this thesis, the predictive performance of Kassandra’s machine learning models is analyzed
as well as optimized. The focus was on the Corviglia region where the models
performed significantly worse, making reliable resource planning difficult. Through exploratory
data analysis and model optimization, weaknesses in the model and workflow were
identified and addressed. This resulted in a significant reduction of the mean absolute
error (MAE) and an improvement in the coefficient of determination (R2). The thesis
highlights the areas with optimization potential and quantifies their impact. Finally, recommendations
are provided for the continuation of this work.
In dieser Arbeit wird die Prognoseg¨ute der Machine Learning Modelle von Kassandra
analysiert und optimiert. Im Fokus stand dabei das Gebiet Corviglia, auf welchem die Modelle
signifikante Schw¨achen zeigten, was eine zuverl¨assige Ressourcenplanung erschwerte.
Durch explorative Datenanalysen und gezielte Modelloptimierung wurden Schwachstellen
des Modells und des Workflows identifiziert und adressiert. Dadurch konnte eine deutliche
Reduktion des mittleren absoluten Fehlers (MAE) und eine Verbesserung des Determinationskoeffizienten
(R2) erreicht werden. Die Arbeit zeigt auf, in welchen Bereichen
Optimierungspotential besteht und wie gross dieses ausf¨allt. Abschliessend werden Handlungsempfehlungen
zur Weiterf¨uhrung dieser Arbeit gegeben.
In this thesis, the predictive performance of Kassandra’s machine learning models is analyzed
as well as optimized. The focus was on the Corviglia region where the models
performed significantly worse, making reliable resource planning difficult. Through exploratory
data analysis and model optimization, weaknesses in the model and workflow were
identified and addressed. This resulted in a significant reduction of the mean absolute
error (MAE) and an improvement in the coefficient of determination (R2). The thesis
highlights the areas with optimization potential and quantifies their impact. Finally, recommendations
are provided for the continuation of this work.