Dynamik und Betrieb technischer Anlagen

Data Science in Engineering

Die Lehrveranstaltung Data Science in Engineering gibt einen Überblick über moderne Methoden der Data Science mit einem Fokus auf die verfahrenstechnische Anwendung. Behandelt werden die Grundlagen zur Datenvorbehandlung wie Multikollinearität, Lineare Abhängigkeiten, Imputation fehlender Werte, Anomaliedetektion, Umgang mit Ausreißern, Methoden zur Feature-Selektion und Extraktion zum Beispiel unter Nutzung von Stepwise Variable Selection, Lasso, L1/L2-Regularisierung und PCA. Basierend darauf werden überwachte Methoden des maschinellen Lernens eingeführt, um Regressionsprobleme zu lösen. Neben linearen Methoden (Lineare Regression, Lasso, Robuste Regression) werden auch nichtlineare Methoden wie Support Vector Regression, Gaußprozess Regression und künstliche neuronale Netze eingeführt. Weiterhin werden zur dynamischen datengetriebenen Modellierung rekurrente neuronale Netze behandelt.

Die Methoden werden anhand von Beispielen aus dem Chemieingenieurwesen bzw. der Verfahrenstechnik erläutert und die Beispiele den Studierenden zur Verfügung gestellt. Zur Anwendung kommen Softwareframeworks in Python.

Die Prüfung erfolgt in Form einer Semesteraufgabe mit anschließender mündlicher Rücksprache. Inhalt der Semesteraufgabe ist die Anwendung der erlernten Methoden auf einen realen Datensatz aus der Verfahrenstechnik.

Ansprechpartner

Christian Hoffmann

c.hoffmann@tu-berlin.de

Gebäude KWT-A
Raum KWT-A 110