htw saar Piktogramm QR-encoded URL
Zurück zur Hauptseite Version des Moduls auswählen:
Lernziele hervorheben XML-Code


[Lernergebnisse des Moduls anzeigen]

Data Science

Modulbezeichnung:
Bezeichnung des Moduls innerhalb des Studiengangs. Sie soll eine präzise und verständliche Überschrift des Modulinhalts darstellen.
Data Science
Modulbezeichnung (engl.): Data Science
Studiengang:
Studiengang mit Beginn der Gültigkeit der betreffenden ASPO-Anlage/Studienordnung des Studiengangs, in dem dieses Modul zum Studienprogramm gehört (=Start der ersten Erstsemester-Kohorte, die nach dieser Ordnung studiert).
Praktische Informatik, Master, SO 01.10.2026
Code: PIM-DS
SAP-Submodul-Nr.:
Die Prüfungsverwaltung mittels SAP-SLCM vergibt für jede Prüfungsart in einem Modul eine SAP-Submodul-Nr (= P-Nummer). Gleiche Module in unterschiedlichen Studiengängen haben bei gleicher Prüfungsart die gleiche SAP-Submodul-Nr..
P221-0051
SWS/Lehrform:
Die Anzahl der Semesterwochenstunden (SWS) wird als Zusammensetzung von Vorlesungsstunden (V), Übungsstunden (U), Praktikumsstunden (P) oder Projektarbeitsstunden (PA) angegeben. Beispielsweise besteht eine Veranstaltung der Form 2V+2U aus 2 Vorlesungsstunden und 2 Übungsstunden pro Woche.
3V+1U (4 Semesterwochenstunden)
ECTS-Punkte:
Die Anzahl der Punkte nach ECTS (Leistungspunkte, Kreditpunkte), die dem Studierenden bei erfolgreicher Ableistung des Moduls gutgeschrieben werden. Die ECTS-Punkte entscheiden über die Gewichtung des Fachs bei der Berechnung der Durchschnittsnote im Abschlusszeugnis. Jedem ECTS-Punkt entsprechen 30 studentische Arbeitsstunden (Anwesenheit, Vor- und Nachbereitung, Prüfungsvorbereitung, ggfs. Zeit zur Bearbeitung eines Projekts), verteilt über die gesamte Zeit des Semesters (26 Wochen).
6
Studiensemester: 1
Pflichtfach: ja
Arbeitssprache:
Deutsch
Studienleistungen (lt. Studienordnung/ASPO-Anlage):
Übungen
Prüfungsart:
Klausur, Dauer 120 min.

[letzte Änderung 29.07.2024]
Verwendbarkeit / Zuordnung zum Curriculum:
Alle Studienprogramme, die das Modul enthalten mit Jahresangabe der entsprechenden Studienordnung / ASPO-Anlage.

DFI-DS (P610-0280) Informatik, Master, ASPO 01.10.2018 , 1. Semester, Pflichtfach
KIM-DS (P221-0051) Kommunikationsinformatik, Master, ASPO 01.10.2017 , Wahlpflichtfach, informatikspezifisch
PIM-DS (P221-0051) Praktische Informatik, Master, ASPO 01.10.2017 , 1. Semester, Pflichtfach
PIM-DS (P221-0051) Praktische Informatik, Master, SO 01.10.2026 , 1. Semester, Pflichtfach
Arbeitsaufwand:
Der Arbeitsaufwand des Studierenden, der für das erfolgreiche Absolvieren eines Moduls notwendig ist, ergibt sich aus den ECTS-Punkten. Jeder ECTS-Punkt steht in der Regel für 30 Arbeitsstunden. Die Arbeitsstunden umfassen Präsenzzeit (in den Vorlesungswochen), Vor- und Nachbereitung der Vorlesung, ggfs. Abfassung einer Projektarbeit und die Vorbereitung auf die Prüfung.

Die ECTS beziehen sich auf die gesamte formale Semesterdauer (01.04.-30.09. im Sommersemester, 01.10.-31.03. im Wintersemester).
Die Präsenzzeit dieses Moduls umfasst bei 15 Semesterwochen 60 Veranstaltungsstunden (= 45 Zeitstunden). Der Gesamtumfang des Moduls beträgt bei 6 Creditpoints 180 Stunden (30 Std/ECTS). Daher stehen für die Vor- und Nachbereitung der Veranstaltung zusammen mit der Prüfungsvorbereitung 135 Stunden zur Verfügung.
Empfohlene Voraussetzungen (Module):
Keine.
Als Vorkenntnis empfohlen für Module:
Modulverantwortung:
Prof. Dr. Klaus Berberich
Dozent/innen: Prof. Dr. Klaus Berberich

[letzte Änderung 05.10.2016]
Lernziele:
Nach erfolgreichem Absolvieren dieses Moduls können Studierende moderne Verfahren der Datenanalyse und des Maschinellen Lernens beschreiben, erklären, auswählen und anwenden, um aus Daten belastbare Erkenntnisse für praktisch relevante Fragestellungen abzuleiten.
 
Sie erläutern gängige Vorgehensmodelle der Datenanalyse (z. B. CRISP-DM) und können unterschiedliche Merkmalsarten (nominal, ordinal, metrisch) identifizieren, klassifizieren, aufbereiten und für Analyseprozesse nutbar machen.
 
Für eine konkrete Problemstellung sind die Studierenden in der Lage, eine geeignete Modellklasse (z. B. Regressions-, Klassifikations- oder Clusterverfahren) auszuwählen, und mithilfe moderner Werkzeuge (z. B. scikit-learn, PyTorch, Jupyter Notebook) passende Modelle zu entwickeln, zu trainieren, zu validieren und systematisch zu optimieren.
 
Sie analysieren und bewerten die relevanten Gütemaße zur Modellbewertung (z. B. Accuracy, F1, ROC-AUC, RMSE, Silhouette) und können diese fundiert interpretieren. Die gewonnenen Ergebnisse bereiten sie adressatengerecht durch geeignete Visualisierungen, Plots, Dashboards oder Reports auf und kommunizieren sie zielgruppenorientiert.
 
Darüber hinaus reflektieren die Studierenden zentrale Aspekte der ethischen, fairen und verantwortungsvollen Nutzung von Daten und können Modelle auch im Hinblick auf ihre Interpretierbarkeit analysieren, bewerten und einordnen (z. B. mittels SHAP, LIME oder Permutation Feature Importance).

[letzte Änderung 26.11.2025]
Inhalt:
1. Einführung in Data Science
1.1 Was ist Data Science?
1.2 Vorgehensmodelle
    
2. Mathematische Grundlagen
2.1 Multivariate Funktionen
2.2 Lineare Algebra
2.3 Wahrscheinlichkeitsrechnung
2.4 Statistik
 
3. Regression
3.1 Lineare Regression
3.2 Merkmalstransformation
3.3 Regularisierung
3.4 Bewertung von Regressionsmodellen
 
4. Klassifikation
4.1 Logistische Regression
4.2 k-Nächste Nachbarn
4.3 Entscheidungsbäume und Random Forests
4.4 Naive Bayes
4.5 Ensemble Learning (Bagging, Boosting, Gradient Boostin)
4.6 Bewertung von Klassifikationsmodellen
 
5. Clustering und Dimensionsreduktion
5.1 Partitionierungsverfahren (k-Means, k-Medoids)
5.2 Hierarchisches Clustering
5.3 Dichtebasiertes Clustering (DBSCAN, HDBSCAN)
5.4 Bewertung und Interpretation von Clustern (Purity, Silhouette)
5.5 Dimensionsreduktion (PCA, t-SNE, UMAP)
 
6. Muster- und Assoziationsanalyse
6.1 Finden häufiger Mengen (Apriori, FP-Growth)
6.2 Bestimmen von Assoziationsregeln
 
7. Neuronale Netze
7.1 Mehrschichtperzeptron (MLP)
7.2 Convolutional Neural Networks (CNNs)
7.3 Rekurrente und sequentielle Modelle (RNN, LSTM, GRU)
7.4 Moderne Architekturen (Transformer)
 
8. Datenvisualisierung und Kommunikation
8.1 Visualisierungsgrundlagen
8.2 Werkzeuge (matplotlib, seaborn)
8.3 Storytelling mit Daten
8.4 Aufbereitung für verschiedene Zielgruppen

[letzte Änderung 26.11.2025]
Weitere Lehrmethoden und Medien:
Folien, Videos, Jupyter Notebooks sowie vorlesungsbegleitende praktische und theoretische Übungen

[letzte Änderung 26.11.2025]
Literatur:
Aggarwal C.: Data Mining - The Textbook, Springer, 2015
 
Bishop C.: Deep Learning: Foundations and Concepts, Springer, 2023
 
Chollet F.: Deep Learning with Python, Manning, 2025
 
Goodfellow, I., Bengio, Y., Courville, A.: Deep Learning, MIT Press, 2016
 
James G., Witten D, Hastie T., Tibshirani R. und Taylor J.: An Introduction to Statistical Learning: with Applications in Python, Springer, 2023
 
Provost F. und Fawcett T.: Data Science for Business, O´Reilly, 2013
 
Raschka S., Liu Y. und Mirjalili V.: Machine Learning with PyTorch and Scikit-Learn: Develop machine learning and deep learning models with Python, Packt Publishing, 2023
 
Zaki Mohammed J. und Meira Wagner Jr: Data Mining and Analysis: Fundamental Concepts and Algorithms, Cambridge University Press, 2020

[letzte Änderung 26.11.2025]
[Sat Nov 29 18:49:30 CET 2025, CKEY=pds, BKEY=pim3, CID=PIM-DS, LANGUAGE=de, DATE=29.11.2025]