htw saar Piktogramm QR-encoded URL
Zurück zur Hauptseite Version des Moduls auswählen:
Lernziele hervorheben XML-Code


Data Science

Modulbezeichnung:
Bezeichnung des Moduls innerhalb des Studiengangs. Sie soll eine präzise und verständliche Überschrift des Modulinhalts darstellen.
Data Science
Modulbezeichnung (engl.): Data Science
Studiengang:
Studiengang mit Beginn der Gültigkeit der betreffenden ASPO-Anlage/Studienordnung des Studiengangs, in dem dieses Modul zum Studienprogramm gehört (=Start der ersten Erstsemester-Kohorte, die nach dieser Ordnung studiert).
Praktische Informatik, Master, ASPO 01.10.2017
Code: PIM-DS
SAP-Submodul-Nr.:
Die Prüfungsverwaltung mittels SAP-SLCM vergibt für jede Prüfungsart in einem Modul eine SAP-Submodul-Nr (= P-Nummer). Gleiche Module in unterschiedlichen Studiengängen haben bei gleicher Prüfungsart die gleiche SAP-Submodul-Nr..
P221-0051
SWS/Lehrform:
Die Anzahl der Semesterwochenstunden (SWS) wird als Zusammensetzung von Vorlesungsstunden (V), Übungsstunden (U), Praktikumsstunden (P) oder Projektarbeitsstunden (PA) angegeben. Beispielsweise besteht eine Veranstaltung der Form 2V+2U aus 2 Vorlesungsstunden und 2 Übungsstunden pro Woche.
3V+1U (4 Semesterwochenstunden)
ECTS-Punkte:
Die Anzahl der Punkte nach ECTS (Leistungspunkte, Kreditpunkte), die dem Studierenden bei erfolgreicher Ableistung des Moduls gutgeschrieben werden. Die ECTS-Punkte entscheiden über die Gewichtung des Fachs bei der Berechnung der Durchschnittsnote im Abschlusszeugnis. Jedem ECTS-Punkt entsprechen 30 studentische Arbeitsstunden (Anwesenheit, Vor- und Nachbereitung, Prüfungsvorbereitung, ggfs. Zeit zur Bearbeitung eines Projekts), verteilt über die gesamte Zeit des Semesters (26 Wochen).
6
Studiensemester: 1
Pflichtfach: ja
Arbeitssprache:
Deutsch
Studienleistungen (lt. Studienordnung/ASPO-Anlage):
Übungen
Prüfungsart:
Klausur, Dauer 120 min.

[letzte Änderung 29.07.2024]
Verwendbarkeit / Zuordnung zum Curriculum:
Alle Studienprogramme, die das Modul enthalten mit Jahresangabe der entsprechenden Studienordnung / ASPO-Anlage.

DFI-DS (P610-0280) Informatik, Master, ASPO 01.10.2018 , 1. Semester, Pflichtfach
KIM-DS (P221-0051) Kommunikationsinformatik, Master, ASPO 01.10.2017 , Wahlpflichtfach, informatikspezifisch
PIM-DS (P221-0051) Praktische Informatik, Master, ASPO 01.10.2017 , 1. Semester, Pflichtfach
Arbeitsaufwand:
Der Arbeitsaufwand des Studierenden, der für das erfolgreiche Absolvieren eines Moduls notwendig ist, ergibt sich aus den ECTS-Punkten. Jeder ECTS-Punkt steht in der Regel für 30 Arbeitsstunden. Die Arbeitsstunden umfassen Präsenzzeit (in den Vorlesungswochen), Vor- und Nachbereitung der Vorlesung, ggfs. Abfassung einer Projektarbeit und die Vorbereitung auf die Prüfung.

Die ECTS beziehen sich auf die gesamte formale Semesterdauer (01.04.-30.09. im Sommersemester, 01.10.-31.03. im Wintersemester).
Die Präsenzzeit dieses Moduls umfasst bei 15 Semesterwochen 60 Veranstaltungsstunden (= 45 Zeitstunden). Der Gesamtumfang des Moduls beträgt bei 6 Creditpoints 180 Stunden (30 Std/ECTS). Daher stehen für die Vor- und Nachbereitung der Veranstaltung zusammen mit der Prüfungsvorbereitung 135 Stunden zur Verfügung.
Empfohlene Voraussetzungen (Module):
Keine.
Als Vorkenntnis empfohlen für Module:
PIM-DL Deep Learning


[letzte Änderung 15.11.2021]
Modulverantwortung:
Prof. Dr. Klaus Berberich
Dozent/innen:
Prof. Dr. Klaus Berberich


[letzte Änderung 29.07.2024]
Lernziele:
Studierende sind nach erfolgreichem Absolvieren dieses Moduls in der Lage, geeignete Verfahren der Datenanalyse einzusetzen, um Erkenntnisse zur Entscheidungsfindung bei praktischen Fragestellungen zu gewinnen. Die Studierenden erlangen Kenntnisse über wichtige Verfahren der Datenanalyse. Die Studierenden kennen verschiedene Merkmalsarten (z.B. nominal, ordinal, metrisch) und können gegebene Daten geeignet vorverarbeiten (z.B. durch Normalisierung oder Standardisierung). Für eine gegebene Fragestellung erkennen sie, welche Art von Verfahren (z.B. Regression oder Klassifikation) zur Entscheidungsfindung geeignet ist. Die Studierenden können die erlernten Verfahren in einer geeigneten Programmiersprache (z.B. Python) implementieren oder eine zur Verfügung stehende Implementierung sinnvoll einsetzen. Parameter der eingesetzten Verfahren können die Studierenden systematisch anhand zur Verfügung stehender Daten festlegen und die Güte der erlangten Resultate kritisch beurteilen. Ihre aus den Daten gewonnen Erkenntnisse können die Studierenden geeignet aufbereiten (z.B. in Form einer Visualisierung), um sie einem technischen oder nicht-technischen Publikum (z.B. Entscheidungsträger im Unternehmen) verständlich zu machen.

[letzte Änderung 04.07.2024]
Inhalt:
1. Einführung
 
2. Regression
2.1 Lineare Regression
2.2 Merkmalstransformation
2.3 Regularisierung
 
3. Klassifikation
3.1 Logistische Regression
3.2 Entscheidungsbäume
3.3 Naive Bayes
3.4 Support Vector Machines
 
4. Clusteranalyse
4.1 Repräsentantenverfahren (k-Means und k-Medoids)
4.2 Hierarchische Verfahren
4.3 Dichtebasierte Verfahren
 
5. Assoziationsanalyse
5.1 Finden häufiger Mengen (Apriori und FP-Growth)
5.2 Bestimmen von Assoziationsregeln
5.3 Finden häufiger Sequenzen (GSP und PrefixSpan)
5.4 Finden häufiger Zeichenketten
5.5 Finden häufiger Teilgraphen
 
6. Neuronale Netze
6.1 Perzeptron
6.2 Mehrschichtige Neuronale Netze (MLPs)
6.3 Faltende Neuronale Netze (CNNs)
6.4 Rekurrente Neuronale Netze (RNNs)
 
7. Datenvisualisierung


[letzte Änderung 04.07.2024]
Weitere Lehrmethoden und Medien:
Folien, vorlesungsbegleitende praktische und theoretische Übungen

[letzte Änderung 18.10.2016]
Literatur:
Aggarwal C.: Data Mining - The Textbook, Springer, 2015
 
Harrington P.: Machine Learning In Action, Manning, 2012
 
Kelleher J., Mac Namee B. und D´Arcy A.: Fundamentals of Machine Learning for Predictive Data Analytics, MIT Press, 2015
 
Provost F. und Fawcett T.: Data Science for Business, O´Reilly, 2013
 
Raschka S.: Machine Learning mit Python, mitp, 2017
 
Zaki Mohammed J. und Meira Wagner Jr: Data Mining and Analysis: Fundamental Concepts and Algorithms, Cambridge University Press, 2020

[letzte Änderung 04.07.2024]
Modul angeboten in Semester:
WS 2024/25, WS 2023/24, WS 2022/23, WS 2021/22, WS 2020/21, ...
[Sun Dec 22 10:56:50 CET 2024, CKEY=pds, BKEY=pim2, CID=PIM-DS, LANGUAGE=de, DATE=22.12.2024]