Data Science
KIM-DS
P221-0051
kim2
3
V
1
U
6
0
nein
Deutsch
Übungen
Klausur
DFI-DS
Informatik
0
Pflichtfach
KIM-DS
Kommunikationsinformatik
0
Wahlpflichtfach
PIM-DS
Praktische Informatik
0
Pflichtfach
Die Präsenzzeit dieses Moduls umfasst bei 15 Semesterwochen 60 Veranstaltungsstunden (= 45 Zeitstunden). Der Gesamtumfang des Moduls beträgt bei 6 Creditpoints 180 Stunden (30 Stunden/ECTS Punkt). Daher stehen für die Vor- und Nachbereitung der Veranstaltung zusammen mit der Prüfungsvorbereitung 135 Stunden zur Verfügung.
Prof. Dr. Klaus Berberich
kbe
Prof. Dr. Klaus Berberich
kbe
Studierende sind nach erfolgreichem Absolvieren dieses Moduls in der Lage, geeignete Verfahren der Datenanalyse einzusetzen, um Erkenntnisse zur Entscheidungsfindung bei praktischen Fragestellungen zu gewinnen. Die Studierenden erlangen Kenntnisse über wichtige Verfahren der Datenanalyse. Die Studierenden kennen verschiedene Merkmalsarten (z.B. nominal, ordinal, metrisch) und können gegebene Daten geeignet vorverarbeiten (z.B. durch Normalisierung oder Standardisierung). Für eine gegebene Fragestellung erkennen sie, welche Art von Verfahren (z.B. Regression oder Klassifikation) zur Entscheidungsfindung geeignet ist. Die Studierenden können die erlernten Verfahren in einer geeigneten Programmiersprache (z.B. Python oder R) implementieren oder eine zur Verfügung stehende Implementierung sinnvoll einsetzen. Parameter der eingesetzten Verfahren können die Studierenden systematisch anhand zur Verfügung stehender Daten festlegen und die Güte der erlangten Resultate kritisch beurteilen. Ihre aus den Daten gewonnen Erkenntnisse können die Studierenden geeignet aufbereiten (z.B. in Form einer Visualisierung), um sie einem technischen oder nicht-technischen Publikum (z.B. Entscheidungsträger im Unternehmen) verständlich zu machen.
1. Einführung
2. Regression
2.1 Lineare Regression
2.2 Merkmalstransformation
2.3 Regularisierung
3. Klassifikation
3.1 Logistische Regression
3.2 Entscheidungsbäume
3.3 Naive Bayes
3.4 Support Vector Machines
4. Clusteranalyse
4.1 Repräsentantenverfahren (k-Means und k-Medoids)
4.2 Hierarchische Verfahren
4.3 Dichtebasierte Verfahren
5. Neuronale Netze
5.1 Perzeptron
5.2 Mehrschichtige Neuronale Netze (MLPs)
5.3 Faltende Neuronale Netze (CNNs)
5.4 Rekurrente Neuronale Netze (RNNs)
6. Assoziationsanalyse
6.1 Finden häufiger Mengen (Apriori und FP-Growth)
6.2 Bestimmen von Assoziationsregeln
6.3 Finden häufiger Sequenzen (GSP und PrefixSpan)
6.4 Finden häufiger Zeichenketten
6.5 Finden häufiger Teilgraphen
7. Datenvisualisierung
Folien, vorlesungsbegleitende praktische und theoretische Übungen
Aggarwal C.: Data Mining - The Textbook, Springer, 2015
Harrington P.: Machine Learning In Action, Manning, 2012
Kelleher J., Mac Namee B. und D"Arcy A.: Fundamentals of Machine Learning for Predictive Data Analytics, MIT Press, 2015
Provost F. und Fawcett T.: Data Science for Business, O"Reilly, 2013
Raschka S.: Machine Learning mit Python, mitp, 2017
Zaki Mohammed J. und Meira Wagner Jr: Data Mining and Analysis: Fundamental Concepts and Algorithms, Cambridge University Press, 2014
WS 2023/24
WS 2022/23
WS 2021/22
WS 2020/21
WS 2019/20
Fri Mar 29 14:41:20 CET 2024, CKEY=pds, BKEY=kim2, CID=[?], LANGUAGE=de, DATE=29.03.2024