|
Modulbezeichnung (engl.):
Data Science |
|
Code: PIM-DS |
|
3V+1U (4 Semesterwochenstunden) |
6 |
Studiensemester: 1 |
Pflichtfach: ja |
Arbeitssprache:
Deutsch |
Studienleistungen (lt. Studienordnung/ASPO-Anlage):
Übungen |
Prüfungsart:
Klausur, Dauer 120 min.
[letzte Änderung 29.07.2024]
|
DFI-DS (P610-0280) Informatik, Master, ASPO 01.10.2018
, 1. Semester, Pflichtfach
KIM-DS (P221-0051) Kommunikationsinformatik, Master, ASPO 01.10.2017
, Wahlpflichtfach, informatikspezifisch
PIM-DS (P221-0051) Praktische Informatik, Master, ASPO 01.10.2017
, 1. Semester, Pflichtfach
|
Die Präsenzzeit dieses Moduls umfasst bei 15 Semesterwochen 60 Veranstaltungsstunden (= 45 Zeitstunden). Der Gesamtumfang des Moduls beträgt bei 6 Creditpoints 180 Stunden (30 Std/ECTS). Daher stehen für die Vor- und Nachbereitung der Veranstaltung zusammen mit der Prüfungsvorbereitung 135 Stunden zur Verfügung.
|
Empfohlene Voraussetzungen (Module):
Keine.
|
Als Vorkenntnis empfohlen für Module:
PIM-DL Deep Learning
[letzte Änderung 15.11.2021]
|
Modulverantwortung:
Prof. Dr. Klaus Berberich |
Dozent/innen: Prof. Dr. Klaus Berberich
[letzte Änderung 29.07.2024]
|
Lernziele:
Studierende sind nach erfolgreichem Absolvieren dieses Moduls in der Lage, geeignete Verfahren der Datenanalyse einzusetzen, um Erkenntnisse zur Entscheidungsfindung bei praktischen Fragestellungen zu gewinnen. Die Studierenden erlangen Kenntnisse über wichtige Verfahren der Datenanalyse. Die Studierenden kennen verschiedene Merkmalsarten (z.B. nominal, ordinal, metrisch) und können gegebene Daten geeignet vorverarbeiten (z.B. durch Normalisierung oder Standardisierung). Für eine gegebene Fragestellung erkennen sie, welche Art von Verfahren (z.B. Regression oder Klassifikation) zur Entscheidungsfindung geeignet ist. Die Studierenden können die erlernten Verfahren in einer geeigneten Programmiersprache (z.B. Python) implementieren oder eine zur Verfügung stehende Implementierung sinnvoll einsetzen. Parameter der eingesetzten Verfahren können die Studierenden systematisch anhand zur Verfügung stehender Daten festlegen und die Güte der erlangten Resultate kritisch beurteilen. Ihre aus den Daten gewonnen Erkenntnisse können die Studierenden geeignet aufbereiten (z.B. in Form einer Visualisierung), um sie einem technischen oder nicht-technischen Publikum (z.B. Entscheidungsträger im Unternehmen) verständlich zu machen.
[letzte Änderung 04.07.2024]
|
Inhalt:
1. Einführung 2. Regression 2.1 Lineare Regression 2.2 Merkmalstransformation 2.3 Regularisierung 3. Klassifikation 3.1 Logistische Regression 3.2 Entscheidungsbäume 3.3 Naive Bayes 3.4 Support Vector Machines 4. Clusteranalyse 4.1 Repräsentantenverfahren (k-Means und k-Medoids) 4.2 Hierarchische Verfahren 4.3 Dichtebasierte Verfahren 5. Assoziationsanalyse 5.1 Finden häufiger Mengen (Apriori und FP-Growth) 5.2 Bestimmen von Assoziationsregeln 5.3 Finden häufiger Sequenzen (GSP und PrefixSpan) 5.4 Finden häufiger Zeichenketten 5.5 Finden häufiger Teilgraphen 6. Neuronale Netze 6.1 Perzeptron 6.2 Mehrschichtige Neuronale Netze (MLPs) 6.3 Faltende Neuronale Netze (CNNs) 6.4 Rekurrente Neuronale Netze (RNNs) 7. Datenvisualisierung
[letzte Änderung 04.07.2024]
|
Weitere Lehrmethoden und Medien:
Folien, vorlesungsbegleitende praktische und theoretische Übungen
[letzte Änderung 18.10.2016]
|
Literatur:
Aggarwal C.: Data Mining - The Textbook, Springer, 2015 Harrington P.: Machine Learning In Action, Manning, 2012 Kelleher J., Mac Namee B. und D´Arcy A.: Fundamentals of Machine Learning for Predictive Data Analytics, MIT Press, 2015 Provost F. und Fawcett T.: Data Science for Business, O´Reilly, 2013 Raschka S.: Machine Learning mit Python, mitp, 2017 Zaki Mohammed J. und Meira Wagner Jr: Data Mining and Analysis: Fundamental Concepts and Algorithms, Cambridge University Press, 2020
[letzte Änderung 04.07.2024]
|
Modul angeboten in Semester:
WS 2024/25,
WS 2023/24,
WS 2022/23,
WS 2021/22,
WS 2020/21,
...
|