Data Science

Data Science KIM-DS P221-0051 kim2 3 V 1 U 6 0 nein Deutsch Übungen Klausur DFI-DS Informatik 0 Pflichtfach KIM-DS Kommunikationsinformatik 0 Wahlpflichtfach PIM-DS Praktische Informatik 0 Pflichtfach Die Präsenzzeit dieses Moduls umfasst bei 15 Semesterwochen 60 Veranstaltungsstunden (= 45 Zeitstunden). Der Gesamtumfang des Moduls beträgt bei 6 Creditpoints 180 Stunden (30 Stunden/ECTS Punkt). Daher stehen für die Vor- und Nachbereitung der Veranstaltung zusammen mit der Prüfungsvorbereitung 135 Stunden zur Verfügung. Prof. Dr. Klaus Berberich

kbe

Prof. Dr. Klaus Berberich

kbe

Studierende sind nach erfolgreichem Absolvieren dieses Moduls in der Lage, geeignete Verfahren der Datenanalyse einzusetzen, um Erkenntnisse zur Entscheidungsfindung bei praktischen Fragestellungen zu gewinnen. Die Studierenden erlangen Kenntnisse über wichtige Verfahren der Datenanalyse. Die Studierenden kennen verschiedene Merkmalsarten (z.B. nominal, ordinal, metrisch) und können gegebene Daten geeignet vorverarbeiten (z.B. durch Normalisierung oder Standardisierung). Für eine gegebene Fragestellung erkennen sie, welche Art von Verfahren (z.B. Regression oder Klassifikation) zur Entscheidungsfindung geeignet ist. Die Studierenden können die erlernten Verfahren in einer geeigneten Programmiersprache (z.B. Python) implementieren oder eine zur Verfügung stehende Implementierung sinnvoll einsetzen. Parameter der eingesetzten Verfahren können die Studierenden systematisch anhand zur Verfügung stehender Daten festlegen und die Güte der erlangten Resultate kritisch beurteilen. Ihre aus den Daten gewonnen Erkenntnisse können die Studierenden geeignet aufbereiten (z.B. in Form einer Visualisierung), um sie einem technischen oder nicht-technischen Publikum (z.B. Entscheidungsträger im Unternehmen) verständlich zu machen. 1. Einführung 2. Regression 2.1 Lineare Regression 2.2 Merkmalstransformation 2.3 Regularisierung 3. Klassifikation 3.1 Logistische Regression 3.2 Entscheidungsbäume 3.3 Naive Bayes 3.4 Support Vector Machines 4. Clusteranalyse 4.1 Repräsentantenverfahren (k-Means und k-Medoids) 4.2 Hierarchische Verfahren 4.3 Dichtebasierte Verfahren 5. Assoziationsanalyse 5.1 Finden häufiger Mengen (Apriori und FP-Growth) 5.2 Bestimmen von Assoziationsregeln 5.3 Finden häufiger Sequenzen (GSP und PrefixSpan) 5.4 Finden häufiger Zeichenketten 5.5 Finden häufiger Teilgraphen 6. Neuronale Netze 6.1 Perzeptron 6.2 Mehrschichtige Neuronale Netze (MLPs) 6.3 Faltende Neuronale Netze (CNNs) 6.4 Rekurrente Neuronale Netze (RNNs) 7. Datenvisualisierung Folien, vorlesungsbegleitende praktische und theoretische Übungen Aggarwal C.: Data Mining - The Textbook, Springer, 2015 Harrington P.: Machine Learning In Action, Manning, 2012 Kelleher J., Mac Namee B. und D"Arcy A.: Fundamentals of Machine Learning for Predictive Data Analytics, MIT Press, 2015 Provost F. und Fawcett T.: Data Science for Business, O"Reilly, 2013 Raschka S.: Machine Learning mit Python, mitp, 2017 Zaki Mohammed J. und Meira Wagner Jr: Data Mining and Analysis: Fundamental Concepts and Algorithms, Cambridge University Press, 2020 WS 2024 WS 2023/24 WS 2022/23 WS 2021/22 WS 2020/21 WS 2019/20

Tue Jul 16 07:48:31 CEST 2024, CKEY=pds, BKEY=kim2, CID=[?], LANGUAGE=de, DATE=16.07.2024