Modul 63123 Data Engineering für Data Science

Modulinformationen

- Methoden und Algorithmen im Kontext der Verarbeitung von großen Datenmengen
   (Big Data)
- Voraussetzungen und Herausforderungen von Data Wrangling und Data Quality
- Data Wrangling und Datenanalysen mit Python und SQL
- Verteilte und parallele Big-Data-Infrastrukturen (Hadoop, Spark etc.)
- Big-Data-Referenzarchitekturen
- Verteilte nicht-relationale Datenbanksysteme (NoSQL-Datenbanksysteme)

ECTS10
Arbeitsaufwand
Bearbeiten der Lektionen: 160 Stunden
Bearbeitung der Einsendeaufgaben inkl. Verarbeitung des Korrektur-Feedbacks:
80 Stunden
Wiederholung und Prüfungsvorbereitung, Prüfung: 60 Stunden
Dauer des Modulsein Semester
Häufigkeit des Modulsin jedem Semester
Anmerkung
Der Basistext muss vor Semesterbeginn beschafft werden. Basistext: Susan E. McGregor: Practical Python Data Wrangling and Data Quality, O'Reilly Media, Inc., 2021 ISBN: 9781492091509
Inhaltliche Voraussetzung
Grundkenntnisse Datenbanksysteme und Programmierung,


 


Hardware (mindestens):


- 16 GB RAM


- CPU mit 8 Cores


- 4 GB freier Festplattenspeicher


 


 

Aktuelles Angebot

Prüfungsinformation

M.Sc. Praktische Informatik
Art der Prüfungsleistungbenotete zweistündige Prüfungsklausur
VoraussetzungVon den Einsendeaufgaben zu den Lektionen 2-5 müssen mindestens die Einsendeaufgaben zu einer Lektion bestanden sein.
Stellenwert der Note1/8
Formale Voraussetzungenkeine
M.Sc. Data Science
Art der Prüfungsleistungbenotete zweistündige Prüfungsklausur
VoraussetzungVon den Einsendeaufgaben zu den Lektionen 2-5 müssen mindestens die Einsendeaufgaben zu einer Lektion bestanden sein.
Stellenwert der Note1/12
Formale Voraussetzungenkeine
M.Sc. Informatik
Art der Prüfungsleistungbenotete zweistündige Prüfungsklausur
VoraussetzungVon den Einsendeaufgaben zu den Lektionen 2-5 müssen mindestens die Einsendeaufgaben zu einer Lektion bestanden sein.
Stellenwert der Note1/12
Formale Voraussetzungenkeine

Download

Ansprechpersonen

mathinf.webteam | 14.02.2024