Prüfung des Zertifikatskurses Data Science und Business Analytics 

  • Methodische und technische Ansätze von Business Intelligence
  • Strategische und organisatorische Aspekte z. B. Self Service BI
  • Extraktion, Integration und Analyse von verteilten Daten
  • Fallstudien zu Business Intelligence und Analytics

  • Grundlagen von Big Data und Datenbanken
  • Datenmodellierung und Datenbankabfrage SQL
  • Einführung in NoSQL-Datenbanken wie MongoDB
  • Big-Data-Anwendungen und -Szenarien

  • Die Herausforderung bei der Zusammenstellung und Verknüfnung von Unternehmensdaten mit Hilfe des ETL-Prozesses liegt vor allem darin, deren Qualität herzustellen und aufrechtzuerhalten. Es gilt den tückischen Weg von Daten in einem BI-Stack zu erfahren und ihn programmiertechnisch zu meistern.
  • Anhand von überschaubaren Übungen – entlehnt aus typischen Anwendungsfällen des Big Data, Social Media und IoT (Internet of Things) – wird etappenweise ein BI-Stack erschlossen und die Programmierung eingeübt. Verwendung findet dabei der BI-Stack von Pentaho.

  • Definition, Aufgaben und Methoden des Data Mining
  • Grundlagen einer professionellen Data Mining-Software
  • Fallstudien zu Undirected und Directed Data Mining

  • Einführung in Python
  • Import und Export von Daten mit Pandas, Datenstrukturen in Pandas
  • Datenvorverarbeitung und Datenanalyse mit Pandas
  • Visualisierung von Daten mit Python und Matplotlib
  • Regressionsanalysen mit scikit-learn

  • Grundlagen des Machine Learning
  • Praktischer Einsatz ausgewählter Machine Learning-Algorithmen
  • Evaluierung von Systemen

  • Überblick zu Deep Learning, Gründe für den Boom
  • Funktionsweise Technischer Neuronaler Netze und Lernalgorithmen
  • Verkaufspreise mit einem Multi-Layer-Perceptron (MLP) vorhersagen
  • Realisierung der Modelle mittels TensorFlow und Keras