Online-Seminar  /  08. Juni 2020  -  10. Juni 2020

Data Quality and Data Preprocessing

Daten sind der Rohstoff der Zukunft, wobei die Qualität der Daten maßgeblich das Ergebnis einer jeden Analyse beeinflusst. Dies gilt für klassische Data-Mining-Prozesse und neueste KI-Methoden gleichermaßen. Hochwertige Daten bieten Unternehmen einen klaren Mehrwert und Wettbewerbsvorteil. In diesem Seminar lernen Analysten, Entwickler und Datenmanager Verfahren zur Beurteilung und Verbesserung der Datenqualität. Reale Daten enthalten oftmals kleine Fehler, welche negative Auswirkungen auf eine Analyse haben können. Damit Sie das Potenzial Ihrer Daten voll ausschöpfen, vermittelt dieses Seminar umfassend die wesentlichem Grundlagen der modernen Datenvorverarbeitung. Praxisbezogen und interaktiv werden die Schulungsinhalte in kleinen Aufgaben angewandt: anhand eines Datensatzes setzen Sie die erlernte Theorie mit Python praktisch um. Nach dem Besuch dieser Schulung sind Sie in der Lage, die Datenvorverarbeitungen in Ihrem Alltag strukturiert und effizient durchzuführen und Ihre Daten besser zu nutzen.

Zielgruppe

  • Analysten, die ihre Fähigkeiten zur Datenaufbereitung ausweiten wollen.
  • Softwareentwickler/-architekten, die Lösungen für analytische Fragestellungen entwickeln. 
  • Interessierte aus der Forschung, die eine Orientierung im Bereich Data Science suchen.

Voraussetzungen

Grundkenntnisse in Statistik und Datenanalyse werden vorausgesetzt; Basiswissen in Programmierung und im Umgang mit Datenbanken sind von Vorteil.

Maximale Teilnehmerzahl

Zwölf Teilnehmer, die Anmeldungen werden in der Reihenfolge des Eingangs berücksichtigt.

Unsere Referenten

Diese Schulung wird in Kooperation mit dem Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS durchgeführt.

Dipl. Inf. Daniel Trabold arbeitet als wissenschaftlicher Mitarbeiter am Fraunhofer IAIS an der Entwicklung von Verfahren und Grundlagen des Fraud Mining. Er hat langjährige Erfahrung im Data Mining und als Entwickler in angewandten Wirtschafts- und Forschungsprojekten, insbesondere in den Industrien Finance, Automotive und Telekommunikation. Seine aktuellen Arbeitsschwerpunkte sind echtzeitfähige Big-Data-Architekturen und Data-Mining-Algorithmen.

Jonathan Krauß ist Gruppenleiter in der Abteilung für Produktionsqualität am Fraunhofer IPT. In über 20 Projekten hat er gemeinsam mit Industriepartnern Fertigungssysteme mithilfe von Machine Learning und Künstlicher Intelligenz verbessert. Forschungsseitig liegt sein Fokus auf Automated Machine Learning sowie Hyperparameter Tuning.

Maik Frye ist wissenschaftlicher Mitarbeiter in der Abteilung für Produktionsqualität am Fraunhofer IPT. Er hat mehrjährige Erfahrung im Bereich des Machine Learning (ML) und arbeitet in einer Vielzahl von Projekten gemeinsam mit Industrieunternehmen an der Optimierung von Produktionsprozessen mittels ML. Aktuell liegen seine Forschungsanstrengungen vor allem in der Strukturierung und Automatisierung des Data Preprocessing zur Erhöhung der Qualität von Daten.