•  

Do you know what K-Means? – Cluster-Analysen durchführen und in Echtzeit implementieren

A session at JAX 2017

  • Harald Erb

Tuesday 9th May, 2017

2:45pm to 3:45pm (CET)

Cluster-Analysen sind heute „Brot und Butter“-Analysetechniken mit Verfahren, die zur Entdeckung von Ähnlichkeitsstrukturen in (großen) Datenbeständen genutzt werden, mit dem Ziel neue Gruppen in den Daten zu identifizieren. Der K-Means-Algorithmus ist dabei einer der einfachsten und bekanntesten unüberwachten Lernverfahren, das in verschiedenen Machine Learning Aufgabenstellung einsetzbar ist. Zum Beispiel können abnormale Datenpunkte innerhalb eines großen Data Sets gefunden, Textdokumente oder Kundensegmente geclustert werden. Bei Datenanalysen kann die Anwendung von Cluster-Verfahren ein guter Einstieg sein bevor andere Klassifikations- oder Regressionsmethoden zum Einsatz kommen.
In diesem Talk wird der K-Means Algorithmus samt Erweiterungen und Varianten nicht im Detail betrachtet und ist stattdessen eher als ein Platzhalter für andere Advanced Analytics-Verfahren zu verstehen, die heute „intelligente“ Bestandteile in modernen Softwarelösungen sind bzw. damit kombiniert werden können. Anhand von zwei Kurzbeispielen wird live gezeigt: (1) Identifizierung von Kunden-Cluster mit einem Big Data Discovery Tool und Python (Jupyter Notebook) und (2) die Realisierung einer Anomalieerkennung direkt im Echtzeitdatenstrom mit einer Stream Analytics Lösung von Oracle.

About the speaker

This person is speaking at this event.
Harald Erb

Architecting, designing and implementing Business Intelligence and Data Warehouse Systems by Oracle Corporation

Sign in to add slides, notes or videos to this session

JAX 2017

Germany Germany, Mainz

8th12th May 2017

Tell your friends!

When

Time 2:45pm3:45pm CET

Date Tue 9th May 2017

Session Hash Tag

#Big & Fast Data

Short URL

lanyrd.com/sfpzpf

View the schedule

Share

See something wrong?

Report an issue with this session