Dataworks Summit Europe 2017, 5. bis  6. April, ICM München
Talk am 5. April um 11:30 Uhr in Raum 11

Vom 5. bis zum 6. April veranstaltet Hortonworks in München den Dataworks Summit Europe 2017. Stephanie Fischer und Christian Winkler von mgm sind mit einem Talk im „Apache Spark and Data Science“-Track dabei. Ihr Vortrag „Classifying Unstructured Text – A Hybrid Deterministic/ML Approach“ gibt eine praktische Einführung in die automatische Klassifikation von Text, wie er Tag für Tag in sozialen Medien oder redaktionellen Webportalen entsteht. Ausgehend von beispielhaften Visualisierungen demonstrieren die Experten, wie die Textklassifikation mit Machine Learning funktioniert und sich Trainingsdaten deterministisch erweitern lassen. Alle Beispiele nutzen Daten, die frei verfügbar und vorkategorisiert sind und damit zu eigenen Experimenten einladen. Als Software-Tools kommen R, Apache Solr und D3.js sowie weitere Apache-Tools rund um Natural Language Processing und Machine Learning zum Einsatz.