Der WM-Ball in Russland rollt. Notorisch flattern die Deutschland-Fähnchen an den polierten Autos. Und wie seinerzeit bei der Papstwahl sind wir plötzlich wieder alle (na ja, nicht wenige) Deutschland. Wunderbar! Was uns aktuell jedoch viel mehr entzückt (und wir unseren Kickern voraus haben): seit letzter Woche sind wir: Cup Sieger! Unser Berliner Kollege und Big Data Experte Dr. Sebastian Bönisch hat beim diesjährigen BVM-Kongress den Data Science Cup abgeräumt. Dazu nochmals unseren herzlichen Glückwunsch, Sebastian – sauber verwandelt! 🙂
Der BVM hat den Data Science Cup 2017 ins Leben gerufen, weil das Thema Datenanalyse / “Big Data” in der Marktforschung (natürlich nicht nur dort) immer relevanter wird. Teilnehmen und ihre Arbeiten einreichen konnten Datenanalysten, Data Miner, Data Scientists oder IT-Spezialisten – kurz: alle, die sich mit dem Thema Big Data beschäftigen. Als Senior Director Data Science & Software Engineering ließ sich Sebastian die Chance nicht nehmen und reichte nach drei Monaten Vorlaufzeit schließlich sein Datenanalyse-Projekt ein. Um was ging’s konkret in diesem Jahr?
Um die letzte US-Wahl! Sebastian und die anderen Wettbewerbsteilnehmer durften etwa 3 Millionen Datensätze analysieren, die auf dem „American Community Survey“ (ACS) des Jahres 2016 basieren. Der ACS ist eine Art US-Mikrozensus, der einmal pro Jahr erhoben wird und etwa ein Prozent der amerikanischen Gesamtbevölkerung umfasst. Big Data kommt dadurch ins Spiel, dass in diesem Zuge fast unendlich viele soziodemographische Informationen (z.B. zu Bildung, Herkunft oder Einkommen) repräsentativ erhoben werden.
Für den BVM Cup wurden diese Daten aufbereitet und mit den Wahlergebnissen der US-Präsidentschaftswahl 2016 angereichert. Sebastian zeigte auf dem BVM Kongress vergangene Woche mit seinen Analysen, wie sich die Resultate der US-Präsidentenwahlen durch einen Neuzuschnitt der Wahlkreise verändern lassen. Der Clou: Je nach Analyse konnte er entweder einen überdeutlichen Sieg für die Republikaner unter Donald Trump oder eben eine 91-prozentige Wahlmänner Zustimmung für Hillary Clinton errechnen.
Im Detail mussten die Cup-Teilnehmer vier verschiedene Aufgaben bearbeiten, darunter die Prognose regionaler Wahlergebnisse oder auch Ausreißer-Erkennungen. Alles in allem handelte sich also zwar um hoch komplexe Berechnungen, aber auch um eine sehr griffige, aktuelle Thematik und brisante Datengrundlage (buzz words: Facebook-Skandal, Cambridge Analytica, Trump). Die inhaltliche Gestaltung und Betreuung der Data Science Cup TeilnehmerInnen hatte übrigens das renommierte ScaDS Dresden/Leipzig inne – eines der beiden nationalen Big-Data-Kompetenzzentren.
Sebastian leitet bei der GIM den Bereich Advanced Analytics, der Erkenntnisse aus Datenanalysen mit Konsumentenwissen aus Marktforschungsstudien verknüpft. Dabei liegt sein Fokus unter anderem darauf, Datenbankarchitekturen zu designen und die darin gesammelten Daten für unsere Kunden zu analysieren. Da das Thema Big Data im Fussball bekanntlich auch “in der Offensive” ist, sollten wir aufpassen, dass der DFB nicht versucht, Sebastian für Spielanalysen und Taktikoptimierungen abzuwerben. Nach dem vergeigten Auftakt gegen Mexiko wär’s allemal vonnöten. 🙂
Bei Fragen zum Thema könnt ihr Euch natürlich gerne direkt an Sebastian wenden (s.boenisch@g-i-m.com).