Aus dem Leben eines Data Scientist – Oder warum Statistik sexy ist

prudsys, prudsys RDE, Omnichannel, Handel, E-Commerce, Echtzeit, Personalisierung, Job, Data Scientist

Im April dieses Jahres bewarb ich mich auf eine Ausschreibung als Mitarbeiter in der Forschung bei der prudsys AG. Diese Stelle entsprach so ziemlich genau dem, was ich – nach meinem Master-Abschluss in Statistik und seit ich auf der Online-Lernplattform „Coursera“ den Machine-Learning-Kurs von Andrew Ng (Chief Scientist bei Baidu Research im Silicon Valley und Professor an der Stanford Universität) belegte – beruflich machen wollte. Die universell einsetzbare Idee, maschinell aus Beispieldaten zu lernen und zu verallgemeinern, faszinierte mich. Entsprechend groß war die Freude, als ich meine neue Arbeitsstelle bei prudsys tatsächlich antreten durfte. Heute bin ich bereits seit drei Monaten im Unternehmen und möchte in diesem Beitrag berichten, womit ich mich in meiner täglichen Arbeit beschäftige.

Die Forschungsabteilung der prudsys AG arbeitet an der Weiterentwicklung von Algorithmen und der Erprobung innovativer Verfahren für den Omnichannel-Handel. Somit ist es die Aufgabe des Teams, unsere Personalisierungslösung, die prudsys Realtime Decisioning Engine (kurz: prudsys RDE), nicht nur jeden Tag ein Stück besser zu machen, sondern schon heute an den Lösungen von morgen zu arbeiten. Als ich Anfang Juni als neuer Research Consultant bei prudsys startete, galt es zunächst, mich in die verschiedenen Verfahren einzulesen und die Algorithmen-Bibliothek sowie die Daten-Strukturen kennenzulernen. Dabei wurde mir schnell klar, wieviel ich eigentlich nicht weiß. Aber genauso schnell wurde mir auch bewusst, dass ich mit meinen Fragen nicht allein bin und mir meine Kollegen gern und gut helfen können.

Data Scientist – Sexiest Job des 21. Jahrhunderts

Um meinen Aufgabenbereich auf den Punkt zu bringen, nutze ich gern den Begriff „Data Science“. Dieser Begriff bezeichnet im Allgemeinen eine Extraktion von Wissen aus einer Datenmenge. Um meine Arbeit zu beschreiben, möchte ich auf das sogenannte Data-Science-Venn-Diagramm verweisen. Diese Abbildung verdeutlicht, welche Kenntnisse Data Science erfordert – nämlich Fachkompetenz, Programmier-Fähigkeiten und Wissen in Mathematik und Statistik. Den Begriff Data Science verwende ich übrigens nicht, weil der Data Scientist als „Sexiest Job des 21. Jahrhunderts“ bezeichnet wurde, sondern weil ein Data Scientist geschätzte 80 Prozent seiner Arbeitszeit mit der Datenaufbereitung verbringt. Vielleicht ist das für einige ein Widerspruch. Ich finde es allerdings sehr spannend, da sich hinter dieser Arbeit vielfältige Themen, wie die Ersetzung von fehlenden Werten in Daten, die Umcodierung kategorischer Attribute (wie Farbe) in numerische Werte oder das Generieren neuer Kennzahlen auf Basis bestehender Attribute, verbergen. Wie viel Raum diese Fragestellungen einnehmen und wie viel Kreativität nötig ist, um diese zu lösen, haben mir nicht zuletzt die Präsentationen der Sieger-Teams des diesjährigen DATA-MINING-CUP beim prudsys personalization summit 2016 in Berlin gezeigt. Bei dem weltweit renommierten Studenten-Wettbewerb ruft die prudsys AG jedes Jahr Studenten auf, ihr Know-how im Bereich der intelligenten Datenanalyse zu testen. Wie in den vorangegangenen Jahren bestand die Aufgabe im Lösen eines aktuellen praxisrelevanten Problems. Anhand historischer anonymisierter Bestelldaten eines echten Onlineshops entwickelten die Teilnehmer ein Prognose-Modell, mit dessen Hilfe Vorhersagen für neue Bestellungen samt ihrer Retouren möglich sind. In der Theorie werden solche Fragen oft vernachlässigt und man beginnt dort direkt mit der Modellerstellung auf den Daten. In der Praxis kommt dieser Schritt erst ziemlich spät.

Bisher habe ich an der Erstellung von Modellen zur Prognose von Warenkorb-Abbrechern im Rahmen der Automation von Marketingaktivitäten im Onlinehandel mitgearbeitet. Außerdem bin ich im Bereich Dynamic Pricing tätig. Hier geht es darum, Verfahren zu entwickeln, um eine bestmögliche Preisfindung für tausende Produkte eines Händlers in Echtzeit vorzunehmen. Neben der Wahl des Verfahrens spielen an dieser Stelle die verwendeten Parameter eine große Rolle, bei der auch eine gewisse Erfahrung notwendig ist. Schließlich gilt es auch hier, auszuwerten, welche Parameter welche Änderungen der Ergebnisse nach sich ziehen und wie stark diese sind. Neben dem Wettbewerberpreis spielen beim Dynamic Pricing eine Vielzahl von anderen Preisbildungsfaktoren eine Rolle – beispielsweise das Wetter, Saisonzeiten, Wochen- oder Tageszeiten oder Bestandsinformationen. Ein Dynamic-Pricing-Algorithmus ist in der Lage, über Regressions-, Cluster- und Entscheidungsbaum-Algorithmen, die Preiselastizität für alle Artikel des Sortiments zu bestimmen. Die Preiselastizität sagt aus, wie sich die Nachfrage ändert, wenn sich der Preis ändert. So wird zum Beispiel für Artikel mit begrenzter Lebensdauer der richtige Preis, zu jeder Zeit und in jeder Filiale bzw. jedem Webshop berechnet.

Fazit

Nach meinen ersten Monaten bei prudsys kann ich festhalten, dass meine Erwartungen an meine Stelle als Research Consultant mehr als erfüllt wurden. Ich habe bereits sehr viel mitgenommen – nicht zuletzt die Erkenntnis, dass es wenig gibt, was man mit einer Linux-Konsole nicht machen kann. Es macht unglaublich viel Spaß, für die prudsys AG zu arbeiten, die ich als eine Firma mit offener Unternehmenskultur kennengelernt habe. Die Kollegen haben es mir darüber hinaus sehr leicht gemacht, mich schnell einzuleben und mich wohl zu fühlen.

Wir sind immer auf der Suche nach motivierten Kolleginnen und Kollegen, die ihre Arbeit als Teamsport begreifen, gerne ihren Horizont erweitern und ihr fachliches Know-how proaktiv einbringen. Aktuell suchen wir eine/n Mathematiker/in zur Verfahrensentwicklung im Bereich Echtzeit-Datenanalyse. Diese und weitere Stellenausschreibungen findet ihr unter http://www.prudsys.de/unternehmen/karriere


Weiterführende Links:

Dein neuer Job im prudsys Team

Meine neue Arbeitsstelle bei prudsys – ein Blick hinter die Kulissen

Ein Praktikum bei prudsys: Marketing ist mehr als Werbung

1 Antwort

Trackbacks & Pingbacks

  1. […] Ausbildung bei der prudsys AG: Einblicke in den Arbeitsalltag eines angehenden Fachinformatikers Dein neuer Job im prudsys Team Aus dem Leben eines Data Scientist – Oder warum Statistik sexy ist […]

Dein Kommentar

Want to join the discussion?
Feel free to contribute!

Schreib einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *