Das war es wieder einmal

Die Aufnahmen bei LinkedIn Learning sind fertig. Morgen früh geht es mit dem Flieger von Graz zurück nach Hause. Ich habe dieses Mal eine Adaption eines US-Trainings zum Thema „Big Data und Data Science mit Python“ eingespielt. Allerdings ziemlich von den Schwerpunkten umstrukturiert. Und im Januar soll eine Fortsetzung Richtung „Maschinen Lernen“ folgen.

Big Data und Data Science sind ja Schlagworte, die im Moment in Medien und Politik omnipresent sind. Auf Spiegel Online erzählt gerade eine junge Frau, was sie als Data Scientist so beruflich macht. Weil die Alten ja nichts mit den neuen Berufsbezeichnungen Data Scientist oder Data Analyst anfangen könnten. Aus guten Grund, denn im Grunde kann sich jeder mit solchen Bezeichnungen schmücken. Was nichts daran ändert, dass die Verwertung von großen Datenmengen wichtige Aufschlüsse geben kann und der Umgang mit Daten für mich als Mathematiker sowies tägliches Brot ist. Tatsächlich ist im Moment jedoch m.E. auch viel heiße Luft dabei, die in keiner Weise standardisierte Dinge reißerisch mit einem neuen Label anpreist.

Nur nannte sich das früher einfach Stochastik und/oder Stastik. Einziges Manko – es wurden bzw. werden dabei die Zahlen halt oft nicht so aufbereitet, dass sie auch Laien verstehen konnten/können. Das ist wohl die große Kunst bei dem ganzen Thema – Daten erst einmal logisch auswählen, übliche mathematischen Standardverfahren anwenden und die Ergebnisse vernünftig aufbereiten.

Der Punkt, wo das größte Know How notwendig ist, ist die Wahl der richtigen Daten, bevor man an die Verarbeitung geht. Der Rest ist Mathematik und Computertechnologie – also weigehend Standardverfahren (wenngleich nicht immer trivial).