R

Mit der Programmiersprache R hatte ich bisher nicht wirklich viel zu tun. Auch wenn  R eine der beliebtesten Programmiersprachen für Data Science und statistische Analyse ist und dies durchaus meine Expertisen berührt. Aber da bin ich eigentlich mit Python unterwegs. Nur studieren meine Söhne Geowissenschaften und einer will mit R bzw. RStudio Auswertungen für seine Masterarbeit durchführen. RStudio ist eine  integrierte Entwicklungsumgebung und GUI für R unter Open Source-Lizenz, die es sowohl als lokale Desktop-Version als auch als Server-Version mit gleichem Layout gibt. Die Serverversion läuft auf einem Linux-Server und auf sie wird über einen Webbrowser per Port 8787 in der Standardeinstellung zugegriffen.

Da die Rechner von meinem Sohn wirklich alt und ziemlich schwach auf der Brust sind, wollte ich ihm Kapazitäten von meinen Rechnern abtreten und dort einen R-Server bereitstellen. „R“ weiterlesen

Aktualisierung meines Trainings zu Programmierung mit ChatGPT

Bei Linked Learning (LiL) wurde gestern mein Training zu KI-unterstütztes Programmieren mit OpenAI und ChatGPT aktualisiert. Dabei habe ich ziemlich umfangreiche Änderungen, Anpassungen und Aktualisierungen vorgenommen. Mehr als in je einem Training zuvor. Aber die rasante Entwicklung bei KI und vor allen Dingen der Benutzerschnittstellen der Large Language Model (LLM) haben dieses umfangreiche Update notwendig gemacht, auch wenn ich schon über die letzten Monate die Grundversion von 2023 immer wieder erweitert und aktualisiert hatte.

Wobei ich ja schon vor der ChatGPT-Supernova im Umfeld von KI bzw. AI recht viele Videotraining zu Grundlagen der künstlichen Intelligenz veröffentlicht habe. Etwa zu Statistik in Verbindung mit Python und  Mathematik-Grundbegriffe für Programmierer, was einen Teil der KI-Grundlagen samt der Arbeitsweise von LLM berührt und vor allen Dingen Python für die Datenanalyse 1: Grundlagen sowie Python für die Datenanalyse 2: Machine Learning, was elementare Basistheorien und -techniken für das Training von KI bzw. LLM abdeckt.

Als LLM mit ChatCPT als Speersitze wie ein Sturm die IT umgekrempelt und Künstliche Intelligenz vom Nerd-Thema zum Massenhype befördert hat, habe ich sofort ein Training dazu aufgezeichnet und damit die Welle ganz am Beginn mitgenommen. Da ich mit dem Training aber eben absolut am Anfang schon dabei war, habe ich in dem Training – trotz immer wieder laufender Aktualisierungen – zu ChatCPT auch noch einige Videos auf dem Stand gehabt, der eben 2022 am Beginn der Welle up2date war.

Das musste einfach bei einigen Videos angepasst werden und teils war es auch sinnvoll Videos zu entfernen, weil die Art des Zugangs zu ChatCPT und anderen LLM 2025 nicht mehr auf diese Weise erfolgt, wie es „früher“ (man beachte die Ironie, wenn ich bei 2022/2023 von der Vergangenheit rede) gemacht wurde. Etwa hat der Playground bei ChatGPT nicht mehr die Bedeutung wie am Anfang und wird auch anders eingesetzt. Die reine GUI von ChatGPT ist zudem einfacher geworden und steht auch mittlerweile ohne Anmeldung zur Verfügung, wenn man nur einfache Ansrpüche hat. Dazu wurden Features erweitert bzw. vom Playground in das einfache ChatGPT-Userinterface verlagert. Das musste einfach in das Training rein.

Damit sollte das Videotraining jetzt wieder vollständig auf dem aktuellen Stand der KI-Entwicklung bzw. der Verwendung von ChatGPT & Co sein.

 

Numpy-Training

Ich frage mich langsam, ob es noch Zufall ist. Aber es kam in der letzten Zeit echt oft vor, dass ich an neuen Aufnahmen für LinkedIn Learning (LiL) gesessen hatte und in genau der Zeit ein Training von mir veröffentlich wurde, das ich in einer vorherigen Aufnahme-Session eingespielt hatte. Wobei ich das ganz und gar nicht negativ meine, aber genau das ist gerade wieder passiert. Wir leben in der Matrix.

Mein neues Training ist ein Grundkurs zu Numpy. Diese Python-Bibliothek habe ich bei diveren anderen Videotraining schon dabei, aber immer nur als Randthema. Mir schien es an der Zeit, Numpy aus der Nebenrolle ins Rampenlicht zu holen. „Numpy-Training“ weiterlesen

KI und Machine Learning ausprobieren

 

Ich habe ja bei LinkedIn Learning (LiL) diverse Training zu KI, aber auch  Big Data, Maschinenlernen und Datenanalyse veröffentlicht. Aktuell bin ich auf einen extrem spannenden Ansatz von Google gestoßen, wie man Künstliche Intelligenz und Maschinenlernen direkt im Browser mehr oder weniger spielerisch ausprobieren kann. „KI und Machine Learning ausprobieren“ weiterlesen

KI-Update bei Python für die Datenanalyse 1: Grundlagen

Es ist schon eine kleine Weile her, seit ich den US-Kurs zu Big Data, Maschinenlernen und Datenanalyse meiner amerikanischen Kollegin Lillian Pierson ins Deutsche adaptiert habe und er unter Python für die Datenanalyse 1: Grundlagen bei LinkedIn Learing veröffentlicht wurde. Er ist immer noch einer meiner bestgehenden LiL-Kurse, aber die ganzen Entwicklungen rund um künstliche Intelligenz haben mich zu einem kleinen KI-Update veranlasst. Obwohl es auch zu der Zeit der ursprünglichen Aufnahme natürlich schon sehr leistungsfähige und fortgeschrittene KI gab, war es da ein Randthema für Nerds. ChatCPT & Co haben das geändert und KI ins tägliche Leben der Masse katapultiert. Deshalb machte es m.E. viel Sinn, einmal die Grundlagenbedeutung von Big Data, Maschinenlernen und Datenanalyse für KI aufzunehmen also auch den Tipp, wie umgekehrt KI bei diesen Grundlagenthemen selbst helfen kann.

Künstliche Intelligenz und Überwachung – sehenswerter, wichtiger Beitrag auf ZDF Info

Bei ZDF Info ist ein sehr guter, informativer und ziemlich beunruhigender Beitrag zum Thema „Künstliche Intelligenz und den Wettlauf der Großmächte“ zu finden. Weniger technisch, aber die Auswirkungen auf die Arbeitswelt und vor allen Dingen auf die Privatsphäre werden da beleuchtet. Mit den „üblichen“ Ausführungen zu der kompletten Spionage durch Facebook, Google und Co über ihre Webseiten als auch die sogenannten „Smart“-Geräte (Synonym für Wanzen), aber auch wie Staaten versuchen, mit Überwachung als auch KI (oder auch kurz AI für artifizielle Intelligenz oder englisch AE für artificial intelligence) das ganze Volk unter komplette (Gedanken-)Kontrolle zu bekommen (und leider tut sich da gerade China ziemlich negativ hervor). Aber es wird auch vertieft, wie man durch (as-)soziale Medien gezielt manipulieren kann. Die damalige Cambridge-Manipulation der US-Wahl durch Facebook-Daten als Aufhänger, wird auch das Thema weiter gesponnen.

Alles in allem beunruhigende Vorstellungen, ich mich sowohl als reines Opfer (Bürger bzw Kunde bzw einfach Mensch) betreffen, aber zudem meine eigene Arbeit berühren. Denn ich verdiene ja durchaus an Techniken wie Künstlicher Intelligenz, Datenauswertung im Allgemeinen, Data Science oder Big Data und Maschinenenlernen sowie Datenanalyse. Sei es durch Videotraining bei LinkedIn Learning (LiL), sei es durch Schulungen, die in dem Umfeld ablaufen (gerade heute habe ich ein Vorabgespräch zu so einer Schulung gehabt).

Ich habe definitiv kein schlechtes Gewissen dabei, denn per se sind die Techniken nicht schlecht oder böse. Aber man muss verdammt wachsam sein, dass sie nicht missbraucht werden und wo sie es schon werden – sei es bei Facebook, Google, Apple, Amazon oder auch Staaten, muss man dies immer wieder deutlich machen. Das gilt gerade für Leute für mich, die zumindest im weiteren Zirkel der Entwicklung aktiv sind.

Es gibt einfach zu viele Eloi in der Welt und die Morlocks haben zu leichtes Spiel.

Und was ich gerade beim Schreiben des Beitrags nur beiläufig bemerkt habe – in meinem Firefox Browser war plötzlich die Standardsuchmaschine von DuckDuckGo auf Bing umgestellt. Die Jäger versuchen wirklich mit allen Tricks Opfer zu erlegen. Eine Sekunde nicht aufgepasst und man verwendet keine sichere Suchmaschine wie DuckDuckGo mehr, sondert landet mit Suchanfragen bei einer Datenkrake.

Uffbasse Leute, uffbasse!

 

Python für die Datenanalyse: Grundlagen

Da isses ja! Im letzten Nov aufgenommen und jetzt brandneu veröffentlicht.


Python für die Datenanalyse: Grundlagen


Mein neustes Online-Training bei LinkedIn Learning – eine Adaption eines US-Trainings – dreht sich um Big Data und die Auswertung und Analyse von Daten sowie deren Manipulation, Transformation und ihrer sinnvollen Aufbereitung über Python samt seinen diversen Bibliotheken. Neben dem allgemeinen Verständnis für Data Science und Big Data werden auch Tools und Bibliotheken wie Anaconda, das Jupyter Notebook oder Numpy und Pandas behandelt.

Für Eltern erklärt

Wenn mir nicht der Rücken ständig zwicken würde, müsste ich wohl noch ziemlich jung sein. Denn mir ist durchaus geläufig, was ein Data Scientist macht bzw. dieses Modewort bezeichnet.

Anscheinend muss man das Leuten, die in dem Alter sind, dass sie (theoretisch) Kinder oder gar Enkel haben können, erst einmal erklären. Fällt in Spiegel Online unter die Kategorie „Berufe für Eltern erklärt“.

Na sowas – und warum erkläre ich mit meinem Alter in dem neusten Training, das ich die letzten Tage bei LinkedIn Learning in Graz aufgenommen habe, den Jungen (aber natürlich nicht nur denen) erst einmal, wie ein Data Science bzw. Data Analyst das machen kann, was er dann wieder den Eltern und Großeltern erklären soll?

Das war es wieder einmal

Die Aufnahmen bei LinkedIn Learning sind fertig. Morgen früh geht es mit dem Flieger von Graz zurück nach Hause. Ich habe dieses Mal eine Adaption eines US-Trainings zum Thema „Big Data und Data Science mit Python“ eingespielt. Allerdings ziemlich von den Schwerpunkten umstrukturiert. Und im Januar soll eine Fortsetzung Richtung „Maschinen Lernen“ folgen.

Big Data und Data Science sind ja Schlagworte, die im Moment in Medien und Politik omnipresent sind. Auf Spiegel Online erzählt gerade eine junge Frau, was sie als Data Scientist so beruflich macht. Weil die Alten ja nichts mit den neuen Berufsbezeichnungen Data Scientist oder Data Analyst anfangen könnten. Aus guten Grund, denn im Grunde kann sich jeder mit solchen Bezeichnungen schmücken. Was nichts daran ändert, dass die Verwertung von großen Datenmengen wichtige Aufschlüsse geben kann und der Umgang mit Daten für mich als Mathematiker sowies tägliches Brot ist. Tatsächlich ist im Moment jedoch m.E. auch viel heiße Luft dabei, die in keiner Weise standardisierte Dinge reißerisch mit einem neuen Label anpreist.

Nur nannte sich das früher einfach Stochastik und/oder Stastik. Einziges Manko – es wurden bzw. werden dabei die Zahlen halt oft nicht so aufbereitet, dass sie auch Laien verstehen konnten/können. Das ist wohl die große Kunst bei dem ganzen Thema – Daten erst einmal logisch auswählen, übliche mathematischen Standardverfahren anwenden und die Ergebnisse vernünftig aufbereiten.

Der Punkt, wo das größte Know How notwendig ist, ist die Wahl der richtigen Daten, bevor man an die Verarbeitung geht. Der Rest ist Mathematik und Computertechnologie – also weigehend Standardverfahren (wenngleich nicht immer trivial).