Was machen eigentlich ein Machine Learning Engineer und ein Data Scientist? Beide sind sehr wichtig für die digitale Transformation. Machine Learning und Data Science sind zudem Begriffe, die heutzutage häufig verwendet werden. Dennoch wissen manche gar nicht, worum es sich dabei genau handelt. Wir bringen Licht ins Dunkle, über was die Unterschiede und Gemeinsamkeiten zwischen den beiden sind.
Der Unterschied
Als Machine Learning Engineer oder Data Scientist gehört man zu den Newcomern in der Arbeitswelt und deshalb kann niemand genau sagen, worin sie sich unterscheiden. Im weitesten Sinne beschäftigen wir uns hier mit den Ingenieuren und Wissenschaftlern, welche beide technisch höchst versiert sind. Ein Wissenschaftler muss Dinge verstehen und der Ingenieur muss etwas aufbauen. Beides ist mit dem Aufkommen von Artificial Intelligence (AI), Big Data und Co. zu einem wichtigen Thema geworden. Neben diesen beiden sind in den letzten Jahren noch weitere ähnliche Berufe aufgekommen, sodass man schnell mal den Überblick verliert. So gibt es z.B. auch Virtual Reality Entwickler, Ethical Hacker oder den Cloud Architekt. Wir wollen im Folgenden für ein klares Bild darüber sorgen, worin die Unterschiede zwischen Engineer und Scientist liegen. Dafür schauen wir uns aber erst an, womit sich Machine Learning und Data Science beschäftigen.
Machine Learning
Machine Learning ist ein Teilbereich von AI. Datengesteuerte Algorithmen sollen es Softwareanwendungen ermöglichen, Ergebnisse mit hoher Genauigkeit vorherzusagen, ohne dass dies explizit programmiert werden musste. Dafür werden Algorithmen entwickelt, die Eingabedaten empfangen und statistische Modelle zur Vorhersage einer bestimmten Ausgabe nutzen. Sobald neue Daten verfügbar sind, wird die Ausgabe aktualisiert. Um es ganz einfach auszudrücken: Der Netflix Algorithmus lernt mit der Zeit, was uns gefällt und was nicht. Der Algorithmus sieht, wie viele Nutzer zu welcher Zeit etwas schauen, aber auch wie alt diese sind und welches Geschlecht sie haben und so weiter. Darauf aufbauend gibt uns Netflix Vorschläge für Filme oder Serien. So hängt dieses Gebiet stark mit dem Data Mining zusammen, weil für die Vorhersagen erst die Daten durchsucht und Muster identifiziert werden müssen, um die Ausgabe laufend anzupassen.
Data Science
Im Bereich der Data Science geht es um das beschreiben, vorhersagen und schlussfolgern aus strukturierten und unstrukturierten Daten. Überraschenderweise gibt es den Begriff schon seit den 1960er Jahren. Wenn eine große Datenmenge vorhanden ist, kann diese in eine wertvolle Ressource umgewandelt werden. Beispielsweise können Daten Unternehmen bei dem Treffen von Entscheidungen helfen. Solche Entscheidungen können z.B. sein wie das Unternehmen neue Marktchancen identifiziert oder seine Effizienz steigern kann. Data Science selber nutzt neben Mathematik und Statistik auch Techniken wie z.B. Artificial Intelligence. Aber eben auch Business Know-How ist hier wichtig, um aus den Daten entsprechende Handlungsempfehlungen für Unternehmen ableiten zu können. In der Grafik sieht man, wie die Teilbereiche von AI, Machine Learning, Big Data, Deep Learning und Data Science zusammenhängen.
Machine Learning Engineer vs. Data Scientist
Das macht der Data Scientist
Ein Data Scientist arbeitet mit Rohdaten Dieser analysiert und visualisiert er. Sein Wissen geht mehr in die Breite, als in die Tiefe. Dabei muss er einen Software Engineer in Statistik schlagen können. Analytische und Hacking Skills spielen hier ebenfalls eine große Rolle. Was genau gehört zu seinen Aufgaben im Unternehmen? Ein Data Scientist erforscht und entwickelt Modelle für Analysen und er arbeitet mit Produktmanagern und Technikern für ein besseres Verständnis der Unternehmensbedürfnisse zusammen. Außerdem vermittelt er Ergebnisse und Konzepte an das Unternehmensmanagement, entwickelt kundenspezifische Datenmodelle und erstellt Prozesse und Tools zur Analyse von Datengenauigkeit.
Das macht der Machine Learning Engineer
Ein ML Engineer sitzt an der Schnittstelle zwischen Software Engineering und Data Science. Er nimmt Daten auf und gibt sie, in möglichst effizienter Weise, in einer geeigneten Form aus. Dafür muss er unter anderem Programmiersprachen wie Python, Java, R und C++ beherrschen. Aber was genau gehört jetzt zu seinen täglichen Aufgaben? Ein ML Engineer entwickelt Modelle für Machine Learning und verbessert bestehende Modelle. Er schreibt Codes auf Produktionsebene, macht Code Reviews, kommuniziert komplexe Prozesse an das Unternehmensmanagement und erforscht Verfahren zur Verbesserung der Machine Learning Infrastruktur.
Machine Learning Engineer ft. Data Scientist
Wenn ein Machine Learning Engineer und ein Data Scientist zusammen in einem Team arbeiten, dann würde die Arbeit folgendermaßen ablaufen: Der Data Scientist führt eine statistische Analyse durch, um herauszufinden, welcher Ansatz von Machine Learning benutzt werden soll. Danach wird der Algorithmus modelliert und ein Prototyp zum Testen erstellt. Der Machine Learning Engineer nimmt diesen Prototyp und macht ihn Marktreif. Deshalb wird von einem ML Engineer nicht erwartet, dass er die komplizierte Mathematik hinter den Vorhersagemodellen versteht, so wie es der Data Scientist tut. Dafür wird aber vom ML Engineer erwartet, dass er die Software Tools beherrscht, um die Modelle nutzbar zu machen. So ergänzen sich beide Bereiche einwandfrei. Weiterhin werden beide Berufe in der nahen Zukunft noch sehr gefragt sein, denn die Potenziale von Machine Learning sind groß und werden gerade immer mehr erkannt.