Das Erlernen neuer Programmiersprachen ist eine Investition ins Humankapital. Die Ermittlung des Return on Investment kann daher sehr aussagekräftig sein. Die Anforderungen für jede Branche und jeden spezifischen Job sind sehr spezifisch – eine verallgemeinerbare Antwort auf diese Frage zu finden, ist deshalb schwierig. Ein Ansatz könnte aber darin bestehen, die erforderlichen Softwarekenntnisse bei Stellenausschreibungen zu analysieren, die die aktuelle Nachfrage widerspiegeln und dadurch einen allgemeinen Return on Investment anzeigen können. Wir haben alle deutschen Stellenangebote mit einem Datenbezug auf Indeed heruntergeladen, um eine grobe Vorstellung der Beliebtheit jeder Software auf dem deutschen Arbeitsmarkt zu erhalten.
Wir haben im Juni 2017 alle Stellenangebote in Deutschland auf datenwissenschaftliche Schlüsselwörter (Data Scientist, Data Analyst, Big Data, Machine Learning) abgesucht. Dies deckt zwar nur die aktuellen Stellenausschreibungen ab, da sie jedoch in der Regel mehrere Wochen online geschaltet werden, können wir davon ausgehen, dass wir so ein relativ genaues Bild der aktuelle Marktnachfrage erhalten. Die Suche umfasst 2807 Stellenausschreibungen, aber nur 70% der Ausschreibungen geben eine Software oder Programmiersprache an. Warum enthalten so viele Postings keine spezielle Anforderungen? Häufig stellen Arbeitgeber nur allgemeine Anforderungen (z.B. Kenntnisse im Bereich Machine Learning oder Data Analytics) und einige der Stellenausschreibungen enthalten datenwissenschaftliche Suchbegriffe, richten sich aber nicht in erster Linie an Datenwissenschaftler..
Wir haben die 2807 Stellenausschreibungen nach den 25 beliebtesten Data-Science-Softwares durchsucht. 1971 Stellenausschreibungen erwähnen mindestens eine der Softwares, viele von ihnen mehrere. Die folgende Abbildung zeigt die Anzahl der Stellenangebote, die eine bestimmte Software erwähnen. Mit rund 1000 Stellenangeboten ist SQL die beliebteste Software, gefolgt von Python mit rund 900 Nennungen und Java mit 670.
Ist die obige Verteilung charakteristisch für Deutschland oder spiegelt sie weltweite Trends wider? Robert Muenchen hat die gleiche Analyse für den US-Markt durchgeführt. Die Plätze eins bis drei sind identisch: SQL (18.000 Jobs), Python (13.000 Jobs) und Java (13.000 Jobs) dominieren den Markt. Einige Unterschiede bestehen weiter unten: So ist z.B. SAP auf dem deutschen Markt (6.) gefragter als auf dem US-Markt (12.). Insgesamt sind sich die beiden Grafiken jedoch sehr ähnlich, was bestätigt, dass die Softwaretrends global sind und die Anforderungen durch die technologischen Grenzen geprägt sind.
Wenn Sie neu in der Datenwissenschaft sind oder darüber nachdenken, in diese Berufsrichtung zu gehen, gibt Ihnen diese Analyse eine gute Vorstellung davon, welche Programmierkenntnisse in naher Zukunft besonders wertvoll sein dürften. Die hohe Nachfrage nach SQL könnte ein Zeichen dafür sein, dass viele Unternehmen nicht nur Fähigkeiten in der Datenanalyse erwarten, sondern auch ein reibungsloses Zusammenspiel mit Datenbanken. Python scheint auf dem Vormarsch zu sein. Robert Muenchen zeigt, dass die Popularität von Python in den letzten drei Jahren stark zugenommen hat und das Wachstum den anderen großen Open-Source-Player R überholt. Insgesamt dürfte eine Kombination aus starken analytischen Fähigkeiten in Python und R mit soliden SQL-Kenntnissen eine gute Grundlage für eine Karriere im wachsenden Data-Science-Arbeitsmarkt sein.
Interessiert an der Analyse von Jobs auf Indeed? Sie können auf die Jobs über deren API zugreifen. Das jobbR-Paket auf R ist hilfreich; ähnliche Werkzeuge gibt es für Python.