Wenn Ressourcen für Data Science schwer zu finden oder nicht zu bezahlen sind, dann soll Software Abhilfe schaffen und fortgeschrittene Analytik für Analyst:innen und andere Fachanwender:innen verfügbar machen.
In Zeiten von „AI first“ heißt die Antwort oft Machine Learning und Artificial Intelligence. Dies ist auch der Ansatz von DataRobot. Durch Machine Learning soll die Aufbereitung der Features weitgehend automatisiert werden.
Besonderes Augenmerk liegt auf der automatischen Berechnung einer großen Anzahl an Advanced-Analytics-Algorithmen im Autopilot-Modus. Dies geschieht im Hintergrund und der/die Anwender:in erhält übersichtlich sortiert und gut dokumentiert die Information über die zuverlässigsten Vorhersagemodelle. BARC nennt diesen Ansatz „Guided Advanced Analytics„.
Zusätzlich zum gesetzten Ziel, Vorhersagen durch Machine Learning für mehr Anwender:innen verfügbar zu machen, will DataRobot mit dem Ansatz für mehr Anwenderfreundlichkeit und Automation auch die Produktivität der Data Scientists erhöhen.
Neben der Automation von Data Science soll die einfache Einbettung der Modelle den Nutzen von Data Science durch die unmittelbare Entscheidungsunterstützung oder -automation in operativen Prozessen sicherstellen.
DataRobot Facts
- Gegründet 2012 in Boston, MA
- $124 Funding
- 180+ Data Scientists
DataRobot Highlights
- Einbettung der Modelle in operative Applikationen über verschiedene Methoden
- Data Profiling: Visuelle Darstellung der Verteilung der Datenfelder
Automatische Vorschläge für Anpassungen, Korrekturen und Verbesserungen auf Basis der Feldinhalte - „Autopilot“ und „Manual Mode“ verfügbar für jeweilige Anwendergruppe: Autopilot wählt die besten Algorithmen aus, dabei testen die Algorithmen im Hintergrund und alle Modelle werden mit allen kalkulierten Parametern gemäß ihrer Aussagekraft gereiht
- R, Python und andere bereits in Installation inkludiert
- Verfügbar On-Premises oder in der Cloud (SaaS)
- Textmining verfügbar
DataRobot Limits
- Data Preparation limitiert: Alle Daten in einem Datenset (Datei, ODBC, HDFS)
- Präsenz im DACH-Raum noch im Aufbau
Fazit
DataRobot liefert eine einfach zu verwendende Lösung, mit deren Hilfe mit wenig Aufwand und Vorwissen auch große Datensätze auf versteckte Zusammenhänge und Muster geprüft werden können.
Umfangreiche Unterstützung und Automation im Hintergrund (Guidance) erleichtern den Zugang für Analyst:innen und steigern die Produktivität der Data Scientists.
Trotz aller Unterstützung bedarf es statistisch versierter Anwender:innen, um die bereitgestellten Ergebnisse interpretieren und validieren zu können, denn Muster weist fast jeder Datensatz auf.
Die Bewertung, ob diese bedeutungsvoll sind, verlangt nach statistischem und geschäftlichem Know-how, sowie Verständnis für die wissenschaftliche Methode. Für die Aufbereitung der Datensets für die Analyse sind Werkzeuge für Data Preparation empfehlenswert.