{"id":16939,"date":"2020-05-28T14:29:00","date_gmt":"2020-05-28T14:29:00","guid":{"rendered":"https:\/\/barc.com\/?p=16939"},"modified":"2023-10-26T08:57:52","modified_gmt":"2023-10-26T08:57:52","slug":"briefing-insights-dremio","status":"publish","type":"post","link":"https:\/\/barc.com\/de\/briefing-insights-dremio\/","title":{"rendered":"Briefing-Insights: Dremio &#8211; die \u201eData Lake Engine\u201c"},"content":{"rendered":"\n<p>Was ist denn nun wieder eine Data Lake Engine? Kurz gesagt: Eine Engine soll helfen, Daten einfach und schnell in seinem (Cloud) Data Lake zu finden und mit einer hohen Abfrageperformance auszuwerten.<\/p>\n\n\n\n<p>Technisch ist eine SQL-basierte Query-Engine mit semantischem Layer gemeint, die Abfragen auf verschiedenen Datenhaltungssystemen (On Premises oder in der Cloud) erm\u00f6glicht und damit als zentraler Zugriffspunkt f\u00fcr JDBC\/ODBCODBC-kompatible Anwenderwerkzeuge fungiert.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Dremio<\/h2>\n\n\n\n<p>Dremio wurde 2015 ins Leben gerufen. Der Hauptsitz ist in den USA, Santa Clara. Heute arbeiten rund 120 Mitarbeiter:innen f\u00fcr den Technologielieferanten. Weltweit geh\u00f6ren Konzerne wie z. B. Diageo, Microsoft, NCR, PayPal, Standard Chartered, Transunion zu den Kund:innen.<\/p>\n\n\n\n<p>Im DACH-Raum nutzen bereits DATEV, DB Cargo, Henkel und die Software AG (Cumulocity IoT) Dremio. Zu den Vorzeigekunden im DACH-Raum z\u00e4hlen vor allem Datev, DBCargo und Henkel. Einen Branchenschwerpunkt gibt es nicht. Speziell f\u00fcr den deutschsprachigen Markt gibt es seit Anfang 2020 ein dediziertes Team, das weiter ausgebaut werden soll.<\/p>\n\n\n\n<p>Seit 2018 ist die Dremio Enterprise Edition auch als kommerzielle Version als Erg\u00e4nzung zum Open-Source Produkt Dremio Community Edition verf\u00fcgbar. Bezahlt wird vor allem f\u00fcr zus\u00e4tzliche Enterprise-Funktionen rund um den Datenschutz und Sicherheit sowie Service-Leistungen. Dremio kann On Premises und\/oder im eigenen Cloud-Account (AWS, Azure) genutzt werden.<\/p>\n\n\n\n<p>Dremio ist im Marketplace sowohl AWS als auch Azure verf\u00fcgbar und Co-Sell-Partner dieser Anbieter.<\/p>\n\n\n\n<p>Ein weiterer starker globaler Partner ist Tableau. Tableau nutzt Dremio vor allem f\u00fcr den SQL-Datenzugriff auf verteilte Dateisysteme und hat bereits mehrere Kund:innen von der Zusammenarbeit mit Dremio \u00fcberzeugen k\u00f6nnen.<\/p>\n\n\n\n<p>Dremio ist fremdfinanziert und hat k\u00fcrzlich eine Finanzspritze in H\u00f6he von 70 Mio. US$ erhalten.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Das Ziel<\/h2>\n\n\n\n<p>Dremio m\u00f6chte mit seiner Technologie den Zugang zu Daten f\u00fcr analytische Workflows vereinfachen, beschleunigen und dies kosteng\u00fcnstiger gestalten als andere Player im Markt. Hier z\u00e4hlt nicht nur die Technologie-Lizenz, sondern auch der Ansatz, Daten m\u00f6glichst nicht in der Gesamtarchitektur zu bewegen, zu duplizieren und damit Kosten zu verursachen.<\/p>\n\n\n\n<p>Vielmehr verfolgt Dremio den Ansatz, \u00fcber ein nutzerfreundliches Interface verschiedene Sichten auf die Daten f\u00fcr einen schnellen, flexiblen Zugriff auf (verteilte) Daten zu gew\u00e4hren. Dadurch sollen zus\u00e4tzliche persistierte Schichten wie Aggregationen vermieden werden k\u00f6nnen und vor allem den Nutzer:innen eine Plattform gegeben werden, um performante Ad-hoc-Analysen fahren zu k\u00f6nnen.<\/p>\n\n\n\n<p>Als Hauptnutzer:innen werden Business Analyst:innen, Data Scientists und Data Engineers gesehen. Wichtig ist es Dremio dabei, als agnostisches Werkzeug gesehen zu werden. Dremio erm\u00f6glicht die Abfrage unterschiedlicher Datenspeichertechnologien, an unterschiedlichen Standorten (cross-cloud, On Premises \/Cloud, \u2026).<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Die Technologie<\/h2>\n\n\n\n<p>Dremio geht auf Apache Drill zur\u00fcck, eine SQL-Engine f\u00fcr Hadoop. Diese hat sich f\u00fcr analytische Workloads nie so richtig durchsetzen k\u00f6nnen. Als Gr\u00fcnde werden u. a. die Performance und das komplexe Handling genannt.<\/p>\n\n\n\n<p>Einen Schritt weiter geht Apache Arrow, eine Technologie, die sich Dremio zu Nutze macht und von Dremio Co-Gr\u00fcnder &amp; CTO Jaques Nadeau mitentwickelt wurde und weiterhin mitentwickelt wird. Apache Arrow bietet eine sprachen\u00fcbergreifende Entwicklungsplattform f\u00fcr In-Memory Daten und spezifiziert ein standardisiertes sprachunabh\u00e4ngiges Spaltenspeicherformat f\u00fcr flache und hierarchische Daten an.<\/p>\n\n\n\n<p>Dies wird dann interessant, wenn es darum geht, unterschiedliche Datenspeicher mit unterschiedlichen Formaten miteinander zu verkn\u00fcpfen f\u00fcr analytische Abfragen und dabei noch eine gute Performance hinzulegen.<\/p>\n\n\n\n<p>Der Anbieter stellt Konnektoren zu unterschiedlichsten relationalen und nicht-relationalen Speichertechnologien und verteilten Dateisystemen in Dremio bereit. Im n\u00e4chsten Schritt k\u00f6nnen Abfragen auf die angeschlossenen Systeme ausgef\u00fchrt werden. Diese Abfragen sind als virtuelle Data-Sets definiert und werden zum Ausf\u00fchrungszeitpunkt (live) ausgef\u00fchrt.<\/p>\n\n\n\n<p>Jede Abfrage nutzt Beschleunigungsmechanismen wie Massivparalleles-Processing, Query-Optimierung oder Push-Down-Optionen. Der Push-Down erm\u00f6glicht die Delegation von Arbeitslast in die Quellsysteme. Eine der Haupt-Performance-Funktionen in der Dremio-L\u00f6sung nennen sich \u201eReflections\u201c. Sie erinnern an \u201ematerialized views\u201c und persistieren physikalisch optimierte Datendarstellung auf Wunsch in spalten-basierten Parquet-Files.<\/p>\n\n\n\n<p>Mit jeder Abfrage pr\u00fcft Dremio, ob ein persistiertes (vorberechnetes) Zwischenergebnis verf\u00fcgbar ist und spart so Rechenzeit. F\u00fcr die Datensuche in den technischen Metadaten steht ein interner Katalog zur Verf\u00fcgung. Die technischen Metadaten k\u00f6nnen mit Wikis und Tags versehen werden und so auch f\u00fcr den\/die fachlichere\/n Nutzer:in auffindbar werden. Die L\u00f6sung ersetzt keinen Enterprise Datenkatalog, kann aber mit einem integriert werden.<\/p>\n\n\n\n<p>Spannend auf der Roadmap ist vor allem der weitere Ausbau der Reflections. Der Aufbau dieser muss heute noch manuell erfolgen. Hier soll das System zuk\u00fcnftig \u201eintelligent\u201c dabei unterst\u00fctzen mithilfe von Daten aus dem Abfrageverhalten.<\/p>\n\n\n\t\t<div data-elementor-type=\"section\" data-elementor-id=\"3424\" class=\"elementor elementor-3424\" data-elementor-post-type=\"elementor_library\">\n\t\t\t\t\t<section class=\"ob-is-breaking-bad elementor-section elementor-top-section elementor-element elementor-element-d7236a1 elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"d7236a1\" data-element_type=\"section\" data-e-type=\"section\" data-settings=\"{&quot;_ob_bbad_use_it&quot;:&quot;yes&quot;,&quot;_ob_bbad_sssic_use&quot;:&quot;no&quot;}\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-c06ff87\" data-id=\"c06ff87\" data-element_type=\"column\" data-e-type=\"column\" data-settings=\"{&quot;_ob_bbad_is_stalker&quot;:&quot;no&quot;}\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<section class=\"ob-is-breaking-bad ob-bb-inner elementor-section elementor-inner-section elementor-element elementor-element-bdbc1b5 elementor-section-height-min-height elementor-section-content-middle shadow1nohover elementor-section-boxed elementor-section-height-default\" data-dce-background-color=\"#87CDD2\" data-dce-background-overlay-image-url=\"https:\/\/barc.com\/wp-content\/uploads\/2022\/06\/header-test-v2.svg\" data-id=\"bdbc1b5\" data-element_type=\"section\" data-e-type=\"section\" data-settings=\"{&quot;background_background&quot;:&quot;classic&quot;,&quot;_ob_bbad_use_it&quot;:&quot;yes&quot;,&quot;_ob_bbad_sssic_use&quot;:&quot;no&quot;}\">\n\t\t\t\t\t\t\t<div class=\"elementor-background-overlay\"><\/div>\n\t\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-50 elementor-inner-column elementor-element elementor-element-2352c6b elementor-hidden-phone\" data-id=\"2352c6b\" data-element_type=\"column\" data-e-type=\"column\" data-settings=\"{&quot;_ob_bbad_is_stalker&quot;:&quot;no&quot;}\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-ad6d366 elementor-widget elementor-widget-image\" data-id=\"ad6d366\" data-element_type=\"widget\" data-e-type=\"widget\" data-settings=\"{&quot;_ob_widget_stalker_use&quot;:&quot;no&quot;}\" data-widget_type=\"image.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t<img decoding=\"async\" width=\"71\" height=\"70\" src=\"https:\/\/barc.com\/wp-content\/uploads\/2022\/07\/Corporate-Outline_Mail.svg\" class=\"attachment-full size-full wp-image-43585\" alt=\"\" srcset=\"https:\/\/barc.com\/wp-content\/uploads\/\/2022\/07\/Corporate-Outline_Mail.svg 150w, https:\/\/barc.com\/wp-content\/uploads\/\/2022\/07\/Corporate-Outline_Mail.svg 300w, https:\/\/barc.com\/wp-content\/uploads\/\/2022\/07\/Corporate-Outline_Mail.svg 1024w, https:\/\/barc.com\/wp-content\/uploads\/\/2022\/07\/Corporate-Outline_Mail.svg 71w\" sizes=\"(max-width: 71px) 100vw, 71px\">\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t<div class=\"elementor-column elementor-col-50 elementor-inner-column elementor-element elementor-element-1946952\" data-id=\"1946952\" data-element_type=\"column\" data-e-type=\"column\" data-settings=\"{&quot;_ob_bbad_is_stalker&quot;:&quot;no&quot;}\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-18ef7b5 elementor-widget elementor-widget-heading\" data-id=\"18ef7b5\" data-element_type=\"widget\" data-e-type=\"widget\" data-settings=\"{&quot;_ob_widget_stalker_use&quot;:&quot;no&quot;}\" data-widget_type=\"heading.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t<div class=\"elementor-heading-title elementor-size-default\">Gef\u00e4llt Ihnen dieser Beitrag?<\/div>\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-31c0486 elementor-widget elementor-widget-heading\" data-id=\"31c0486\" data-element_type=\"widget\" data-e-type=\"widget\" data-settings=\"{&quot;_ob_widget_stalker_use&quot;:&quot;no&quot;}\" data-widget_type=\"heading.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t<div class=\"elementor-heading-title elementor-size-default\">Wir haben noch viel mehr davon! Schlie\u00dfen Sie sich \u00fcber 25.775 Data &amp; Analytics Professionals an, um der Konkurrenz einen Schritt voraus zu bleiben.<\/div>\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-4a1562c elementor-align-left elementor-mobile-align-center ob-is-butterbutton elementor-widget elementor-widget-button\" data-id=\"4a1562c\" data-element_type=\"widget\" data-e-type=\"widget\" data-settings=\"{&quot;_ob_butterbutton_use_it&quot;:&quot;yes&quot;,&quot;_ob_widget_stalker_use&quot;:&quot;no&quot;}\" data-widget_type=\"button.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<div class=\"elementor-button-wrapper\">\n\t\t\t\t\t<a class=\"elementor-button elementor-button-link elementor-size-sm\" href=\"https:\/\/barc.com\/de\/newsletter\/\">\n\t\t\t\t\t\t<span class=\"elementor-button-content-wrapper\">\n\t\t\t\t\t\t\t\t\t<span class=\"elementor-button-text\">Newsletter abonnieren<\/span>\n\t\t\t\t\t<\/span>\n\t\t\t\t\t<\/a>\n\t\t\t\t<\/div>\n\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<\/div>\n\t\t\n\n\n\n<h3 class=\"wp-block-heading\">Analystenmeinung<\/h3>\n\n\n\n<p>Dremio ist eine Query-Engine f\u00fcr analytische Workloads, pr\u00e4feriert auf (Cloud) Data Lakes. Die Technologie bietet einen Ansatz zur (virtuellen) Zusammenf\u00fchrung der heute komplexen, heterogenen Systemlandschaften.<\/p>\n\n\n\n<p>Vor allem die Idee eines Zugriffslayer \u00fcber verschiedene Cloud-Angebote hinweg erscheint attraktiv und er\u00f6ffnet M\u00f6glichkeiten sich auf mehr als einer Cloud-Plattform zu bewegen und dem\/der Analyst:in viel Flexibilit\u00e4t in der Datenversorgung zu geben. Ein Technologie-\/Vendor Lock-in wird vermieden.<\/p>\n\n\n\n<p>Dremio bezeichnet sich selbst als Query-Engine mit semantischen Layer und \u00fcberl\u00e4sst das Feld der Datenverarbeitung den Spezialist:innen. So gelingt auch die Abgrenzung zu Anbietern wie Databricks oder Denodo. Das Versprechen: hohe Performance zu niedrigen Kosten.<\/p>\n\n\n\n<p>Inwiefern die Performance tats\u00e4chlich \u00fcberzeugt bleibt abzuwarten. Wir freuen uns auf die bevorstehenden Referenzkundengespr\u00e4che und technologischen Deep Dives.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>BARC-Analyst Timm Grosser stellt die Data Lake Engine von Dremio vor.<\/p>\n","protected":false},"author":13,"featured_media":47297,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"site-sidebar-layout":"default","site-content-layout":"default","ast-site-content-layout":"default","site-content-style":"default","site-sidebar-style":"default","ast-global-header-display":"","ast-banner-title-visibility":"","ast-main-header-display":"","ast-hfb-above-header-display":"","ast-hfb-below-header-display":"","ast-hfb-mobile-header-display":"","site-post-title":"","ast-breadcrumbs-content":"","ast-featured-img":"","footer-sml-layout":"","ast-disable-related-posts":"","theme-transparent-header-meta":"default","adv-header-id-meta":"","stick-header-meta":"","header-above-stick-meta":"","header-main-stick-meta":"","header-below-stick-meta":"","astra-migrate-meta-layouts":"set","ast-page-background-enabled":"default","ast-page-background-meta":{"desktop":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"tablet":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"mobile":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""}},"ast-content-background-meta":{"desktop":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"tablet":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"mobile":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""}},"footnotes":""},"categories":[48,150],"tags":[],"plus":[],"content_typ":[209],"layoutvorlage":[],"class_list":["post-16939","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-datenmanagement","category-data-driven-enterprise","content_typ-artikel"],"acf":[],"_links":{"self":[{"href":"https:\/\/barc.com\/de\/wp-json\/wp\/v2\/posts\/16939","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/barc.com\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/barc.com\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/barc.com\/de\/wp-json\/wp\/v2\/users\/13"}],"replies":[{"embeddable":true,"href":"https:\/\/barc.com\/de\/wp-json\/wp\/v2\/comments?post=16939"}],"version-history":[{"count":0,"href":"https:\/\/barc.com\/de\/wp-json\/wp\/v2\/posts\/16939\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/barc.com\/de\/wp-json\/wp\/v2\/media\/47297"}],"wp:attachment":[{"href":"https:\/\/barc.com\/de\/wp-json\/wp\/v2\/media?parent=16939"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/barc.com\/de\/wp-json\/wp\/v2\/categories?post=16939"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/barc.com\/de\/wp-json\/wp\/v2\/tags?post=16939"},{"taxonomy":"plus","embeddable":true,"href":"https:\/\/barc.com\/de\/wp-json\/wp\/v2\/plus?post=16939"},{"taxonomy":"content_typ","embeddable":true,"href":"https:\/\/barc.com\/de\/wp-json\/wp\/v2\/content_typ?post=16939"},{"taxonomy":"layoutvorlage","embeddable":true,"href":"https:\/\/barc.com\/de\/wp-json\/wp\/v2\/layoutvorlage?post=16939"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}