Read the book: «SAP Data Warehouse Cloud»
Klaus-Peter Sauer
SAP® Data Warehouse Cloud
Klaus-Peter Sauer
SAP® Data Warehouse Cloud
ISBN:978-3-96012-073-5 (E-Book)
Lektorat:Anja Achilles
Korrektorat: Die Korrekturstube
Coverdesign: Philip Esch
Coverfoto: © wisoot | ID 171917308 – stock.adobe.com
Satz & Layout: Johann-Christian Hanke
1. Auflage 2021
© Espresso Tutorials GmbH, Gleichen 2021
URL: www.espresso-tutorials.de
Das vorliegende Werk ist in allen seinen Teilen urheberrechtlich geschützt. Alle Rechte sind vorbehalten, insbesondere das Recht der Übersetzung, des Vortrags, der Reproduktion und der Vervielfältigung. Espresso Tutorials GmbH, Bahnhofstr. 2, 37130 Gleichen, Deutschland.
Ungeachtet der Sorgfalt, die auf die Erstellung von Text und Abbildungen verwendet wurde, können weder der Verlag noch die Autoren oder Herausgeber für mögliche Fehler und deren Folgen eine juristische Verantwortung oder Haftung übernehmen.
Feedback: Wir freuen uns über Fragen und Anmerkungen jeglicher Art. Bitte senden Sie diese an: info@espresso-tutorials.com.
Inhaltsverzeichnis
Cover
Titelseite
Coypright/Impressum
Vorwort
1 Einführung
1.1 Anforderungen an moderne Systeme
1.2 Überblick und Grundideen
1.3 Typische Anwendungsfälle
1.4 Architekturüberblick
1.5 Navigation im System
1.6 Systemvoraussetzungen
1.7 Testsystem und Release-Zyklus
2 Datenmanagement mit Spaces
2.1 Space Management
2.2 Allgemeine Space-Einstellungen
2.3 Zuordnung von Benutzern
2.4 Quellsysteme
2.5 Datenbankbenutzer und externe Schnittstellen
2.6 Zeitdaten
2.7 Space-Auditierung und -Monitoring
3 Datenmodellierung im Data Builder
3.1 Data Builder im Überblick
3.2 Tabellen-Editor
3.3 Hierarchien
3.4 View-Editor
3.5 SQL-View-Editor
3.6 Entity-Relationship-Modell-Editor
3.7 Data-Flow-Editor
3.8 File Upload im Data Builder
3.9 Datenmodellierung im Open-SQL-Schema
3.10 Explorer
4 Semantische Modellierung im Business Builder
4.1 Business Builder im Überblick
4.2 Business-Entitäten
4.3 Faktenmodell
4.4 Consumption-Modelle und ihre Perpektiven
4.5 Berechtigungsszenarien
4.6 Versionierung von Business-Objekten
5 Hybride Einsatzszenarien
5.1 Hybrid mit SAP HANA und HANA Cloud
5.2 Hybrid mit SAP BW und BW/4HANA
6 Konfiguration und Sicherheit
6.1 Rollen
6.2 Benutzer
6.3 Sicherer Datenzugriff
6.4 Konfiguration
6.5 Content Network Transport
6.6 Integration mit SAP Analytics Cloud
7 Ausblick
A Der Autor
B Quellenverzeichnis
D Disclaimer
Willkommen bei Espresso Tutorials!
Unser Ziel ist es, SAP-Wissen wie einen Espresso zu servieren: Auf das Wesentliche verdichtete Informationen anstelle langatmiger Kompendien – für ein effektives Lernen an konkreten Fallbeispielen. Viele unserer Bücher enthalten zusätzlich Videos, mit denen Sie Schritt für Schritt die vermittelten Inhalte nachvollziehen können. Besuchen Sie unseren YouTube-Kanal mit einer umfangreichen Auswahl frei zugänglicher Videos: https://www.youtube.com/user/EspressoTutorials.
Kennen Sie schon unser Forum? Hier erhalten Sie stets aktuelle Informationen zu Entwicklungen der SAP-Software, Hilfe zu Ihren Fragen und die Gelegenheit, mit anderen Anwendern zu diskutieren: http://www.fico-forum.de.
Eine Auswahl weiterer Bücher von Espresso Tutorials:
Christoph Kretner & Jascha Kanngießer: Berechtigungen in SAP® BW, HANA und BW/4HANA
Frank Riesner, Klaus-Peter Sauer:SAP BW/4HANA® und BW auf HANA – 2., erweiterte Auflage
Jürgen Noe: Praxishandbuch SAP® Business Warehouse mit BW/4HANA
Martin Munzel, Renata Munzel: Projektcontrolling mit SAP® PS
Ulrich Bähr, Axel Treusch: Praxisbuch SAP® Interactive Forms und Adobe LiveCycle Designer
Jörg Böke:Schnelleinstieg in SQLScript für SAP HANA®
Dirk Vahlkamp, Leon Vahlkamp: Smart Predict in SAP® Analytics Cloud
Vorwort
Neue Software-Produkte wecken stets den Bedarf an weiterführenden Informationen. Bei SAP Data Warehouse Cloud (DWC) ist das nicht anders. Neben der Online-Hilfe existieren bisher kaum Informationsquellen, die einen kompakten Überblick über die gesamte Software-Lösung bieten. Genau diese Lücke soll dieses Buch schließen.
Für wen ist das Buch?
Das vorliegende Buch adressiert Benutzer in unterschiedlichen Arbeitsbereichen der Fachabteilungen und der Informationstechnologie (IT). Im zuletzt genannten Umfeld sind das zumeist SAP-Berater und -Administratoren, aber auch Datenmodellierer und BI-Spezialisten, während es in der Fachabteilung typischerweise auf Power-User und Anwender zielt, die es gewohnt sind, Daten aus unterschiedlichen Bereichen selbstständig zu verknüpfen.
Vorkenntnisse zu den Themen »Analytics« und »Business Intelligence« sind für ein besseres Verständnis hilfreich; insbesondere, wie ein Data Warehouse funktioniert, warum Daten modelliert und wie Daten zwischen Systemen bewegt und transformiert werden.
Zum Aufbau des Buches
Diese Handreichung startet mit einem Überblick über die Grundideen und über typische Anwendungsfälle, die von der Software abgedeckt werden. Nach einer kurzen Erläuterung der Architektur werden die ersten Schritte der Navigation im System erklärt.
Die weitere Gliederung des Buches entspricht den wesentlichen Funktionsbereichen der Software: Datenmanagement mit Spaces, Datenmodellierung und -flüsse im Data Builder, semantische Modellierung im Business Layer sowie administrative Themen und zum Abschluss Sicherheitsaspekte. Dazwischen finden Sie ein kurzes Kapitel speziell zu hybriden Einsatzszenarien, die bei vielen Kunden eine wesentliche Rolle spielen.
Da es sich bei Data Warehouse Cloud um ein recht neues Produkt der SAP handelt, gebe ich Ihnen zum Ende einen Ausblick darauf, was im Jahr 2021 und darüber hinaus noch an Funktionen und Innovationen zu erwarten ist.
Was nicht im Buch zu finden ist
Theoretische Grundlagen zu Datenbanken, Data-Warehouse-Systemen und zur Datenmodellierung werden nicht erklärt. Ebenso verzichte ich auf eine detaillierte Beschreibung der unterschiedlichen Quellsysteme und deren Funktionen.
Weiterhin finden Sie weder SAP Analytics Cloud noch den Story Builder oder Business Content näher erläutert, auch die Planung ist kein Bestandteil dieses Buches. Zu all diesen Themen existiert bereits genügend weiterführende Literatur.
Cloud-Software
Bei SAP Data Warehouse Cloud handelt es sich um eine Cloud-Software mit einem sehr agilen Entwicklungszyklus. In der Regel erscheinen 14-tägig neue Versionen, die der Nomenklatur [JAHR.VERSION]
folgen. Somit ist davon auszugehen, dass sich im Laufe der Zeit Veränderungen zu den im Buch beschriebenen Abläufen und Bildschirmmasken ergeben. In Abhängigkeit von der Bildschirmauflösung und der Fenstergröße Ihres Browsers kann die Software bei Ihnen etwas anders aussehen als in diesem Buch abgebildet. Daneben werden in die Software auch neue Funktionen Einzug halten. Einen Ausblick auf bereits angekündigte Funktionen finden Sie im letzten Kapitel.
Das vorliegende Werk basiert auf der Version 2021.13.
Linksammlung zum Buch
Viele der im Buch angesprochenen Themen mögen für Sie von besonderem Interesse sein, sodass Sie sich damit eingehender beschäftigen möchten. Hierfür habe ich Ihnen eine umfassende Auflistung weiterführender Links zusammengestellt, die Sie unter https://www.espresso-tutorials.de/sap-data-warehouse-cloud/ aufrufen können.
Danksagung
Ein Buch zu schreiben, bedeutet, einen langen Weg zu gehen, dessen Ziel ohne die Unterstützung anderer kaum zu erreichen ist. Auch dieses Werk wäre ohne die Hilfe zahlreicher Menschen nicht möglich gewesen. Daher möchte ich die Gelegenheit wahrnehmen, mich hierfür zu bedanken.
An erster Stelle danke ich meiner Ehefrau Martina Andrea. Du hast mir immer die nötige Unterstützung gegeben, auch wenn dieses weitere Buchprojekt unsere gemeinsame Zeit wieder einmal auf ein Minimum reduziert hat. Du bist mein größter Schatz!
Mein Dank gilt zudem allen SAP-Kollegen, die mir mit Informationen und Rat zur Seite standen. Zu nennen sind hier insbesondere San Tran, Jascha Kanngießer, Amogh Kulkarni, Gordon Witzel, Heiko Scheider, Dr. Ulrich Christ und vor allem Axel Meier.
Ein ganz besonderer Dank geht an Lothar Henkes! Habʼ vielen Dank für unsere Freundschaft und die langjährige, vertrauensvolle Zusammenarbeit. Ich wünsche Dir ganz viel Spaß und wenig Langeweile im Ruhestand.
Schließlich danke ich Martin Munzel und Anja Achilles sowie dem ganzen Team von Espresso Tutorials für die sehr angenehme und professionelle Zusammenarbeit. Ihr seid klasse!
In den Text sind Kästen eingefügt, um wichtige Informationen besonders hervorzuheben. Jeder Kasten ist zusätzlich mit einem Piktogramm versehen, das diesen genauer klassifiziert:
Hinweis
Hinweise bieten praktische Tipps zum Umgang mit dem jeweiligen Thema.
Beispiel
Beispiele dienen dazu, ein Thema besser zu illustrieren.
Achtung
Warnungen weisen auf mögliche Fehlerquellen oder Stolpersteine im Zusammenhang mit einem Thema hin.
Die Form der Anrede
Um den Lesefluss nicht zu beeinträchtigen, verwenden wir im vorliegenden Buch bei personenbezogenen Substantiven und Pronomen zwar nur die gewohnte männliche Sprachform, meinen aber gleichermaßen Personen weiblichen und diversen Geschlechts.
Hinweis zum Urheberrecht
Sämtliche in diesem Buch abgedruckten Screenshots unterliegen dem Copyright der SAP SE. Alle Rechte an den Screenshots hält die SAP SE. Der Einfachheit halber haben wir im Rest des Buches darauf verzichtet, dies unter jedem Screenshot gesondert auszuweisen.
1 Einführung
Die SAP bietet mit Data Warehouse Cloud einen neuen Software-Service in der Cloud an. Es handelt sich dabei um einen vollständigen End-to-End-Service, der von der Datenintegration, über Transformationen und Modellierungen sowie einem semantischen Business Layer bis hin zum Dashboard alle erforderlichen Funktionalitäten mitbringt. Die SAP geht bei dieser Lösung über den reinen Analytics- und Reporting-Bereich hinaus und bietet ein Werkzeug zur Self-Service-Modellierung an.
Sie erhalten zunächst einen Gesamtüberblick und lernen die typischen Anwendungsfälle für die Lösung kennen, bevor die Architektur, die Navigation im System und die Benutzereinstellungen näher erklärt werden.
1.1 Anforderungen an moderne Systeme
Data Warehouse Cloud wurde von der SAP im November 2019 auf den Markt gebracht, ist also noch ein junges Produkt mit viel Entwicklungspotenzial. Die Lösung will Benutzern aus den Fachabteilungen und der IT ermöglichen, gemeinsam ein skalierbares analytisches Informationssystem aufzubauen, welches die Anforderungen an moderne, zukunftsfähige Lösungen erfüllt.
Die häufigsten Systemanforderungen vonseiten der IT der Kunden sind Elastizität und Skalierbarkeit, Investitionsschutz in Bezug auf bestehende Lösungen und angrenzende Systeme, Einfachheit bezüglich Aufbau, Weiterentwicklung und Betrieb sowie nicht zuletzt Kosteneffizienz. Dabei muss die korrekte Harmonisierung, Integration und Konsolidierung von Stamm- und Bewegungsdaten sichergestellt sein.
Aufseiten der Fachabteilung werden sehr oft die Punkte Agilität und Schnelligkeit genannt, um möglichst rasch zu werthaltigen Erkenntnissen (Time-to-Value) zu gelangen. Aber auch Flexibilität bei der Verwendung weiterer Werkzeuge zur Analyse und Datenaufbereitung sowie die einfache Kollaboration mit Kollegen und anderen Abteilungen sind sehr wichtige Voraussetzungen, um die Mitarbeiter zu befähigen, selbst neue Erkenntnisse zu generieren. Vielfach gefordert wird außerdem der einfache Zugang zu Daten, um die Demokratisierung von Informationen im Unternehmen weiter voranzutreiben und zentrale Unternehmensdaten in Eigenregie mit lokalen bzw. externen Daten verknüpfen zu können.
1.2 Überblick und Grundideen
SAP Data Warehouse Cloud ermöglicht Anwendern den schrittweisen Aufbau eines modernen, cloudbasierten Data Warehouse. Dabei können sowohl vorhandene Data Warehouses als auch beliebige On-Premises- oder cloudbasierte Datenquellen hinzugefügt und nahtlos miteinander verknüpft werden.
Lösung für Fachabteilung und IT
Traditionell wird der Aufbau einer Data-Warehouse-Landschaft von der IT-Abteilung vorangetrieben, insbesondere wegen der oft anspruchsvollen technischen Umsetzung. Mit Data Warehouse Cloud erfährt dieser Anwenderkreis eine Erweiterung, indem sie Fachbereiche und IT auf einer Plattform näher zusammenbringt.
Anwender aus Fachabteilungen sollen eigene Business-Modelle, KPIs (Key Performance Indicators) und Analysen erstellen können, ohne tiefgreifende IT-Kenntnisse zu besitzen. Ihnen soll es möglich sein, Unternehmensdaten mit ihren lokalen Daten flexibel anzureichern, um so neue Kennzahlen zu generieren und daraus Erkenntnisse zu gewinnen. Entscheidende Voraussetzungen hierfür sind intuitiv bedienbare grafische Benutzeroberflächen und Editoren, die auch als »Low-Code/No-Code«-Werkzeuge bezeichnet werden.
IT-Spezialisten bevorzugen hingegen oft code- und scriptbasierte Editoren, in denen sie direkt SQL-Anweisungen und -Prozeduren programmieren können. Die Offenheit der Lösung ermöglicht auch den Einsatz externer Werkzeuge. Damit können Entwickler in Verbindung mit Data Warehouse Cloud weiterhin ihre gewohnten Tools nutzen.
End-to-End-Lösung
Data Warehouse Cloud ist ein vollständiger End-to-End-Software-Service in der Cloud. Integriert in einer Lösung, enthält es Konnektoren zu unterschiedlichsten Quellsystemen, On-Premises oder in der Cloud, sowie diverse Möglichkeiten zur Datentransformation und -modellierung. Zusätzlich ist SAP Analytics Cloud (SAC) ein integraler Bestandteil der Lösung, damit Sie direkt Analysen und Dashboards erstellen können.
Virtueller Zugriff versus Persistenz
Der Name »Data Warehouse Cloud« legt zwar nahe, dass sich die Daten ebenfalls in der Cloud befinden, das ist aber nicht zwingend notwendig. Über einen virtuellen Zugriff (Remote Access) können Daten aus sehr vielen Quellen genutzt werden, ohne dass sie – wie früher üblich – erst in das System kopiert werden müssen. Auf diese Weise können Sie ein »virtuelles« Data Warehouse aufbauen. In Data Warehouse Cloud wird dafür der Begriff Remote-Tabellen verwendet. Welche Konnektoren einen virtuellen Zugriff auf Remote-Tabellen erlauben, wird in Abschnitt 3.4.5 im Einzelnen erklärt.
Wenn Sie die Daten zu einem späteren Zeitpunkt doch persistieren möchten, können Sie komfortabel wählen, ob Sie sie in Echtzeit replizieren oder als Snapshot bzw. persistierten View ablegen möchten – automatisiert und regelmäßig einplanbar. Wichtig zu wissen, ist, dass Sie dabei das Datenmodell nicht verändern müssen. Die Umstellung von Remote-Zugriff auf Echtzeitreplikation bzw. Snapshot nehmen Sie direkt an der Remote-Tabelle vor. Alle darauf aufbauenden Modelle bleiben davon unberührt.
Isolierte Arbeitsbereiche
Alle Daten werden in virtuellen und isolierten Arbeitsbereichen, den sogenannten Spaces, abgelegt oder verknüpft. Sie können beliebige Arbeitsbereiche für Projekte, einmalige Aufgaben, Fachthemen oder -abteilungen anlegen, die von der IT oder auch der Fachabteilung verwaltet werden. Spaces ermöglichen damit den Spagat zwischen Agilität und IT-Governance.
Die IT-Abteilung gibt Fachbereichen Zugriff auf bestehende Datenbestände, die zentral verwaltet und bereits konsolidiert bzw. harmonisiert sind, ohne die Daten erneut zu kopieren. Dies können beispielsweise Finanz- und Controlling-Daten oder auch zentrale Stammdaten sein.
Die Fachabteilung wiederum kann diese zentralen Daten im eigenen Space mit ihren lokalen Daten anreichern. Indem sie die Daten kombiniert und eigene KPIs erstellt, lassen sich neue Erkenntnisse gewinnen.
Self-Service-Modellierung
Anwender aus Fachabteilungen sollen in der Lage sein, eigene Modelle, KPIs und Analysen zu erstellen. Dabei wird der Zugriff auf bestehende Daten gewährt, die von der IT- oder anderen Fachabteilungen zur Verfügung gestellt werden. Unternehmensdaten können so mit lokalen Daten flexibel angereichert werden, um neue Modelle und Kennzahlen zu entwickeln.
Diese neuen Modelle lassen sich mit anderen Fachanwendern teilen, um die Zusammenarbeit zwischen den Abteilungen zu stärken, ohne die Daten ständig kopieren zu müssen. Dadurch werden dem Endbenutzer Informationen in einem digitalen Format zugänglich gemacht, über das sich Daten ohne Hilfe von außen sammeln und analysieren lassen. Dieser Prozess wird auch als Datendemokratisierung bezeichnet.
Semantische Schicht
Die semantische Schicht im Business Builder bietet die Möglichkeit der Abstraktion von oft komplexen und sehr technischen Datenmodellen in Objekte mit normaler Sprache. So erstellen Sie wiederverwendbare Objekte, anhand derer andere Anwender die Daten sofort verstehen. Sie können zudem die Beziehungen zwischen Elementen in Ihrem Datenmodell definieren und Ihre Datenfelder mit weiteren Geschäftsinformationen anreichern.
Um die semantische Modellierung im Sinne einer Self-Service-Modellierung nutzen zu können, benötigen Sie einen guten Grundstock an Entitäten und analytischen Modellen, damit sich die Benutzer einfach an bestehenden Objekten bedienen können, um eigene Consumption-Modelle oder Perspektiven zu erstellen.
Offenheit
Die Offenheit der Lösung ist ein ganz zentraler Bestandteil des Konzepts und zeigt sich auf allen Ebenen: bei Werkzeugen, Daten und Schnittstellen.
In Bezug auf die Datenintegration bedeutet dies Konnektivität sowohl zu klassischen On-Premises-Systemen als auch zu cloudbasierten Software-Lösungen, unabhängig davon, ob es sich dabei um SAP-Systeme handelt oder nicht. Eine gute Integration in eine bestehende SAP-Landschaft mit unterschiedlichen Lösungen wird vom Kunden ohnehin vorausgesetzt. Diesbezüglich deckt Data Warenhause Cloud bereits eine breite Palette von Quellsystemen ab.
Reichen die ausgelieferten Quellsystemverbindungen nicht aus, können Sie beliebige externe Werkzeuge (z.B. SAP Data Services, SAP Data Intelligence, Informatica, SnapLogic, Adverity und andere) zur Datenintegration verwenden, sofern diese einen SQL-basierten HANA-Konnektor anbieten. Dabei werden die Daten in ein offenes SQL-Schema geschrieben, in dem Sie außerdem SQL-basiert Datenmodellierungen vornehmen und diese nahtlos in die weitere Modellierung mit Data Warehouse Cloud integrieren können. So kommen die in Unternehmen häufig vorhandenen SQL-Kenntnisse zum Einsatz.
Gleichzeitig lassen sich über ein offenes SQL-Schema die Bibliotheken für maschinelles Lernen aus dem HANA-Cloud-Scriptserver nutzen, um Data-Science-Projekte auf den vorhandenen Datenbeständen durchzuführen.
Für Analytics-Werkzeuge von Drittanbietern steht ebenfalls eine SQL-Schnittstelle zur Verfügung. Die weitere Roadmap sieht darüber hinaus Schnittstellen auf der Ebene von Spaces und der Datenmodellierung vor, über die Data-Warehouse-Cloud-Objekte von externen Werkzeugen erzeugt werden können.