Einleitung
Im letzten Teil der Blogreihe „Mein erster Report mit Power BI“ haben wir begonnen, Daten für einen Bericht abzurufen. Die Daten wurden mit Hilfe von Power Query in Power BI Desktop abgerufen. Nachdem wir nun alle Daten abgeholt haben, können wir diese modellieren. Dazu gibt es in Power BI Desktop die beiden Buttons Daten und Modell. Mit deren Hilfe schaltet man um.
Daten und Modell
Im Bereich Modell kann man Beziehungen zwischen den einzelnen Tabellen (Abfragen aus den Quellen von Power Query) angelegen. Sobald eine Beziehung zwischen zwei Tabellen existiert, wird diese automatisch bei der Anzeige oder beim Filtern verwendet. Bei Beziehungen ist daher immer auf eine richtige Anlage zu achten.
Bei Daten hingegen werden alle Tabellen (bzw. Abfrageergebnisse) angezeigt. Hier kann ich noch Veränderungen an den Daten vornehmen. Zum Beispiel Spalten entfernen, neue Spalten hinzufügen, Datentypen verändern, Formatierungen angeben etc. Alternativ kann man eine Spalte auch ausblenden. Damit wird der Benutzer bei der Berichtsmodellierung nicht mehr angezeigt. Für Verknüpfungen oder Berechnungen kann man die Spalte aber weiter einsetzen. Die Programmiersprache für neue Spalten oder Berechnungen ist DAX und hat ein paar Ähnlichkeiten mit Excel. DAX kann aber sehr komplex sein und ist eigentlich die Sprache für Microsoft PowerPivot.
An dieser Stelle tritt immer wieder die Fragen auf, wo ich denn jetzt etwas machen soll. Viele der Funktionalitäten mit DAX gibt es schließlich auch in Power Query. Als Faustformel sollte immer gelten, was ich bereits in Power Query machen kann, sollte ich auch dort erledigen. Vor allem wenn ich Spalten weglassen kann, sollte dies auch in Power Query bereits passieren. So müssen diese nicht erst geladen werden und benötigen damit auch keinen Speicherplatz.
Wichtig zu erwähnen ist noch, dass Datentypen und Formatierungen nicht das Gleiche sind. Das sieht zwar auf den ersten Blick so aus, aber Datentypen sind die von Power BI Desktop gespeicherten Typen. Formatierungen hingegen sind nur bei der Anzeige im Bericht relevant.
An dieser Stelle sollten auch Hierarchien angelegt werden, sofern es denn welche gibt.
Hierarchie innerhalb des Datums
Bis hierhin haben wir immer noch keinen Bericht gesehen, aber wir haben nun die richtigen Daten zur Verfügung und können im nächsten Teil endlich zur Visualisierung kommen. Hier aber noch der Hinweis: Je mehr Arbeit bereits in ein stabiles Data Warehouse investiert wurde, desto weniger muss noch bei der Beladung und Datenmodellierung angepasst werden. Am besten steht hier ein gut strukturiertes Data Warehouse zur Verfügung.