Mein erster Report mit Power BI (Teil 2)

Im letzten Teil haben wir begonnen, Daten für einen Bericht abzurufen. Die Daten wurden mit Hilfe von Power Query in Power BI Desktop abgerufen. Nachdem wir nun alle Daten abgeholt haben, können wir diese modellieren. Dazu gibt es in Power BI Desktop die beiden Buttons Daten und Modell. Mit deren Hilfe kann umgeschaltet werden.

power-bi-daten-modell

Daten und Modell

Im Bereich Modell können Beziehungen zwischen den einzelnen Tabellen (Abfragen aus den Quellen von Power Query) angelegt werden. Sobald eine Beziehung zwischen zwei Tabellen existiert, wird diese automatisch bei der Anzeige oder beim Filtern verwendet. Bei Beziehungen ist daher immer auf eine richtige Anlage zu achten.

Bei Daten hingegen werden alle Tabellen (bzw. Abfrageergebnisse) angezeigt. Hier kann ich noch Veränderungen an den Daten vornehmen. Zum Beispiel Spalten entfernen, neue Spalten hinzufügen, Datentypen verändern, Formatierungen angeben etc. Alternativ kann eine Spalte auch ausgeblendet werden und wird damit dem Benutzer bei der Berichtsmodellierung nicht mehr angezeigt. Für Verknüpfungen oder Berechnungen kann die Spalte aber weiter eingesetzt werden. Die Programmiersprache für neue Spalten oder Berechnungen ist DAX und hat ein paar Ähnlichkeiten mit Excel. DAX kann aber sehr komplex sein und ist eigentlich die Sprache für Microsoft PowerPivot.

An dieser Stelle tritt immer wieder die Fragen auf, wo ich denn jetzt etwas machen soll. Viele der Funktionalitäten mit DAX gibt es schließlich auch in Power Query. Als Faustformel sollte immer gelten, was ich bereits in Power Query machen kann, sollte ich auch dort erledigen. Vor allem wenn ich Spalten weglassen kann, dann sollten diese auch bereits in Power Query weggelassen werden. So müssen diese nicht erst geladen werden und benötigen damit auch keinen Speicherplatz.

Wichtig zu erwähnen ist noch, dass Datentypen und Formatierungen nicht das Gleiche sind. Das sieht zwar auf den ersten Blick so aus, aber Datentypen sind die von Power BI Desktop gespeicherten Typen. Formatierungen hingegen sind nur bei der Anzeige im Bericht relevant.

An dieser Stelle sollten auch Hierarchien angelegt werden, sofern es denn welche gibt.

date-hierarchy

Hierarchie innerhalb des Datums

Auch ist es hier wichtig die richtigen Aggregate festzulegen. Normalerweise wird in einem Bericht in irgendeiner Weise aggregiert. Also kann die Summe, die Anzahl, das Maximum etc. für Kennzahlen genommen werden.

Bis hierhin haben wir immer noch keinen Bericht gesehen, aber wir haben nun die richtigen Daten zur Verfügung und können im nächsten Teil endlich zur Visualisierung kommen. Hier aber noch der Hinweis: Je mehr Arbeit bereits in ein stabiles Data Warehouse investiert wurde, desto weniger muss noch bei der Beladung und Datenmodellierung angepasst werden. Am besten steht hier ein gut strukturiertes Data Warehouse zur Verfügung.

Teilen:

Share on xing
Share on email
Martin Kopp

Martin Kopp

Schreiben Sie einen Kommentar

Blog abonnieren:
Loading

Weitere Beiträge: