Explizites Erhöhen
Explizites Erhöhen ist eine Funktion von GoodDatas Extensible Analytics Engine, die Ihnen mehr Flexibilität beim Aggregieren von Metriken in Berichten ermöglicht.
Im Diagramm des logischen Datenmodells (LDM) unten können Metriken, die aus dem Fakt Value aggregiert werden, wie zum Beispiel SELECT SUM(Value)
, durch sämtliche rot markierten Attribute aggregiert werden. Bitte beachten Sie, dass dies die Attribute sind, die auf den Wert zeigen.
Mit explizitem Erhöhen können Sie mit dem Schlüsselwort BY gegen den Grain der Aggregation vorgehen, um die Aggregationsstufe auf ein Attribut festzulegen, nach dem eine bestimmte Metrik sonst nicht aufgeschlüsselt werden könnte.
In dem folgenden Beispiel desselben LDM können Sie sehen, wie Sie mit explizitem Erhöhen die Metrik Einwohnerzahl
nach Shop_ID
aufschlüsseln können, obwohl Shop_ID
sich anscheinend nicht auf den Fakt Einwohnerzahl
bezieht.
Diese Aggregation ist im nachfolgenden Beispiel 1 ausführlicher beschrieben.
Beispiel 1 - Um eine Aggregationsstufe erhöhen
Die folgende Metrik stellt die Gesamtanzahl der Einwohner einer Stadt dar.
SELECT SUM(Number of Residents)
Aus dem unten dargestellten Projekt-LDM ist ersichtlich, dass die Metrik Einwohnerzahl
nach Stadt (Town_ID
) oder Bezirk (County
) aufgeschlüsselt werden kann.
Der daraus resultierende Bericht sieht folgendermaßen aus:
Durch explizites Erhöhen können Sie Metriken nach anderen Attributen aufschlüsseln, die sich nicht direkt auf den grundlegenden Fakt der Metrik beziehen. Sie können beispielsweise deren Definition zum Aufschlüsseln der Metrik Einwohnerzahl
nach Shop_ID
ändern.
SELECT SUM(Number of Residents) BY Shop_ID
Jetzt zeigt der Bericht die Einwohnerzahl
in jeder Stadt, in der die Verkaufsstelle sich befindet. Die Metrik ist auf der Stufe Town_ID
aggregiert.
Nun können Sie die Metrik Einwohnerzahl
mit eine Metrik vergleichen, welche die Bruttoerlöse jeder Verkaufsstelle (d. h. den Gesamtwert aller auf der Stufe Shop_ID
) darstellt.
Um die Bruttoerlöse zu zählen, müssen Sie die folgende Metrik erstellen:
SELECT SUM(Value)
Diese Metrik können Sie nach einem beliebigen zugehörigen Attribut höherer Granularität (siehe rotes Attribut in der ersten obigen Grafik) aufschlüsseln. Dazu müssen Sie diese Attribute auf Berichtsebene hinzufügen.
Fügen Sie dem Bericht zum Beispiel die Attribute County
, Town_ID
und Shop_ID
hinzu. So können Sie eine Korrelation zwischen der Einwohnerzahl der Stadt, in welcher die Verkaufsstelle liegt, und den Bruttoerlösen der Verkaufsstelle herstellen.
Um die Korrelation zwischen den beiden Metriken genauer zu betrachten, entfernen Sie die Attribute County
und Town_ID
aus dem Bericht und zeigen Sie den geänderten Bericht als Streudiagramm an.
Beispiel 2 - Um mehrere Aggregationsstufen erhöhen
Anhand desselben LDM wie in Beispiel 1 können Sie die Manager der erfolgreichsten Verkaufsstellen überprüfen: Berechnen Sie den Gesamttransaktionswert jedes Verkaufsstellenmanagers.
Dieser Manager
ist nicht mit dem Fakt Value
im LDM verknüpft. Durch explizites Erhöhen können Sie Value
auf der Stufe Shop_ID
aggregieren und angeben, dass diese Werte auf der Stufe Mitarbeiterdatensätze
aggregiert werden sollen. Auf diese Weise können Sie nach dem Attribut Manager
mit Bezug auf Mitarbeiterdatensätze
aufschlüsseln.
Schreiben Sie zunächst eine Metrik zum Aggregieren des Wertes
der einzelnen Transaktionen auf der Stufe jeder Verkaufsstelle. So erhalten Sie den Gesamtwert aller in jeder Verkaufsstelle durchgeführten Transaktionen:
SELECT SUM(Value) BY Shop_ID
Dann aggregieren Sie diese Werte auf der Stufe Mitarbeiterdatensätze
.
SELECT ((SELECT SUM(Value) BY Shop_ID)) BY Records of Employee
Zum Schluss fügen Sie die Aggregationsfunktion MAX hinzu, um die Metrik auf Managerebene aufzuschlüsseln.
SELECT MAX(( SELECT (( SELECT SUM(Value) BY Shop_ID)) BY Records of Employee))
Die SELECT-Verschachtelung von SUM verhindert doppeltes Zählen (bei einem Verhältnis Manager-Verkaufsstellenverhältnis von 1:1). Durch Aggregieren mit SUM anstatt mit MAX würde jeder Wert mit der Anzahl der dem Manager und der Verkaufsstelle zugeordneten Mitarbeiteranzahl multipliziert.
Beachten Sie bitte, dass diese verschachtelte Metrik dazu führt, dass Werte doppelt gezählt werden - ein häufig beklagtes Problem bei M:N-Relationen.
Der sich ergebende Bericht zeigt die Aggregation der einzelnen Transaktionswerte – den Gesamterlös der Transaktionen – aufgeschlüsselt nach Verkaufsstellenmanager.
Zwar ist jeder der angezeigten Gesamtwerte einem Manager zugeordnet, aber trotzdem werden sie auf Verkaufsstellenebene aggregiert. Abgleichen der Werte für zwei Manager bedeutet nicht, dass diese in derselben Verkaufsstelle arbeiten. Alexander und Michael sind Manager in verschiedenen Verkaufsstellen.
Um sehen zu können, wer die Verkaufsstellen mit der besten Leistung leitet, und die Bruttoerlöse der Verkaufsstelle eines jeden Managers, müssen Sie zu einem anderen Bildschirm umschalten.
Beispiel 3 - Erweitertes explizites Erhöhen
Sie können auch die Zeit zählen, die im Durchschnitt zwischen beiden ersten Transaktionen der Kunden vergeht.
Durch explizites Erhöhen können Sie das Transaktionsdatum
mit dem Schlüsselwort BY
auf die individuelle Transaktionsstufe festlegen. Dann können Sie die Differenz zwischen den Transaktionsdaten für jeden Kunden berechnen. Damit können Sie die Zeitdauer für jeden Kunden sowie die im Schnitt zwischen den Transaktionen aller Käufer verstreichende Zeit ermitteln.
Zuerst müssen Sie die Daten der Transaktionen zählen. Wählen Sie die Datumswerte der einzelnen Transaktionen aus. Es ist keine Aggregation erforderlich.
SELECT Date (Transaction Date) BY Records of Transaction
Um festzustellen, ob in einem Ausdruck eine Aggregationsfunktion erforderlich ist, müssen Sie den auszuführenden Prozess im LDM des Projekts darstellen:
Durchgangsrichtung | Erforderliche Aggregation |
---|---|
In Pfeilrichtung links-rechts | Dies ist explizites Erhöhen. Es ist keine Aggregation erforderlich. |
In Pfeilrichtung rechts-links | Dies ist Aggregation. Es ist eine Aggregationsfunktion erforderlich. |
Erstellen Sie als nächstes zwei Metriken, die sich auf die erhöhte Metrik des ursprünglichen Transaktionsdatums beziehen:
- Eine Metrik, welche die ersten Kaufdaten filtert
- Eine Metrik, welche die zweiten Kaufdaten filtert
SELECT MAX(Transaction date lifted) WHERE Purchase Number = 1
SELECT MAX(Transaction date lifted) WHERE Purchase Number = 2
Diese Metriken aggregieren das mit einer MAX-Funktion erhöhte Transaktionsdatum und filtern es nach Kauf-Nr. Dies hat folgende Gründe:
- SUM funktioniert, wenn die Daten nur einen Wert enthalten, der mit der Kaufnummer = 2 übereinstimmt. Bei mehreren Werten mit der Kaufnummer = 2 zählt die Metrik die Werte doppelt.
- AVG reflektiert die Absicht, die mit der Metrik verfolgt wird. Bei AVG dauert die Berechnung jedoch länger.
Erstellen Sie zum Schluss eine Metrik zur Berechnung der Differenz zwischen den Kaufdatumsmetriken. Dann können Sie das Endergebnis nach Shopper (Käufer)
aufschlüsseln, dem Attribut auf Berichtsebene.
SELECT AVG(Second purchase date - First purchase date)
Der daraus resultierende Bericht zeigt die Dauer zwischen dem ersten und dem zweiten Besuch, aufgeschlüsselt nach dem Käuferattribut.
Wenn wir die Metrik Total Value
zu dem Bericht (SELECT SUM(Value)
) hinzufügen, können wir die Dauer zwischen Ersttransaktionen und den verausgabten Gesamtbetrag zueinander in Korrelation setzen.
Um herauszufinden, welcher Zeitraum im Schnitt zwischen den beiden ersten Transaktionen aller Käufer liegt, müssen wir die Metrik ändern und alle Berichtsattribute entfernen:
SELECT AVG((SELECT Second purchase date - First purchase date BY Shopper))