Explizites Erhöhen

Explizites Erhöhen ist eine Funktion von GoodDatas Extensible Analytics Engine, die Ihnen mehr Flexibilität beim Aggregieren von Metriken in Berichten ermöglicht.

Im Diagramm des logischen Datenmodells (LDM) unten können Metriken, die aus dem Fakt Value aggregiert werden, wie zum Beispiel SELECT SUM(Value), durch sämtliche rot markierten Attribute aggregiert werden. Bitte beachten Sie, dass dies die Attribute sind, die auf den Wert zeigen.

Mit explizitem Erhöhen können Sie mit dem Schlüsselwort BY gegen den Grain der Aggregation vorgehen, um die Aggregationsstufe auf ein Attribut festzulegen, nach dem eine bestimmte Metrik sonst nicht aufgeschlüsselt werden könnte.

In dem folgenden Beispiel desselben LDM können Sie sehen, wie Sie mit explizitem Erhöhen die Metrik Einwohnerzahl nach Shop_ID aufschlüsseln können, obwohl Shop_ID sich anscheinend nicht auf den Fakt Einwohnerzahl bezieht.

Diese Aggregation ist im nachfolgenden Beispiel 1 ausführlicher beschrieben.

Beispiel 1 - Um eine Aggregationsstufe erhöhen

Die folgende Metrik stellt die Gesamtanzahl der Einwohner einer Stadt dar.

SELECT SUM(Number of Residents)

Aus dem unten dargestellten Projekt-LDM ist ersichtlich, dass die Metrik Einwohnerzahl nach Stadt (Town_ID) oder Bezirk (County) aufgeschlüsselt werden kann.

Der daraus resultierende Bericht sieht folgendermaßen aus:

Durch explizites Erhöhen können Sie Metriken nach anderen Attributen aufschlüsseln, die sich nicht direkt auf den grundlegenden Fakt der Metrik beziehen. Sie können beispielsweise deren Definition zum Aufschlüsseln der Metrik Einwohnerzahl nach Shop_ID ändern.

SELECT SUM(Number of Residents) BY Shop_ID

Jetzt zeigt der Bericht die Einwohnerzahl in jeder Stadt, in der die Verkaufsstelle sich befindet. Die Metrik ist auf der Stufe Town_ID aggregiert.

Nun können Sie die Metrik Einwohnerzahl mit eine Metrik vergleichen, welche die Bruttoerlöse jeder Verkaufsstelle (d. h. den Gesamtwert aller auf der Stufe Shop_ID) darstellt.

Um die Bruttoerlöse zu zählen, müssen Sie die folgende Metrik erstellen:

SELECT SUM(Value)

Diese Metrik können Sie nach einem beliebigen zugehörigen Attribut höherer Granularität (siehe rotes Attribut in der ersten obigen Grafik) aufschlüsseln. Dazu müssen Sie diese Attribute auf Berichtsebene hinzufügen.

Fügen Sie dem Bericht zum Beispiel die Attribute County, Town_ID und Shop_ID hinzu. So können Sie eine Korrelation zwischen der Einwohnerzahl der Stadt, in welcher die Verkaufsstelle liegt, und den Bruttoerlösen der Verkaufsstelle herstellen.

Beispiel 2 - Um mehrere Aggregationsstufen erhöhen

Anhand desselben LDM wie in Beispiel 1 können Sie die Manager der erfolgreichsten Verkaufsstellen überprüfen: Berechnen Sie den Gesamttransaktionswert jedes Verkaufsstellenmanagers.

Dieser Manager ist nicht mit dem Fakt Value im LDM verknüpft. Durch explizites Erhöhen können Sie Value auf der Stufe Shop_ID aggregieren und angeben, dass diese Werte auf der Stufe Mitarbeiterdatensätze aggregiert werden sollen. Auf diese Weise können Sie nach dem Attribut Manager mit Bezug auf Mitarbeiterdatensätze aufschlüsseln.

Schreiben Sie zunächst eine Metrik zum Aggregieren des Wertes der einzelnen Transaktionen auf der Stufe jeder Verkaufsstelle. So erhalten Sie den Gesamtwert aller in jeder Verkaufsstelle durchgeführten Transaktionen:

SELECT SUM(Value) BY Shop_ID

Dann aggregieren Sie diese Werte auf der Stufe Mitarbeiterdatensätze.

SELECT ((SELECT SUM(Value) BY Shop_ID)) BY Records of Employee

Zum Schluss fügen Sie die Aggregationsfunktion MAX hinzu, um die Metrik auf Managerebene aufzuschlüsseln.

SELECT MAX(( SELECT (( SELECT SUM(Value) BY Shop_ID)) BY Records of Employee))

Die SELECT-Verschachtelung von SUM verhindert doppeltes Zählen (bei einem Verhältnis Manager-Verkaufsstellenverhältnis von 1:1). Durch Aggregieren mit SUM anstatt mit MAX würde jeder Wert mit der Anzahl der dem Manager und der Verkaufsstelle zugeordneten Mitarbeiteranzahl multipliziert.

Beachten Sie bitte, dass diese verschachtelte Metrik dazu führt, dass Werte doppelt gezählt werden - ein häufig beklagtes Problem bei M:N-Relationen.

Der sich ergebende Bericht zeigt die Aggregation der einzelnen Transaktionswerte – den Gesamterlös der Transaktionen – aufgeschlüsselt nach Verkaufsstellenmanager.

 

Um sehen zu können, wer die Verkaufsstellen mit der besten Leistung leitet, und die Bruttoerlöse der Verkaufsstelle eines jeden Managers, müssen Sie zu einem anderen Bildschirm umschalten.

Beispiel 3 - Erweitertes explizites Erhöhen

Sie können auch die Zeit zählen, die im Durchschnitt zwischen beiden ersten Transaktionen der Kunden vergeht.

Durch explizites Erhöhen können Sie das Transaktionsdatum mit dem Schlüsselwort BY auf die individuelle Transaktionsstufe festlegen. Dann können Sie die Differenz zwischen den Transaktionsdaten für jeden Kunden berechnen. Damit können Sie die Zeitdauer für jeden Kunden sowie die im Schnitt zwischen den Transaktionen aller Käufer verstreichende Zeit ermitteln.

Zuerst müssen Sie die Daten der Transaktionen zählen. Wählen Sie die Datumswerte der einzelnen Transaktionen aus. Es ist keine Aggregation erforderlich.

SELECT Date (Transaction Date) BY Records of Transaction

Erstellen Sie als nächstes zwei Metriken, die sich auf die erhöhte Metrik des ursprünglichen Transaktionsdatums beziehen:

  • Eine Metrik, welche die ersten Kaufdaten filtert
  • Eine Metrik, welche die zweiten Kaufdaten filtert

 

SELECT MAX(Transaction date lifted) WHERE Purchase Number = 1
SELECT MAX(Transaction date lifted) WHERE Purchase Number = 2

Diese Metriken aggregieren das mit einer MAX-Funktion erhöhte Transaktionsdatum und filtern es nach Kauf-Nr. Dies hat folgende Gründe:

  • SUM funktioniert, wenn die Daten nur einen Wert enthalten, der mit der Kaufnummer = 2 übereinstimmt. Bei mehreren Werten mit der Kaufnummer = 2 zählt die Metrik die Werte doppelt.
  • AVG reflektiert die Absicht, die mit der Metrik verfolgt wird. Bei AVG dauert die Berechnung jedoch länger.

Erstellen Sie zum Schluss eine Metrik zur Berechnung der Differenz zwischen den Kaufdatumsmetriken. Dann können Sie das Endergebnis nach Shopper (Käufer) aufschlüsseln, dem Attribut auf Berichtsebene.

SELECT AVG(Second purchase date - First purchase date)

Der daraus resultierende Bericht zeigt die Dauer zwischen dem ersten und dem zweiten Besuch, aufgeschlüsselt nach dem Käuferattribut.

Wenn wir die Metrik Total Value zu dem Bericht (SELECT SUM(Value)) hinzufügen, können wir die Dauer zwischen Ersttransaktionen und den verausgabten Gesamtbetrag zueinander in Korrelation setzen.

Um herauszufinden, welcher Zeitraum im Schnitt zwischen den beiden ersten Transaktionen aller Käufer liegt, müssen wir die Metrik ändern und alle Berichtsattribute entfernen:

SELECT AVG((SELECT Second purchase date - First purchase date BY Shopper))

 

Average duration across all shoppers