Présentation de la plateforme GoodData
La plateforme GoodData est un outil d’analyse de données de bout en bout sur le cloud : capturez et chargez des données à partir de nombreuses sources de données différentes puis construisez des métriques et créez des rapports et des tableaux de bord.
Grâce à la nature modulable et à l’adaptabilité de la plateforme GoodData, vous pouvez construire votre propre pipeline de données, concevoir votre propre modèle de données logique et proposer des données analytiques personnalisées et réutilisables.
Avec la plateforme GoodData, vous avez accès à des outils SDK puissants ainsi qu’à une riche bibliothèque d’API REST (voir Référence d’API).
Couches de la plateforme GoodData
La plateforme GoodData comprend les couches suivantes :
Présentation : appelée le portail GoodData, la couche présentation de la plateforme GoodData est une interface web intuitive où construire et manipuler vos métriques, tableaux de bord et perceptions. Les utilisateurs authentifiés peuvent accéder au portail GoodData à partir de n’importe quel navigateur web moderne équipé de JavaScript. La couche présentation accède à la plateforme via des API. Toutes les fonctionnalités de la plateforme sont disponibles via ces API, l’intégration à d’autres systèmes d’entreprise est donc facilitée. Pour plus d’informations, reportez-vous à Portail GoodData.
Moteur analytique : Les requêtes envoyées du portail GoodData passent par le moteur analytique qui les décompose en plus petits ensembles de requêtes afin d’optimiser les performances et effectuer la mise en cache. Ces requêtes sont envoyées à l’espace de travail pour être traitées.
Espace de travail : dans GoodData, un espace de travail contient toutes les données et métadonnées chargées (métriques, perceptions et tableaux de bord) d’un sujet donné.
Entrepôt de données : l’entrepôt de données sous-jacent contient toutes les données de votre domaine et est utilisé pour alimenter les espaces de travail. Pour plus d’informations, reportez-vous à Data Warehouse.
ETL (Extract, Transform and Load : Extraire, transformer et charger) : Les processus ETL sont utilisés pour acquérir des données à partir de systèmes source, les consolider et les charger dans des ensembles de données sur la plateforme GoodData. Pour plus d’informations, reportez-vous à Préparation et distribution des données.
Architecture de la plateforme
GoodData est une plateforme mutualisée contenant des centaines de services asynchrones qui sont intégrés les uns aux autres pour assurer une distribution, un basculement et une sécurité optimum.
Stockage des données
En fonction des besoins du client, la plateforme GoodData peut être intégrée à diverses bases de données pour un stockage et un accès sécurisés aux données.
Toutes les données client sont stockées dans un entrepôt de données appelé un domaine (anciennement appelé « organisation »). Un domaine contient des espaces de travail individuels et leurs données, des utilisateurs et des processus ETL (voir Votre domaine GoodData). Pour en savoir plus sur la terminologie, voir Glossaire GoodData.
Modélisation des données
Sur la plateforme, les modèles de données sont segmentés en deux composantes : le modèle de données logique et le modèle de données physique.
Un modèle de données logique décrit les attributs et faits contenus dans chaque ensemble de données, ainsi que les relations entre ces objets. Quand le modèle de données logique est déployé dans un espace de travail de la plateforme, il est utilisé pour créer ou modifier le modèle de données physique qui décrit les tableaux de l’entrepôt de données utilisé pour stocker les données chargées.
Les données ETL entrantes sont écrites dans le modèle de données physique à l’aide du modèle de données logique. De même, les requêtes de données d’espace de travail dans le portail GoodData sont récupérées via le modèle de données logique.
Les modèles de données logiques sont créés dans LDM Modeler (consulter Modélisation de données dans GoodData).
Chargement des données
Les données peuvent être chargées dans un espace de travail via des processus ETL à partir de n’importe quelle source de données bien organisée. Ces processus peuvent être créés pour Extraire des données sources dans de nombreux formats, notamment des fichiers plats, des bases de données et JSON via API, les Transformer en fonction des besoins pour nettoyer, combiner et optimiser les entrées et les Charger dans l’espace de travail choisi. Pour plus d’informations, reportez-vous à Préparation et distribution des données.
Vous pouvez suivre les processus ETL déployés via la Console d’intégration des données. Voir Références Console d’intégration de données.
Accès aux données
Toutes les données client sont sécurisées et localisées dans le domaine appartenant au client. Un utilisateur ne peut accéder à aucune donnée stockée sur la plateforme en dehors du domaine dans lequel l’utilisateur a été créé.
La plupart des utilisateurs interagissent avec la banque de données via le portail GoodData, une application web qui permet aux utilisateurs de voir ou modifier des espaces de travail créés pour eux. Voir Portail GoodData.
L’accès aux fonctionnalités du portail GoodData dépend du rôle attribué à chaque utilisateur. Pour plus d’informations, reportez-vous à Rôles utilisateur.
Les requêtes concernant des données de la banque de données passent par le moteur Extensible Analytics Engine pour une récupération des éléments de l’espace de travail performante et adaptable. Ces requêtes sont créées par une demande du portail ou par une entrée utilisateur avec MAQL, un langage de requête propriétaire. Voir MAQL - Langage de requête analytique.
Sécurité
Pour en savoir plus sur la sécurité de la plateforme GoodData, voir Sécurité et conformité de la plateforme.