Ce mémoire est consacré à la conception et à la réalisation de l'entrepôt de données pour le suivi et l'évaluation pédagogique des enseignements. Pour ce faire, nous nous sommes attelés à comprendre les problémes rencontrés par les décideurs de la CAAP (Cellule d'Appui à l'Action P\'edagogique) dans la réalisation de leurs objectifs. Ensuite, on a appréhendé les standards et bonnes pratiques de business intelligence et de mise en œuvre des entrepôts de données. En outre, sur la base d'analyse des besoins des décideurs nous avons ressorti les indicateurs pertinents, structuré les sources de données puis, avons conçu le schéma de l'entrepôt de données multidimensionnels. Après, une étude comparative de quelques logiciels disponibles a été réalisé afin de déterminer l'offre la mieux adaptée à la CAAP. Enfin, ces logiciels ont été utilisé pour mettre en œuvre un entrepôt de données pour la resolution des probèmes de la CAAP.
Résumé
Ce mémoire est consacré à la conception et à la réalisation de l´entrepôt de données pour le suivi et l´évaluation pédagogique des enseignements. Pour ce faire, nous nous sommes attelés à comprendre les problèmes rencontrés par les décideurs de la CAAP (Cellule d’Appui l’Action Pédagogique) dans la réalisation de leurs objectifs. Ensuite, on a appréhendé les standards et bonnes pratiques de business intelligence et de mise en œuvre des entrepôts de données. En outre, sur la base d´analyse des besoins des décideurs nous avons ressorti les indicateurs pertinents, structuré les sources de données puis, avons conçu le schéma de l´entrepôt de données multidimensionnels. Après, une étude comparative de quelques logiciels disponibles a été réalisé afin de déterminer l´offre la mieux adaptée à la CAAP. Enfin, ces logiciels ont été utilisé pour mettre en œuvre un entrepôt de données pour la resolution des problèmes de la CAAP.
Mots-cles : entrepot de données, business intelligence, indicateurs, besoins, prise de décision, SID.
Abstract
This document is devoted on the conception and production of a data warehouse for the follow- up and pedagogic evaluation of teaching (case of the Teachers´ Resource Unit of the Ministry of Secondary Education in Cameroon - CAAP). To achieve this, we start up by understanding the problems encountered by the administration of CAAP in attaining their objectives. This is then followed by a good mastery of the standards and best practice of business intelligence as well as the putting in place of a data warehouse. Furthermore, from analyzing the requirements of the decision makers of CAAP, we evaluate and have been able come up with pertinent indicators, structure the data sources, then conceive the multidimensional data warehouse scheme. There after, a comparative study of available software packages is carried out in order to determine, the option best suited and better adapted to CAAP. Our choices done, we end our project by the utilization of these tools to put in place a data warehouse in CAAP via the available software that we have chosen.
Key words : data warehouse, business intelligence, requirements, decisions making, SID.
1 INTRODUCTION GÉNÉRALE
1.1 Contexte
De nos jours, il n´est plus possible de prendre des décisions de qualité en se basant uniquement sur des ”coups de génie”. Pour bien gérer une entreprise, il est nécessaire pour les décideurs, de prendre en compte les analyses des données afin d´améliorer les rendements présents et prédire l´avenir. La Cellule d´Appui à l´Action Pédagogique (CAAP), où nous avons fait notre stage de fin de formation, est l´un des services phares de l´Inspection Générale des Enseignements du Ministère des Enseignements Secondaires au Cameroun. Placée sous l´autorité d´un chef de cellule, et travaillant en étroite collaboration avec les Inspections de Pédagogie auxquelles elle apporte un appui multiforme dans la réalisation de leurs missions, à savoir 17:
- l´accompagnement des activités de recherche pédagogique ;
- l´appui à la formation continue des personnels ;
- la gestion des infrastructures et des équipements pédagogiques à usage transversal ;
- l´organisation de la validation des ressources numériques, en liaison avec les inspections de pédagogie et la cellule informatique ;
- la promotion et la diffusion des résultats de recherche ;
- la production et la diffusion des annales.
La C.A.A.P est constituée en plus d´un chef de cellule, de quatre chargés d´études assistants et de dix antennes régionales réparties sur l´ensemble du territoire. Les responsables de la C.A.A.P sont de ce fait appelés à prendre régulièrement dans l´accomplissement de leurs tâches quotidiennes, certaines décisions. Ces décisions concernent la gestion : des formations en T.I.C ; des infrastructures et équipements d´ordre pédagogique ; de l´ingénierie documentaire et de la diffusion ; de l´appui à la recherche pédagogique.
1.2 Problématique
Depuis sa création, la C.A.A.P reçoit chaque jour des rapports sous formes manuscrites et/ou numériques. Ces rapports, éléments capitaux dans la prise de décisions subissent des traitements où d´importantes quantités de données sont extraites, traitées, et archivées. Les responsables de la C.A.A.P sont souvent contraints de :
- prendre des décisions avec une vue partielle sur les données, car ces dernières n´arrivent pas toujours à temps (exemple : on peut avoir besoin d´un rapport venant d´une antenne régionale. Mais, le temps mis par ledit rapport pour parvenir aux responsables de la C.A.A.P, ne permet pas de prendre une décision basée sur le contenu de celui-ci) ;
- traiter les données dans des délais qui ne sont pas toujours optimaux, à cause des méthodes et supports d´archivages.
- perdre du temps dans les opérations manuelles, ce qui occasionne souvent la présence de certaines erreurs dans les rapports et sont souvent les causes des retards dans l´exécution de certains projets ;
- de perdre certaines données importantes, à cause de la dégradation des feuilles de papiers dans les archives. Ces pertes de données peuvent aussi occasionner l´échec ou le retard dans la réalisation de plusieurs projets.
- travailler sans avoir des estimations chiffrées à long terme pour certaines données, car il manque encore un système fiable pouvant permettre une historisation des données de la cellule ;
- de gérer manuellement les ressources, car il n´existe pas encore de système automatique pour celà ;
La mise en place d´un entrepôt de données pourra permettre aux décideurs de la C.A.A.P d´avoir une vue globale sur les données à différents niveaux de la chaˆıne, pour une prise de décisions encore plus efficace. Cet entrepôt permettra de centraliser et d´historiser les données. Il pourra aussi constituer une archive générale ou détaillée, sur laquelle on pourra faire les tâches de suivi, de fouille de données. La présence des états qui en résulteraient de l´interrogation du data warehouse servira de base concrète et efficace pour une prise de décisions7, basée sur les rapports d´activités des différents maillons de la chaˆıne dont il est responsable. La CAAP construit un système d´aide à la prise de décision, en vue d´améliorer la performance des décideurs dont elle a la charge. Elle doit de ce fait décider et anticiper en fonction de l´information disponible et, capitaliser sur ses expériences. Ses décideurs sont amenés à prendre certaines mesures liées au suivi des formations en T.I.C, à la gestion des infrastructures et équipements pédagogiques, sur l´évolution des recherches d´ordre pédagogique, sur le fonctionnement des différentes antennes régionales et pour la bonne marche de leurs services vers les objectifs qu´ils se sont fixés.
Afin de permettre à la CAAP d´atteindre ces objectifs, nous nous proposons de concevoir et réaliser un entrepôt de données qui permettra dans un premier temps de fournir au demandeur : l´évolution de la production et la validation des ressources pédagogiques ; le pourcentage des ressources non validées ; le nombre d´enseignants formés par la C.A.A.P par session et par année, la fonction et le service d´appartenance ; la fréquence d´occupation (de réservation) des salles de formation au sein de la C.A.A.P ; l´évolution des formations au sein de la cellule ; le taux de fréquentation de la bibliothèque ; les résultats des travaux et (ou) des recherches d´ordre pédagogique obtenus par les différents maillons de la chaˆıne pédagogique ;
En définitive notre entrepôt devra offrir les fonctionnalités et états permettant de faciliter nettement aux décideurs de la C.A.A.P du MINESEC la prise de décision, tout ceci en facilitant l´analyse rapide des données en provenance de sources éparses.
1.3 Objectifs
Nous nous fixons comme objectifs :
- de faire une analyse afin de ressortir les problèmes de la C.A.A.P, ce qui nous permettra de leur offrir des outils qui soient adaptés à leurs besoins ;
- d´utiliser les outils gratuits afin d´éviter des coûts supplémentaires lors de la mise en place de l´entrepôt de données ;
- de construire un entrepôt avec des outils qui faciliteront l´extraction et la visualisation des données avec une interface conviviale et facile pour les décideurs qui ne sont pas des experts du domaine ;
- de produire des rapports sur les indicateurs définis afin d´aider à la prise de décision, ceci de manière efficace par les dirigeants du MINESEC et de la CAAP en particulier ;
- d´effectuer des recherches sur les données contenues dans l´entrepôt, afin de fournir l´information nécessaire et voulue des décideurs.
- de former les décideurs à l´utilisation de cet outil pour la bonne marche de leurs services et les administrateurs à la maintenance évolutive et corrective.
1.4 Plan
Notre travail s´articule autour de plusieurs points, à savoir :
La section 1, constituée de trois parties, est consacrée à l´état de l´art sur les data warehouse de leur naissance à nos jours ; des généralités sur le data warehouse en présentant successivement, les outils de modélisation, les outils d´extraction, de transformation et de chargement des données dans l´entrepôt, et les outils de présentation. Puis la section 2, est réservée à l´analyse des besoins de la C.A.A.P avec une description des indicateurs qui en découleront. Ensuite la section 3, intitulée conception, présentera une structuration des sources de données et une conception de l´entrepôt. Après la section 4, intitulée déploiement et test d´intégration parlera de l´installation, de la maintenance, et de l´aide à l´utilisation du système. Enfin, nous achèverons ce travail par une conclusion générale.
2 ÉTATDE l´ART SUR LE DATA WAREHOUSE
Avec l´évolution de l´informatique, les entreprises conservent de plus en plus d´importantes quan- tités de données. Ces données peuvent être à l´origine de l´émergence de l´entreprise à condition de sa- voir les analyser correctement, et d´agir en conséquence. L´entrepôt de données, cœur de l´informatique décisionnelle, est une base de données permettant de fédérer et de regrouper les informations de l´entreprise, pour en faire des analyses et faciliter la prise de décisions à court, moyen, et long terme. Il fournit aux décideurs des moyens chiffrés d´évaluer les faits voulus. C´est dans cette optique que, nous présenterons dans cette section, l´historique des data warehouses, de la naissance à nos jours. Ensuite, nous présenterons les généralités sur les data warehouse, à savoir les modèles, les outils d´extraction, de transformation, et de chargement des données (une comparaison entre les outils propriétaires et open source sera faite à ce niveau), enfin nous terminerons par les outils de présentation.
2.1 Historique
Le concept d´entrepôt de données a été formalisé, il y a environ plus d´une vingtaine d´années. Suite au besoin de constituer une base de données orientée sujet, intégrée, historisée, non volatile et destinée aux processus d´aide à la prise de décision7. Ce concept fut dans un premier temps accueilli avec une certaine perplexité. Beaucoup d´informaticiens et décideurs ne voyaient que l´habillage d´un concept déjà ancien : l´infocentre selon22, consistait dans les années 70 et 80 de mettre à la disposition des utilisateurs finaux toute la puissance de calcul d´un ordinateur en temps partagé au moyen des terminaux, de banques de données, de langage comme le BASIC, le FORTRAN, APL d´une aide en ligne et d´une équipe d´assistance technique.
Mais l´évolution des entreprises et de l´économie de nos jours en a décidé autrement. La concurrence entre les entreprises se fait de plus en plus forte, les clients de plus en plus exigeants, dans un environnement organisationnel de plus en plus grandissant, complexe et mouvant.
La mouvance des entrepôts de données pour les entreprises dans le monde est parvenue au Cameroun, il y a quelques années. Les grandes sociétés comme Orange et MTN utilisent les entrepôts de données dans la gestion de leurs activités commerciales. Dans le domaine de l´éducation comme dans beaucoup d´autres domaines au Cameroun, il n´existe pas encore d´entrepôts de données à notre connaissance. Les décideurs prennent encore des décisions basées sur des ”coups de génie” ce qui ne semble plus efficace, surtout lorsqu´on gère de très grandes quantités d´informations et que l´on doit prendre des décisions sur l´avenir d´une société ou d´un service. Il est de ce fait très important de mettre en place des environnements décisionnels pour l´amélioration des systèmes d´aide à la prise de décisions pour un futur meileur notamment dans le domaine de l´éducation au Cameroun.
2.2 Généralités
Ici nous allons présenter les architectures technique et les concepts utilisés dans le domaine des entrepôts de données.
1. Les architectures techniques.
Un entrepôt de données est une base de données regroupant une partie ou l´ensemble des données fonctionnelles d´une entreprise. d´un point de vue technique, il sert à alléger les bases de données opérationnelles des requêtes pouvant nuire à leurs performances. D´un point de vue architectural, il existe deux manières de l´appréhender :
- L’architecture de haut en bas : dans [13, 12] l’entrepôt de données est une base de données au niveau détail, consistant en un référentiel global et centralisé de l’entreprise. En cela, il se distingue du Datamart (d´après le jargon informatique, un datamart est un petit data warehouse extrait d´un data warehouse plus important et spécialisé dans un domaine.), qui regroupe, agrège et cible fonctionnellement les données.
- L’architecture de bas en haut : dans [13, 3] l’entrepôt de données est constitué peu à peu par les Datamarts de l’entreprise, regroupant ainsi différents niveaux d’agrégation et d’historisation de données au sein d’une même base.
2. Concepts et définitions
Les dimensions peuvent être définies comme les points de vue depuis lesquels les mesures peuvent être observées 9.
Exemples : date, région, service, type de formation.
Les faits (mesures) sont les valeurs numériques que l´on compare. Ces valeurs sont le résultat d´une opération d´agrégation des données.
Exemple : nombre d´apprenants formés, durée occupation salle.
Une table de fait est un ensemble d´éléments organisés dans un schéma en étoile ou en flocon, formés de champs de type dimension (axe d´analyse) et champs de type mesure (les faits) qui stocke des mesures de l´évaluation d´une activité. Il existe plusieurs types de tables de fait que nous pouvons comparer grâce au tableau 1 ( : comparaison des types de table de fait).
Nous pouvons comme13 définir un entrepôt de données comme est une collection de données orientées sujet, intégrées, non volatiles et historisées, organisées pour le support d´un processus d´aide à la décision.. De cette définition l´on dégage quatre caractéristiques fondamentales des data warehouse, à savoir :
- les données orientées sujet ;
- les données intégrées ;
- les données historiseés ;
- les données non volatiles.
Abbildung in dieser Leseprobe nicht enthalten
Tableau 1 : comparaisons des types de table de faits 12
2.3 Méthodologie
2.3.1 Les méthodes de développement des SID
l´ensemble des productions littéraires propose de nos jours à notre connaissance, trois catégories de méthode pour le développement d´un Système d´ Information Décisionnel (SID) : ascendantes, descendantes et mixtes 19.
1. L´approche descendante
Elle propose de définir le schéma de l´entrepôt en fonction des besoins d´analyses et suppose que les données disponibles permettront la mise en œuvre d´un tel schéma (schéma de l´entrepôt), ou tout du moins que la confrontation avec les données réelles se fera dans un second temps.
Parmi les approches orientées pour les besoins d´analyses, les auteurs proposent dans 20 une distinction entre les approches guidées par les buts et les approches guidées par les utilisateurs.
2. L´approche ascendante
Elle ne prend pas en compte les besoins des utilisateurs. Elle consiste à construire le schéma de l´entrepôt de données à partir des sources et suppose que le schéma construit pourra répondre à tous les besoins d´analyses. Par exemple, les auteurs dans20 proposent une méthodologie semiautomatique pour construire un schéma du data warehouse à partir des schémas entité-relation qui représentent les bases de données sources.
3. L´approche mixte
L´approche mixte quant à elle combine les deux méthodes précédentes. Cependant elle présente l´inconvenient de ne pas avoir de méthodes d´analyses des besoins utilisateurs. La figure 3 présente les étapes de la méthode mixte.
l´avantage de cette démarche est la combinaison de la méthode descendante et ascendante ; elle intègre à la fois les données des sources de productions et les besoins des décideurs dans la définition du modèle décisionnel.
[...]
- Arbeit zitieren
- Ronade Duplex Tane Nongosso (Autor:in), 2014, Data warehouse pour le suivi et l'évaluation pédagogique des enseignements, München, GRIN Verlag, https://www.grin.com/document/313772
-
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen.