Articles Tagués ‘Data Explorer’

Data Explorer–fonction unpivot

13 avril 2013

Ce matin une bonne nouvelle de la part de l’équipe Data Explorer : la fonction Unpivot arrive !

Blog Data Explorer – Latest update

Dès mes premiers tests sur PowerPivot (Octobre 2011), j’ai été bloqué par l’absence de cette feature. J’ai même essayé de la développer avec une fonction M récursive à base de SelectNames() mais je ne suis pas arrivé au bout.image

Mais aujourd’hui, j’ai juste à faire un update de l’addin directement dans Excel.

La version est la 1.0.3264.4.

Voyons le cas d’usage concret.

Vous savez que je base une bonne partie de mes démos sur des données Open Data fournies par la France (très pauvre sur le sujet mais on a quand même quelques chiffres).
Le jeu de données est une feuille Excel crado contenant la fréquentation des musées d’Ile-de-France :

http://www.data.gouv.fr/DataSet/30382387

image
On passera sur le fait que l’administration française n’ait aucune notion sur les datasets et la qualité de données (on voit bien qu’un fonctionnaire a juste déposé son fichier Excel 97 sur le site).

Concentrons nous sur le fait que les années sont en colonnes. Pour faire une jolie table de faits et ainsi avoir un modèle facilement exploitable (croissance annuelle, slicer temporel, play axis dans un Scatter Graph ou dans GeoFlow…), il nous faut pivoter la table.

Les utilisateurs d’Excel me diront (m’ont déjà dit) :

“c’est facile, tu fais un Transpose”

En fait, le transpose inverse ligne et colonne, il ne pivote pas une ou plusieurs colonnes. Le seul outil que je connaisse capable de faire cela est SSIS.

C’est parti. Pour commencer, importons les données ; pour cela, pas besoin de mettre le fichier Excel sur votre bureau, il suffit directement de laisser Data Explorer aller le chercher.

image

On fait un peu le ménage dans les lignes et les colonnes pour ne conserver que le tableau de données

image

Dans le détails, ça donne :

  • Remove Top Rows
  • Use First Row as Headers
  • Change Type to Number (colonne 1)
  • Filter Value <> null et Number.NaN (colonne 1)
  • Hide Columns “Evolutions xxx”

Ensuite, on lance la fonction de Unpivot

image

Il faut sélectionner l’ensemble des colonnes que l’ont souhaite pivoter. Le nom de la colonne devient la valeur d’une nouvelle colonne “Attribute” et la valeur de la cellule devient la la valeur de la nouvelle colonne “Value”.

Evidemment, tout cela est paramétrable dans la fonction M:

= Table.Unpivot(FilteredRows,{"TOTAL#(lf) 06", "TOTAL#(lf) 07", "TOTAL#(lf) 08", "TOTAL#(lf) 09", "TOTAL#(lf) 10"},"TOTAL","Fréquentation")

Petite subtilité

Dans notre exemple, nous devons pivoter 2 fois : la fréquentation totale et la fréquentation gratuite. Le problème c’est qu’en pivotant 2 fois, on génère la combinatoire des années “totales” et “gratuites”.

image

L’astuce que je prends est la suivante :

  • je transforme la colonne pour n’avoir que l’année
=Table.ReplaceValue(ReplacedValue1,"GRAT#(lf)","20",Replacer.ReplaceText,{"GRATUIT"})
  • je filtre pour ne garder que les lignes quand les 2 colonnes sont égales
=Table.SelectRows(ReplacedValue2, each [TOTAL] = [GRATUIT])

 

Et voila le résultat :

image

Replay de mes sessions aux TechDays

31 mars 2013

 

Etat de l’art et Roadmap de la BI Mobile

image

 

Gouvernance des données et Self-Service ETL avec Data Explorer

image

 

Et pour revoir TOUT les Techdays :  Vidéos des sessions 2013

Data Explorer version 2013

17 mars 2013

Préambule

Si vous aimez connaitre tout l’historique voici mes posts sur la version “alpha” de Data Explorer, quand il était encore incubé par les Azure Labs :

 

Pour démarrer, il vous faut l’add-in Excel :

Data Explorer v1.0.3231

C’est bon, vous l’avez installé, c’est parti.

Recherche online

Le principe de la recherche “online” est super simple : vous tapez juste des mots-clés pour trouver des données, comme vous le feriez dans votre moteur de recherche habituel.

Data Explorer se charge de trouver des DataSets correspondant à votre recherche. Pour le moment, il n’y a que des données en provenance de Wikipedia (en anglais) mais on imagine bien avoir de nombreuses sources “publiques” à disposition dans la version finale et notamment le Azure Data Market (disponible mais pas en mode recherche).

image

Pour utiliser un Dataset comme source de données, il suffit de cliquer sur Use dans le panneau de recherche et la fenêtre de Mashup de Data Explorer s’ouvre.

 

Les nouveaux connecteurs

Data Explorer a conservé ses sources principales : contenu web (HTML, JSon, OData, SharePoint), fichiers locaux ou sur le web (texte, csv, XML, Access, Excel) et SQL Server.

La liste des bases de données supportées s’est considérablement agrandie. On peut se connecter maintenant à Azure, MySQL, Oracle, DB2, PostgreSQL et Teradata. On regrette toutefois qu’il n’y ait pas tout simplement un support de OLEDB ou de ODBC.

On trouve aussi maintenant des sources Active Directory (ce qui montre bien que les données de l’entreprise sont bien la cible), HADOOP (HDFS et HDInsight) et même l’Open Graph de Facebook.

Enfin, très naturellement puisque maintenant on est dans Excel, une simple table Excel devient également une source de données.

 

La nouvelle interface

C’est évidemment du côté de l’interface qu’il y a eu de grands changements.

image
Version Azure Labs

imageVersion Excel

On retrouve toutefois les éléments qui composent notre mashup de données mais organisés de différentes façons pour apporter un maximum d’intuitivité à l’utilisateur dans le façonnage de son Dataset.

  • imageNavigator : la zone à gauche de la fenêtre est une zone de navigation dans la source de données.
    En fonction du “provider” des données choisi comme source, on va pouvoir naviguer pour rechercher le Dataset voulu.
    C’est le cas pour un fichier Excel avec les feuilles de données mais aussi pour une base de données la liste des bases puis des tables.
    Cela montre bien que Data Explorer tire partie de chaque Provider en lui déléguant une partie du travail. J’en reparlerai dans un prochain article mais c’est pareil pour un filtre, une jointure ou une agrégation, elle sera faite au niveau le plus bas possible.
  • Steps : la zone à droite de la fenêtre liste toute les étapes de notre mashup. Elle remplace le “fil d’ariane” qui se trouvait au dessus du Dataset dans la précédente version. Cela permet de revenir à une étape pour la modifier ou la supprimer.
    Je la trouve d’ailleurs plus rapide et pratique que la précédente.
  • La barre d’outils : mais où est-elle passée ? Dans la précédente version, elle occupait tout un bandeau en haut de l’écran et là, plus rien, place aux données…
    En fait, toutes les actions / transformations sont maintenant accessibles dans leur contexte avec un simple clic-droit. Par exemple, si on veut masquer une colonne du dataset qu’on utilise pas, il suffit de faire un clic-droit sur son entête.
    Les zones cliquables sont les entêtes de colonnes, les valeurs (contextualisées) et le tableau lui même (dans le coin en haut à gauche)
    Plus intuitif (ou pas ?), en tout cas on retrouve ses petits assez facilement je trouve.
  • La barre de formules : l’un des atouts de Data Explorer pour un profil ‘”développeur” comme moi, c’est de savoir qu’on peut développer soit même les fonctions de transformations.
    Pour cela, on a une barre de formules, comme celle d’Excel ou de PowerPivot.
    Le langage est toujours le langage M et l’API est plutôt riche.

image

Les transformations

imageComme je le disais, les transformations sont maintenant accessibles directement dans le Dataset. A première vue, je n’ai pas noté de nouvelles transformations ou de transformations en moins. (il me manque toujours le Pivot/Unpivot…)

Toutefois, en jouant un peu avec les données, il y a 2 nouveautés que j’ai bien apprécié.

La première, c’est la possibilité de récupérer le contenu des fichiers d’un répertoire (pas juste les noms) ce qui permet d’adresser des scénarios de concaténation de fichiers textes par exemple.

image

La seconde est dans la même lignée. En fonction de la source de données, on peut suivre les “jointures” possibles. Ca marche avec les relations entre des tables d’une base de données par exemple. On peut donc choisir de récupérer de nouvelles colonnes ou bien agréger des données relatives. On utilisera aussi cette façon de faire pour dérouler du contenu JSON, HTML ou XML.

image

Cette nouveauté est vraiment une tuerie !

 

Mixer les sources

Enfin, pour compléter l’expérience de Mashup, il ne manque que la liaison entre plusieurs Datasets.

imageDans la précédente version, on avait tous nos Datasets sur la gauche et des options pour faire des UNION, des MERGE ou des copies/références.
Data Explorer en version Excel garde toutes ces fonctionnalités mais réparties différemment dans l’interface.

 

Déjà, sachez que chacun de nos Dataset est appelé Query (on verra la traduction qui sera choisie). Pour les retrouvez, c’est simple allez sur la table résultante et vous aurez les toutes les options dans le ruban Excel (Data Explorer ou Table Tools).

imageimage

 

Et mes données, j’en fais quoi après ?

Cette question n’a qu’une réponse : OBVIOUS !

Vous êtes dans Excel, non mais allô quoi ? vous me recevez ? Vous êtes dans Excel ? Genre tu fais de la BI et tu connais pas PowerPivot ? Non mais allô quoi…1

En fait, c’est simple vous injectez votre Dataset dans PowerPivot (ie. dans votre Data Model si vous êtes dans 2013) et vous n’avez plus qu’à faire vos analyses et vos tableaux de bord.
Vous pouvez même faire un rapport Power View.

 

En conclusion

Concernant les fonctionnalités, pas de grandes évolutions par rapport à la version alpha mise à part de nouvelles sources de données. Je retrouve tout ce qui m’a séduit dans l’outil dans sa précédente version.

Toutefois, on doit noter que  la navigation dans les sources de données est vraiment améliorée ce qui simplifiera la vie des utilisateurs qui ne savent pas ce qu’est une jointure.

Le grand changement est évidemment les interfaces très intuitives et bien dans le style Excel 2013. Et justement, le fait d’être dans Excel permet un usage instantané des données. (oubliez le Publish mis en avant dans la précédente version)

 

Pour aller plus loin

Pour rester informé, suivez ce blog (je mettrai d’autres tutoriaux) ou celui de l’équipe produit :

http://blogs.msdn.com/b/dataexplorer/

 

1 : si vous n’avez pas compris ce passage, c’est que vous n’avez pas suivi le buzz du moment.

Public CTP de Data Explorer

27 février 2013

imageCe soir (ce matin, 10am Pacific Time) sort officiellement la CTP de Data Explorer.

 

Mais il n’y avait pas déjà une CTP ?

En fait, non. C’était une version “alpha” qui était hébergée dans les SQL Azure Labs (une sorte de pépinière d’innovation).

Sans nouvelles depuis presque 1 an, le projet était en phase de développement intensive à Redmond.

Etant à Seattle depuis 10 jours (pour le MVP Summit), j’ai eu la chance de passer un peu de temps à discuter avec les équipes de Data Explorer.

Le produit a vraiment pris de la maturité d’un coup. Cette nouvelle version fonctionne directement dans Excel sous la forme d’un Add-in et les interfaces sont vraiment bien intégrées.

image

What’s New ?

Les fonctionnalités restent les mêmes mais les cas d’usage sont plus fluides et pratiques.

Pas de nouvelles transformations mais de nouvelles sources (Facebook, HDInsight, etc.).

Ce qui me  plait le plus est l’intégration à Excel 2013 et au Data Model puisque vous pouvez directement envoyer votre flux dans le Data Model (ie. PowerPivot).

Le moteur de formules (langage M) est toujours là mais un peu plus caché, ce qui en fait un vrai outil de SSBI (Self-Service BI) et un peu moins un outil de geek.

Pour démarrer :

Téléchargez juste l’addin : http://www.microsoft.com/en-us/download/details.aspx?id=36803

 

PS : Je suis sensé être en vacances donc je posterai un article plus complet à mon retour. On jouera au jeu des 7 différences et verra comment intégrer Data Explorer dans votre Self-Service BI.

PASS Summit – Keynote 2

9 novembre 2012

Quentin Clark, Corporate VP, nous parle du Data Lifecycle (tiens, ça me rappelle ma première présentation BI il y a quelques années qui s’appelait "le voyage de la donnée").

La présentation fait une synthèse des outils que l’on a autour des données (et de SQL Server évidemment) ainsi que de ses usages, que ce soit dans un cluster HADOOP, dans un DWH PDW, dans un ETL ou dans une analyse Power View.

La démo s’appuie sur une histoire, certes simplifiée, mais tellement représentative de ce que les entreprises pourraient tirer comme bénéfices en analysant leurs données (et que certaines font déjà).

L’histoire tourne autour d’un cinéma qui cherche à optimiser ses places par film.

 

HADOOP & PolyBase

L’histoire commence avec des données provenant de Twitter (tiens, il y avait longtemps) et vous vous doutez bien qu’elles vont atterrir dans un Cluster HADOOP. A côté, nous avons un DataWarehouse sur PDW.

Évidemment, l’analyste (en l’occurrence Julie Strauss, Program Manager), a besoin de croiser les 2 ; les “sentiments” sur les films en provenance des réseaux sociaux avec les films et les salles qui viennent du DataWareHouse maison.

Cela est possible avec PolyBase qui sait requêter et joindre des données SQL Server et HDFS.

Tout ceci pour remettre une louche sur les annonces de la veille évidemment. On a même vu un peu de PDW pour le côté “management” de la donnée.

 

Data Explorer

L’idée ensuite est de nettoyer ces données. Evidemment, nous sommes toujours avec notre Data Analyst Julie qui ne connait rien aux ETL et n’a que Excel comme outil.

L’an dernier, je vous parlais de Data Explorer (j’ai même fait une session d’une heure aux TechDays). Il a bien grandi depuis févier.

Il est maintenant intégré dans Excel ! Et le moins qu’on puisse dire, c’est que l’ergonomie a grandement été améliorée avec de meilleures interfaces. Pour faire une opération sur une colonne (cache, split, merge, etc.), il suffit de faire un clic-droit dessus par exemple.

Data Explorer avait déjà une bonne gestion des types mais elle semble avoir encore été améliorée. Par exemple, un merge de 3 colonnes contenant jour/mois/année est converti en date automatiquement.
(mais j’attends de voir ce que ça donne dans une culture comme fr-FR)

Un changement dans la présentation de l’outil, on ne parle plus de Publish (ETP) mais de Copie.
En sauvegardant une copie, d’autres utilisateurs pourront réutiliser le mashup.

On peut évidemment l’intégrer dans la feuille Excel ou l’importer directement dans le Data Model (PowerPivot).

Data Explorer est en passe de devenir un vrai ETL for masses comme on l’imaginait dès le départ. Le trou dans la raquette va être comblé.

Je n’ai pas de capture d’écran à vous montrer mais dès que je peux, je ferai un petit article dessus.

 

PowerPivot

PowerPivot ? Il ne vient pas d’y avoir une mise à jour récemment ? Exact mais ce n’est pas pour autant que le produit ne continue pas à évoluer.
Ce qui a été présenté rejoint Data Explorer et sa version présentée l’année dernière.

Dans PowerPivot, on a une proposition de catégorisation des données (des colonnes en fait). Cela ajoute toutes les méta-données qui font d’une simple table un élément d’un modèle sémantique.

L’exemple présenté montre des données géographiques  et on les tag comme telles (pays, région, etc.).
(Ca ne vous rappelle pas la propriété Type sur un attribut de dimension en multidimensionnel ? Sourire)

Mais le truc fantastique qui en découle, c’est qu’on peut ensuite aller chercher des données associées à notre qualification dans l’Azure Data Market.
La démo montre l’ajout des ZipCodes sur nos données géographiques (il n’y avait que les villes).

Enfin, le détail final, la possibilité de rafraichir directement depuis Excel / PowerView (dans la démo, Julie change une valeur dans le DWH avant).

 

Transformation en BISM

Le Data Life Cycle ne peut pas être bouclé si on ne parle pas de la gestion opérationnelles des données (ie. le boulot des admins qui maintiennent les infrastructures derrière)

Dans la démo, en regardant les statistiques d’usage de PowerPivot dans SharePoint 2013, on voit que notre classeur prend beaucoup de ressources. L’idée est donc de le transformer en un vrai modèle BISM et de le déployer dans SSAS, plus adapté pour gérer des workload d’analyse (notamment avec la prise en charge des partitions).

La démo montre un import de notre classeur PowerPivot dans SSDT qui le transforme en fichier BIM que l’on pourra déployer dans un SSAS Tabular. Facile, mais on reste avec les limitations du tabulaires (cf. l’article de la FrenchConnection.BI).

 

Au cours de la démo, nous avons vu aussi le réplication synchronisation de nos données sur Azure. Histoire de partager rapidement des données entre filiales ou entre partenaires par exemple. Très facile avec Data Sync.

 

En conclusion

Evidemment, tout ce qui a été montré lors du second keynote n’est pas encore disponible (je pense à Data Explorer en particulier). Mais Microsoft nous donne ses orientations et on devine la RoadMap (même si nous n’avons aucune date Triste).

Je m’inscris totalement dans le direction que prend MS et je pense qu’ils affirment encore plus leur place de visionnaire et de leader sur ce marché.

Maintenant, il est important pour les entreprises de ne pas se laisser distancer. La BI est un avantage concurrentiel, un outil pour faire mieux son Business !

Les outils sont là. Les experts sont là. Allez-y !

Je terminerai en citant Quentin Clark :

How your business gonna change ?

Slides et sources de mes sessions aux TechDays

11 février 2012

J’espère que j’aurai le courage de faire quelques posts sur les TechDays mais dans un premier temps, je vous livre les slides (et les sources quand il y en a) sur mes sessions.

Pour les impatients, tout le contenu sur mon SkyDrive

 

Data Explorer : Self-Service ETP (Extract-Transform-Publish)

Si j’avais dû en garder qu’une, ça aurait été celle la. Ce nouveau produit va faire du bruit dans les mois à venir !

image

La sécurité avec SQL Server

Une répétition de la session de l’année dernière mais la répétition des messages en matière de sécurité, c’est juste essentiel.

image

SQL Server et les développeurs

Merci David pour cette session d’initiation aux problématiques de base de données à des développeurs (certes très bons avec du C# ou du XAML mais peu aguerris à l’art ancestral du SQL ou des index).

image

Reporting Services en 2012

Une session sur Reporting Services de 2008 à 2012. Les nouveautés mais aussi un rappel sur les composants actuels (Sparklines, Cartographie, etc.).

image

Sharepoint et SQL Server pour les étudiants

Une session un peu spéciale pour présenter les métiers et le quotidien des Sharepointers et des spécialistes SQL. Affaire à suivre Sourire

image

Data Explorer aux TechDays

9 février 2012

Peu de monde à ma session Data Explorer mais des dizaines de convaincu sur la Self-Sevice BI.

image

Just for 4 fun, un petit rapport qui consomme une publication Data Explorer qui se connecte à l’API de foursquare pour récupérer mon historique de checkins…en live.

image

PS : je centraliserai les slides et le code de l’ensemble de mes sessions dans un prochain post.

Re-PS : vous aurez également le webcast bien évidemment

Data Explorer 101

18 janvier 2012

Je parle de Data Explorer depuis quelques articles mais sans rentrer dans le dur : une démo.

L’objectif de cet article est de vous proposer un tutorial pour démarrer, un one-o-one comme dit dans le jargon.

Avant de commencer

Il vous faut un accès à Data Explorer. La beta est publique mais il faut quand même une invitation. Ca se passe ici :  https://dataexplorer-signup.sqlazurelabs.com/

Vous pouvez aussi commencer avec la version on-premices : télécharger Data Explorer

En premier lieu, choisir la source

C’est simple, il suffit de piocher dans les types de sources disponibles. On retrouve les classiques (fichiers, SQL, web, etc.). Je détaillerai dans d’autres articles les sources un peu exotiques. Là on va faire simple, on va prendre un CSV.

image

On choisit donc notre source en cliquant sur Import File.

image

Un peu de vocabulaire et de bases :

  1. en haut à gauche, c’est le mashup, l’équivalent d’un package en ETL (retenez le, c’est là que vous faites Ctrl+S)
  2. dans la colonne de gauche, ce sont les ressources. On peut les comparer à des flux (Data Flow Task pour les SSIS-guys) mais c’est plus “compliqué” que cela, j’y reviendrai dans d’autres articles
    l’icone en forme d’oeil à côté indique si la ressource (ie. le flux) est visible, c’est à dire s’il sera publié, ou s’il est purement interne
  3. Tâches de la ressource : c’est un fil d’Ariane qui montre l’enchainement des tâches à appliquer sur le flux de données (comme des composants de DFT)
  4. Tools : c’est votre Toolbox où vous choisissez les tâches à ajouter dans la ressource
  5. Formule : toute tâche peut s’écrire avec une formule à la Excel. Vous noterez ici que lire un fichier se fait avec la méthode Embedded.Content().
  6. Configuration de la tâche : si vous ne connaissez pas la syntaxe des tâches, vous pouvez utiliser le panneau de configuration de la tâche

Ajouter des transformations

Nous avons notre source CSV dans la ressource qui s’appelle Musees (c’est la liste des musées de France). Appliquons maintenant des transformations pour exploiter cette source. Dans l’ordre, nous allons :

  • typer la source en CSV
  • déclarer la première ligne comme entête des colonnes
  • filtrer des lignes
  • supprimer des colonnes

Typage de la source

image

Il suffit juste de cliquer sur la tâche CSV dans la toolbox.

Déclaration des entêtes

image

On promeut la première ligne comme entête de colonnes

Filtrer les lignes

On ne veut que les musés ouverts (donc colonne ferme=NON).

image

On verra dans d’autres articles la notion de type; ici on considère le champ comme du texte (Text.Type) donc attention à la casse. Pour sécuriser, on aurait pu utiliser la fonction Text.Upper()

Supprimer des colonnes

La colonne “ferme” ne nous sert plus à rien donc on va la supprimer (masquer) du flux.

image

Vous devez avoir un flux qui ressemble à cela :

image

Note : vous pouvez renommer les tâches pour donner un peu plus de sens (documentez !)

Publication

Il nous reste à publier le flux pour une exploitation (PowerPivot, SSRS, etc.).

La première chose est de sauvegarder (en haut à gauche) et de revenir sur votre workspace (en haut à droite).

image

Clic-droit –> Publish, simple non ? Vous avez aussi un bouton Publish en bas et les options de publication.

image

Une fois publié, vous avez accès à une page contenant tous les liens d’accès aux données (OData, Excel, CSV, etc.).

image

Et voila.

Bon mashup !

Philosophie autour de Data Explorer : find the pony in your data

16 janvier 2012

imageIl y a quelques temps, lors d’une discussion BI, nous nous sommes interrogés mon interlocuteur et moi sur ce sujet : comment trouver des événements exceptionnels dans nos données ?

Événements exceptionnels ? J’entends par là des patterns dans les faits ou des faits suffisamment particuliers (ou hors-normes) pour avoir un “intérêt” métier. On peut appeler cela anomalies, cas aux limites, intuition, etc.

Tous les SI contiennent une masse impressionnante de données et je milite depuis toujours pour construire des projets décisionnels et de les exploiter.

Mais bien souvent lors de la modélisation, le réflexe est d’assainir les données, en ne prenant que le plus simple finalement. Cette simplification arrondit les angles et en conséquence rabote les événements exceptionnels.

Ce n’est pas par laxisme évidemment ; c’est parce que c’est le chemin le plus court (et donc celui qui rentre dans le budget) pour obtenir des résultats exploitables par le client et évidemment des résultats corrects, qui est un prérequis en BI.

Il y a une expression anglaise qui dit : “find the pony”. Je n’ai pas trouvé d’expression équivalente dans la langue française mais on pourrait la traduire par “trouver la pépite

On est tous d’accord que chercher cette pépite dans nos données est une tâche compliquée voire impossible quand la volumétrie s’exprime en To.

Comment le trouver ce poney ?
(non on ne va pas voir Bonjour Poney Florent)

La première piste est de trouver un outil qui va nous aider dans la recherche, c’est le propos du Data Mining. (NDM : j’ai failli mettre méthodologie au lieu d’outil – le débat est ouvert).
Soit, cet outil se base sur une logique humaine (si on considère que les dataminers sont humains) et le résultat doit être interprété par un œil humain (pour les algos de pure découverte).

La réflexion porte donc sur la capacité du cerveau humain à identifier rapidement des patterns, à détecter en un clin d’œil une anomalie ou tout simplement à imaginer des associations.
C’est le propre de l’homme et certains en font leur métier ; c’est le cas des artistes ou des marketeux (évidemment, dans le lot, certains sont talentueux).image

Donc imaginons que tout le monde soit "data miner", imaginons que des services entiers (marketing par exemple1) scrutent les données dans tous les sens.

 

Quelle force de frappe on aurait !

Eh bien, c’est un des aspects de la BI en Self-Service et de l’ouverture des données (OData par exemple). Cause ou conséquence, la poule ou l’œuf ?
En tout cas ces 2 courants, simples buzz il y a quelques années (note : je n’ai pas cru à OData en 2008 Triste), sont maintenant une réalité.

L’idée n’est pas d’avoir un outil magique qui trouverait tout seul mais donner accès massivement aux utilisateurs et de les laisser fouiller en libre accès. Ainsi on bénéficie d’un nombre important de cerveaux humains prêt à jouer avec les données dans tous les sens.

L’armée mexicaine en quelque sorte.

Armée mexicaine

 

Mais concrètement, ils doivent faire quoi mes utilisateurs ?

Evidemment, il faut quand même des outils car vous vous doutez bien que les utilisateurs ne vont pas écrire des SELECT *.

Là interviennent des outils comme PowerPivot et Data Explorer. Le premier est très mature et se concentre sur le croisement des données. Le second, encore en beta, va permettre de créer des mashup et de faire du traitement de données (nettoyage, consolidation, reformatage, etc.).

Leur point commun est que l’utilisateur est autonome dans sa relation avec les données dès l’instant où il y a accès.

Je reviendrais un peu plus sur Data Explorer dans les prochains posts et évidemment, je vous recommande ma session aux TechDays avec plein de démos.

Allez les utilisateurs, on fait chauffer les neurones et on augmente la maturité BI de sa boite.

 

1 j’ai une grande admiration pour les métiers du marketing, c’est pourquoi je les “chalenge” un peu. Il n’y a pas de mauvais esprit ou un contentieux à régler Tire la langue


Suivre

Recevez les nouvelles publications par mail.

Joignez-vous à 325 followers