Data Explorer version 2013

Préambule

Si vous aimez connaitre tout l’historique voici mes posts sur la version “alpha” de Data Explorer, quand il était encore incubé par les Azure Labs :

 

Pour démarrer, il vous faut l’add-in Excel :

Data Explorer v1.0.3231

C’est bon, vous l’avez installé, c’est parti.

Recherche online

Le principe de la recherche “online” est super simple : vous tapez juste des mots-clés pour trouver des données, comme vous le feriez dans votre moteur de recherche habituel.

Data Explorer se charge de trouver des DataSets correspondant à votre recherche. Pour le moment, il n’y a que des données en provenance de Wikipedia (en anglais) mais on imagine bien avoir de nombreuses sources “publiques” à disposition dans la version finale et notamment le Azure Data Market (disponible mais pas en mode recherche).

image

Pour utiliser un Dataset comme source de données, il suffit de cliquer sur Use dans le panneau de recherche et la fenêtre de Mashup de Data Explorer s’ouvre.

 

Les nouveaux connecteurs

Data Explorer a conservé ses sources principales : contenu web (HTML, JSon, OData, SharePoint), fichiers locaux ou sur le web (texte, csv, XML, Access, Excel) et SQL Server.

La liste des bases de données supportées s’est considérablement agrandie. On peut se connecter maintenant à Azure, MySQL, Oracle, DB2, PostgreSQL et Teradata. On regrette toutefois qu’il n’y ait pas tout simplement un support de OLEDB ou de ODBC.

On trouve aussi maintenant des sources Active Directory (ce qui montre bien que les données de l’entreprise sont bien la cible), HADOOP (HDFS et HDInsight) et même l’Open Graph de Facebook.

Enfin, très naturellement puisque maintenant on est dans Excel, une simple table Excel devient également une source de données.

 

La nouvelle interface

C’est évidemment du côté de l’interface qu’il y a eu de grands changements.

image
Version Azure Labs

imageVersion Excel

On retrouve toutefois les éléments qui composent notre mashup de données mais organisés de différentes façons pour apporter un maximum d’intuitivité à l’utilisateur dans le façonnage de son Dataset.

  • imageNavigator : la zone à gauche de la fenêtre est une zone de navigation dans la source de données.
    En fonction du “provider” des données choisi comme source, on va pouvoir naviguer pour rechercher le Dataset voulu.
    C’est le cas pour un fichier Excel avec les feuilles de données mais aussi pour une base de données la liste des bases puis des tables.
    Cela montre bien que Data Explorer tire partie de chaque Provider en lui déléguant une partie du travail. J’en reparlerai dans un prochain article mais c’est pareil pour un filtre, une jointure ou une agrégation, elle sera faite au niveau le plus bas possible.
  • Steps : la zone à droite de la fenêtre liste toute les étapes de notre mashup. Elle remplace le “fil d’ariane” qui se trouvait au dessus du Dataset dans la précédente version. Cela permet de revenir à une étape pour la modifier ou la supprimer.
    Je la trouve d’ailleurs plus rapide et pratique que la précédente.
  • La barre d’outils : mais où est-elle passée ? Dans la précédente version, elle occupait tout un bandeau en haut de l’écran et là, plus rien, place aux données…
    En fait, toutes les actions / transformations sont maintenant accessibles dans leur contexte avec un simple clic-droit. Par exemple, si on veut masquer une colonne du dataset qu’on utilise pas, il suffit de faire un clic-droit sur son entête.
    Les zones cliquables sont les entêtes de colonnes, les valeurs (contextualisées) et le tableau lui même (dans le coin en haut à gauche)
    Plus intuitif (ou pas ?), en tout cas on retrouve ses petits assez facilement je trouve.
  • La barre de formules : l’un des atouts de Data Explorer pour un profil ‘”développeur” comme moi, c’est de savoir qu’on peut développer soit même les fonctions de transformations.
    Pour cela, on a une barre de formules, comme celle d’Excel ou de PowerPivot.
    Le langage est toujours le langage M et l’API est plutôt riche.

image

Les transformations

imageComme je le disais, les transformations sont maintenant accessibles directement dans le Dataset. A première vue, je n’ai pas noté de nouvelles transformations ou de transformations en moins. (il me manque toujours le Pivot/Unpivot…)

Toutefois, en jouant un peu avec les données, il y a 2 nouveautés que j’ai bien apprécié.

La première, c’est la possibilité de récupérer le contenu des fichiers d’un répertoire (pas juste les noms) ce qui permet d’adresser des scénarios de concaténation de fichiers textes par exemple.

image

La seconde est dans la même lignée. En fonction de la source de données, on peut suivre les “jointures” possibles. Ca marche avec les relations entre des tables d’une base de données par exemple. On peut donc choisir de récupérer de nouvelles colonnes ou bien agréger des données relatives. On utilisera aussi cette façon de faire pour dérouler du contenu JSON, HTML ou XML.

image

Cette nouveauté est vraiment une tuerie !

 

Mixer les sources

Enfin, pour compléter l’expérience de Mashup, il ne manque que la liaison entre plusieurs Datasets.

imageDans la précédente version, on avait tous nos Datasets sur la gauche et des options pour faire des UNION, des MERGE ou des copies/références.
Data Explorer en version Excel garde toutes ces fonctionnalités mais réparties différemment dans l’interface.

 

Déjà, sachez que chacun de nos Dataset est appelé Query (on verra la traduction qui sera choisie). Pour les retrouvez, c’est simple allez sur la table résultante et vous aurez les toutes les options dans le ruban Excel (Data Explorer ou Table Tools).

imageimage

 

Et mes données, j’en fais quoi après ?

Cette question n’a qu’une réponse : OBVIOUS !

Vous êtes dans Excel, non mais allô quoi ? vous me recevez ? Vous êtes dans Excel ? Genre tu fais de la BI et tu connais pas PowerPivot ? Non mais allô quoi…1

En fait, c’est simple vous injectez votre Dataset dans PowerPivot (ie. dans votre Data Model si vous êtes dans 2013) et vous n’avez plus qu’à faire vos analyses et vos tableaux de bord.
Vous pouvez même faire un rapport Power View.

 

En conclusion

Concernant les fonctionnalités, pas de grandes évolutions par rapport à la version alpha mise à part de nouvelles sources de données. Je retrouve tout ce qui m’a séduit dans l’outil dans sa précédente version.

Toutefois, on doit noter que  la navigation dans les sources de données est vraiment améliorée ce qui simplifiera la vie des utilisateurs qui ne savent pas ce qu’est une jointure.

Le grand changement est évidemment les interfaces très intuitives et bien dans le style Excel 2013. Et justement, le fait d’être dans Excel permet un usage instantané des données. (oubliez le Publish mis en avant dans la précédente version)

 

Pour aller plus loin

Pour rester informé, suivez ce blog (je mettrai d’autres tutoriaux) ou celui de l’équipe produit :

http://blogs.msdn.com/b/dataexplorer/

 

1 : si vous n’avez pas compris ce passage, c’est que vous n’avez pas suivi le buzz du moment.

Une réflexion sur “Data Explorer version 2013

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s