janvier 13, 2022

Comment choisir la bonne visualisation de données

Par andy1712


visualisation de données low-fi à l'aide d'un crayon, d'une feuille de papier et d'une règle

PHOTO : Isaac Smith | unsplash

Les données sont mieux comprises lorsqu’elles sont présentées dans un format visuel plutôt que textuel. Alors, comment choisissez-vous le visuel qui capture le mieux ce que vos données marketing essaient de dire ?

Dans cet article, je couvrirai les considérations clés derrière un bon choix de visualisation.

Votre choix de visualisation a un impact sur l’histoire que vos données raconteront

Les visualisations de données capturent toutes les tâches mesurées dans le parcours client. Il est destiné à organiser les observations d’une dimension ou d’une métrique dans un graphique. Mais le bon choix de visualisation n’est pas toujours évident lorsque les analystes se mettent au travail dans leurs solutions de données. Les menus et tableaux de bord des solutions contiennent souvent des graphiques représentant les plates-formes qu’ils étaient censés mesurer. Ces options peuvent fonctionner si vous utilisez l’outil de manière cohérente.

Pourtant, les analystes doivent souvent combiner des données trouvées sur une plate-forme avec d’autres données ou dans une métrique calculée. Cela changera leurs choix de visualisation. Cependant, ils ne manquent pas de choix car la croissance des données a conduit à un nombre accru d’options de visualisation pour afficher les résultats et incorporer des données en temps réel.

Tout cela rend le choix du bon visuel encore plus compliqué.

Article connexe : Comment les outils de visualisation de données facilitent l’analyse en libre-service

Pour commencer votre sélection de visualisation, posez les questions Munzner

Alors, par où commencer pour choisir un bon graphique ?

Dans mon article sur la visualisation, What Makes a Good Data Visualization, j’ai mentionné deux aspects des données à prendre en compte. Vous voulez un graphique qui transmet des idées à partir de données trop complexes pour être expliquées par des mots et qui aide votre public à analyser rapidement les informations et à agir sur les résultats.

Pour arriver à ce graphique, posez une série de questions créées par Tamara Munzner, professeur d’études informatiques à l’Université de la Colombie-Britannique. Munzner est réputée pour ses recherches approfondies dans le développement, l’évaluation et la caractérisation de systèmes et de techniques de visualisation. Elle a souligné ce cadre de questions dans son présentation sur l’évitement de l’analyse de visualisation.

  1. Qui sont les utilisateurs finaux ? (C’est le public qui a besoin de l’information.)
  2. Qu’est-ce qui est montré ?
  3. Pourquoi l’utilisateur le regarde-t-il ? (Les questions 2 et 3 visent à mettre en évidence ce que sont les données, comment elles sont organisées et leur source.)
  4. Comment cela est-il montré ? (C’est la question clé – quel type de graphique montre le mieux les données.)

Les réponses aux questions de Munzner aident à affiner les graphiques qui représentent le mieux les réponses visuellement. Votre choix de graphique doit atteindre l’un des objectifs suivants :

  1. Pour analyser une composition ou un changement de distribution.
  2. Pour identifier des modèles ou des tendances.
  3. Pour révéler l’objectif 1 et/ou l’objectif 2 dans un sous-ensemble d’un ensemble de données donné.

Choisissez un graphique qui affiche une hiérarchie dans les données

Quatre catégories de graphiques conviennent pour afficher des hiérarchies dans les données : composition, distribution, relation et comparaison. Les graphiques de composition et de distribution traitent de la structure de vos dimensions ou mesures données en fonction des observations, tandis que les graphiques de relation et de comparaison sont destinés à mettre en évidence les différences contrastées à travers des modèles et des tendances.

Les graphiques de composition sont destinés à décrire la composition d’un ensemble d’observations. Les visualisations de cette catégorie incluent les graphiques circulaires, les treemaps et les graphiques à barres empilées.

Les graphiques de distribution affichent la plage d’observations, ce qui les rend parfaits pour les statistiques indiquant la qualité des dimensions et des mesures qui contiennent ces observations. Des exemples tels que l’histogramme ou les boîtes à moustaches sont choisis pour traiter la plage statistique.

boîte à moustaches

Les graphiques de relations concernent les tendances de corrélation entre deux ou plusieurs dimensions ou métriques. Les nuages ​​de points et les graphiques à bulles en sont de bons exemples.

nuage de points

Les graphiques de comparaison sont destinés à mettre en évidence les différences en ce qui concerne l’écart, les tendances ou le classement entre deux ou plusieurs dimensions ou métriques. Il s’agit souvent d’une variante spécialisée des graphiques de relation ou de composition, tels que les graphiques de régression, les graphiques de Pareto, les graphiques en relief et les graphiques à colonnes empilées.

Le meilleur graphique pour votre objectif organise les données pour répondre à la question “Pourquoi l’utilisateur regarde-t-il cela ?”

Chacune de ces catégories a plusieurs styles de graphiques, plus que ce qui peut être couvert dans un seul article. Mais en choisissant un graphique, vous recherchez celui qui affiche le mieux une hiérarchie répondant de manière claire et précise à vos questions.

Article connexe : Arrêtez de torturer vos données et autres conseils pour révéler de véritables informations sur les données

Savoir comment vos données et vos couleurs véhiculent des informations

Le succès d’un graphique dépend en partie s’il crée une charge cognitive pour le public. La charge cognitive fait référence à la quantité d’informations qu’un cerveau peut traiter à un moment donné. Vous voulez donc vous assurer que les éléments graphiques se combinent pour raconter l’histoire la plus claire avec le moins d’effort de la part du spectateur.

Par exemple, les graphiques à barres et les graphiques à secteurs peuvent également afficher une composition de données, mais les graphiques à barres sont plus efficaces pour afficher les différences d’unités. Ces différences sont importantes pour montrer la précision de la comparaison. Au lieu de dire qu’il y a une augmentation de 20 % du trafic organique, par exemple, vous avez besoin d’un graphique à barres qui montre cette augmentation de 20 %. D’un seul coup d’œil, votre utilisateur final peut facilement absorber le changement.

Dans le tableau ci-dessous, vous pouvez clairement voir qu’il y avait peu de véhicules à propulsion arrière (r) par rapport aux véhicules à traction intégrale (4) ou à traction avant (f).

transmission

Une bonne visualisation met l’accent sur la précision lors de l’indication des mesures. Les cartes thermiques peuvent montrer des changements de gradient, mais peuvent être un mauvais choix pour la précision lorsque le public veut comprendre les différences numériques distinctes entre les éléments. Par exemple, si un changement de température d’un ou deux degrés a une signification pour votre sujet, vous devez choisir un graphique qui met en évidence le moment où cette différence apparaît.

La couleur est un autre élément à considérer. S’en tenir à une seule couleur et utiliser des nuances pour indiquer une distinction visuelle réduit les charges cognitives. Tenez également compte des problèmes d’accessibilité, tels que les utilisateurs daltoniens, lors de la sélection de votre jeu de couleurs. Une deuxième couleur est acceptable pour mettre en évidence une dimension spécifique afin qu’elle se démarque des autres dimensions dans un graphique à barres. Deux couleurs sont parfaites pour les graphiques qui montrent deux extrêmes divergents, comme une carte thermique. Vous voyez souvent cela dans les graphiques de corrélation, comme celui ci-dessous, pour indiquer la force de la corrélation pour les observations.

corrélation

Mais il y a des limites au nombre de couleurs pouvant être attribuées dans certains graphiques de composition. Habituellement, six à huit couleurs sont une bonne approximation pour montrer une différence significative entre plusieurs dimensions ou métriques. Plus que cela introduit trop de granularité. La visualisation qui en résulte regroupe les visuels graphiques et rend les distinctions difficiles à voir.

Si vous devez afficher plus de huit dimensions différentes avec des couleurs distinctes, un treemap est un meilleur choix. Un treemap est un diagramme de rectangles imbriqués affichés sous forme de hiérarchie en fonction de la valeur des données données. L’aire de chaque rectangle correspond à la valeur numérique de ses données. Les tailles permettent de voir clairement l’échelle de chaque point de données, avec des échelles de couleurs offrant une distinction supplémentaire, le tout dans un espace d’affichage restreint.

De plus, les plates-formes de visualisation avancées telles que Tableau et Google Data Studio disposent d’options pour interroger des sous-ensembles de données à partir de sources de données. Cela vous donne des couleurs et des choix visuels supplémentaires pour raconter l’histoire de vos données.

Article connexe : Comment utiliser efficacement les rapports TreeMap de Google Analytics

Choisissez des visualisations qui correspondent à votre chronologie ou à votre emplacement

Le prochain choix de visualisation concerne l’affichage de l’évolution des données dans le temps. Les graphiques de relations fonctionnent généralement bien, tels que les graphiques linéaires qui peuvent montrer une comparaison dans le temps, ou tracer des graphiques de régression des changements de données sur une période définie. Mais vous devrez peut-être afficher de longues périodes de temps pour montrer une tendance importante, bien qu’évoluant lentement.

C’est là que les langages de programmation comme R et Python peuvent aider. Les bibliothèques – des scripts ajoutés pour la fonctionnalité – offrent des choix de visualisation afin que l’utilisateur puisse annoter des graphiques et créer des animations qui montrent comment les données changent au fil du temps. Souvent, les données sont lues dans le programme, puis mappées dans des graphiques visuels à l’aide de la bibliothèque. Les utilisateurs de Python ont un choix de bibliothèques, telles que Matplotlib et Seaborn, tandis que les utilisateurs de R ont accès à ggplot2, une bibliothèque basée sur une grammaire de concept graphique consistant à ajouter ou supprimer chaque élément graphique en tant que couche pour fournir des options de personnalisation.

L’avantage de ces bibliothèques est que vous pouvez créer des visuels personnalisés pour répondre à vos besoins, en utilisant des scripts qui appellent des données en temps réel via une API. Cela permet aux graphiques de rester à jour avec les informations les plus récentes.

Ceux-ci sont également utiles pour les visualisations spatiales telles que les graphiques de géolocalisation. Les données sont mappées à un emplacement d’intérêt, ce qui ajoute une autre considération pour l’affichage des informations. Les bibliothèques pour Python et R offrent des options pour les cartes visuelles et les combinaisons de graphiques.

Demandez à quelle fréquence les mises à jour des graphiques sont nécessaires

Un graphique doit-il être mis à jour régulièrement pour surveiller les performances en cours ou est-il nécessaire pour une analyse ponctuelle ? La réponse dicte quel type de flux de travail fonctionne le mieux.

Les graphiques en temps réel sont généralement associés à des tableaux de bord basés sur le cloud pour gérer les données et les visuels. Par exemple, dans la programmation R, vous pouvez facilement créer une application brillante, une application Web simple qui permet aux données, aux résultats du programme et aux graphiques d’apparaître dans un environnement numérique partagé. Une application brillante peut être hébergée en tant que tableau de bord qui met à jour les visualisations instantanément lorsque les données sont appelées. De plus, vous pouvez également ajouter des fonctionnalités HTML telles que des boutons et des curseurs pour permettre à votre public d’ajuster un affichage sans toucher aux données ou au code sous-jacent.

En fin de compte, vous devez définir le calendrier des rapports qui répond le mieux aux besoins de votre public à partir des données. Cela mettra en évidence les étapes nécessaires pour fournir vos graphiques et voir ce qui a un impact sur les décisions. Parfois, il y a des raisons techniques pour ajuster la chronologie. Souvent, les gens préfèrent une image statique ou sont limités à une image si le graphique est destiné à un document imprimé. Le mappage de données brutes sur des éléments visuels soulève la question de savoir quel accès aux sources de données est nécessaire pour alimenter les graphiques. S’il est mis à jour régulièrement, vous avez besoin d’un moyen simple pour mettre à jour les données et les annotations associées.

Article connexe : Qu’est-ce que Tableau ? Comment la BI inspire la croissance

Quelques derniers conseils pour choisir de bonnes visualisations

En fin de compte, une bonne sélection de visualisation rendra vos analyses claires. Comme je l’ai mentionné dans 10 erreurs à éviter lors de la refonte de votre stratégie d’analyse, vous voulez éviter les questions générales qui se transforment en un long récit ennuyeux sur vos données. Cela ne conduit à aucune conclusion significative sur vos efforts de marketing.

Si vous avez beaucoup de matériel critique mais que vous savez que les parties prenantes n’ont pas beaucoup de temps, vous pouvez placer ces visuels dans une annexe afin que les destinataires puissent examiner les détails quand cela leur convient. Vous pouvez découvrir quelques règles de base supplémentaires dans mon article sur la visualisation.

Choisir de bons visuels pour raconter une histoire met l’accent sur votre analyse marketing. Une visualisation forte ouvrira des discussions dans votre public sur les plats à emporter qui feront avancer vos expériences client – et votre organisation.

Pierre DeBois est le fondateur de Zimana, un cabinet de conseil en analyse numérique pour petites entreprises. Il examine les données des solutions d’analyse Web et de tableau de bord des médias sociaux, puis fournit des recommandations et des actions de développement Web qui améliorent la stratégie marketing et la rentabilité de l’entreprise.