Analyse des ventes d’une librairie avec Python et R Shiny

Author

AGOSSOU Conrad
DJOKO FOKOU Keyssel
ICHAS Gaspard

Published

March 9, 2025

Introduction

Les données ont été proposé par OpenClassrooms dans le cadre de leur formation Data Analyst. Ce projet a été réalisé dans le but de renforcer nos compétences en visualisation de données et en analyse descriptive, tout en mettant en pratique la construction d’un dashboard interactif avec R Shiny.

Scénario

Nous sommes consultant Data Analyst rattaché au service Marketing de Lapage, une grande librairie généraliste en ligne. Après deux années d’activité, l’entreprise souhaite analyser ses ventes et obtenir des insights pour optimiser ses performances.

Objectifs

  • Nettoyer et préparer les données.
  • Réaliser une analyse descriptive univariée et bivariée avec Python.
  • Développer un dashboard interactif sous R Shiny.
  • Identifier des tendances et fournir des recommandations basées sur les données.

Méthodologie

  1. Préparation des données : Nettoyage, suppression des valeurs aberrantes, gestion des valeurs manquantes.
  2. Analyse exploratoire : Visualisation des données avec matplotlib, seaborn et pandas.
  3. Développement du dashboard : Création d’un dashboard en R Shiny structuré en cinq onglets.

Structure du Dashboard

Nous avons conçu cinq onglets principaux correspondant aux besoins de l’entreprise :

  1. Chiffre d’affaires
  2. Produits
  3. Clientèle
  4. Catégories de produits
  5. Sessions du site e-commerce

Résultats et Insights

Analyse du Chiffre d’Affaires

  • Forte croissance entre 2021 et 2022, suivie d’une chute marquée en 2023 qui n’en est pas une en réalité car les données couvrent les ventes jusqu’à février 2023.
  • Forte variabilité journalière avec des pics et des creux, suggérant des tendances saisonnières ou des événements influents.
  • À l’échelle mensuelle, tendance globalement stable, mais une chute en octobre 2021 due à une baisse du nombre de sessions, possiblement causée par un problème avec le site e-commerce.

Analyse des Produits

  • 3 265 références réparties en trois catégories.
  • La majorité des produits appartiennent à la catégorie 0.
  • En termes de ventes :
    • Catégorie 0 : 415 459 unités vendues, largement dominante.
    • Catégorie 1 en seconde position.
    • Catégorie 2 marginale.
  • Les produits les plus performants en chiffre d’affaires ne sont pas forcément ceux les plus vendus en quantité, indiquant des écarts de prix significatifs.
  • La majorité des produits ont un faible volume de ventes, tandis qu’un petit nombre de produits se vendent en grandes quantités.

Analyse des Clients

  • Les femmes représentent la majorité de la clientèle, bien que les proportions entre les sexes soient assez comparables.
  • Répartition par âge similaire entre hommes et femmes :
    • Les jeunes adultes sont les plus représentés.
    • Suivis des clients d’une quarantaine d’années.
    • Âge minimal : 19 ans.
    • Âge maximal : 94 ans.
  • Analyse du chiffre d’affaires des clients :
    • Écart significatif entre les quatre plus gros clients et les suivants.
    • Ces clients semblent être des professionnels ou des entreprises.
    • Nécessité de traiter ces clients séparément pour éviter qu’ils n’influencent trop fortement les résultats.

Analyse de la Répartition des Catégories

  • Catégories “0” et “1” génèrent un chiffre d’affaires comparable.
  • Catégorie “2” en retrait.
  • Répartition des quantités inégale :
    • Catégorie “0” : prix majoritairement autour de 10 €.
    • Catégorie “1” : prix majoritairement autour de 20 €.
    • Catégorie “2” : produits bien plus chers.

Analyse des Sessions

  • Forte fluctuation du nombre de sessions.
  • Chute brutale en octobre 2021, possiblement liée à un événement spécifique ou un problème technique de la plateforme e-commerce.
  • Répartition des sessions par mois relativement stable :
    • Baisse en novembre.
    • Augmentation en décembre.
  • Répartition par sexe équilibrée, avec un léger avantage pour les hommes.

Conclusion

L’analyse met en évidence plusieurs axes d’amélioration :

Optimisation des Ventes et du Chiffre d’Affaires

  • Cibler la catégorie 0 qui représente la majorité des ventes en renforçant les promotions et la visibilité des best-sellers.
  • Miser sur les produits les plus rentables : notamment ceux à forte valeur ajoutée dans la catégorie 1.

Amélioration de l’Expérience e-Commerce

  • Corriger les problèmes techniques ayant causé la chute des sessions en octobre 2021.
  • Optimiser l’ergonomie du site pour réduire les abandons de navigation et faciliter les achats.
  • Améliorer le référencement des produits afin d’accroître la visibilité des articles les plus vendus.

Segmentation et Stratégie Client

  • Distinguer les professionnels des particuliers et leur proposer des offres adaptées.
  • Personnaliser les recommandations en fonction des tranches d’âges et des habitudes d’achat.
  • Cibler les jeunes adultes et quadragénaires qui constituent la majorité de la clientèle.

Stratégie Produit et Tarification

  • Ajuster la tarification des catégories : optimiser la gamme de prix de la catégorie 2 pour attirer plus de clients.
  • Développer des offres groupées combinant des produits des catégories 0 et 1 pour booster les ventes.

Le dashboard R Shiny permet aux décideurs d’avoir une vue dynamique et interactive des résultats, facilitant ainsi la prise de décision basée sur les données. Pour accéder au dashboard, cliquez ici.

Prochaines étapes : Intégrer des modèles de machine learning pour prédire les tendances et affiner les recommandations.


Projet réalisé avec Python, R studio, R Shiny