content_atlanticaweb.fr/posts/R/ventes_de_boissons_a_20.md

1.9 KiB

title date tags categories draft description slug
R 2021-04-01T11:48:56+02:00
R
R
true analyse des ventes analyse des ventes

Analyse des ventes

Dans une entreprise commerciale, il est souvent pertinent de suivre la vente d'une catégorie particulière. Ici nous allons nous intéresser à la vente des boissons à 20%

Le modèle de données

Le fichier csv qui sert de support est comme suit : jour,date,total.TTC.10,total.TTC.20

Les dates sont au format JJ/MM/AAAA Exemple de données :

1 jour,date,total TTC 10 %,total TTC 20 %
2 samedi,01/04/17,"458,5","7,6"
3 dimanche,02/04/17,"323,35",
4 lundi,03/04/17,,
5 mardi,04/04/17,176,
6 mercredi,05/04/17,"289,6","6,8"
7 jeudi,06/04/17,"329,5",

Première étape : charger le fichier csv ''Database <- read.csv(file.choose(), header = TRUE, sep= ",", encoding="UTF-8")''

On vérifie la qualité du chargement : ''Les entêtes'' ''> names(Database)'' ''[1] "jour" "date" "total.TTC.10.." "total.TTC.20.."'' Le nombre de colonnes et le nombre de lignes : '''

dim(Database)
[1] 365 4 '''

On vérifie les premières lignes : '''

head(Database)
jour date total.TTC.10.. total.TTC.20.. 1 samedi 01/04/17 458,5 7,6 2 dimanche 02/04/17 323,35
3 lundi 03/04/17
4 mardi 04/04/17 176
5 mercredi 05/04/17 289,6 6,8 6 jeudi 06/04/17 329,5 '''

Sélectionner que les mardis : ''subset(Database, Database$jour %in% "mardi")''

===== Passer la colonne date au format YYYY-MM-DD =====

install.packages('lubridate') library(lubridate) dmy(Database$date)

install.packages("magrittr") # pour avoir accés à la fonction %>% library(magrittr) install.packages("dplyr") # pour avoir la fonction group_by library(dplyr)