--- title: "R" date: 2021-04-01T11:48:56+02:00 tags: - R categories : - R draft: false description : "analyse des ventes" slug : "analyse des ventes" image: "R_logo.png" --- # Analyse des ventes Dans une entreprise commerciale, il est souvent pertinent de suivre la vente d'une catégorie particulière. Ici nous allons nous intéresser à la vente des boissons à 20% ## Le modèle de données Le fichier csv qui sert de support est comme suit : jour,date,total.TTC.10,total.TTC.20 Les dates sont au format JJ/MM/AAAA Exemple de données : 1 jour,date,total TTC 10 %,total TTC 20 % 2 samedi,01/04/17,"458,5","7,6" 3 dimanche,02/04/17,"323,35", 4 lundi,03/04/17,, 5 mardi,04/04/17,176, 6 mercredi,05/04/17,"289,6","6,8" 7 jeudi,06/04/17,"329,5", ## Première étape : charger le fichier csv {{< highlight R>}} Database <- read.csv(file.choose(), header = TRUE, sep= ",", encoding="UTF-8") {{< /highlight >}} On vérifie la qualité du chargement : * Les entêtes {{< highlight R>}} > names(Database) [1] "jour" "date" "total.TTC.10.." "total.TTC.20.." {{< /highlight >}} * Le nombre de colonnes et le nombre de lignes : {{< highlight R >}} > dim(Database) [1] 365 4 {{< /highlight >}} ## On vérifie les premières lignes {{< highlight R >}} > head(Database) jour date total.TTC.10.. total.TTC.20.. 1 samedi 01/04/17 458,5 7,6 2 dimanche 02/04/17 323,35 3 lundi 03/04/17 4 mardi 04/04/17 176 5 mercredi 05/04/17 289,6 6,8 6 jeudi 06/04/17 329,5 {{< /highlight >}} ## Sélectionner que les mardis : {{< highlight R >}} subset(Database, Database$jour %in% "mardi") {{< /highlight >}} ## Passer la colonne date au format YYYY-MM-DD * Pour changer le format de la date on a besoin du package **lubridate** {{< highlight R >}} install.packages('lubridate') library(lubridate) dmy(Database$date) {{< /highlight >}} ## Regrouper les lignes pour n'avoir qu'un cumul par mardi * On a besoin de 2 paquets supplémentaires {{< highlight R >}} install.packages("magrittr") # pour avoir accés à la fonction %>% library(magrittr) install.packages("dplyr") # pour avoir la fonction group_by library(dplyr) {{< /highlight >}}