ADD : section R

This commit is contained in:
Alexandre LUCAZEAU 2021-04-02 08:32:12 +02:00
parent 60e5330a49
commit 45de005e53
1 changed files with 72 additions and 0 deletions

View File

@ -0,0 +1,72 @@
---
title: "R"
date: 2021-04-01T11:48:56+02:00
tags:
- R
categories :
- R
draft: true
description : "analyse des ventes"
slug : "analyse des ventes"
---
# Analyse des ventes
Dans une entreprise commerciale, il est souvent pertinent de suivre la vente d'une catégorie particulière.
Ici nous allons nous intéresser à la vente des boissons à 20%
## Le modèle de données
Le fichier csv qui sert de support est comme suit :
jour,date,total.TTC.10,total.TTC.20
Les dates sont au format JJ/MM/AAAA
Exemple de données :
1 jour,date,total TTC 10 %,total TTC 20 %
2 samedi,01/04/17,"458,5","7,6"
3 dimanche,02/04/17,"323,35",
4 lundi,03/04/17,,
5 mardi,04/04/17,176,
6 mercredi,05/04/17,"289,6","6,8"
7 jeudi,06/04/17,"329,5",
Première étape : charger le fichier csv
''Database <- read.csv(file.choose(), header = TRUE, sep= ",", encoding="UTF-8")''
On vérifie la qualité du chargement :
''Les entêtes''
''> names(Database)''
''[1] "jour" "date" "total.TTC.10.." "total.TTC.20.."''
Le nombre de colonnes et le nombre de lignes :
'''
> dim(Database)
[1] 365 4
'''
On vérifie les premières lignes :
'''
> head(Database)
jour date total.TTC.10.. total.TTC.20..
1 samedi 01/04/17 458,5 7,6
2 dimanche 02/04/17 323,35
3 lundi 03/04/17
4 mardi 04/04/17 176
5 mercredi 05/04/17 289,6 6,8
6 jeudi 06/04/17 329,5
'''
>
Sélectionner que les mardis :
''subset(Database, Database$jour %in% "mardi")''
===== Passer la colonne date au format YYYY-MM-DD =====
install.packages('lubridate')
library(lubridate)
dmy(Database$date)
install.packages("magrittr") # pour avoir accés à la fonction %>%
library(magrittr)
install.packages("dplyr") # pour avoir la fonction group_by
library(dplyr)