Acquisition des données d’historique

L’acquisition des données d’historique est un travail long, fastidieux et délicat. Les données ne sont jamais dans le format voulu, elles ne représentent jamais exactement ce que l’on cherche, elles sont entachées d’erreurs, elles comportent des aberrations.

Les données historiques utilisées en gestion des opérations sont essentiellement :

  • Production par unité de temps (heure, jour, semaines, mois, année)
  • Vente par unité de temps (jours, semaine, mois, années)
  • Chiffre d’affaire par unité de temps (semaine, mois, années)
  • Demande par unité de temps

Le premier travail consiste donc à travailler sur les données brutes pour obtenir des données exploitables. Les étapes du travail sont essentiellement :

  • Recherche des données dans les différents systèmes d’information
  • Corriger l’historique
    • correction des erreurs majeures
    • correction des anomalies identifiables
    • redressement structurel (périodes inégales)
  • Redresser l’historique (correction des biais interprétables)
  • Lisser l’historique

La première correction consiste à rechercher les données aberrantes, soit les erreurs de transcription, soit les erreurs de saisis. Ces erreurs sont fréquentes et peuvent être trouvées en recherchant systématiquement les valeurs au-delà de la moyenne +- deux écart types.

Les anomalies identifiables sont les anomalies qui ont eu une influence importante sur l’historique, mais qui expriment des phénomènes que l’on ne retrouvera pas. On peut parler :

  • Phénomènes climatiques ayant eu une influence
  • Phénomène exogène ayant eu une grosse influence (11 septembre, tsunami, etc.)
  • Phénomène endogène non renouvelé (période d’arrêt de travail par exemple)

Ces corrections sont manuelles et doivent éliminer l’influence de ces phénomènes sur la chronique.

Le redressement structurel est plus complexe. Les données historiques sont souvent issues de l’observation d’un phénomène dans le temps, que l’on agrège par période. L’hypothèse est que les périodes sont définies de telle sorte qu’elles soient comparables. Les périodes sont souvent fixées indépendamment du phénomène et sont intrinsèquement inégales par rapport à ce phénomène.

  • On utilise le mois, alors que le nombre de jours diffère et que le phénomène est lié au nombre de jour,
  • On utilise le mois alors que les jours ont une grande importance (fin de semaine en particulier) et le nombre de jours spéciaux diffère d’un mois à l’autre
  • On utilise la semaine, mais en cas de jours ferrié, on perd 1/7 de la semaine.

Pour corriger ce phénomène, on doit définir une unité élémentaire de capacité, analyser la composition de chaque période en fonction de cette unité élémentaire de capacité (nombre d’unités élémentaires de capacité à chaque période) et puis évaluer dans la période la charge moyenne de cette unité élémentaire d’une unité de capacité élémentaire.

Voir la fiche technique Redressement Structurel dans la section des fiches techniques.

Exemple de redressement avec des jours ouvrables.


Lorsque le demande journalière est indépendante du jour de la semaine (par exemple une entreprise travaillant 5 jours semaine et livrant indifféremment sur les 5 jours), la demande apparante du mois doit être corrigée pour ramener cela à un nombre standard de jours ouvrables:

  • Soit [math] n_i [/math] le nombre de jour ouvrable du mois i
  • Soit [math] d_i [/math] la demande apparente du mois i
  • Soit [math] dr_i [/math] la demande redressée:
  • [math]dr_i = \displaystyle\frac{\sum_{j = 1}^{12} n_j}{12}*\frac {d_i}{n_i} [/math]


    Donc si les demandes des 12 mois de 2011 étaient (626,621,671,620,651,662,609,680,663,623,665,675), tenant compte du fait que le nombre de jours ouvrables a été de (21,20,23,21,22,22,21,23,22,2,22,22), le nombre moyen de jours ouvrables par mois était de 260/12=21,666
    Les demandes redressées sont donc de : 645,672,632,639,641,651,628,640,652,642,654,664.
    La variance de la chronique initiale est de 648 (écart type de 25), ce qui peut donner l'impression d'une demande très variable, alors que la variance de la chronique redressée n'est que de 160 (écart type de 12) ce qui est plus rassurant.

    Exemple de redressement avec des jours déséquilibrés.


    Soit une chronique donnant l'historique des ventes dans les 12 derniers mois (830, 716, 821, 847, 783, 811, 839, 798, 785, 736, 800, 891). La variance est de 2261, écart type de 47, soit un système peu stable.
    L'analyse montre que les moyennes des demandes par jours sont respectivement (9.3; 28.6; 29.4; 29.2; 28.9, 59) - les ventes sont fermées le dimanche.
    L'analyse montre donc que les contributions des différents jours de la semaines en "jours équivalents" sont (0.35; 1.85; 1.11; 1,11; 1,11; 2.24; 0).
    On peut ainsi calculer le nombre de jours équivalents de chaque mois: (30.6; 28; 31.3; 31.4; 29.5; 30.22; 31.34; 30.55; 30.2; 30.6; 30.2; 32.44). En appliquant la méthode d'équilibrage précédente, on obtient des données redressées de (828; 780; 800; 825; 812; 819; 817; 797; 793; 734; 808; 838). Une variance de 750 et un écart type de 27.

    ____________

    1 http://fr.wikipedia.org/wiki/Pr%C3%A9vision_%C3%A9conomique
    2 http://en.wikipedia.org/wiki/Focus_group
    3 Le coefficient R2 mesure la part de la variance totale de la chronique par la variance de l’approximation, autrement dit c’est la (variance du modèle)/(variance de X(t)). Proche de 1, le modèle explique bien les données.