Les méthodes de prévision



Les prévisions ne sont pas réservées à la gestion des opérations. Elles sont évidement beaucoup plus vastes. Globalement, il existe 3 méthodes principales pour effectuer des prévisions1.
  • Méthodes informelles,
  • Méthodes extrapolatives,
  • Méthodes explicatives

La prévision ne peut être obtenue qu'en combinant au mieux, en fonction de la situation, ces trois approches.

Pour établir des prévisions avec une méthode extrapolative, les étapes sont les suivantes:
  • Chercher des données historiques (Chronique),
  • Corriger et nettoyer la chronique (erreurs, points aberrants...),
  • Identifier le modèle sous-jacent (généralement linéaire-tendance, avec ou sans saisonnalité),
  • Si besoin est, désaisonnaliser,
  • Filtrer les données (éliminer le bruit),
  • Établir des prévisions sur le modèle,
  • Resaisonnaliser si besoin,

Dans la plupart des cas, la prévision pour la date courante + n périodes est simplement la valeur filtrée actuelle + n fois la tendance.
La tendance peut être évaluée la plupart du temps en étudiant la chronique y(t)-y(t-1) (avec y(t) est la chronique filtrée, désaisonnalisée si besoin) qui est une chronique constante si le modèle est un modèle à tendance.
1 http://fr.wikipedia.org/wiki/Pr%C3%A9vision_%C3%A9conomique

Les trois méthodes de prévision

Les méthodes informelles utilisent des experts, soit au travers de focus groups2 , soit en utilisant des méthodes moins formalisées.
Ces méthodes utilisent les connaissances implicites des experts, leur connaissance des phénomènes spéciaux, leur connaissance d'événements futurs. Ils apportent dans la prévision du futur tout ce qui ne s'expliquera pas par le passé.Les méthodes informelles complètent souvent les autres méthodes, lorsque des phénomènes nouveaux interfèrent avec des phénomènes plus classiques et plus connus.

Les méthodes extrapolatives permettent d’analyser des séries chronologiques (historique d’une variable X(t) sur une longue période allant de -∞ à t) pour déterminer les valeurs prévisibles à t+1, t+2, etc. Ces méthodes ne cherchent pas à expliquer l’historique, mais seulement à le prolonger. En fait, la seule variable « explicative » utilisée par les méthodes extrapolatives est le temps pour les saisonnalités.

Les méthodes explicatives, quand à elles cherchent à expliquer un historique par des variables exogènes. On va chercher des relations du type


[math]v(t)=f(x_1(t),x_2(t),...,x_n(t))[/math]


Où les xi(t) sont des variables dont on connait les valeurs au cours du temps.


Exemple 1

Soit une entreprise québécoise, fabriquant des meubles haut de gamme pour le marché américain. Elle prépare son plan stratégique pour l’année suivante et se demande quelle seront ses ventes aux États-Unis. Elle peut :

Réunir ses responsables des ventes, et essayer de faire un focus groupe sur leur perception du marché, sur leur perception de la concurrence, etc…
Ressortir 3 années d’historique, état par état (ou globalement) et chercher si les ventes suivent une tendance ou des saisonnalités. Ensuite, anticiper le futur en extrapolant le passé.
Sachant que les ventes dépendent du prix et de l’état de la consommation, utiliser 3 historiques; les ventes v(t), le prix du baril de Pétrole (pb(t)) et le taux de change du huart (tch(t)) et chercher à expliquer les ventes par le prix du baril et du huart v(t)=f(pb(t),tch(t)). Ensuite, réunir des expert et établir des scénarios possibles de l’évolution du prix du baril et du taux de change, et en déduire des scénarios de ventes.

Exemple 2
Comment anticiper les ventes de bières dans une grosse épicerie?
On peut utiliser un historique, repérer des saisonnalités (par exemple pic de vente le mardi) et faire un modèle basé sur l’historique.
On peut aussi essayer d’expliquer les variations par les matchs des canadiens et par la température. Ces deux variables exogènes donneront peut être une meilleure précision que la seule utilisation de l’historique.

Le rôle des prévisions dans la GOP

La prévision en gestion des opérations à pour but de dimensionner les ressources à mettre en place pour pouvoir faire face à la demande. Les prévisions seront utilisées au niveau stratégique et au niveau tactique.

En gestion des opérations, on utilise le plus souvent les méthodes extrapolatives, corrigées par des méthodes informelles pour prendre en compte les phénomènes exceptionnels identifiés. Les méthodes extrapolatives consistent en une succession d’étapes bien déterminées :

  • Acquisition des données historiques (recherche et nettoyage
  • Identification du modèle
  • Filtrage des données pour éliminer les variations à court terme
  • Prévisions à partir des données filtrées

L’identification du modèle consiste d’une part à choisir le type de fonction représentant le mieux l’historique, mais aussi, une fois la fonction choisie, à trouver les paramètres de cette fonction représentant le mieux l’historique

Exemple :




Sur cet exemple, la même série chronologique a été utilisée sous Excel pour déterminer une prévision. On a essayé 3 modèles :

  • En haut à droite, modèle polynomial d’ordre 2,
  • En bas à gauche, modèle exponentiel,
  • En bas à droite, modèle linéaire.

Excel permet de choisir le type de la courbe de tendance et donne simultanément les paramètres de la fonction de ce type s’ajustant le mieux aux données et le coefficient R2.3 Sur cet exemple, la prévision faite avec le modèle polynomiale serait sans doute de « 9 » pour la prochaine période, avec le modèle exponentiel de 15, et avec le modèle linéaire de 13. Le choix du modèle est donc fondamental. On peut avec Excel non seulement avoir les paramètres du modèle mais aussi les « valeurs » prévisibles dans le futur (insérer une courbe de tendance+choisir le modèle+prévision transférer x période).

Les principaux modèles utilisées en gestion des opérations sont :

  • Modèle constant
  • Modèle à tendance
  • Modèle constant ou à tendance avec saisonnalité
    • Saisonnalité additive
    • Saisonnalité multiplicative

____________

1 http://fr.wikipedia.org/wiki/Pr%C3%A9vision_%C3%A9conomique
2 http://en.wikipedia.org/wiki/Focus_group
3 Le coefficient R2 mesure la part de la variance totale de la chronique par la variance de l’approximation, autrement dit c’est la (variance du modèle)/(variance de X(t)). Proche de 1, le modèle explique bien les données.



Acquisition des données d’historique

L’acquisition des données d’historique est un travail long, fastidieux et délicat. Les données ne sont jamais dans le format voulu, elles ne représentent jamais exactement ce que l’on cherche, elles sont entachées d’erreurs, elles comportent des aberrations.

Les données historiques utilisées en gestion des opérations sont essentiellement :

  • Production par unité de temps (heure, jour, semaines, mois, année)
  • Vente par unité de temps (jours, semaine, mois, années)
  • Chiffre d’affaire par unité de temps (semaine, mois, années)
  • Demande par unité de temps

Le premier travail consiste donc à travailler sur les données brutes pour obtenir des données exploitables. Les étapes du travail sont essentiellement :

  • Recherche des données dans les différents systèmes d’information
  • Corriger l’historique
    • correction des erreurs majeures
    • correction des anomalies identifiables
    • redressement structurel (périodes inégales)
  • Redresser l’historique (correction des biais interprétables)
  • Lisser l’historique

La première correction consiste à rechercher les données aberrantes, soit les erreurs de transcription, soit les erreurs de saisis. Ces erreurs sont fréquentes et peuvent être trouvées en recherchant systématiquement les valeurs au-delà de la moyenne +- deux écart types.

Les anomalies identifiables sont les anomalies qui ont eu une influence importante sur l’historique, mais qui expriment des phénomènes que l’on ne retrouvera pas. On peut parler :

  • Phénomènes climatiques ayant eu une influence
  • Phénomène exogène ayant eu une grosse influence (11 septembre, tsunami, etc.)
  • Phénomène endogène non renouvelé (période d’arrêt de travail par exemple)

Ces corrections sont manuelles et doivent éliminer l’influence de ces phénomènes sur la chronique.

Le redressement structurel est plus complexe. Les données historiques sont souvent issues de l’observation d’un phénomène dans le temps, que l’on agrège par période. L’hypothèse est que les périodes sont définies de telle sorte qu’elles soient comparables. Les périodes sont souvent fixées indépendamment du phénomène et sont intrinsèquement inégales par rapport à ce phénomène.

  • On utilise le mois, alors que le nombre de jours diffère et que le phénomène est lié au nombre de jour,
  • On utilise le mois alors que les jours ont une grande importance (fin de semaine en particulier) et le nombre de jours spéciaux diffère d’un mois à l’autre
  • On utilise la semaine, mais en cas de jours ferrié, on perd 1/7 de la semaine.

Pour corriger ce phénomène, on doit définir une unité élémentaire de capacité, analyser la composition de chaque période en fonction de cette unité élémentaire de capacité (nombre d’unités élémentaires de capacité à chaque période) et puis évaluer dans la période la charge moyenne de cette unité élémentaire d’une unité de capacité élémentaire.

Voir la fiche technique Redressement Structurel dans la section des fiches techniques.

Exemple de redressement avec des jours ouvrables.


Lorsque le demande journalière est indépendante du jour de la semaine (par exemple une entreprise travaillant 5 jours semaine et livrant indifféremment sur les 5 jours), la demande apparante du mois doit être corrigée pour ramener cela à un nombre standard de jours ouvrables:

  • Soit [math] n_i [/math] le nombre de jour ouvrable du mois i
  • Soit [math] d_i [/math] la demande apparente du mois i
  • Soit [math] dr_i [/math] la demande redressée:
  • [math]dr_i = \displaystyle\frac{\sum_{j = 1}^{12} n_j}{12}*\frac {d_i}{n_i} [/math]


    Donc si les demandes des 12 mois de 2011 étaient (626,621,671,620,651,662,609,680,663,623,665,675), tenant compte du fait que le nombre de jours ouvrables a été de (21,20,23,21,22,22,21,23,22,2,22,22), le nombre moyen de jours ouvrables par mois était de 260/12=21,666
    Les demandes redressées sont donc de : 645,672,632,639,641,651,628,640,652,642,654,664.
    La variance de la chronique initiale est de 648 (écart type de 25), ce qui peut donner l'impression d'une demande très variable, alors que la variance de la chronique redressée n'est que de 160 (écart type de 12) ce qui est plus rassurant.

    Exemple de redressement avec des jours déséquilibrés.


    Soit une chronique donnant l'historique des ventes dans les 12 derniers mois (830, 716, 821, 847, 783, 811, 839, 798, 785, 736, 800, 891). La variance est de 2261, écart type de 47, soit un système peu stable.
    L'analyse montre que les moyennes des demandes par jours sont respectivement (9.3; 28.6; 29.4; 29.2; 28.9, 59) - les ventes sont fermées le dimanche.
    L'analyse montre donc que les contributions des différents jours de la semaines en "jours équivalents" sont (0.35; 1.85; 1.11; 1,11; 1,11; 2.24; 0).
    On peut ainsi calculer le nombre de jours équivalents de chaque mois: (30.6; 28; 31.3; 31.4; 29.5; 30.22; 31.34; 30.55; 30.2; 30.6; 30.2; 32.44). En appliquant la méthode d'équilibrage précédente, on obtient des données redressées de (828; 780; 800; 825; 812; 819; 817; 797; 793; 734; 808; 838). Une variance de 750 et un écart type de 27.

    ____________

    1 http://fr.wikipedia.org/wiki/Pr%C3%A9vision_%C3%A9conomique
    2 http://en.wikipedia.org/wiki/Focus_group
    3 Le coefficient R2 mesure la part de la variance totale de la chronique par la variance de l’approximation, autrement dit c’est la (variance du modèle)/(variance de X(t)). Proche de 1, le modèle explique bien les données.



Filtre suivi de prévision versus régression linéaire

Lorsque l'on dispose d'un ensemble de point décrivant un phénomène dans le temps, si l'on intuite une comportement linéaire, il est tentant de faire une régression linéaire1, de prendre les valeurs des coefficients a et b de la courbe, et d'utiliser ces valeurs pour prédire les valeurs futures. Cette méthode est simple (même sous Excel), surtout qu'il n'y a dans ce cas qu'une seule variable explicative, le temps. Cela pose cependant plusieurs problèmes :

  • Dans la régression, chaque valeur est équiprobable. Donc les valeurs passées ont autant d'importance que les valeurs récentes, alors que dans le cas de chroniques, on accorde souvent plus d'importance au passé proche qu'au passé lointain (la variable temps n'est pas une variable "ordinaire").
  • Dans la régression, on suppose généralement les données valides, alors que dans une chronique temporelle, on sait que, même si il y a un modèle sous-jacent, chaque valeur est bruitée (terme d'erreur).

Les méthodes préconisés pour prévoir dans une chronique consistent à contourner ces deux problèmes, et principalement:

  • Filtrer les données pour éliminer le bruit (les erreurs)
  • Choisir le type de modèle et estimer les paramètres de ce modèle
  • Utiliser ce modèle pour prévoir

Les méthodes de filtre avec la moyenne ou le lissage exponentiel apportent un gros avantage : elles ne prennent en compte qu’un horizon limité (moyenne mobile) ou accordent plus d’importance au passé proche qu’au passé lointain. Dans le cas ou la tendance évolue dans le temps, les méthodes de filtrage vont mieux caler à l’évolution du modèle.

Lorsque la chronique a une composante saisonnière, on doit rajouter une étape de désaisonnalisation (éliminer les effets de la variation saisonnière). Doit-on le faire avant ou après le filtrage. En le faisant avant (filtrage de la chronique brute avant de désaisonnaliser), on risque d'atténuer les effets saisonniers en filtrant. On confond ainsi un phénomène de variation saisonnière normal avec un bruit. Mais pour filtrer après avoir désaisonnalisé, il faut connaitre le modèle a priori.

Ne seront présenté ici que des méthodes simples de filtrage (moyenne mobile, centrée, lissage exponentiel) et des méthodes simples d'évaluation des paramètres.

Des méthodes plus avancées de prévision peuvent être vue dans : http://fr.wikipedia.org/wiki/ARMA

1 http://fr.wikipedia.org/wiki/R%C3%A9gression_lin%C3%A9aire

Méthodes de filtrage des données

Filtrer, c'est traiter une chronique pour éliminer tous les phénomènes perturbant qui d'une période à l'autre viennent brouiller le modèle sous-jacent. On filtre une chronique avant de faire les prévisions. Dans le cas d'une chronique saisonnière, on doit d'abord la désaisonnaliser avant de la filtrer. Les deux outils classiques sont la moyenne mobile et le lissage.

Moyenne mobile

La moyenne mobile est l’outil le plus simple pour filtrer une chronique et pour faire des prévisions. La moyenne mobile se définit de la manière suivante :


[math]\overline {y(t)} = \displaystyle\frac{1}{n} \sum_{i = 0}^{n-1} (y(t-i)) [/math]



Elle demande pour la calculer la connaissance des n-1 dernières valeurs de la chronique, plus la valeur courante. La moyenne mobile ignore le passé lointain et donne autant d’importance à chacune des « n » valeurs utilisées.



Prévision :

Dans le cas d’une chronique sans tendance, la moyenne mobile est un estimateur sans biais de la prévision et on a [math]\hat Y (t+i)=\overline {y(t)}[/math].

Si la chronique suit une tendance [math]y(t)= at + b [/math], alors la moyenne mobile des n dernières valeurs induit un biais de [math]\displaystyle\frac {m-1}{2}[/math] et on a : [math]\overline {y(t)} = a \left( t - \displaystyle\frac {m-1}{2} \right ) + b [/math].

Voir la fiche technique Prévisions dans la section des fiches techniques.



Remarque :
On utilise quelque fois la moyenne mobile centrée :


[math]\overline {y(t)} = \displaystyle\frac {1}{2n-1} \sum_{i = -n}^{n} y(t-i)[/math]



Ceci ne change pas trop, sauf que la moyenne mobile centrée n’introduit pas de biais lorsque la chronique suit une tendance, mais en revanche elle n’est pas définie pour les n dernières valeurs de la chronique.

La moyenne mobile d’ordre 2 noté [math] \overline{\overline {y(t)}}[/math] est la moyenne des moyennes :


[math]\overline{\overline {y(t)}}= \displaystyle\frac{1}{n} \sum_{i = 0}^{n-1} \overline{y(t-i)}[/math]



Prévision :

Dans le cas d’une chronique avec tendance, la prévision [math]\hat y (t+i)[/math] peut être obtenue par la courbe

[math] \hat y (t+i)= a*i + b [/math]


avec [math] a=\displaystyle\frac {2}{n-1} \left( \overline{y(t)}-\overline{\overline {y(t)}}\right)[/math] et [math]b= 2\overline{y(t)} - \overline{\overline{y(t)}}[/math]

Voir la fiche technique Prévisions dans la section des fiches techniques.

On peut aussi étudier la chronique [math]\overline{a(t)} = \overline{y(t)} - \overline{y(t-1)} [/math] qui est normalement une chronique constante de moyenne a. On peut prendre la moyenne des k dernières valeurs de a, faire un lissage exponentiel, etc..
Finalement, la prévision sera [math] \hat Y (t+i)= \overline{y(t)}+ a* \left( i+\displaystyle\frac {m-1}{2}\right) [/math]
Voir l'exemple dans le fiche technique Exemple de prévision avec la moyenne


Lissage exponentiel

Le lissage exponentiel permet de filtrer les données en donnant une importance plus importante au passé proche qu’au passé lointain. Le lissage exponentiel de la chronique y(t) est définie par


[math]y'(t)= \alpha \displaystyle \sum_{i = 0}^{\infty} (1- \alpha)^i y(t-i)[/math]


C’est en quelque sorte une moyenne avec des poids variables. En effet, la somme des coefficients vaut 1 puisque :


[math]\displaystyle \sum_{i = 0}^{\infty} (1- \alpha)^i = \displaystyle \frac {1}{ \alpha}[/math]



Plutôt que de mémoriser l’historique complet, on remarque que


[math]y'(t)= \alpha \displaystyle \sum_{i = 0}^{\infty} (1-\alpha)^i y(t-i)=\alpha y(t)+ \displaystyle \sum_{i=1}^{\infty}(1- \alpha)^i y(t-i)[/math]



En sortant le terme en i=0, puis en changeant de variable (j=i-1)


[math]y'(t)= \alpha y(t)+(1- \alpha) \alpha \displaystyle \sum_{i=1}^{\infty} (1- \alpha)^{i-1}y \left( t-1-(i-1) \right) = \alpha y(t)+(1- \alpha) \alpha \displaystyle \sum_{j=0}^{\infty}(1- \alpha)^{j}y \left( t-1-j \right) [/math]


donc
[math]y'(t)= \alpha *y(t)+(1-\alpha)*y'(t-1)[/math]


Le lissage prenant en compte l’historique au complet peut donc être calculé en n’utilisant que deux valeurs, la valeur observée courante de la chronique et la valeur lissée à la période précédente.


Prévision :

Si le modèle sous-jacent est un modèle constant (sans tendance), alors la prévision pour [math] \hat {Y}(t+i)[/math] est Y'(t).

Si le modèle sous-jacent est un modèle avec tendance, alors il faut utiliser le lissage d’ordre deux. En effet, le lissage simple induit un retard de [math]\displaystyle \frac {1- \alpha}{\alpha} [/math]

Voir la fiche technique Prévisions dans la section des fiches techniques.

Le lissage exponentiel d’ordre 2 est noté y’’(t). Il se défini comme le lissage du lissage.


[math]y''(t)= \alpha \displaystyle \sum_{i=0}^{\infty}(1- \alpha)^i y'(i-t)[/math]



Comme pour le lissage d’ordre 1, on remarque que


[math]y''(t)= \alpha y'(t) + (1- \alpha) y''(t)(t-1)[/math]



Avec ce lissage double, il est possible d’effectuer plus de prévisions



Prévision :

Si le modèle est un modèle avec tendance, alors en prenant comme la prévision pour [math]\hat {Y}(t+i)[/math] est

[math]\hat {Y}(t+i)=a(i)+b[/math]


Où [math] a= \displaystyle \frac {\alpha}{1- \alpha} \left( y'(t) - y''(t) \right )[/math] et [math]b=2y'(t) - y'' (t) [/math]

Voir la fiche technique Prévisions dans la section des fiches techniques.

On peut aussi utiliser les écarts entre deux lissage consécutif comme estimateur de a.
Voir aussi pour les prévisions l'exemple dans le fiche technique Exemple de prévision avec le lissage exponentiel

Exemple :

Dans le fichier previsions-lissageexponentiel.xlsx
il y a deux feuilles. Considérons la feuille prévision avec lissage simple.

Partie 1

Le principe de le feuille est de générer aléatoirement une chronique y(t) pour t=1 à t=83. Cette chronique est générée suivant la loi suivante : Y(t)=base+pente+bruit.

En jouant sur les coefficients de la pente ou du bruit, on génère une chronique plus ou moins régulière.

Les colonnes y’(t) et y’’(t) donnent les lissages d’ordre 1 et 2 de la chronique. Les valeurs initiales (pour t=1) sont prise par défaut à y’(1)=y’’(1)=y(1). Évidement, cela ne permet pas de connaitre le passé, mais l’équation mathématique [math] \displaystyle \sum_{i=0}^ \infty \alpha (1- \alpha)^i y(t-i) [/math] n’a pas de sens dans le monde réel, aucune chronique ne comment à [math]- \infty [/math].

Les colonnes a et b donnent les coefficients de la pente tel qu’ils sont calculables à chaque instant.

Par exemple, pour la date t=22, en connaissant seulement les y(t) de 1 à 22, le coefficient calculé est dans la cellule (E26). Le b calculé est dans la cellule (E27). Avec ces deux coefficients, le responsable peut prédire la valeur [math] \hat {y}(23) [/math] qui est dans la cellule (G27).

La colonne H donne les écarts entre cette prévision (faisant l’hypothèse que la chronique suit une tendance) et la réalité. La colonne I, quant à elle, donne l’écart entre le lissage fait en semaine t-1 et la valeur observée en t : c’est donc l’écart entre prévision et observation si on utilise pour la chronique un modèle sans tendance donc [math]\hat {y}(t)=y’(t-1)[/math].

La colonne J représente la prévision qu’on pourrait faire en date de la semaine 52, pour les semaines de 53 à 83. Il faut comprendre qu’évidement, lorsque cette prévision est faite, les valeurs y(t) pour t=53 à 83 sont inconnus.

Question

Faites varier le coefficient alpha de 0.01 à 0.3 et observez ce qui se passe. Pourquoi ces variations?

Faites varier le coefficient de la pente et interpréter.

Partie 2

Regarder la feuille «prevision avec lissage complexe ». Le générateur de chronique est plus complexe, et le phénomène sous jacent est une courbe avec tendance, mais dont la tendance évolue légèrement (sinusoïde) en fonction du temps.

La courbe bleu est la chronique, la rouge est la prévision en utilisant le modèle avec tendance, la verte en utilisant le modèle sans tendance. La courbe verte accuse donc un retard de [math] \displaystyle \frac {(1- \alpha)}{ \alpha} [/math] sur la chronique. Soit si alpha=0.1, un retard de 9 périodes.

1 http://fr.wikipedia.org/wiki/Pr%C3%A9vision_%C3%A9conomique
2 http://en.wikipedia.org/wiki/Focus_group
3 Le coefficient R2 mesure la part de la variance totale de la chronique par la variance de l’approximation, autrement dit c’est la (variance du modèle)/(variance de X(t)). Proche de 1, le modèle explique bien les données.



Saisonnalité

Beaucoup de chroniques étudiées en gestion des opérations sont saisonnières. Les saisonnalités peuvent provenir :
  • Du mois de l’année car les ventes sont associées au climat (motoneige, ski, produit de jardin, service lié aux périodes de congé, etc.)
  • De la période de l’année pour des raisons calendaires (fête du calendrier, lien avec des rentrées universitaire ou scolaire, liés à des autorisations de pêche ou de chasse, etc…)
  • De la période du mois (disponibilités financières liées au versement des salaires dans des pays ou les salaires sont mensuels, disponibilités liées aux fin de semaines, etc.)

Si on dispose d’une série chronologique X(t) et qu’on suspecte une saisonnalité, on peut confirmer l’impression avec un graphique superposé ou un corrélogramme.

Graphique superposé :

Le graphique superposé consiste tout simplement, lorsque l'on suspecte une saisonnalité de période T dans une chronique X(t), à représenter les différentes courbes : [math] \displaystyle Y_i = \left(X_{i*T+j}\right)_{j=1..T} [/math] pour les [math]i [/math] pour lesquels c'est définie, allant de 0 à [math] n/T[/math] si n est le nombre d'éléments de la chronique. Autrement dit, une courbe par période, toutes supperposées. Si le phénomène est effectivement saisonnier, les courbes ont toutes la même allure.
LE graphique des coefficients de corrélation donne tout simplement pour un j donné, le coefficient de corrélation entre la chronique [math] \left(X_i\right)_{i=1..n-j}[/math] et la chronique décalée de j, soit [math] \left(X_i\right)_{i=j..n}[/math]. Si la chronique est de périodicité T, le corrélogramme doit atteindre un maximum proche de 1 pour [math] j=T
[/math]

Exemple : A COMPLETER

Une fois la saisonnalité identifiée, deux modèles sont possibles : additif ou multiplicatif.

  • Additif : X(t)=f(t)+Cs(t)+e(t)
  • Multiplicatif : X(t)=f(t)*Cs(t)+e(t)

Où f(t) est le modèle sous jacent (constant ou avec une tendance) et e(t) l’erreur.

L’évaluation des coefficients de saisonnalité se fait le plus souvent par une moyenne des coefficients passés, ramené à la moyenne [math] \overline {X(t)} de la chronique.

  • Additif : moyenne des [math] X(t + i \times T) - \overline {X(t + i \times T)} [/math] disponibles
  • Multiplicatif : moyenne des [math] \displaystyle \frac {X(t+i \times T)} {\overline {X(t + i \times T)}} [/math] disponibles

La moyenne [math] \overline {(X(t)} [/math] étant calculée de la manière suivante :

  • Si la saisonnalité est un nombre impair «T» de période :

    [math] \overline {X(t)} = \displaystyle \frac {1}{T} \sum_{ \frac {-(T-1)}{2}}^{ \frac {T-1}{2}} X(t+i) [/math]

  • Si la saisonnalité est un nombre pair «T» de période :

    [math] \overline {X(t)} = \displaystyle \frac {1}{T-1} \sum_{ \frac {-T}{2} -1}^{ \frac {T}{2} -1} X(t+i) + \frac 12 \left( X(t+ \frac T2) + X(t- \frac T2) \right) [/math]

Exemple : A COMPLETER

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31
janvier 72 18 23 20 33 11 40 70 15 25 23 33 17 49 77 12 26 24 30 17 42 70 15 20 28 30 19 45 78 16 20
février 25 37 16 41 75 15 20 29 37 14 48 71 15 26 26 32 17 47 74 12 24 24 33 10 46 71 12 26 25
mars 36 10 40 79 16 23 21 36 17 48 77 18 21 28 36 16 43 74 12 24 20 36 15 46 77 17 28 21 33 13 48
avril 72 11 24 28 37 11 42 72 19 20 21 37 11 46

Pour prévoir avec une chronique ayant une composante saisonnière, on procède le plus souvent de la manière suivante :

  • Désaisonnaliser la chronique
  • Effectuer une prévision sur la chronique désaisonnalisée, soit avec un modèle constant, soit avec un modèle avec tendance
  • Resaisonnaliser la prévision.

Les coefficients de saisonnalité peuvent être calculés une fois pour toute ou recalculés à chaque prévision.

Exemple : A COMPLETER

____________

1 http://fr.wikipedia.org/wiki/Pr%C3%A9vision_%C3%A9conomique
2 http://en.wikipedia.org/wiki/Focus_group
3 Le coefficient R2 mesure la part de la variance totale de la chronique par la variance de l’approximation, autrement dit c’est la (variance du modèle)/(variance de X(t)). Proche de 1, le modèle explique bien les données.