Filtre suivi de prévision versus régression linéaire

Lorsque l'on dispose d'un ensemble de point décrivant un phénomène dans le temps, si l'on intuite une comportement linéaire, il est tentant de faire une régression linéaire1, de prendre les valeurs des coefficients a et b de la courbe, et d'utiliser ces valeurs pour prédire les valeurs futures. Cette méthode est simple (même sous Excel), surtout qu'il n'y a dans ce cas qu'une seule variable explicative, le temps. Cela pose cependant plusieurs problèmes :

  • Dans la régression, chaque valeur est équiprobable. Donc les valeurs passées ont autant d'importance que les valeurs récentes, alors que dans le cas de chroniques, on accorde souvent plus d'importance au passé proche qu'au passé lointain (la variable temps n'est pas une variable "ordinaire").
  • Dans la régression, on suppose généralement les données valides, alors que dans une chronique temporelle, on sait que, même si il y a un modèle sous-jacent, chaque valeur est bruitée (terme d'erreur).

Les méthodes préconisés pour prévoir dans une chronique consistent à contourner ces deux problèmes, et principalement:

  • Filtrer les données pour éliminer le bruit (les erreurs)
  • Choisir le type de modèle et estimer les paramètres de ce modèle
  • Utiliser ce modèle pour prévoir

Les méthodes de filtre avec la moyenne ou le lissage exponentiel apportent un gros avantage : elles ne prennent en compte qu’un horizon limité (moyenne mobile) ou accordent plus d’importance au passé proche qu’au passé lointain. Dans le cas ou la tendance évolue dans le temps, les méthodes de filtrage vont mieux caler à l’évolution du modèle.

Lorsque la chronique a une composante saisonnière, on doit rajouter une étape de désaisonnalisation (éliminer les effets de la variation saisonnière). Doit-on le faire avant ou après le filtrage. En le faisant avant (filtrage de la chronique brute avant de désaisonnaliser), on risque d'atténuer les effets saisonniers en filtrant. On confond ainsi un phénomène de variation saisonnière normal avec un bruit. Mais pour filtrer après avoir désaisonnalisé, il faut connaitre le modèle a priori.

Ne seront présenté ici que des méthodes simples de filtrage (moyenne mobile, centrée, lissage exponentiel) et des méthodes simples d'évaluation des paramètres.

Des méthodes plus avancées de prévision peuvent être vue dans : http://fr.wikipedia.org/wiki/ARMA

1 http://fr.wikipedia.org/wiki/R%C3%A9gression_lin%C3%A9aire