Le rôle de la causalité de Granger dans l'identification des relations causales pour la prévision de séries chronologiques

Nouvelles

MaisonMaison / Nouvelles / Le rôle de la causalité de Granger dans l'identification des relations causales pour la prévision de séries chronologiques

Aug 10, 2023

Le rôle de la causalité de Granger dans l'identification des relations causales pour la prévision de séries chronologiques

Histoire réservée aux membres David Andres Suivre DataDrivenInvestor -- Partager Nous avons présenté l'autorégression vectorielle ou VAR dans un article précédent. Mais est-il vraiment judicieux d’utiliser deux (ou plus)

Histoire réservée aux membres

David Andrés

Suivre

Investisseur piloté par les données

--

Partager

Nous avons présenté l'autorégression vectorielle ou VAR dans un article précédent. Mais est-il vraiment judicieux d’utiliser deux (ou plus) variables différentes pour faire une prévision ? La réponse est non, du moins pas toujours. Cela ne sera vraiment bénéfique que s’il existe une sorte de relation entre eux. L’utilisation de variables non liées pourrait introduire du bruit dans le modèle, dégradant les prédictions plutôt que de les améliorer.

Avertissement : certaines parties de cet article ont été améliorées avec l'aide de l'IA, en utilisant le code Python généré par l'IA comme base ou en reformulant les paragraphes à des fins d'amélioration de la clarté.

Un moyen simple de vérifier s’il existe une relation pourrait consister à vérifier la corrélation entre les variables. Mais ce n’est pas le seul type de relation que peuvent entretenir deux variables.

Nous pourrions également vérifier s’il existe une sorte de relation de causalité entre eux. Cependant, il y a quelque chose d'essentiel à comprendre d'abord : nos tests montrent que la causalité ne signifie pas nécessairement que l'un est la cause de l'autre, cela signifie simplement qu'il existe une sorte de corrélation dans les données passées.

Comprenons mieux ce concept avec un exemple qui vise à déterminer si les cas de COVID et les décès sont liés d'une manière ou d'une autre.

Importons d'abord les données et effectuons quelques traitements de base. Nous utiliserons les données COVID d’Allemagne. Les données sont réparties par état, comté, âge et sexe ; mais par souci de simplicité, nous les regrouperons.