Terminale > Chaînes de Markov > Fiche résumée

Graphe pondéré et graphe probabiliste

Définition

Graphe pondéré

Un graphe est dit pondéré si chacune de ses arêtes est affecté d’un nombre positif (ou nul) que l’on appelle poids.

Le poids d’une chaîne (ou d’un chemin) est la somme des poids de ses arêtes.

Graphe probabiliste

On appelle graphe probabiliste un graphe orienté et pondéré tel que :

Pour chaque sommet, la somme des poids des arcs issus de ce sommet vaut $1$ .
Il y a au plus $1$ arrête orientée reliant chaque sommet.

Il peut être utile de faire l’analogie entre les graphes probabilistes et les arbres de probabilité vus en classe de Première.

Matrice de transition

Définition

Soit $G$ un graphe probabiliste d’ordre $n$ . On appelle matrice de transition du graphe $G$ , la matrice carrée d’ordre $n$ dont le coefficient à la ligne $i$ et à la colonne $j$ est égal au poids de l’arête reliant le sommet $i$ au sommet $j$ .

Une telle matrice est qualifiée de stochastique car la somme des coefficients de chacune de ses lignes vaut $1$ .

Attention cependant à ne pas confondre matrice de transition et matrice d’adjacence.

Chaînes de Markov

Définition

Il vous est fortement conseillé de relire (et de maîtriser) le cours sur les variables aléatoires avant d’aborder cette section. De plus, sachez que cette partie est sans doute la plus difficile du programme de Terminale. Mais ne vous découragez pas car elle reste parfaitement accessible !

Définition

Soit $(X_{n})$ une suite de variables aléatoires discrètes définies sur un même univers $Ω$ et à valeurs dans un ensemble $E$ . On dit que $(X_{n})$ définit une chaîne de Markov sur $E$ si pour tout $n \in N$ et tout $x_{0}, x_{1}, x_{2}, \dots, x_{n} \in E$ , l’événement $(X_{n} = x_{n})$ ne dépend que de l’événement antérieur $(X_{n - 1} = x_{n - 1})$ (et pas des précédents) ; autrement dit, si $P_{(X_{n - 1} = x_{n - 1}) \cap \dots \cap (X_{0} = x_{0})} (X_{n} = x_{n}) = P_{(X_{n - 1} = x_{n - 1})} (X_{n} = x_{n})$ .

De plus, l’ensemble $E$ est appelé espace des états de la chaîne de Markov.

En français, cela signifie que si $X_{n}$ représente l’état d’un système à un temps $n$ , alors l’état suivant $X_{n + 1}$ ne dépend que de l’état au temps $n$ et pas des états précédents. De plus, notez bien que nous n’avons pas fait d’hypothèse sur le cardinal de $E$ (qui peut donc être de cardinal $m \in N$ ).

Chaîne de Markov homogène

Soit $(X_{n})$ une chaîne de Markov dont on note $E$ l’espace des états. Alors $(X_{n})$ est dite homogène si pour tout $n \in N$ et pour tout $x$ , $y \in E$ , la probabilité $P_{(X_{n} = x)} (X_{n + 1} = y)$ est indépendante de $n$ .

En termes mathématiques, cela signifie que pour tout $n \in N$ et pour tout $x$ , $y \in E$ , $P_{(X_{n} = x)} (X_{n + 1} = y) = P_{(X_{0} = x)} (X_{1} = y)$ .

Matrice et graphe associés à une chaîne de Markov

Matrice de transition

Soit $(X_{n})$ une chaîne de Markov homogène dont on note $E = {x_{1}, x_{2}, \dots, x_{m}}$ l’espace des états. La matrice de transition de $(X_{n})$ est la matrice carrée d’ordre $m$ dont le coefficient situé à la $i$ -ième ligne et à la $j$ -ième colonne est égal à $p_{i, j} = P_{(X_{n} = x_{i})} (X_{n + 1} = x_{j})$ .

Graphe associé à une chaîne de Markov

Soit $(X_{n})$ une chaîne de Markov homogène dont on note $E = {x_{1}, x_{2}, \dots, x_{m}}$ l’espace des états. On associe à cette chaîne de Markov un graphe probabiliste $G$ d’ordre $m$ dont les sommets sont les états $x_{i}$ et dont les arêtes $x_{i} - x_{j}$ sont pondérées par les poids $p_{i, j} = P_{(X_{n} = x_{i})} (X_{n + 1} = x_{j})$ .

La matrice de transition de $(X_{n})$ est égale à la matrice de transition du graphe probabiliste $G$ : il s’agit donc aussi d’une matrice stochastique.

Distributions dans une chaîne de Markov

Proposition

Soit $(X_{n})$ une chaîne de Markov homogène dont on note $E = {x_{1}, x_{2}, \dots, x_{m}}$ l’espace des états. On pose $p_{i, j}^{(k)} = P_{(X_{0} = x_{i})} (X_{k} = x_{j})$ pour tout $k \in N^{*}$ (qui représente la probabilité que la chaîne de Markov $(X_{n})$ passe de l’état $x_{i}$ à l’état $x_{j}$ en $k$ étapes). On a : $p_{i, j}^{(k)} = q = 1 \sum m p_{i, q}^{(k - 1)} \times p_{q, j}^{(1)} = p_{i, 1}^{(k - 1)} \times p_{1, j}^{(1)} + p_{i, 2}^{(k - 1)} \times p_{2, j}^{(1)} + \dots + p_{i, m}^{(k - 1)} \times p_{m, j}^{(1)}$ De plus, comme $(X_{n})$ est homogène, $p_{i, j}^{(k)} = p_{i, j}^{(n + k)}$ pour tout $n \in N$ .

Cette formule semble un petit peu compliquée à interpréter. Elle signifie simplement que la probabilité que la chaîne de Markov $(X_{n})$ passe de l’état $x_{i}$ à l’état $x_{j}$ en $k$ étapes est égale à la probabilité qu’elle passe de l’état $e_{i}$ à $e_{q}$ en une étape, puis de passer de $e_{q}$ à $e_{j}$ en $k - 1$ étapes. Heureusement, il est possible de la simplifier grandement à l’aide des matrices de transition.

Lien avec la matrice de transition

En reprenant les notations précédentes et en notant $M$ la matrice de transition de $(X_{n})$ , alors $p_{i, j}^{(k)}$ est le coefficient à la ligne $i$ et à la colonne $j$ de la matrice $M^{k}$ .

Enfin, donnons la définition centrale de cette section.

Définition

Soit $(X_{n})$ une chaîne de Markov homogène dont on note $E = {x_{1}, x_{2}, \dots, x_{m}}$ l’espace des états. On appelle suite des distributions de $(X_{n})$ la suite de matrices $(π_{n})$ , définie pour tout $n \in N$ par $π_{n} = (P (X_{n} = x_{1}) P (X_{n} = x_{2}) \dots P (X_{n} = e_{m}))$ .

$π_{n}$ est donc une matrice ligne d’ordre $m$ et est appelée distribution au temps $n$ .

$π_{0}$ (la distribution au temps $0$ ) est appelée distribution initiale.

Une propriété très sympathique des distributions, est que l’on dispose d’une relation de récurrence permettant de calculer facilement la distribution à un temps $n$ donné.

Relation entre $π_{n + 1}$ et $π_{n}$

En reprenant les notations de la définition précédente et en notant $M$ la matrice de transition de $(X_{n})$ , alors la suite $(π_{n})$ vérifie une relation de récurrence donnée pour tout $n \in N$ par $π_{n + 1} = π_{n} M$ .

On en déduit que pour tout $n \in N$ , $π_{n} = π_{0} M^{n}$ .

Distribution invariante

Définition

Soit $(X_{n})$ une chaîne de Markov homogène de matrice de transition $M$ . Une distribution $π$ est invariante si les deux conditions suivantes sont respectées :

$π M = π$ (donc si $π$ est une distribution à un temps $n$ , on a $π = π_{n}$ et cette condition se résume à avoir $π_{n} = π_{n} M = π_{n + 1}$ ).
La somme des coefficients de $π$ vaut $1$ .

Existence et unicité de la distribution invariante au temps $n$

Soit $(X_{n})$ une chaîne de Markov homogène de matrice de transition $M$ .

Si $M$ ne possède aucun coefficient non nul autre que sur sa diagonale, alors $(X_{n})$ admet une unique distribution invariante $π$ .

Convergence de la distribution

Soit $(X_{n})$ une chaîne de Markov homogène dont on note $(π_{n})$ la suite des distributions.

Si $(π_{n})$ est une suite de matrices convergente, alors elle converge vers une distribution invariante $π$ .
Si le cardinal de l’ensemble des états de $(X_{n})$ est $2$ , alors $(π_{n})$ est convergente (et converge vers la distribution invariante $π$ ).

Graphe pondéré et graphe probabiliste

Définition

Graphe pondéré

Graphe probabiliste

Matrice de transition

Définition

Chaînes de Markov

Définition

Définition

Chaîne de Markov homogène

Matrice et graphe associés à une chaîne de Markov

Matrice de transition

Graphe associé à une chaîne de Markov

Distributions dans une chaîne de Markov

Proposition

Lien avec la matrice de transition

Définition

Relation entre πn+1​ et πn​

Distribution invariante

Définition

Existence et unicité de la distribution invariante au temps n

Convergence de la distribution

Relation entre $π_{n + 1}$ et $π_{n}$

Existence et unicité de la distribution invariante au temps $n$