Qu’est-ce que l’indépendance conditionnelle ?

L’autre jour, je lisais un bouquin de stats et je suis tombé sur l’exemple ci-dessous expliquant ce qu’est l’indépendance conditionnelle (par rapport à l’indépendance tout court bien sûr). Je l’ai donc recopié ici afin de ne pas l’oublier.

Le problème. Considérons deux usines, A et B, fabriquant des montres. L’usine A fabrique en moyenne une montre cassée sur 100, et la B une sur 200. Maintenant supposons qu’un revendeur reçoive une livraison de montres sans savoir de quelle usine elles proviennent. Il regarde la première montre: elle marche. Quelle est la probabilité que la seconde marche aussi ?

La formalisation. Soit X_n l’état de la n-ième montre livrée, avec X_n = 1 si elle marche et X_n = 0 sinon. Soit Y l’usine d’origine. A priori on n’a aucun indice sur l’usine de provenance, donc on pose l’hypothèse suivante:

P( Y = A ) = P( Y = B ) = \frac{1}{2}

On suppose aussi que, sachant Y = A, les états des montres testées successivement sont indépendants (idem pour Y = B):

P( X_1 = 1, X_2 = 0 | Y = A ) = P( X_1 = 1 | Y = A ) \times \\ P( X_2 = 0 | Y = A )

Par contre, on sait quand même que P( X_n = 0 | Y = A ) = 0.01 et que P( X_n = 0 | Y = B ) = 0.005.

La reformulation de la question. On veut ici calculer P( X_2 = 1 | X_1 = 1 ).

La solution. D’après la formule de Bayes, on peut écrire:

P( X_2 = 1 | X_1 = 1 ) = P( X_1 = 1, X_2 = 1 ) / P( X_1 = 1 )

Or on peut aussi dire que le numérateur vaut:

P( X_1 = 1, X_2 = 1 ) = P( X_1 = 1, X_2 = 1 | Y = A ) \times \\ P( Y = A ) + P( X_1 = 1, X_2 = 1 | Y = B ) \times P( Y = B )

En utilisant le fait que X_1 et X_2 sont indépendants conditionnellement à Y:

P( X_1 = 1, X_2 = 1 ) = P( X_1 = 1 | Y = A ) \times P( X_2 = 1 | Y = A ) \times P( Y = A ) + P( X_1 = 1 | Y = B ) \times P( X_2 = 1 | Y = B ) \times P( Y = B )

Puis en remplaçant par les valeurs numériques:

P( X_1 = 1, X_2 = 1 ) = \frac{99}{100} \times \frac{99}{100} \times \frac{1}{2} + \frac{199}{200} \times \frac{199}{200} \times \frac{1}{2}

On aboutit à:

P( X_1 = 1, X_2 = 1 ) = \frac{1}{2} \times ( \frac{99}{100}^2 + \frac{199}{200}^2 )

De même, le dénominateur vaut:

P( X_1 = 1 ) = P( X_1 = 1 | Y = A ) \times P( Y = A ) + \\ P( X_1 = 1 | Y = B ) \times P( Y = B )

P( X_1 = 1 ) = \frac{1}{2} \times ( \frac{99}{100} + \frac{199}{200} )

En mettant les deux ensembles, on obtient:

P( X_2 = 1 | X_1 = 1 ) = \frac{ \frac{99}{100}^2 + \frac{199}{200}^2 }{ \frac{99}{100} + \frac{199}{200} }

P( X_2 = 1 | X_1 = 1 ) = 0.9925063

La différence entre « indépendant » et « conditionnellement indépendant ». Il faut bien noter que les états des deux montres ne sont pas indépendants « tout court », mais indépendants conditionnellement à leur usine de provenance… Et oui, si les états des deux montres étaient inconditionnellement indépendants, on aurait:

P( X_2 = 1 | X_1 = 1 ) = P( X_2 = 1 )

Et de là:

P( X_2 = 1 ) = P( X_2 = 1 | Y = A ) \times P( Y = A ) + P( X_2 = 1 | Y = B ) \times P( Y = B )

Soit encore:

P( X_2 = 1 ) = \frac{1}{2} \times ( \frac{99}{100} + \frac{199}{200} )

P( X_2 = 1 ) = 0.9925

Alors oui c’est proche, mais ce n’est pas égal…

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s

%d blogueurs aiment cette page :