Théorie de la Décision
Exercice 2 : Soit une série statistique de taille n, classée suivant la partition . On
noterespectivement l'effectif, l'effectif cumulé et l'amplitude de la classe . Soit la ...
part of the document
BED Equation ,
et finalement codé comme une séquence de symboles choisis dans un alphabet fini (binaire, par exemple) :
EMBED Equation .
Le signal original est ainsi transformé dans une série de symboles (binaires dans le cas de l'exemple).
Ce sont ces symboles qui modulent une porteuse (en phase, en amplitude ou en fréquence) pour générer le signal transmis dans le canal de communication. Ainsi, dans le cas où le système de modulation n'a pas de mémoire (absence d'interférence inter-symbolique), le signal EMBED Equation émis pendant l'intervalle de temps correspondant à un symbole est complètement déterminé par le symbole transmis. Par exemple, pour les systèmes de modulation d'amplitude et avec des symboles binaires
EMBED Equation
Le signal reçu à la sortie du canal de communication est, en général, une version bruité et déformée de m(t):
EMBED Equation
où EMBED Equation est lopérateur de transmission du canal, en général, connu.
Le système de réception doit, en chaque intervalle EMBED Equation , faire correspondre au signal reçu, soit un symbole 1, soit un symbole 0. Il doit donc résoudre le problème de décision suivant. Etant donné EMBED Equation , décider laquelle des deux hypothèses suivantes est vraie:
EMBED Equation
En référence à la Figure 3.1, on doit, pour cet exemple, effectuer les correspondances suivantes:
SYMBOL 222 \f "Symbol" \s 5 \h source: système de codage, qui génère des symboles 0 ou 1;
SYMBOL 222 \f "Symbol" \s 5 \h mécanisme de transition: le canal, qui déforme le signal EMBED Equation et ajoute du bruit au message;
SYMBOL 222 \f "Symbol" \s 5 \h mécanisme de décision: Application qui fait correspondre à chaque signal observé un des deux symboles:
EMBED Equation
3-2 détection de cibles en radar
Les systèmes de radar utilisent une antenne pour détecter des cibles dans l'espace (en général 3D) autour de l'antenne. Pour chaque cible, on désire savoir sa position, sa direction et sa vitesse. On considère ici le cas simple où on ne détermine pas la vitesse de la cible. L'antenne du radar peut être dirigée de façon à émettre, à chaque instant, une impulsion EMBED Equation seulement dans un cône angulaire étroit autour de la direction EMBED Equation . S'il existe une cible dans cette direction, le signal émis est réfléchi et reçu avec un temps de retard qui est proportionnel à la distance d entre l'antenne et la cible:
EMBED Equation
où EMBED Equation dépend de l'attitude de la cible, des ses propriétés de réflexion, de la distance, etc., et c est la vitesse de propagation des ondes électromagnétiques. Pour détecter la cible, le système doit donc résoudre un problème de décision entre les deux hypothèses suivantes:
EMBED Equation
où la première hypothèse correspond à l'absence de cible dans la direction EMBED Equation , et la deuxième à la présence d'une cible à une distance qui est déterminée par EMBED Equation .
Nota: l'hypothèse EMBED Equation de ce test binaire dépend des deux paramètres EMBED Equation et EMBED Equation qui ne sont pas connus. Ce type de problèmes de décision, bien plus difficile à résoudre, en général, que les problèmes de décision simple (comme le cas de l'exemple précédant), est connu sous le nom de tests d'hypothèses composées.
3-3 reconnaissance de mots
La reconnaissance de mots parmi un dictionnaire est encore un problème de décision: étant donné un segment d'un signal de parole, qu'on admet correspondre à un mot unique, on doit décider de quel mot il s'agit. Ce problème très complexe peut être formalisé comme un problème de décision, avec autant d'hypothèses que de mots. Dans ce cas encore, chaque hypothèse (mot) est composée, puisque le signal de parole qui correspond à un mot donné varie avec la personne qui le prononce (homme/femme, région, âge, ...).
Dans tous les exemples présentés, le système de décision est défini par une application de l'espace des observations dans l'ensemble des hypothèses possibles. On désigne cette application par règle de décision. Elle détermine, dans l'espace des observations, une partition en sous-ensembles disjoints, chaque sous-ensemble correspondant aux observations qui sont associées à une même hypothèse.
Règle de décision EMBED Equation partition de l'espace d'observations en régions EMBED Equation associées aux différentes hypothèses :EMBED Equation
Comme on doit associer une hypothèse à chaque observation possible ,
EMBED Equation .
Et, comme les hypothèses sont alternatives, c'est-à-dire, l'occurrence simultanée de deux hypothèses différentes est impossible, les sous-ensembles EMBED Equation sont disjoints:
EMBED Equation .
La règle de décision est facilement décrite en fonction des régions EMBED Equation :
EMBED Equation
où EMBED Equation représente les observations (qui peuvent être scalaires, vectorielles, où les échantillons d'un signal pris dans un intervalle de temps).
3.2 Tests de Bayes.
Dans cette section, on étudie l'approche Bayesienne aux problèmes de décision, qui est basée sur la connaissance, pour chaque hypothèse EMBED Equation , de la probabilité a priori pour que cette hypothèse se réalise,
EMBED Equation ,
et qui associe, à chaque comportement possible du système de décision, un coût (équivalent à une pénalisation ou une récompense):
EMBED Equation .
La figure suivante illustre la définition de ces quantités pour un test binaire (où on considère que seulement deux hypothèses sont possibles)
EMBED MSDraw \* MERGEFORMAT
Figure 3.2
Dans la figure précédente, les lignes interrompues représentent les situations d'erreur.
Les tests de Bayes consistent à déterminer les régions de décision EMBED Equation et EMBED Equation de façon à minimiser la valeur moyenne du coût:
EMBED Equation
Chaque probabilité conjointe qui figure dans cette expression peut être écrite comme:
EMBED Equation
où l'on a exprimé la probabilité de décider EMBED Equation quand EMBED Equation est vraie comme la probabilité pour que les observations appartiennent à la région EMBED Equation où on décide EMBED Equation , étant donné que EMBED Equation est vraie.
Dans le cas de tests binaires, les deux régions de décision sont complémentaires, EMBED Equation , et on peut donc écrire
EMBED Equation ,
Avec ce résultat, on peut exprimer le coût de Bayes EMBED Equation en fonction d'une seule région:
EMBED Equation .
Les deux premiers termes dans cette expression de dépendent pas des régions de décision, et constituent une pénalisation fixe. Pour minimiser C, il faut donc minimiser l'intégrale. Pour cela, on doit attribuer à EMBED Equation tous les points de l'espace des observations pour lesquels l'intégrant est négatif, ce qui est équivalent à la règle de décision suivante:
EMBED Equation ,
où on a défini le seuil EMBED Equation :
EMBED Equation .
On voit donc que le test de Bayes conduit à comparer le rapport entre les densités de probabilités conditionnelles à un seuil (EMBED Equation ). On appelle le rapport des densités conditionnelles dans l'équation précédente le rapport de vraisemblance
Notons que les tests de probabilité d'erreur moyenne minimale sont un cas particulier des tests de Bayes. Pour les obtenir, il suffit de prendre les valeurs de coût suivantes:
EMBED Equation
pour lesquels le test optimal est
EMBED Equation
Rapport de Vraisemblance.
Le rapport de vraisemblance (entre les densités de probabilité conditionnelles correspondant à chaque hypothèse), qui détermine les tests de Bayes, joue un rôle très important dans tous les problèmes de décision statistique et sera représenté par EMBED Equation :
EMBED Equation .
En fait, si on considère que les densités conditionnelles résument notre connaissance sur chacune des hypothèses, ce rapport compare directement la vraisemblance des observations sous chacune des hypothèses.
Puisque l'application d'une fonction monotone n'affecte pas la validité d'une inégalité, le test de Bayes est équivalent au test suivant:
EMBED Equation ,
où on a défini le nouveau seuil EMBED Equation :
EMBED Equation .
Le logarithme du rapport de vraisemblance est, comme on le verra par la suite, particulièrement simple si les densités conditionnelles appartiennent à une famille exponentielle (dont les densités gaussiennes sont un cas particulier). On appelle EMBED Equation le rapport de vraisemblance logarithmique.
Exemple 3-4.
Soit k une variable aléatoire de Poisson de paramètre EMBED Equation :
EMBED Equation .
On observe N échantillons indépendants de k, et on veut décider entre les hypothèses
EMBED Equation
La densité de probabilité des N observations pour une valeur de EMBED Equation générique est:
EMBED Equation
Le rapport de vraisemblance pour ce test est donc
EMBED Equation
3.3 Statistique suffisante.
On appelle statistique une application de l'espace des observations dans un autre espace, en général de dimension plus petite que celle de l'espace des observations. Pour des problèmes où les observations prennent valeurs dans un espace de dimension élevée (ou même infinie, comme c'est le cas du problème de communications binaires), il est souvent pratique de formuler le problème de décision en considérant une statistique qui est obtenue à partir des observations, au lieu de les traiter directement.
La notion de statistique suffisante établit les conditions dans lesquelles ont peut faire cette compression de données sans perte d'information. Par définition, EMBED Equation est une statistique suffisante si on peut factoriser les densités conditionnelles pour chaque hypothèse de la façon suivante:
EMBED Equation
où la fonction EMBED Equation dépend des observations mais pas de l'hypothèse i. Dans ce cas, le rapport de vraisemblance dépend des observations r uniquement à travers la statistique suffisante:
EMBED Equation .
Exemple 3-5.
Considérons le problème de décision binaire suivant. On effectue EMBED Equation observations indépendantes, EMBED Equation , d'une variable aléatoire gaussienne de covariance EMBED Equation . On sait que la valeur moyenne de la variable, EMBED Equation , peut prendre seulement deux valeurs avec égale probabilité :
EMBED Equation
où EMBED Equation est une constante connue. On désire déterminer laquelle des deux valeurs de EMBED Equation correspond aux observations effectuées.
Pour résoudre ce problème on doit d'abord déterminer la fonction de densité des observations sous chaque hypothèse. L'indépendance des observations permet d'écrire:
EMBED Equation
Et de la même façon, pour l'autre hypothèse,
EMBED Equation
Le rapport de vraisemblance est le quotient de ces deux densités:
EMBED Equation
On vérifie donc que la moyenne des observations ,EMBED Equation , est une statistique suffisante pour ce problème:
EMBED Equation .
Ceci veut dire que le test optimal peut être construit directement à partir de l'analyse de la moyenne, et que, donc, il n'est pas nécessaire de mémoriser toutes les valeurs observées.
Exercice 3-1:
Vérifier que la somme
EMBED Equation
de lexemple 3-4 sur le test sur le paramètre de la variable de Poisson est une statistique suffisante.
3.4 Tests de Neyman-Pearson.
Pour construire le test de Bayes, c'est-à-dire, le coût moyen d'une décision, il faut connaître les probabilités a priori, EMBED Equation , qui déterminent la valeur du seuil auquel le rapport de vraisemblance est comparé. Pour beaucoup d'applications, ces valeurs ne sont pas connues, et on ne peut pas, en conséquence, appliquer l'approche Bayesienne, où encore, même si elles sont connues, le critère ajusté au problème n'est pas obtenu par des considérations de ce qui se passe pour tout l'ensemble de situations possibles. Les tests de Neyman-Pearson constituent, dans ces cas, une approche alternative.
Au lieu de considérer loccurrence de chaque hypothèse comme un phénomène aléatoire, et d'optimiser la performance moyenne, les tests de Neayman-Pearson agissent directement sur les mesures de performance suivantes:
EMBED Equation
EMBED Equation est appelée la probabilité de détection, EMBED Equation la probabilité de fausse alarme, et EMBED Equation est la probabilité de non-détection ("miss"). Cette terminologie est dérivée des systèmes radar, où l'hypothèse EMBED Equation est normalement associée à la présence d'une cible, et l'hypothèse EMBED Equation à l'absence de cible.
On veut, usuellement, avoir une valeur de EMBED Equation le plus grande possible, et, en même temps, une valeur de EMBED Equation la plus petite possible. Cependant, ces deux contraintes ne sont pas indépendantes, et sont même contradictoires: pour augmenter EMBED Equation on doit augmenter EMBED Equation , et pour minimiser EMBED Equation on doit diminuer EMBED Equation . Les tests de Neyman-Pearson correspondent à maximiser la probabilité de détection, avec une contrainte fixe sur la probabilité de fausse alarme :
EMBED Equation
La solution est obtenue à travers l'utilisation des multiplicateurs de Lagrange, et est encore une fois, donnée par le rapport de vraisemblance:
EMBED Equation
où maintenant le seuil EMBED Equation est déterminé de façon à vérifier la contrainte:
EMBED Equation .
Pour arriver à cette solution on minimise la fonction F, qui est obtenue en ajoutant à la fonction à minimiser (la probabilité de non-détection), le multiplicateur de Lagrange fois la contrainte (si la contrainte est vérifiée, on aura minimisé la fonction originelle):
EMBED Equation
Il résulte immédiatement de cette expression que la règle de décision optimale est encore la comparaison du rapport de vraisemblance avec un seuil (EMBED Equation ), qui doit être déterminé de façon à satisfaire la contrainte. Ceci est obtenu en définissant EMBED Equation comme l'ensemble des points r où la fonction intégrée est négative.
Exercice 3-2:
Dans un problème de décision binaire, une des deux hypothèses suivantes est vraie:
EMBED Equation
où les variables aléatoires s et n sont indépendantes,
EMBED Equation EMBED Equation
1. Montrer que le rapport de vraisemblance est proportionnel à l'observation:
EMBED Equation .
2. Déterminer le seuil pour le test de Bayes optimal, en fonction des coûts et des probabilités a priori.
3. Déterminer le seuil du test de Neyman-Pearson en fonction de la probabilité de fausse alarme.
3.5 Tests Minimax.
Les tests minimax sont une autre façon de résoudre des problèmes de décision quand on ne connaît pas les probabilités a priori, et correspondent à choisir le test qui a la meilleure performance dans le cas le plus défavorable.
Pour dériver ce test, on commencera par analyser l'influence du choix du seuil sur le risque de Bayes. Admettons alors qu'une certaine valeur du seuil de décision est fixée, soit EMBED Equation . Une fois que le seuil est fixé, la performance du test, obtenu en comparant le rapport de vraisemblance avec lui, est déterminée:
EMBED Equation
Le coût de Bayes est donc
EMBED Equation .
Si on utilise dans cette équation les relations
EMBED Equation ,
et
EMBED Equation
on obtient une expression qui dépend uniquement de EMBED Equation :
EMBED Equation .
De cette équation, on peut conclure que le coût de Bayes associé à ce test -- pour cette valeur fixe du seuil -- est une fonction linéaire de EMBED Equation .
Ce test est le test optimal si la relation suivante est vérifiée:
EMBED Equation
ce qui est vrai pour
EMBED Equation .
Pour toutes les autres valeurs de EMBED Equation , le test optimal (qui correspond à un seuil différent) aura un coût inférieur. La figure suivante montre la variation du coût du test optimal, et du coût pour un seuil déterminé, en fonction de la valeur de la probabilité a priori :
EMBED MSDraw \* MERGEFORMAT
Figure 3.3: Risque de Bayes pour le test fixe et pour le test optimal.
On déduit donc que le coût pour un seuil fixe est tangent à la courbe qui décrit le coût du test optimal pour chaque valeur possible de EMBED Equation .
Les tests minimax correspondent à choisir le test optimal pour la situation où le coût est maximale, ce qui est obtenu en prenant le test qui a un coût constant pour toutes les valeurs possibles de la probabilité a priori. Pour obtenir ce test, on doit donc choisir un seuil qui conduit à des valeurs deEMBED Equation tels que
EMBED Equation .
Pour des coûts de Bayes qui sont différents de zéro seulement pour les situations d'erreur, le test minimax est défini par
EMBED Equation .
Exemple 3-6.
On sait qu'une pièce est soit standard (PF), soit à deux cotés face (FF). On doit décider sur le type de la pièce avec un seul tirage. Le coût d'une décision fausse est 1 et celui d'une décision correcte est 0. La décision est prise selon la règle suivante:
SYMBOL 222 \f "Symbol" \s 5 \h si on observe P on décide (PF)
SYMBOL 222 \f "Symbol" \s 5 \h si on observe F on prend une décision aléatoirement: (PF) avec probabilité EMBED Equation , et (FF) avec une probabilité EMBED Equation .
Montrer que le coût maximal est minimisé pour EMBED Equation .
La valeur moyenne du coût de Bayes est, dans ce cas
EMBED Equation
où on a admis que la pièce standard est équilibrée (égale probabilité pour face et pile). Cette expression est linéaire en EMBED Equation.3 . Le maximum va donc se trouver sur un des limites, EMBED Equation.3 ou EMBED Equation.3 , selon le signe du coefficient qui multiple EMBED Equation.3 et le coût est constant si ce coefficient est nul.
La valeur maximale du coût est obtenue pour
SYMBOL 183 \f "Symbol" \s 10 \h EMBED Equation si EMBED Equation , et dans ce cas EMBED Equation
SYMBOL 183 \f "Symbol" \s 10 \h EMBED Equation si EMBED Equation , et dans ce cas EMBED Equation
SYMBOL 183 \f "Symbol" \s 10 \h indépendante de EMBED Equation si EMBED Equation , est dans ce cas EMBED Equation .
Cet exemple confirme lanalyse que nous avons fait précédemment, cest à dire, que le test minimax (qui minimise le pire cas) est obtenu quand le risque devient indépendant de la valeur de la probabilité a priori.
3.6 Receiver Operating Characteristic (ROC)
La performance des tests d'hypothèses est jugée à travers la paire (probabilité de détection, probabilité de fausse alarme), ou, dans le cas des tests Bayesiens, par le coût de Bayes qui est aussi une fonction de EMBED Equation .
On introduit ici quelque nomenclature usuelle en statistique.
On appelle taille d'un test binaire à la probabilité avec laquelle on choisit l'hypothèse EMBED Equation quand l'hypothèse EMBED Equation est vraie:
EMBED Equation ,
c'est-à-dire, la taille d'un test est la probabilité de fausse alarme, EMBED Equation . On appelle encore à EMBED Equation la probabilité d'erreurs du type 1.
La puissance d'un test est la probabilité de décider correctement l'hypothèse EMBED Equation , c'est-à-dire, la probabilité de détection, EMBED Equation :
EMBED Equation
La probabilité d'erreurs du type 2 est la probabilité d'une hypothèse erronée quand EMBED Equation est vraie, et est égale à 1 moins la puissance du test.
On désire, naturellement, avoir un test de petite taille et le plus puissant possible. Comme on l'a étudié, le test plus puissant d'une taille donnée est un test de vraisemblance : le test de Neyman-Pearson.
Un test est dit non-biaisé si sa puissance est plus grande que sa taille. Cela veut dire qu'en moyenne on décide plus probablement EMBED Equation quand EMBED Equation est vraie que quand c'est hypothèse EMBED Equation est vraie.
On appelle ROC (Receiver Operating Characteristic) d'un test la courbe de l'évolution de la puissance du test (probabilité de détection) en fonction de sa taille (probabilité de fausse alarme). En effet, ces deux probabilités sont conjointement déterminées par le choix du seuil, EMBED Equation .
Ces courbes possèdent plusieurs propriétés:
1. La courbe EMBED Equation est convexe
EMBED Equation .
2. Tous les tests de vraisemblance ont un ROC qui sont au-dessus de la ligne EMBED Equation (cela veut dire qu'ils son non-biaisés).
3. La pente de la courbe en un point particulier est égale à la valeur du seuil auquel on doit comparer le rapport de vraisemblance pour obtenir les probabilités de détection et de fausse alarme qui lui correspondent.
Dem.
EMBED Equation
Si on dérive les deux équations et que l'on prend leur quotient:
EMBED Equation
Mais,
EMBED Equation
où EMBED Equation est la région de décision pour l'hypothèse 1, c.a.d., où EMBED Equation . Alors, par un changement de variable, on peut écrire la dernière intégrale directement comme une moyenne qui utilise la densité de probabilité du rapport de vraisemblance:
EMBED Equation
Si on utilise ce résultat dans l'expression de EMBED Equation , il résulte facilement
EMBED Equation .
De cette démonstration, on peut déduire que la courbe du ROC est non-décroissante, car EMBED Equation est toujours positif.
4. Le test minimax est déterminé par l'intersection de la ligne
EMBED Equation
et le ROC.
3.7 Tests simples et composés
Les tests binaires étudiés sont des tests simples. Ce nom dérive du fait que sous chaque hypothèse la densité de probabilité des observations est complètement connue, ce qui permet d'écrire le rapport de vraisemblance.
Cependant, dans de nombreuses situations, la densité de probabilité sous chaque hypothèse dépend de paramètres qui ne sont pas connus, c'est-à-dire, il existe plusieurs densités de probabilité qui sont des candidates possibles pour décrire les observations sous au moins une des hypothèses.
Exemple 3-7
EMBED Equation
où n est une variable aléatoire de densité EMBED Equation connue et s est une constante déterministe inconnue. Si on admet connu s, les densités associées à chaque hypothèse sont dans ce cas:
EMBED Equation
Cependant, s n'est pas connu, et donc on a un nombre infini de possibles densités de probabilité qui peuvent décrire les observations sous hypothèse EMBED Equation . On dit alors que EMBED Equation est une hypothèse composée, car on peut lui associer plusieurs densités, selon la valeur de s.
Dans ces cas on appelle le paramètre inconnu paramètre de nuisance, ce qui traduit le fait qu'on est intéressé seulement à prendre une décision et pas à connaître la valeur de s.
On peut formaliser généralement ces situations en introduisant un vecteur de paramètres de nuisance, EMBED Equation , dont dépendent les densités des observations sous chaque hypothèse:
EMBED Equation
Dans ces situations, les définitions précédentes de taille et puissance sont :
EMBED Equation
c'est-à-dire, la taille est, par définition, la valeur supérieure de la taille du test pour toutes les valeurs possibles de EMBED Equation -- cest-à-dire le pire cas possible -- et la puissance est une fonction du vecteur de paramètres inconnus.
Pour les tests composés, on désire déterminer un test qui soit optimal (dans le sens de Neyman-Pearson) pour toutes les valeurs possibles du paramètre inconnu, cest-à-dire que, parmi tous les tests avec une taille égale où inférieure à EMBED Equation , soit le plus puissant pour toutes les valeurs possibles du paramètre inconnu. On appelle à un test avec cette propriété le test uniformément le plus puissant (UMP).
Si on prend n'importe quel test, sa performance est naturellement limitée par la performance du test qui est défini pour la vraie valeur du paramètre inconnu, cest-à-dire, il aura toujours une performance inférieure où égale au test optimal pour la vraie valeur du paramètre. La représentation de la probabilité de détection du test optimal en fonction de la valeur inconnue du paramètre, pour différentes valeurs de probabilité de fausse alarme, est appelée la fonction de puissance. Cette courbe établit une limite à la performance de tous les tests.
On dit qu'un test est uniformément le plus puissant si, pour toutes valeurs de EMBED Equation , la probabilité de détection qui correspond à une probabilité de fausse alarme (taille) fixée est maximale. La condition nécessaire et suffisante pour l'existence d'un test uniformément le plus puissant est la suivante: le rapport de vraisemblance et le seuil doivent pouvoir être déterminés sans connaître EMBED Equation .
Exemple 3-8:
Soit k le nombre d'événements dans une expérience, décrit par une loi de Poisson de paramètre EMBED Equation
EMBED Equation
On va construire le test uniformément le plus puissant pour tester les hypothèses composées
EMBED Equation .
Le rapport de vraisemblance pour tester l'hypothèse composée EMBED Equation contre l'hypothèse simple EMBED Equation est
EMBED Equation
Comme le rapport de vraisemblance est monotone en k, on peut écrire le test directement en fonction de l'observation:
EMBED Equation
Le seuil EMBED Equation peut être déterminé de façon à ce que la taille du test soit EMBED Equation :
EMBED Equation .
Cette taille donne bien le pire cas possible, car pour EMBED Equation la taille sera plus petite que EMBED Equation (vérifier):
EMBED Equation .
Le test est bien le plus puissant - celui qui a une plus grande probabilité de détection pour une valeur donnée de EMBED Equation - parmi tous les tests avec une taille inférieure où égale à EMBED Equation .
3. 8 Rapport de Vraisemblance Généralisé.
Le rapport de vraisemblance généralisé est une approche à la résolution de problèmes de décision quand on ne peut pas construire un test uniformément le plus puissant.
Cette procédure consiste à associer à chaque hypothèse EMBED Equation une densité unique, parmi toutes les densités possibles, en prenant celle qui maximise la vraisemblance des données, et à l'utiliser pour construire un "rapport de vraisemblance réduit":
EMBED Equation
Exercice 3-3:
On dispose de N mesures d'une même quantité inconnue h. On ne sait pas avec lequel de deux instruments, EMBED Equation ou EMBED Equation , les mesures ont été prises. On sait que le premier instrument n'introduit pas de biais, et a des erreurs de mesures gaussiennes, de variance EMBED Equation , et que le deuxième instrument introduit un biais connu b, et des erreurs de mesure de variance EMBED Equation . Déterminer le test de Maximum de Vraisemblance pour identifier l'instrument utilisé.
3.9 Détection d'un signal dans un bruit: le filtre adapté
Considérons le problème de décision suivant:
EMBED Equation
où
SYMBOL 222 \f "Symbol" \s 5 \h EMBED Equation sont des variables aléatoires i.i.d. EMBED Equation
SYMBOL 222 \f "Symbol" \s 5 \h EMBED Equation sont des valeurs connues qui vérifient la condition de normalisation
EMBED Equation .
Ce modèle représente le problème de la détection d'un signal connu, d'énergie E, dans du bruit blanc Gaussien.
On détermine le test qui minimise la probabilité d'erreur, en admettant connues les probabilités a priori EMBED Equation et EMBED Equation - situation usuelle en communications.
Pour écrire le rapport de vraisemblance, on doit d'abord déterminer la densité des observations sous chaque hypothèse. L'indépendance des observations implique
EMBED Equation
Mais
EMBED Equation
et donc
EMBED Equation
Pour l'autre hypothèse
EMBED Equation
Le rapport de vraisemblance est donc
EMBED Equation
Le test optimal (qui minimise la probabilité d'erreur) est
EMBED Equation
ou, d'une façon équivalente,
EMBED Equation
où on a défini le signal normalisé EMBED Equation , où EMBED Equation.3 est lénergie du signal transmis.
On vérifie que le détecteur optimal effectue le produit interne du signal reçu avec une réplique (normalisée) du signal émis. Cette opération peut sinterpréter de plusieurs façons:
1- filtre adapté
Cette interprétation considère le produit interne comme un échantillon pris à la sortie d'un filtre dont la réponse impulsionnelle EMBED Equation est déterminée par le signal émis:
EMBED Equation
cest-à-dire,
EMBED Equation ,
où la sortie du filtre à un instant générique est donnée par
EMBED Equation
ou encore
EMBED Equation .
La figure suivante illustre le cas d'un signal émis triangulaire, et la réponse impulsionnelle du filtre du détecteur optimal correspondant.
EMBED MSDraw \* MERGEFORMAT
Figure 3.4: Signal et réponse impulsionnelle du filtre.
EMBED MSDraw \* MERGEFORMAT
Figure 3.5: Détecteur optimal (configuration filtre adapté).
2- Corrélateur
Ce même détecteur peut être interprété comme la sortie d'un bloc qui effectue la corrélation du signal reçu avec une réplique du signal émis, voir la figure suivante.
EMBED MSDraw \* MERGEFORMAT
Figure 3.6: Récepteur corrélateur.
Calcul de la probabilité derreur
On détermine par la suite la probabilité d'erreur du détecteur optimal. Pour ce calcul, on va admettre que les deux hypothèses sont également probables, et donc que le test optimal est simplement
EMBED Equation .
Pour calculer la probabilité d'erreur,
EMBED Equation ,
on doit déterminer la densité de probabilité de EMBED Equation sous chaque hypothèse. Puisque EMBED Equation est une combinaison linéaire de v.a. Gaussiennes, il est aussi une v.a. Gaussienne. Il reste donc à calculer sa moyenne et sa variance.
Hypothèse H0.
Pour la moyenne,
EMBED Equation .
La v.q.m. est donnée par
EMBED Equation
et donc la variance est
EMBED Equation .
Hypothèse H1
Pour l'autre hypothèse on obtient, d'une façon similaire,
EMBED Equation ,
et
EMBED Equation .
La probabilité derreur est donc (en utilisant la symétrie du problème)
EMBED Equation .
En utilisant la définition de la fonction d'erreur complémentaire,
EMBED Equation ,
l'expression précédente peut être écrite simplement comme,
EMBED Equation .
EXERCICES
1. Les densités qui décrivent les observations dans un problème de décision binaire sont:
EMBED Equation
a) Calculer le rapport de vraisemblance.
b) Le test est
EMBED Equation
Déterminer les régions de décision pour plusieurs valeurs de EMBED Equation .
2. Considérer le problème de test d'hypothèses suivant. Etant données K observations indépendantes
EMBED Equation
où EMBED Equation .
a) Déterminer le rapport de vraisemblance.
b) Supposons que le seuil est EMBED Equation :
EMBED Equation .
Montrer que EMBED Equation est une statistique suffisante. Déterminer le seuil EMBED Equation pour le test
EMBED Equation
en fonction de EMBED Equation .
c) Déterminer une expression pour les probabilités d'erreur.
d) Tracer le ROC pour K=1, EMBED Equation
e) Quelle est la valeur du seuil pour le critère minimax si EMBED Equation et EMBED Equation ?
3. Définir le détecteur optimal (probabilité d'erreur minimale) pour un système de transmission ternaire, qui transmet avec une probabilité égale les symboles (-1,0,1), avec la codification suivante:
EMBED Equation
Le signal reçu est la superposition du signal transmis avec du bruit blanc Gaussien, de moyenne nulle et covariance EMBED Equation . Calculer la probabilité d'erreur du détecteur optimal. Vérifier que pour des symboles également probables, et avec le critère de probabilité d'erreur minimale, le détecteur optimal est le détecteur de Maximum de Vraisemblance.
4. Considérer un système de communication optique:
EMBED MSDraw \* MERGEFORMAT
Un laser transmet pendant l'intervalle EMBED Equation un nombre N(t) de photons qui suit une loi de Poisson de paramètre qui dépend du symbole binaire transmit: EMBED Equation pour un symbole 0, et EMBED Equation pour un symbole 1. Chaque photon est détecté avec une probabilité p. A partir de l'observation du nombre de photons détectés, M(t), on doit décider quel symbole a été transmis.
a) Déterminer la loi de probabilité de M(t).
b) Déterminer le rapport de vraisemblance pour ce problème.
c) Tracer le ROC pour EMBED Equation et EMBED Equation , et pour une valeur de t choisie de façon que la probabilité de détection soit 0.5 pour une probabilité de fausse alarme égale à 0.01.
5. Considérer le problème de détection d'un signal connu dans du bruit blanc, pour lequel on a vérifié que le détecteur de probabilité d'erreur minimale est le filtre adapté, mais où on admet maintenant que le signal est reçu avec un facteur multiplicatif inconnu:
EMBED Equation
a) Déterminer le rapport de vraisemblance pour ce problème.
b) Vérifier qu'un test uniformément le plus puissant existe. Spécifier le test.
PAGE
PAGE 74