Academia.eduAcademia.edu

Trajectographie passive sonar par estimation particulaire à maximum de vraisemblance

1999

This paper introduces the particle method with local adapted redistributions, for the solution of maximum likelyhood estimation problems. The performance of this technique is illustrated by the SONAR target motion analysis problem.

Dix-septième colloque GRETSI, Vannes, 13-17 septembre 1999 Trajectographie passive sonar par estimation particulaire à maximum de vraisemblance André Monin , Gérard Salut , Vincent Teulière Laboratoire d'Analyse et d'Architecture des Systèmes. Centre National de la Recherche Scientique. 7, avenue du Colonel Roche 31077 Toulouse Cedex 4 France [email protected],[email protected],[email protected] Résumé  Cet article introduit la technique particulaire à redistributions locales adaptatives, pour la résolution des problèmes d'estimation à maximum de vraisemblance. La performance de la technique est illustrée sur le problème de trajectographie passive SONAR Abstract  This paper introduces the particle method with local adapted redistributions, for the solution of maximum likelyhood estimation problems. The performance of this technique is illustrated by the SONAR target motion analysis problem. 1 Introduction. les approches de type Kalman étendu. Contrairement aux ltres exprimés dans la base cartésienne, le ltre exprimé La trajectographie passive SONAR consiste à estimer les dans la base polaire modié ne présente pas de problèmes éléments cinématiques d'une cible (distance, vitesse et cap) de stabilité et l'estimation est asymptotiquement non bià partir de mesures bruitées de ses émissions acoustiques. aisée. Dans l'approche particulaire, le repère choisi inue Le problème le plus classique est celui de la trajectogra- aussi sur la qualité de l'estimation. La modélisation pophie à partir de la mesure seule de l'azimut de la cible laire modiée permet de mieux répartir l'information sur ([1],[3],[4],[6]). Le porteur doit alors eectuer des manoeu- chacune des variables d'état et donc de réduire signicavres an d'assurer l'observabilité. L'adjonction des vari- tivement le nombre de particules nécessaire à une bonne ations Doppler au vecteur de mesure assure l'observabilité estimation soit du temps de calcul. De plus, l'algorithme du problème même lorsque le porteur reste immobile. Deux utilise une métrique locale pour ses redistributions qui approches sont utilisables pour traiter ce problème : le s'avère dénie par un calcul de type Kalman étendu. Le ltrage à minimum de variance ([5] et ses références) et choix du modèle polaire modié s'avère bénéciaire à ce l'estimation à maximum de vraisemblance ([2],[12]). Ces titre également. deux approches sont usuellement mises en oeuvre par apSoit un observateur (O) immobile et un mobile cible (C) proximations locales (ltre de Kalman étendu, algorithme observé dans le plan (voir gure 1 décrivant une trajectoire de type Newton) et posent généralement des problèmes rectiligne uniforme. d'initialisation et de comportement global. Nous introduisons ici l'outil de résolution global qu'est la technique particulaire déjà abordée avec succès [7] au sens du ltrage à minimum de variance et brevetée par ailleurs [9]. Cette technique s'avère ici supérieure en performance et en robustesse, au sens du maximum de vraisemblance, lorsqu'on l'assortit de redistributions probabilistes adaptées à la métrique de la vraisemblance. Elle se compare également favorablement aux approximations locales précitées, bien que l'application ne pose pas de dicultés multimodales. Nord K y Cible V Vy D Vx x A Observateur Ouest 2 Modélisation. 2.1 Modèle polaire modié Le modèle choisi est le modèle polaire modié [1]. En eet, cette modélisation a largement prouvé son ecacité dans Fig. 1: Localisation de la cible Le vecteur d'état du modèle polaire modié est consti- 705 Dix-septième colloque GRETSI, Vannes, 13-17 septembre 1999 tué des quatre composantes suivantes : 2 3 2 3 _ x1(t) A(t) 6 7 6 _ 7 7 = 6 D(t)=D(t) 7 X(t) = 64 xx2(t) (1) 5 4 A(t) 5 3 (t) x4(t) 1=D(t) Le modèle polaire modié se déduit du modèle cartésien (x; y; Vx ; Vy ). Il est possible d'exprimer l'état X(t) en fonction de l'état initial X(0) par : 2 3 x1 (0) 6 (tx1(0))2 + (1 + tx2 (0))2 77 6 X(t) = 6 6 6 6 6 6 6 6 6 6 6 6 6 6 4 tx21 (0) + (1 + tx2(0))2 (tx1(0))2 + (1 + tx2 (0))2 1 (0) x3(t0 ) + arctan 1 +txtx 2 (0) 7 7 7 7 7 7 7 7 7 7 7 7 7 7 5 (2) 2 2.2 Vecteur d'observation Le vecteur d'observation est constitué de l'azimut et de la fréquence perçue sous eet Doppler. Il s'exprime donc dans la base polaire modiée par : ( yA (t) = x3 (t) + vA (t) (3) yf (t) = x5(t)(1 , cxx24((tt)) ) + vf (t) où c est la célérité du son dans l'eau supposée constante, vA et vf sont deux bruits gaussiens indépendants, de moyenne nulle et de variances respectives RA et Rf . Y (t) = 3 Estimation particulaire à maximum de vraisemblance. 3.1 Principe de la technique Considérons le problème d'estimation paramétrique à maximum de vraisemblance non linéaire où la dynamique du système est décrite par :  xt = (x0; t) (4) yt = h(xt ) + vt où x est le vecteur d'état, y l'observation et v le bruit d'observation additif Gaussien de variance R. L'estimateur maximise la vraisemblance de x0 conditionnellement aux observations Y0T = fyk gk=0;:::;T T x0 = max c (5) x0 log pxjY (x0 jY0 ) = max x0 VT (x0) où VT (x0) = T (yk , h(xk ))T R,1 (yk , h(xk )) X k=0 PxjY (x0)jY0T )  N X i=1 (6) i x0 (7) i où x0 est la mesure de Dirac de support xi0 et i le poids de la particule xi0 i N X i = exp VTi = k=1 x4 (0) (tx1(0)) + (1 + tx2 (0))2 Une cinquième composante doit être rajoutée à l'état, c'est la pulsation propre acoustique de la cible y5 (t) = y5 (0) = F0. p L'approche particulaire (originellement esquissée dans [8]) consiste à approcher la mesure de probabilité conditionnelle pxjY (x0 jY0T ) par une somme nie et pondérée de mesures de Dirac (voir [10] et ses références) : exp VTk (8) où Vtk est la vraisemblance de la particule k conditionnelle aux mesures sur l'intervalle temporel [0; T] dénie en (6). L'application simple de cette approche bayésienne entraîne que le poids des particules dégénère avec le temps. Le poids des particules éloignées de la condition initiale à estimer devient très faible. Ces particules contribuent faiblement à la construction de l'estimateur : la loi des grands nombres est sous-utilisée. Pour un horizon de temps important tous le poids du support particulaire se concentre sur une seule particule. La densité de probabilité conditionnelle n'est alors plus représentée que par une seule particule. Pour pallier cette diculté, la méthode employée en ltrage particulaire consiste à redistribuer les particules évanescentes selon la densité de probabilité conditionnelle acquise dans tout le domaine. Chacune des positions xi0 du support reçoit un nombre de particules proportionnel à son poids i . Cette procédure de régularisation a pour eet de regrouper les particules dans les zones les plus probables de la densité de probabilité conditionnelle. 3.2 Redistribution diuse adaptative Dans la convergence asymptotique de l'estimation paramétrique, il n'existe pas de perturbations dynamiques. Au cours des redistributions successives, la particule la plus vraisemblable attire toutes les autres particules. L'ensemble du support nit par se concentrer sur la position la plus proche et l'estimation qui en découle hérite du biais initial. La gure 2 illustre ce problème pour un mobile en mouvement de rotation uniforme observé en cartésien. 1 vitesse angulaire vitesse estimee support particulaire 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0 10 20 30 iteration 40 50 60 Fig. 2: Estimation paramétrique - redistribution classique Il faudrait donc une distribution du support fxi0gi=1;:::;N inniment dense pour déterminer le maximum de la den706 Dix-septième colloque GRETSI, Vannes, 13-17 septembre 1999 N X probabilité conditionnelle pxjY (x0 jY0T ) avec exac4. Calcul de l'estimée c x0 = i xi0 Le nombre de particules étant nécessairement limi=1 sité de titude. ité, ce ne peut pas être le cas. La méthode de redistribution diuse adaptative consiste à redistribuer les particules non pas sur une seule et même position mais dans un voisinage autour d'une position donnée. La métrique de ce voisinage est obtenue naturellement à partir de la matrice d'information de Fisher F (xi0). L'inverse de F (xi0 ) se propage selon les mêmes équations que la matrice de covariance d'un lisseur de Kalman local autour de la trajectoire nominale [11] de chaque particule (la linéarité est conséquence de la localisation dans un voisinage). Soit une particule xi dont la dynamique est décrite par le système (4). Les équations de prédiction et de ltrage donnent : où 5. Évolution du support  xik+1 = f(xik )  k=k+1 6. Test de redistribution si le nombre de particules N aller en de poids inférieur à 101N est supérieur à 10 7, sinon retour en 2. 7. Redistribution  Calcul du nombre ni de particules à redistribuer autour de chaque position xi0 soit la partie entière de Ni .  Calcul pour chacune des positions retenues (de poids supérieur à 21N ) de P0ijk.  Redistribution de ni particules autour de la position xi0 par tirage selon N (xi0; P0ijk)  Réinitialisation de la fenêtre k = 0  Réinitialisation des vraisemblances Vki = 0 8. Retour en 2. Ptijt,1 = Fti,1Pti,1jt,1Fti,1T (9) T T Kti = Ptijt,1Hti [HtiPtijt,1Hti + R],1 (10) Ptijt = (I , Kti Hti )Ptijt,1 (11) t) i = @h(xt ) Fti = @(x et H (12) t @x(t) jx @xt x La covariance de la tâche de redistribution sur la position initiale P0ijt = F ,1 (xi0) est obtenue par l'équation de lissage : Pti,1 = Fti,1Pti Fti,1,T (13) i i initialisée par Pt = Ptjt. i t i t Poids initial 1/N dx dy Fig. 3: Principe de redistribution Le principe de redistribution est illustré par la gure 3. Autour de chacune des positions est redistribué un nombre de particules lles unitaires proportionnel au poids acquis par la particule mère. L'algorithme d'estimation particulaire se résume donc à : 1. Initialisation  Tirage du support fxi0gi=1;:::;N selon la loi a priori p(x0).  Initialisation de la fenêtre temporelle k = 0 2. Calcul de la vraisemblance Vki = Vki,1 , (yk , h(xik ))T R,1(yk , h(xik )) 3. Calcul des poids N X i i = exp Vk = exp Vkj j =1 3.3 Lisseur de Kalman conditionnel Lorsque une des composantes de l'état est observée linéairement conditionnellement aux autres composantes de l'état (c'est le cas de la fréquence propre du mobile F0 ), il est possible d'utiliser un estimateur exact sur cette composante conditionnellement aux autres . Le système étudié est donc de la forme : 8 < xt = (x0 ; t) t = Gt,1 + !t (14) : yt = h(xt )t + vt où  et h sont des fonctions non linéaires, G une fonction linéaire, !t et vt deux bruits gaussiens indépendants de moyenne nulle et de variance respectives Qt et Rt. Il sut donc de remarquer que conditionnellement à x, la partie dynamique/observation de  est linéaire,  est donc estimable de manière optimale par un lisseur de Kalman. Les équations du lisseur sont classiques. L'expression de la vraisemblance devient : T X (yt ,h(xit ))T (h(xit )Ptijt,1h(xit)T R),1(yt ,h(xit )) t=0 (15) où Ptijt,1 est la covariance de l'erreur de prédiction. L'estimée b est donnée par : VTi (x0) = d 0jt = N X i=1 i b0i jt (16) Cette méthode permet d'économiser un nombre signicatif de particules. La fréquence propre du mobile est estimée par cette méthode. 707 Dix-septième colloque GRETSI, Vannes, 13-17 septembre 1999 4 Application simulée mouvement rectiligne uniforme. Il est clair que ces résultats sont adaptables au problème ltrage avec bruits de Les seules informationsinitiales sont les mesures de l'azimut dynamique. Ainsi, il est possible d'appliquer cette techet de la fréquence. Aucune autre informationn'est disponible nique particulaire pour estimer la trajectoire d'un navire sur le cap, la vitesse et la distance. L'azimut et la fréquence cible eectuant des manoeuvres. sont donc distribués uniformément autour de leurs mesures initiales. La vitesse maximale est xée à 30 noeuds, cette valeur respecte la réalité physique des divers navires ex- Références istants. La distance est supposée comprise entre 0:5 et [1] Aidala and Hammel.  Utilisation of modied polar 128km. coordinates for bearing only-tracking . IEE TransA des ns comparatives, nous avons testé l'algorithme actions on automatic controls, 28(3):283293, 1983. sur la trajectoire dénie dans l'article [5]. La position initiale est (x(0) = 20km; y(0) = ,1:8km), la vitesse initiale [2] Jaufret and Bar-Shalom.  Track formation with bearing and frequency measuremnts in clutter est (Vx (0) = 0; Vy (0) = 9m=s), les écarts types de mesures . IEEE Transactions on aerospace and electronics pour l'azimut et la fréquence sont respectivement de 1:0 sytems, 26(6):9991010, Novembre 1990. degré et de 0:5 Hertz et la fréquence propre émise est de 300 Hertz. L'ellipsoïde de conance (99%) déduite de la [3] Kronham.  Bearing-only target motion analysis borne de Cramer Rao ainsi que le résultat de l'estimation based on a multihypothesis Kalman lter and adapparticulaire pour 50 trajectoires de bruits diérentes sont tative ownship motion control . IEE Proceedings représentés sur la gure 4. pour trois instants diérents on Radar Sonar and Navigation, 145(4):247252, 08 (5, 10 et 15mn). L'erreur d'estimation moyenne (R =R) 1998. passe au dessous du seuil de 10% au bout de 9mn pour [4] Nardone, Lindgren, and Gong.  Fundamental atteindre 5% en n de simulation. La gure 4 représente properties and performance of conventional bearingune trajectoire typique d'estimation. only target Target Motion Analysis . IEEE Transactions on Automatic control, pages 775,787, Sept 1984. [5] Passerieux, Pillon, Blanc-Benon, and Jaufret.  Target motion analysis with bearings and frequencies measurements . In Proceedings of the 22nd Asilomar Conference, Pacic Grove,CA, Nov 1988. [6] Peach.  Bearing-only tracking using a set of rangeparametrised extented Kalman lters . IEE Proceedings on Control theory Applications, 142(1):7380, 01 1995. [7] Rigal.  Filtrage non-linéaire,résolution particulaire et applications au traitement du signal . PhD thesis, Thèse de l'Université Paul Sabatier - LAAS/CNRS, Fig. 4: Estimation de la trajectoire de la cible. 1993. [8] G. SALUT.  Le thème non-linéaire en automatique et traitement du signal . Journées nationales du GdR traitement du signal et images du CNRS, septembre 1989. [9] G. Salut.  Procédé et système pour l'estimation optimale non-linéaire des processus dynamiques en temps réel . Brevet n INPI 94/07274, Europe extension n 95 95256.5-2206 USA n 8/750.313, juin 1994. [10] G. Salut.  Développement et applications du ltrage particulaire . Ecole des techniques avancées en Signal-Image-Parole de Grenoble Signal et non linéaire, août-septembre 1998. [11] James H. Taylor.  The Cramér-Rao estimation erFig. 5: Trajectoire d'un estimateur. ror lower bound computation for deterministic nonlinear systems . IEEE Transactions on automatic control, AC-24(2):343,345, avril 1979. 5 Conclusion [12] De Vlieger and Gmelig Meylig.  Maximum likelihood estimation for long-range target tracking using La nouvelle technique de redistribution diuse adaptative passive sonar measurements . IEEE Transactions a permise d'obtenir d'excellent résultats sur le problème on signal processing, 40(5):12161225, Mai 1992. de trajectographie SONAR où la cible est supposée en 8000 7000 t = 15mn 6000 5000 y (m) 4000 t = 10 mn 3000 2000 1000 t = 5mn 0 PORTEUR −1000 t=0 −2000 −0.5 0 0.5 1 1.5 2 x (m) 2.5 3 3.5 4 4.5 4 x 10 Position Vitesse 20 40 18 16 35 14 v (m/s) x (km) 12 30 10 8 25 6 4 20 2 15 −2 −1 0 1 2 3 y (km) 4 5 6 7 0 0 5 10 15 t (mn) 708