Dans cet article, nous proposons un modèle génératif qui permet d’extraire les nombres de Betti d... more Dans cet article, nous proposons un modèle génératif qui permet d’extraire les nombres de Betti d’un ensemble de variétés de R à partir d’un échantillon. Ce modèle est basé sur le Complexe Simplicial Génératif, un modèle de mélange dont les composantes sont des simplexes géométriques convolués à une distribution gaussienne multivariée. La nouveauté de la méthode consiste à optimiser BIC, un critère statistique de vraisemblance pénalisée, pour obtenir une estimation des invariants topologiques des variétés génératrices des données, les nombres de Betti. Les résultats d’une telle méthode montrent une plus grande robustesse au bruit que ceux d’une méthode fondée sur une approche purement géométrique. Le Complexe Simplicial Génératif est comparé au Witness Complex (WitC) et la persistance homologique sur des données jouet (sphère, tore, bouteille de Klein) et un jeu de données réelles, COIL-100, une base d’images d’objets en rotation.
L'analyse du lien entre l'environnement et la sante est devenue une preoccupation majeure... more L'analyse du lien entre l'environnement et la sante est devenue une preoccupation majeure de sante publique comme en temoigne l'emergence des deux Plans Nationaux Sante Environnement. Pour ce faire, les decideurs sont confrontes au besoin de developpement d'outils necessaires a l'identification des zones geographiques pour lesquelles on observe une surexposition a des substances toxiques. L'objectif du projet SIGFRIED 1 est de construire des indicateurs spatialises permettant d'evaluer l'exposition de la population francaise aux substances chimiques et ses determinants. La construction des l'indicateurs spatialises repose sur le couplage de deux approches que sont l'evaluation des expositions et la spatialisation des donnees. Une plateforme de modelisation est construite presentant les caracteristiques suivantes : - une approche integree prenant en compte la variete des situations de transfert des polluants dans les compartiments environnement...
Dans le cadre du diagnostic de systemes complexes, ou les donnees sont generalement collectees so... more Dans le cadre du diagnostic de systemes complexes, ou les donnees sont generalement collectees sous la forme de signaux, cet article aborde la problematique de la classification non supervisee de donnees dont les classes evoluent de maniere non stationnaire. Un modele de melange dont les parametres sont modelises de maniere stochastique est propose dans ce contexte, ainsi qu'un algorithme EM variationnel pour l'estimation des parametres de ce modele. Une etude experimentale est menee sur des donnees simulees.
geoENV I — Geostatistics for Environmental Applications, 1997
Abstract. A clustering algorithm for spatial data is presented. It seeks a fuzzy partition which ... more Abstract. A clustering algorithm for spatial data is presented. It seeks a fuzzy partition which is optimal according to a criterion interpretable as a penalized likelihood. We propose to penalize the energy function exhibited by Hathaway (1986) with a term taking into account ...
Cet article aborde le problème de la classification des données temporelles en utilisant un mélan... more Cet article aborde le problème de la classification des données temporelles en utilisant un mélange dynamique de lois gaussiennes dont les moyennes sont considérées comme des variables latentes qui évoluent suivant des marches aléatoires.
We present first the main basic choices which are preliminary to any clustering and then the dyna... more We present first the main basic choices which are preliminary to any clustering and then the dynamic clustering method which gives a solution to a family of optimization problems related to those choices. We show then how these choices interfere in pattern recognition using three approaches: the syntactic approach, the logical approach and the numerical approach. For each approach we present a practical application.
The 3rd ACS/IEEE International Conference onComputer Systems and Applications, 2005.
Summary form only given. Cluster analysis is an important tool in a variety of scientific areas s... more Summary form only given. Cluster analysis is an important tool in a variety of scientific areas such as pattern recognition, information retrieval, microarray, data mining, and so forth. Although many clustering procedures such as hierarchical clustering, k-means or self-organizing maps, aim to construct an optimal partition on the set of objects I or, sometimes, on the set of variables J,
Dans cet article, nous proposons un modèle génératif qui permet d’extraire les nombres de Betti d... more Dans cet article, nous proposons un modèle génératif qui permet d’extraire les nombres de Betti d’un ensemble de variétés de R à partir d’un échantillon. Ce modèle est basé sur le Complexe Simplicial Génératif, un modèle de mélange dont les composantes sont des simplexes géométriques convolués à une distribution gaussienne multivariée. La nouveauté de la méthode consiste à optimiser BIC, un critère statistique de vraisemblance pénalisée, pour obtenir une estimation des invariants topologiques des variétés génératrices des données, les nombres de Betti. Les résultats d’une telle méthode montrent une plus grande robustesse au bruit que ceux d’une méthode fondée sur une approche purement géométrique. Le Complexe Simplicial Génératif est comparé au Witness Complex (WitC) et la persistance homologique sur des données jouet (sphère, tore, bouteille de Klein) et un jeu de données réelles, COIL-100, une base d’images d’objets en rotation.
L'analyse du lien entre l'environnement et la sante est devenue une preoccupation majeure... more L'analyse du lien entre l'environnement et la sante est devenue une preoccupation majeure de sante publique comme en temoigne l'emergence des deux Plans Nationaux Sante Environnement. Pour ce faire, les decideurs sont confrontes au besoin de developpement d'outils necessaires a l'identification des zones geographiques pour lesquelles on observe une surexposition a des substances toxiques. L'objectif du projet SIGFRIED 1 est de construire des indicateurs spatialises permettant d'evaluer l'exposition de la population francaise aux substances chimiques et ses determinants. La construction des l'indicateurs spatialises repose sur le couplage de deux approches que sont l'evaluation des expositions et la spatialisation des donnees. Une plateforme de modelisation est construite presentant les caracteristiques suivantes : - une approche integree prenant en compte la variete des situations de transfert des polluants dans les compartiments environnement...
Dans le cadre du diagnostic de systemes complexes, ou les donnees sont generalement collectees so... more Dans le cadre du diagnostic de systemes complexes, ou les donnees sont generalement collectees sous la forme de signaux, cet article aborde la problematique de la classification non supervisee de donnees dont les classes evoluent de maniere non stationnaire. Un modele de melange dont les parametres sont modelises de maniere stochastique est propose dans ce contexte, ainsi qu'un algorithme EM variationnel pour l'estimation des parametres de ce modele. Une etude experimentale est menee sur des donnees simulees.
geoENV I — Geostatistics for Environmental Applications, 1997
Abstract. A clustering algorithm for spatial data is presented. It seeks a fuzzy partition which ... more Abstract. A clustering algorithm for spatial data is presented. It seeks a fuzzy partition which is optimal according to a criterion interpretable as a penalized likelihood. We propose to penalize the energy function exhibited by Hathaway (1986) with a term taking into account ...
Cet article aborde le problème de la classification des données temporelles en utilisant un mélan... more Cet article aborde le problème de la classification des données temporelles en utilisant un mélange dynamique de lois gaussiennes dont les moyennes sont considérées comme des variables latentes qui évoluent suivant des marches aléatoires.
We present first the main basic choices which are preliminary to any clustering and then the dyna... more We present first the main basic choices which are preliminary to any clustering and then the dynamic clustering method which gives a solution to a family of optimization problems related to those choices. We show then how these choices interfere in pattern recognition using three approaches: the syntactic approach, the logical approach and the numerical approach. For each approach we present a practical application.
The 3rd ACS/IEEE International Conference onComputer Systems and Applications, 2005.
Summary form only given. Cluster analysis is an important tool in a variety of scientific areas s... more Summary form only given. Cluster analysis is an important tool in a variety of scientific areas such as pattern recognition, information retrieval, microarray, data mining, and so forth. Although many clustering procedures such as hierarchical clustering, k-means or self-organizing maps, aim to construct an optimal partition on the set of objects I or, sometimes, on the set of variables J,
Uploads
Papers by Gérard Govaert