page d'accueil   sommaire   faculté  

Machine Learning Group [Machine Learning Group] (MLG)
Faculté des Sciences - Informatique (unité ULB515)

Les activités de l'unité se regroupent sous le thème ''modélisation stochastique''; les aspects vont des techniques d'apprentissage supervisé et le contrôle de systèmes dynamiques à l'analyse de processus markoviens par des méthodes algorithmiques et la théorie des files d'attentes. [The common theme of the research activity in the unit is Stochastic Modeling. The specific research projects cover various fields, from Machine learning to Dynamic Systems Control to the algorithmic analysis of Markovian processes and Queueing Theory.]



coordonnées


Machine Learning Group [Machine Learning Group]
tel +32-2-650.55.97, fax +32-2-650.56.09, latouche@ulb.ac.be
http://www.ulb.ac.be/di/map/map_def.html
Campus de la Plaine, Campus de la plaine Bâtiment NO, bureau N8.104
CP212, boulevard du Triomphe, 1050 Bruxelles

Pour en savoir plus, consultez le site web de l'unité.



responsables


Gianluca BONTEMPI Tom LENAERTS


composition


Olivier CAELEN Benjamin HAIBE-KAINS Sophie HAUTPHENNE Kevin KONTOS Guy LATOUCHE Yann-Aël LE BORGNE Patrick E. MEYER Abhilash MIRANDA Catharina OLSEN


projets


Etude algorithmique de chaînes de Markov [Algorithmic analysis of Markov chains]
Il s'agit de chaînes de Markov dont la matrice de transition possède la même structure, par blocs, que celles de files d'attente M/G/1 et GI/M/1. Les applications sont nombreuses, notamment en modélisation de systèmes informatiques. On utilise des raisonnements probabilistes pour mettre au point des algorithmes de calcul de diverses caractéristiques : distribution stationnaire, temps de passage, etc. [For the Markov chains under study, the transition matrix is block structured like that of the M/G/1 and GI/M/1 queueing systems. These Markov chains have numerous applications in computer systems modeling a.o. One uses probabilistic arguments to develop computational algorithms for various quantities of general interest such as the stationary distribution and moments of first passage times]

Modèles de fluides dans un environnement Markovien. [Fluid flow models in a Markovian environment.]
Les modèles de fluides sont utilisés dans la modélisation de systèmes en télécommunications. La petite taille des paquets à transmettre comparée à celle des buffers permet de traiter les données comme un fluide qui s'accumule dans le buffer ou s'en écoule. Nous introduisons l'effet causé par des arrivées soudaines, provoquées par des événements aléatoires, de grandes quantités de données à transmettre. [Fluid models are used to model digital telecommunication systems where the small size of packets compared to the size of buffers makes it appealing to treat the data as a fluid which accumulates into or drains from a buffer. We intend to incorporate the effect of sudden bursts of huge amount of data to be transmitted, due to random events.]

Réseaux de télécommunication [Telecommunication networks]
La modélisation de réseaux de télécommunication pose des problèmes particuliers, liés d'une part à la conjonction de phénomènes se produisant sur des échelles de temps très différentes, d'autre part au manque de données expérimentales jusqu'il y a peu. On s'intéresse principalement à la modélisation du trafic des paquets. [Some of the difficulties in modeling telecommunication networks are due to the fact that events occur on vastly different time scales, from micro-seconds to minutes. In addition, there have been very few experimental data available until recently. We are mainly interested in the design of packet traffic models]

Systèmes presque décomposables [Nearly completely decomposable systems]
Ce sont des systèmes à grand nombre d'états, partitionnés en sous-ensembles tels que les probabilités de migration d'un sous-ensemble à un autre sont très faibles. On utilise cette caractéristique pour mettre au point des approximations fiables de la distribution stationnaire et de divers temps de passage. [These are Markovian processes, usually on a large state space, where the states are grouped into subsets such that the probability is very small, of moving from one subset to another. This characteristic is used to construct reliable approximations for the stationary distribution and various passage times]

Processus stochastiques planaires de phases [Phase-type planar stochastic processes]
Les applications mobiles en télécommunication sont appelées à se développer et poseront de nombreux problèmes nouveaux de modélisation. Actuellement, les processus planaires sont principalement représentés par le processus de Poisson à deux dimensions. L'objet de ce projet est d'appliquer à ce cadre les méthodes de phase qui ont rencontré un succès éclatant en modélisation temporelle de trafic. [One expects mobile telecommunication services to expand in years to come, thereby raising new and challenging modeling problems. At present, the planar Poisson process is the only available tool. The purpose of this project is to generalize the phase methods which have been so successful in modeling traffic processes in the time domain.]

ARMURS [ARMURS - Automatic Recognition for Map Update by Remote Sensing]
Produites à partir de photographies aériennes, d'images satellitaires ou de relevés de terrain, les bases de données géographiques jouent aujourd'hui un rôle-clef. Reste que ces données doivent non seulement être de plus en plus détaillées mais également remises à jour le plus fréquemment possible. Or, à l'heure actuelle, il n'existe pas d'outil automatisé pour assister ce travail. Soutenu par le programme d'impulsion TIC de la Région de Bruxelles-Capitale, le projet ARMURS a pour objectif de détecter (et de prédire) les changements dans les bases de données topographiques selon deux axes de recherche: à l'échelle d'une région, l'objectif est de prédire la localisation des changements dans les bases de données topographiques à partir de données issues de sources multiples; à une échelle plus locale, la base de données topographique sera comparée à des photographies aériennes ou à des images satellitaires à haute résolution afin de détecter et de reconnaître les changements et de mettre en évidence d'éventuelles erreurs. [The general objective of the project is to capitalize partners' knowledge in the development of a demonstrator to assist data producers in updating more efficiently their topographic database by using state-of-the-art image processing and statistical analysis techniques. Data will include remote sensing images, together with socio-economical data.]

OASIS [OASIS - Detection and analysis of social fraud in OASIS Databases]
Ce projet a deux objectifs principaux: améliorer OASIS en ajoutant des outils de datamining et de mieux comprendre la fraude sociale. Ces deux objectifs sont complémentaires. La modélisation dynamique prévue par le datamining techniques donnera une idée plus précise de la (nouvelle) mécanisme frauduleux. Ensuite, les services d'enquête, les responsables et les chercheurs à mieux comprendre ce phénomène social dans notre pays. Concrètement, le projet permettra de produire une interface pour les différentes communautés (services d'enquête, les services publics, les services politiques, scientifiques). Utilisation d'une interface personnalisée, chacun d'entre eux se réfèrent et d'exploiter les données et les résultats liés à leurs besoins. [This project has two main goals : upgrade OASIS by adding datamining tools and better understand the social fraud. Both goals are complementary. The dynamic modelisation provided by the datamining techniques will give a more precise of the (new) fraud mechanism. Then, the investigating services, the persons in charge and the researchers will better understand this social phenomenon in our country. Concretely, the project will produce an interface to the different communities (investigating services, public services, political services, scientists). Using a personalized interface, each one will refer and exploit data and results related to their needs. ]

ARC [ARC - Integrating experimental and theoretical approaches to decipher the molecular networks of nitrogen utilisation in yeast]
La levure Saccharomyces cerevisiae est un modèle vivant qui a été de loin le plus largement utilisé pour développer les nouvelles méthodes expérimentales de la génomique et la protéomique. Multiples facettes du métabolisme des cellules de levure ont été étudiées en utilisant ces approches. Dans ce projet, nous avons pour la première fois de surveiller l'ensemble du génome à l'échelle de la réponse des cellules de levure à des conditions d'approvisionnement en éléments nutritifs pour une clé de tous les systèmes cellulaires: azote. Des cellules de levure est cultivée sous le plus large éventail de conditions d'approvisionnement en azote que possible (levure peut utiliser jusqu'à une trentaine de composés en tant que seule source d'azote) et de l'état de leur transcriptome sera contrôlé en utilisant la méthode de puces à ADN. En parallèle, la concentration de métabolites contenant de l'azote dans la cellule sera mesuré. La liaison spécifique de la clé de régulation transcriptionnelle de gènes à la multiplicité de leurs objectifs sera également surveillée en vertu de diverses conditions d'approvisionnement en azote. Les données numériques ainsi généré sera interprété par la combinaison de statistiques (clustering, classification supervisée, la prévision des séries chronologiques), statiques (la théorie des graphes), et les méthodes de modélisation dynamique. Novel hypothèses issues de ces analyses en numero sera ensuite soumis à des essais de validation en utilisant des méthodes classiques de la génétique moléculaire. Merci pour ce cross-alimentation permanente entre l'analyse théorique et expérimentale, le projet vise à compléter progressivement déchiffrer le réseau moléculaire de l'azote dans le métabolisme de la levure, de son règlement, et s'attend à des chevauchements entre ce réseau et d'autres domaines de l'activité cellulaire. Le rôle dominant joué soupçonné par la membrane et le transport des éléments nutritifs dans les systèmes de détection à l'orchestration de ce réseau sera aussi étudiée. [The yeast Saccharomyces cerevisiae is the model living organism that has been by far the most extensively used to develop the novel experimental methods of genomics and proteomics. Multiple facets of the metabolism of yeast cells have been explored using these approaches. In this project, we plan for the first time to monitor at whole-genome scale the response of yeast cells to supply conditions for a key nutrient of all cellular systems: nitrogen. Yeast cells will be grown under as wide a range of nitrogen supply conditions as possible (yeast can use up to thirty different compounds as sole nitrogen source) and the state of their transcriptome will be monitored using the DNA microarray method. In parallel, the concentration of nitrogen-containing metabolites in the cell will be measured. The specific binding of key transcriptional regulators to their multiple gene targets will also be monitored under various nitrogen supply conditions. The numerical data thus generated will be interpreted by combining statistical (clustering, supervised classification, time series prediction), static (graph theory), and dynamic modelling methods. Novel hypotheses resulting from these in numero analyses will then be subjected to validation tests using classical methods of molecular genetics. Thanks to this permanent cross-feeding between experimental and theoretical analyses, the project aims to progressively decipher the complete molecular network of nitrogen metabolism in yeast, of its regulation, and of anticipated overlaps between this network and other domains of cell activity. The suspected dominant role played by membrane nutrient transport and sensing systems in the orchestration of this network will also be investigated.]

TANIA - Système d'aide à la conduite de l'anesthésie [TANIA - Decision Support System for Control in Anesthesia]
Nous voulons mettre entre les mains de tous les médecins anesthésistes-réanimateurs et infirmiers anesthésistes un système d'aide à la décision informatique que propose des séquences d'injections d'anesthésiants en fonction de l'information sur le patient, son état général, sa réponse à la chirurgie et les différentes phases de l'opération. Toutes les propositions d'actions anesthésiants seront affichées sur un système de monitorage accessible au médecin lequel pirra les valider et éventuellement accepter. Personnalisé et convivial, un tel système s'appuiera sur une base de connaissance apprise automatiquement par une procédure de data mining à partir d'une base de données collectée au préalable dans les services d'anesthésie partenaires du projet. [The main objective of the project is to aid the anesthesiologists and anesthetists in using a computerized decision-making data-processing system which proposes sequences of administration of anesthetics and other drugs according to the information available from the patient’s general state, response to the surgery and the various phases of the operation. All the proposals for actions on anesthetics and other drugs will be posted on a monitoring system accessible to the expert anesthesiologist who will be able to validate them and possibly accept.]

Processus de branchement et méthodes matricielles [Branching processes and matrix analytic methods]
Un grand nombre de questions dans des domaines comme la biologie, la démographie ou les télécommunications peuvent être modélisées à l'aide de processus de branchement à plusieurs types. Nous nous concentrons sur une classe particulière de ces processus de branchement, appelée arbres binaires markoviens (MBTs pour Markovian binary trees). Ce sont des processus stochastiques contrôlés par un processus d'arrivées markovien (MAP pour Markovian arrival process). Le principal objectif du projet est de répondre à plusieurs questions sur les MBTs par le développement de méthodes de résolution numérique, en mettant l'accent sur leur interprétation probabiliste, avec l'aide de la théorie des méthodes matricielles et des processus de branchement. Quelques exemples de questions intéressantes avec de nombreuses applications sont - la probabilité d'extinction d'un MBT, - la distribution du temps jusqu'à son extinction - le comportement du processus en présence d'immigration, de catastrophes et / ou d'environnements aléatoires, - le nombre de particules en vie à un certain moment, - la distribution de la descendance totale jusqu'à l'extinction, si celle-ci a lieu, - la modélisation à l'aide du MBT dans le domaine des télécommunications (P2P réseaux), de la démographie, et de la biologie. [A large number of questions in fields like biology, demography or telecommunications may be modeled as continuous-time multi-type branching processes. We focus on a particular class of such branching processes, called the Markovian binary trees (MBTs). These are stochastic processes controlled by a Markovian arrival process.The main goal of the project is to answer several questions about the MBT by developing numerical resolution methods, emphasizing on their probabilistic interpretation, with the help of matrix analytic methods and branching processes theory. Some examples of interesting questions with many applications are - the extinction probability of the MBT, - the distribution of the time until its extinction -behavior of the process in presence of immigration, catastrophes and/or random environment, -the number of particles alive at some time, - the distribution of the total progeny of the process until extinction, provided this extinction occurs, - the model of the MBT in telecommunications (P2P networks), demography, and biology.]



publications


Natjet Benseba / Sojourn time distribution in batch service queue. / A. Alfa and S. Chakravarthy, Advances in Matrix Analytic Methods for Stochastic Models - Proceedings of the 2nd International Workshop on Matrix-Analytic Methods, pages 361-380 Notable Publications Inc, NJ, July 1998

I. El Khamlichi and L. Franck. / Study of two policies for implementing routing algorithms in satellite constellations. Conference, 2000 / Proceedings of AIAA, 18th International Communications Satellite Systems

G. Latouche and V. Ramaswami. / Introduction to Matrix Geometric Methods in Stochastic Modeling. / ASA-SIAM Series on Statistics and Applied Probability. SIAM, Philadelphia PA, 1999.

G. Latouche / Algorithmic methods in stochastic modeling: from the Poisson process to MAPs. / Dieter Baum, N. Müller, and R. Rödler, MMB99. Messung, Modellierug und Bewertung von Rechen- und Kommunikations-systemen- Proceedings of the 10th GI/ITG Special Interest Conference, pages 25-34. VDE Verlag, Berlin, 1999

Marie-Ange Remiche and Guy Latouche. / Asymptotic Poisson distribution in isotropic PH planar point processes. / Comm. Statist. Stochastic Models, 16:259-272, 2000

A. Haegemans, G. Latouche and H. Leemans. / How to interpret the condition number of the caudal characteristic of a QBD. / G. Latouche and P. Taylor, editors, Advances in Algorithmic Methods for Stochastic Models - Proceedings of the 3rd International Conference on Matrix-Analytic Methods, pages 154-165. Notable Publication Inc, NJ,2000

M.A.Remiche / On the exact distribution of the isotropic planar point processes of phase-type. / Journal of Computational and Applied Mathematics, 116:77-91, 2000.

M.A. Remiche. / Asymptotic independence of counts in isotropic planar point processes of phase-type. / Adv. in Appl. Probab., 32:363-375, 2000.

M.A. Remiche. / Planar point processes of phase-type with dependent angular coordinates. / G. Latouche and P. Taylor, editors, Advances in Algorithmic Methods for Stochastic Models - Proceedings of the 3rd International Conference on Matrix-Analytic Methods, pages 315-328. Notable Publications Inc, NJ, 2000



theses


Haibe Kains, Benjamin (2009) : ''Identification and Assessment of Gene Signatures in Human Breast Cancer '', 2009

Le Borgne, Yann-aël (2009) ''Learning in wireless sensor networks for energy-efficient environmental monitoring'', 2009

Kontos, Kevin (2009) ''Gaussian Graphical Model Selection for Gene Regulatory Network Reverse Engineering and Function Prediction'', 2009

Meyer, Patrick E. (2008), Information-Theoretic Variable Selection and Network Inference for Microarray Data Analysis, 2008

da Silva Soares, Ana (2005) Fluid Queues: Building upon the Analogy with QBD Processes. ULB., 2005

Remiche, Marie-Ange (1999), Isotropic Phase Planar Point Processes: Analysis and Application to Cellular Mobile Telecommunication, Doctorat en Sciences, ULB, 1999

Seront, Grégory (1999) Evolutionary algorithms and hybridization in optimization and program construction. ULB., 1999

Leemans, Herlinde (1998), The Two-Class Two-Server Queueing Model with Nonpreemptive Heterogeneous Priority Structures, Doctoraat in Toegepaste Economische Wetenschappen, KU Leuven, 1998

Benseba, Nadjet (1996) Etude algorithmique des chaines de Markov de type GI/M/1 et analyse des performances d'un système de fabrication par lots. ULB., 1996



collaborations


Prof. Marcel F. Neuts, University of Arizona, Systems and Industrial Engineering, Tucson, AZ, Etats-Unis (USA)

Prof. Phuoc Tran-Gia, Universität Würzburg, Lehrstuhl für verteilte Systeme, Würzburg, ALLEMAGNE (REP.FED.)

Prof. Peter Taylor, University of Adelaide, Teletraffic Research Centre, Adelaide, Australie

Dr V. Ramaswami., At et T Labs, Middletown N.J., Etats-Unis (USA)

Prof. D. Bini, Dr. B. Meini, Università di Pisa, Dipartimento di Matematica, Pisa, Italie

Prof. Bruno André,, ULB,, Département de Biologie Moléculaire,, Bruxelles,, Belgique

Prof. Luc Barvais,, Hôpital Erasme,, Service d'Anesthésiologie et Réanimation,, Bruxelles,, Belgique

Prof. Jacques Van Helden,, ULB,, Département de Biologie Moléculaire,, Bruxelles, Belgique

Dr. Marcelline Kaufman,, ULB,, Département de Chimie,, Bruxelles,, Belgique

Prof. Marco Dorigo, Prof. Hugues Bersini et Dr. Mauro Birattari,, Iridia,, Faculté des Sciences Appliquées,, Bruxelles,, Belgique

Dr. Christos Sotiriou,, Hôpital Jules Bordet,, Institut de Recherches Interdisciplinaires et de Développements en Intelligence Artificielle,, Bruxelles,, Belgique

Dr. Christine Decaestecker,, Lisa, ULB,, Faculté des Sciences Appliquées,, Bruxelles,, Belgique

Prof. Marco Saerens and Prof. Pierre Dupont,, UCL,, Machine Learning Group,, Louvain-la-Neuve,, Belgique

Prof. Thierry Dutoit,, TCTS Lab, FPMs,, Département d'anestésie des Facultés de Médecine de l'UCL et l'ULg,, Mons,, Belgique

Prof. Giorgio Guariso et Prof. Andrea Bonarini,, Politecnico di Milano,, Dipartimento di Elettronica e Informazione,, Milan,, Italie

Dr. Luca Gambardella et Dr. Giorgio Corani,, ISDIA, Instituto di Studi sull'Intelligenza Artificiale, Lugano, Suisse

Dr. M. De Lorenzi,, Swiss Institute of Bioinformatics,, ISREC,, Lausanne,, Suisse

Silvia Santini,, ETH-Zurich - Swiss Federal Institute of Technology,, Distributed System Group,, Zurich, Suisse

Prof. Carlotta Domeniconi,, Université George Mason,, Département d'Informatique,, Washington,, Etats-Unis (USA)

Marie-Ange Remiche, ULB, Bruxelles, Belgique

Prof. Kenji Leibnitz,, Osaka University, Graduate School of Information Science & Technology,, Advanced Network Architecture Research Group,, Osaka, Japon

Prof. Benny Van Houdt,, University of Antwerp, Department of Mathematics and Computer Science,, PATS Research Group,, Antwerp, Belgique

Pauline Lafitte,, Université Lille I,, Lille, France



savoir-faire/équipements


Laboratoire de reseaux de capteurs

Analyse des données

Modelisation et prédiction

Statistique computationnelle et apprentissage automatique



mots clés compréhensibles déclarés


apprentissage automatique bioinformatique data mining modélisation stochastique prédiction


disciplines et mots clés déclarés


Accompagnement des mourants Algèbre linéaire et matricielle Aménagement du territoire Analyse complexe Analyse numérique Mathématiques Probabilités Processus stochastiques Recherche opérationnelle Technologie des télécommunications [télécommunications]

apprentissage automatique bioinformatique catastrophes chaînes de Markov décomposabilité environnements aléatoires estimation de paramètres files d'attente files d'attentes mémoire longue méthodes algorithmiques méthodes algorithmiques méthodes approximatives méthodes matricielles méthodes matricielles modèle de trafic modèle markovien modèles de fluide probabilité d'extinction processus de branchement processus de diffusion processus de paquets processus de phase processus de phase processus planaires processus QBD réseaux de télécommunication télécommunication mobile