ULB logo

Évaluer et améliorer la qualité de l'information : herméneutique des bases de données administratives

Mme Isabelle Boydens a présenté et défendu publiquement sa dissertation originale le jeudi 17 décembre 1998 et a obtenu la plus grande distinction.
Ce faisant, elle est devenue le premier docteur en Philosophie et Lettres, orientation Information et Documentation de notre section.

Cette thèse de doctorat a fait l'objet de la publication suivante :
Isabelle BOYDENS, Informatique, normes et temps. Bruxelles, éd. Bruylant, 1999.
L'ouvrage s'est vu décerner le prix de la Fondation "Louis Davin", conféré par l'Académie Royale des sciences, des lettres et des beaux-arts de Belgique.

Composition du jury

Abstract

Les informations contenues dans les bases de données sont-elles exactes ? La question de l'exactitude des "données" a-t-elle un sens ? Comment appréhender l'adéquation de l'information au "réel" observable correspondant ? Voici autant de questions que les concepteurs, les gestionnaires et les utilisateurs de bases de données peuvent très légitiment se poser.

Nous soutenons qu'une approche herméneutique, appliquée à l'analyse d'une vaste base de données administrative, permet de formuler des résultats opérationnels en vue d'en améliorer la gestion. L'herméneutique consiste à interpréter une réalité empirique d'ordre humain ou social, dont l'appréhension n'est jamais déterministe, dans le cadre plus large de son contexte. Les résultats obtenus sont généralisables à d'autres systèmes d'information analogues et contribuent à enrichir la théorie en matière de modélisation conceptuelle. L'étude repose sur l'analyse de la base de données LATG (Loon en Arbeidtijdgegevensbank) de l'O.N.S.S.-R.S.Z. (Office national de sécurité sociale-Rijksdienst voor sociale zekerheid). Celle-ci assure la perception des cotisations de sécurité sociale dues par les employeurs. Ces cotisations s'élèvent annuellement à environ 1.100 milliards de francs belges. La gestion d'un tel système d'information est complexe en raison de la fréquence des modifications législatives, des arbitrages que suppose la formalisation de la loi, du statut évolutif de la population représentée et de la nécessité de traiter des valeurs incomplètes ou incohérentes.

La qualité d'une base de données désigne son adéquation relative aux objectifs qui lui sont assignés. L'examen de cette adéquation inclut des éléments formels et informels. Le data quality research, discipline née au sein des laboratoires américains d'AT&T et du MIT, a proposé plusieurs méthodes permettant de rectifier les erreurs formellement identifiables dans de vastes collections de données. Toutefois, la question de l'interprétation est souvent éludée à travers l'hypothèse de l'isomorphisme qui unirait l'information à l'objet observable correspondant. Or cette hypothèse n'est pas fondée. En effet, d'emblée, les concepts d'une base de données sont abstraits au terme d'une simplification du réel. De surcroît, après la phase de conception, la base de données et l'objet qu'elle représente interagissent tout en se transformant à un rythme propre. Enfin, nous ne disposons d'aucun référentiel en vue de vérifier l'adéquation de l'information empirique à son objet. Aussi, à la question "l'information est-elle correcte ?", substituons-nous la question suivante : "comment l'information se construit-elle progressivement ?". Afin d'y répondre, nous appliquons les enseignements de l'heuristique, de la critique historique et de l'herméneutique au cadre opératoire d'une base de données. L'approche consiste à étudier l'évolution de la base de données en interaction avec celle de son environnement. L'environnement d'une base de données inclut les normes qui en régissent le domaine d'application, les observations auxquelles s'appliquent ces normes ainsi que les flux d'information correspondants.

Entre la conformité au cadre opératoire de l'informatique et la question du sens, se déploient les arbitrages auxquels sont quotidiennement confrontés les gestionnaires d'un système d'information administratif. Les enjeux sociaux et financiers de ces choix demandent de caractériser les transformations de la base de données au fil des interprétations que suscite sa gestion. A cette fin, nous montrons comment optimaliser les flux d'information et enrichir le modèle de la base de données tout en minimisant le coût et le travail de mise à jour ultérieurs. Plusieurs stratégies de gestion sont ensuite proposées en vue d'assurer un traitement plus fiable de l'information et, de ce fait, des flux financiers. Les recommandations opérationnelles de l'étude incluent un recours conjoint à diverses disciplines en matière de modélisation conceptuelle, telles que la conception des bases de données temporelles, la gestion des versions de schéma, la gestion des exceptions et la conception des systèmes de méta-information. En retour, ces disciplines, confrontées l'une à l'autre et à l'analyse concrète d'une base de données, s'en trouvent enrichies.

L'herméneutique des bases de données permet d'améliorer la gestion de vastes systèmes d'information au sein desquels l'homogénéité des représentations formelles se heurte à l'hétérogénéité des catégories empiriques.