Expert en : Documents structurés
MARCOUX, Yves
Professeur honoraire
- Sémantique intertextuelle
- Design de la communication
- Théorie du document
- Documents structurés
- Langages de balisage
- Balisage avec chevauchement
Depuis mon arrivée dans le monde académique, je m'intéresse aux documents structurés (XML et consorts) comme mode de représentation de l'information. Ces formalismes permettent – et exigent – un maillage unique de la langue naturelle (les « contenus ») et d'éléments lexicaux purement formels (le « balisage ») qui est étranger aux autres modèles courants de représentation de l'information et des connaissances. Je suis fasciné par cette hybridité, qui permet de déplacer presque en continu la frontière contenu-contenant pour la mouler à l'information à gérer avec autant de précision que l'on veut.
Mes recherches portent principalement sur deux aspects des documents structurés :
- Les langages de balisage eux-mêmes, en particulier leur puissance expressive, c'est-à-dire l'ensemble des structures informationnelles qu'ils peuvent représenter. Je m'intéresse notamment à la comparaison de langages admettant des structures avec chevauchement ("overlapping structures"), impossibles à représenter en XML. Un des projets auxquels je collabore à ce chapitre est le MLCD Overlap Corpus, réalisé conjointement avec le Professeur Claus Huitfeldt, de l'Université de Bergen (Norvège) et Michael Sperberg-McQueen (co-créateur de la Text Encoding Initiative et co-éditeur de la spécification XML du W3C), de Black Mesa Technologies (États-Unis).
- La mise en œuvre des technologies liées aux documents structurés, en particulier les méthodologies de mise sur pied de systèmes d'information basés sur ces technologies. À ce chapitre, je développe depuis 2005, avec le Professeur Élias Rizkallah, de l'UQAM, un cadre sémantique pour les documents structurés basé sur langue naturelle : la sémantique intertextuelle (SI). La SI, qui s'inscrit dans le courant des approches sémiotiques au design, est un outil qui permet à toutes les parties prenantes collaborant à la mise sur pied – et même à l'opération – d'un système, de communiquer efficacement sur le plan sémantique, autrement dit de « bien se comprendre ». Le but visé est l'adéquation entre le système mis sur pied et les besoins et caractéristiques de la collectivité d'utilisateurs visée; autrement dit l'utilisabilité du système et, partant, la qualité de l'expérience utilisateur. Actuellement, le principal terrain d'expérimentation de la SI est le projet de Cyberjustice du Professeur Karim Benyekhlef du Centre de recherche en droit public et de la Faculté de droit de l'Université de Montréal.
Bien que développée dans le contexte des documents structurés, la sémantique intertextuelle (SI) est en principe applicable à l'élaboration de n'importe quel artéfact communicationnel (production sémiotique). Je réfléchis donc aussi à l'applicabilité de la SI et à son apport potentiel dans d'autres domaines, comme par exemple les bases de données relationnelles, les vocabulaires contrôlés et les interfaces-utilisateur.