Partenaires









CARTEC est un projet de recherche soutenu et financé par l'ANR


Projet Cartec - Captation et indexation temporelle des corpus


CARTEC est un projet de recherche industriel dont l’objet est l’analyse de la variation temporelle des ensembles documentaires hypermédia qui évoluent de façon anarchique afin de les transformer en corpus, c’est-à-dire en une ressource construite et exploitable.

Cette transformation pose trois problèmes majeurs qui constituent les trois sous-projets d’innovation autour desquels le projet est architecturé :

  1. la captation de l’information dans un ensemble documentaire non maîtrisé dont l’évolution est inconnue et variable selon les documents ;
  2. l’indexation de l’information, afin de permettre la recherche et la navigation dans le corpus, mais aussi afin d’analyser son évolution ;
  3. le stockage, le codage et la représentation temporelle des résultats d’une recherche.

Cartec place l’ensemble de ses travaux de recherche et d’innovation dans le cadre concret du suivi et de l’indexation temporelle du Web, ce contexte applicatif permettant de se focaliser sur des débouchés industriels et commerciaux de type veille d’information à grande échelle. Cartec dispose par d’un cadre structurant validera l’ensemble des travaux sur le cas concret de l’archivage du Web tel qu’il relève de la mission de l’INA dans le cadre du dépôt légal.