Extraction d'un corpus

Ce chapitre fait l'inventaire des différentes méthodes permettant d'extraire un corpus de documents correspondant à une requête.

Tous ces outils proposent de télécharger un corpus de fichiers de textes intégraux (PDF, TEI, TXT, etc.), de fichiers de métadonnées (Mods, XML) ou de fichiers d’enrichissement (TEI) depuis la base ISTEX à partir d’une requête. Pour plus de détails sur les différents formats et types de fichiers, n'hésitez pas à consulter la rubrique correspondante en annexe.

Pour appréhender les usages avancés de l'API, vous pouvez aussi consulter le tutoriel prévu à cet effet.

results matching ""

    No results matching ""