Le contenu de la requête

Lorsque l'utilisateur a bien identifié ses besoins par rapport au corpus qu'il veut constituer, il reste à définir les modalités d’interrogation qui permettront de capter les documents correspondant au contenu et au périmètre identifiés pour le corpus.

Exemples de contenus Modalité d’interrogation
Un domaine Recherche par catégories scientifiques (selon les classifications Science-Metrix, Web of Science, Scopus ou Pascal-Francis) sur les champs dédiés aux enrichissements ISTEX : categories.scienceMetrix, categories.wos, categories.scopus, categories.inist
Une thématique, un sujet Recherche par mots ou par expressions soit sur tous les champs, soit sur les champs title, abstract ou subject.value. Énumérer un maximum de synonymes et de variantes
Une date de publication Recherche par date sur le champ publicationDate ou copyrightDate
Un type de publication (monographie, revue, etc.) Recherche par type sur le champ host.genre
Un type de contenu (article, résumé, chapitre, etc.) Recherche par type sur le champ genre
Une langue de document Recherche par code langue sur le champ language
Une revue Soit recherche par le nom de la revue sur le champ host.title Soit recherche par l’ISSN sur le champ host.issn

La liste des différentes valeurs possibles dans les champs language, host.genre et genre est donnée dans le chapitre « Annexes ».

Le volume du corpus est apprécié en fonction des capacités de stockage, des capacités de traitement par l’outil auquel il est destiné et du degré de bruit et de silence toléré.

Facettes

Les facettes représentent une aide précieuse pour préciser le contenu du corpus.

En effet, leur utilisation sur le démonstrateur Istex ou sur l’API Istex peut permettre de connaître toutes les valeurs possibles d’un champ avant d’y opérer une sélection pour constituer le corpus attendu.

La syntaxe de la requête à utiliser sur l’API Istex est la suivante :

​ q=(...)&facet=champ&size=0

Exemple : si l’on souhaite connaître toutes les langues de publication des documents Istex de la revue « Astronomische Nachrichten », pour ne sélectionner par la suite que les langues intéressantes :

q=host.title:"Astronomische Nachrichten"&facet=language[*]&size=0

Pour afficher toutes les valeurs possibles dans un champ donné, on fait suivre le nom du champ, par exemple language, par [*]. Autrement, le serveur ne renvoie que les dix premières valeurs. Dans le cas d'un champ de type date, on ajoute [perYear] au nom du champ pour avoir l'ensemble des années.

L’argument facultatif size=0 fait que l'on n’affiche que le résultat de la distribution par facette et pas les informations relatives aux documents pertinents.

Facettes imbriquées

Les facettes imbriquées permettent de combiner plusieurs critères.

La syntaxe de la requête à utiliser sur l’API Istex est la suivante :

​ q=(...)&facet=champ1>champ2&size=0

Exemple : si l’on souhaite connaître toutes les langues de publication des documents Istex de la revue « Astronomische Nachrichten », avec pour chacune d’entre elles, le nombre de documents par année :

q=host.title:"Astronomische Nachrichten"&facet=language[*]>publicationDate[perYear]&size=0

results matching ""

    No results matching ""