Sur quel(s) champ(s) faire son interrogation ?

Les champs interrogeables sont présentés dans la rubrique Accès aux données indexées de la documentation technique de l’API ISTEX.

Par défaut, sans mention de champ, la recherche est effectuée sur tout le document.

Mais, si on a un critère de recherche large, qui ne porte pas sur un champ particulier, il est préférable de commencer par cibler la recherche sur des champs tels que title, abstract, subject.value afin de ne pas générer trop de bruit.

En effet, si on lance une requête sur l’ensemble du document, sans précision de champ, les mots recherchés peuvent être retrouvés dans les métadonnées ou dans les références bibliographiques, et ramener des résultats moins pertinents.

Dans ce cas, il faut répéter la requête en fonction des différents champs choisis (pas de factorisation de champs possible).

Exemple : si l'on souhaite rechercher des documents contenant les mots « Arctic » (mais pas « Arctic » quand il est présent avec des mots commençant par « charr»), Subarctic et ses variantes à la fois dans le champ title et dans le champ abstract, il faut répéter la requête, même complexe, pour chacun des champs souhaités.

q=(title:(Arctic NOT (arctic AND /charr?/) OR Subarctic~1 OR Sub?arctic)) OR (abstract:(Arctic NOT (arctic AND /charr?/) OR Subarctic~1 OR Sub?arctic))

> >

Quelques champs particuliers

Langues

Le champ language permet d'interroger la langue d’un document.

L’interrogation nécessite d’utiliser des codes langues (généralement 3 lettres) issus de la liste normalisée ISO 639, et non le nom complet de la langue ou de la famille de langues.

  • Exemple : Recherche de documents en mohawk
  q=language:moh

Pour savoir quel code langue utiliser, vous pouvez consulter en annexe la liste des codes interrogeables dans Istex.

NB : La valeur « unknown » est présente lorsqu'aucun code langue ne renseigne ce champ. Le champ host.language contient quant à lui systématiquement la valeur « unknown » car il n'est actuellement pas renseigné.

Dates de publication

Le champ publicationDate permet de retrouver les documents publiés au cours d’une année particulière ou bien d’un intervalle de temps grâce à l’emploi de crochets ou d’accolades (voir à ce sujet le paragraphe « Intervalles » ci-dessous).

Quelques types de requêtes :

  • Recherche de documents postérieurs à 2015 : 2 solutions
  q=publicationDate:[2015 TO *]
  q=publicationDate:{2014 TO *]
  • Pour des statistiques concernant des publications sur plusieurs périodes consécutives, ne pas oublier d’exclure l’année frontière.

    ***Exemple** : année 1400 incluse dans une requête de documents du 14e siècle, mais exclue du 15e siècle*
    
    q=publicationDate:[1301 TO 1400]
    

    puis

    q=publicationDate:{1400 TO 1500]
    

    ou bien

    q=publicationDate:[1401 TO 1500]
    
  • Pour récupérer des documents sans date de publication :

  q=NOT publicationDate:[* TO *]
  • Pour rechercher des documents sans date de publication (champ publicationDate vide) mais qui comporteraient une date de copyright, en s’étant assuré au préalable que ce champ est renseigné (champ copyrightDate plein) :
  q=copyrightDate:[* TO *] NOT publicationDate:[* TO *]

results matching ""

    No results matching ""