Gestionnaire de données (F/H/X)


 

 

Offre

 

L’UCLouvain recherche un·e gestionnaire de données

Référence du poste : SF  37142
Publication interne et externe jusqu'au 12 janvier 2025 inclus.

 

Pour l'Institut Langage et Communication (ILC) du Secteur des Sciences Humaines (SSH)
Site principal :  Louvain-la-Neuve

Contrat de 40 à 60% (à convenir) pour une durée d'un an, avec possibilité de prolongation
Entrée en fonction : 1er février 2025 au plus tôt.

Contexte


La recherche actuelle fait un usage massif de données langagières écrites et orales, dans différentes langues (français, espagnol, anglais, néerlandais, etc.). Pour être exploitables, ces données langagières doivent être documentées (métadonnées), anonymisées (afin de respecter les règles sur les données personnelles), enrichies d’annotations (transcription, indexation, analyse thématique, etc.) et déposées dans des bases de données interrogeables en ligne.

 

C’est à ces différentes tâches que le ou la gestionnaire de données contribuera au sein de l’Institut Langage et Communication (ILC), et plus particulièrement du Pôle de recherche en Linguistique (PLIN) et de la plateforme CENTAL (Centre de Traitement Automatique du Langage).

Description du poste


En collaboration avec les chercheurs de PLIN/ILC, le ou la gestionnaire de données a pour fonctions de :
 

  • Superviser la chaine de traitement de constitution des corpus oraux et écrits (acquisition des données, documentation des métadonnées, transcriptions et annotations, versement dans les bases de données existantes, standardisation des formats utilisés)
  • Développer des outils de prétraitement et de traitement des données (segmentation, alignement du texte au son, alignement texte-texte, annotation automatique ou semi-automatique, etc.)
  • Assurer une veille technologique pour l’interopérabilité des données (documentées et traitées selon les standards internationaux, cf. Clarin, Ortolang, Olac, etc.) et l’amélioration de l’acquisition des données (automatic speech recognition, tokenisation, etc.)
  • Veiller au respect des conventions juridiques et éthiques liées à la protection des données (e.g. RGPD) et à la publication des données (e.g. Dataverse)
  • Représenter l’UCLouvain dans différents consortiums internationaux des données en linguistique.
  • Assurer le suivi des demandes d’information et de support effectuées auprès de notre centre K CLARIN sur les corpus d’apprenants

Qualifications et aptitudes requises

 

Le ou la candidat.e répondra aux qualifications suivantes :

  • titulaire d’un diplôme de Master en Sciences du langage, Traitement automatique du langage ou  Linguistique
  • compétences de programmation : Perl et/ou Python, bonne connaissance du XML
  • capacité à traiter des données langagières dans au moins 2 de ces langues (français, anglais, néerlandais, espagnol, allemand, etc.)
  • connaissance de l’anglais (B2) et en particulier de l’anglais académique (pour participer à des réunions internationales et contribuer aux publications de recherche)
  • sens du travail en équipe, capacité d’écoute et d’analyse des besoins, réactivité
  • des notions en statistiques linguistiques constituent un plus

Processus de sélection

Sur base du curriculum vitae et de la lettre de candidature, les candidat·e.s seront, le cas échéant, sélectionné·e.s pour un entretien qui se fera durant la deuxième quinzaine de janvier.


Les valeurs qui sous-tendent notre politique du personnel sont visibles en suivant ce lien :
Politique du personnel | UCLouvain

 

Les candidatures sont à soumettre en ligne uniquement, jusqu’au 12 janvier inclus.

 


 

Contact: Magali Paquot - magali.paquot@uclouvain.be