> Bonjour,
>  
> Offre de postdoc à France Telecom Orange Labs dans le domaine de la recherche 
> d'information multilingue et cross-lingue (CLIR).
>  
> Lieu : France Telecom Orange Labs à Lannion (Bretagne).
> Date : dès que possible.
> Durée : 12 mois.
>  
> Sujet du postdoc :
> Approches hybrides de traitement des requêtes pour la recherche d'information 
> cross-lingue
>  
> Contexte de recherche :
> Certains choix techniques ou méthodologiques en recherche d'information 
> multilingue n'ont pas encore atteint un niveau de consensus. Par exemple, il 
> n'est pas trivial d'opter pour la traduction des requêtes ou la traduction 
> des contenus. Toutefois, il nous semble d'ores et déjà acceptable que la 
> traduction des contenus est plus optimale lorsque la quantité d'informations 
> à indexer ainsi que le nombre de langues concernées ne sont pas très élevés. 
> Dans le cas contraire, la traduction préalable de tous les contenus indexés 
> dans toutes les langues peut poser de réels problèmes d'économie.  En effet, 
> une petite partie seulement des informations traduites pourrait être 
> réellement exploitée.
>  
> Activité du postdoc :
> Cette activité s'inscrit dans le cadre d'un projet de R&D dans le domaine de 
> la recherche d'information multimédia et multilingue. Il est proposé 
> d'explorer, mettre en oeuvre et évaluer une ou des méthodes hybrides pour le 
> traitement des requêtes en vue d'une recherche cross-lingue.
> Contrairement à une traduction brute de la requête, qui peut échouer compte 
> tenu de sa pauvreté syntaxique et contextuelle, ce travail consiste à 
> explorer différentes approches dont la combinaison permettrait d'effectuer 
> des pré-traitements ou des post-traitements moins systématiques et mieux 
> réfléchis sur les requêtes :
> - Identification dans le requête des composants invariants, traduisibles, 
> translitérables, etc.
> - Prise en compte de scores de confiance et post-édition de la traduction 
> automatique.
> - Exploitation de ressources linguistiques : Wikipédia, entités nommées, 
> lexiques multilingues, thésaurus, etc.
> - Utilisation de l'expansion de requêtes pour la compensation de la 
> couverture lexicale issue de la traduction.
> - Choix et usage de techniques appropriées de traduction pour les différents 
> composants de la requête.
> - Etc.
> 
> Profil recherché :
> - Doctorat en informatique ou en linguistique, ayant été soutenu de 
> préférence depuis moins d'un an.
> - Bonnes connaissances en TALN et des différentes approches en traduction 
> automatique.
> - Connaissances en recherche d'information et en CLIR.
> - Maîtrise de Linux, Python ou Java, langage de script (bash), C++ serait un 
> plus.
> - Langues : français et anglais (la connaissance d'autres langues serait la 
> bienvenue).
> - Motivation pour la R&D dans un milieu industriel.
> 
> Contact :
> Malek Boualem
> France Telecom Orange Labs
> Tél. 02 96 05 29 83
> Email. malek.boualem [ à ] orange-ftgroup.com
> 
> Merci de mettre comme objet du message : candidature au postdoc CLIR
> 
> ---------------------------
> Malek Boualem
> France Telecom Orange Labs
> Site de Lannion
> Tél. 02 96 05 29 83
> Mobile. 06 85 71 40 63
> malek.boua...@orange-ftgroup.com
> ---------------------------
_______________________________________________
Mt-list mailing list

Reply via email to