> Bonjour, > > Offre de postdoc à France Telecom Orange Labs dans le domaine de la recherche > d'information multilingue et cross-lingue (CLIR). > > Lieu : France Telecom Orange Labs à Lannion (Bretagne). > Date : dès que possible. > Durée : 12 mois. > > Sujet du postdoc : > Approches hybrides de traitement des requêtes pour la recherche d'information > cross-lingue > > Contexte de recherche : > Certains choix techniques ou méthodologiques en recherche d'information > multilingue n'ont pas encore atteint un niveau de consensus. Par exemple, il > n'est pas trivial d'opter pour la traduction des requêtes ou la traduction > des contenus. Toutefois, il nous semble d'ores et déjà acceptable que la > traduction des contenus est plus optimale lorsque la quantité d'informations > à indexer ainsi que le nombre de langues concernées ne sont pas très élevés. > Dans le cas contraire, la traduction préalable de tous les contenus indexés > dans toutes les langues peut poser de réels problèmes d'économie. En effet, > une petite partie seulement des informations traduites pourrait être > réellement exploitée. > > Activité du postdoc : > Cette activité s'inscrit dans le cadre d'un projet de R&D dans le domaine de > la recherche d'information multimédia et multilingue. Il est proposé > d'explorer, mettre en oeuvre et évaluer une ou des méthodes hybrides pour le > traitement des requêtes en vue d'une recherche cross-lingue. > Contrairement à une traduction brute de la requête, qui peut échouer compte > tenu de sa pauvreté syntaxique et contextuelle, ce travail consiste à > explorer différentes approches dont la combinaison permettrait d'effectuer > des pré-traitements ou des post-traitements moins systématiques et mieux > réfléchis sur les requêtes : > - Identification dans le requête des composants invariants, traduisibles, > translitérables, etc. > - Prise en compte de scores de confiance et post-édition de la traduction > automatique. > - Exploitation de ressources linguistiques : Wikipédia, entités nommées, > lexiques multilingues, thésaurus, etc. > - Utilisation de l'expansion de requêtes pour la compensation de la > couverture lexicale issue de la traduction. > - Choix et usage de techniques appropriées de traduction pour les différents > composants de la requête. > - Etc. > > Profil recherché : > - Doctorat en informatique ou en linguistique, ayant été soutenu de > préférence depuis moins d'un an. > - Bonnes connaissances en TALN et des différentes approches en traduction > automatique. > - Connaissances en recherche d'information et en CLIR. > - Maîtrise de Linux, Python ou Java, langage de script (bash), C++ serait un > plus. > - Langues : français et anglais (la connaissance d'autres langues serait la > bienvenue). > - Motivation pour la R&D dans un milieu industriel. > > Contact : > Malek Boualem > France Telecom Orange Labs > Tél. 02 96 05 29 83 > Email. malek.boualem [ à ] orange-ftgroup.com > > Merci de mettre comme objet du message : candidature au postdoc CLIR > > --------------------------- > Malek Boualem > France Telecom Orange Labs > Site de Lannion > Tél. 02 96 05 29 83 > Mobile. 06 85 71 40 63 > malek.boua...@orange-ftgroup.com > ---------------------------
_______________________________________________ Mt-list mailing list