Le 8 juillet a vu se tenir le troisième atelier de « The European Language Resource Coordination » (ELRC) en Belgique, et c’est l’équipe LT3 Language and Translation Technology de l’Université de Gand qui était chargée de son organisation. ELRC est une initiative européenne visant à collecter des données linguistiques dans le but d’améliorer les technologies linguistiques et de traduction européennes. Les services publics y reçoivent d’ailleurs une attention toute particulière, car ils peuvent aussi être amenés à devoir faire appel aux systèmes européens de traduction automatique.
Nathalie De Sutter, managing partner chez Untranslate, a répondu présent au panel « Language data creation, management and sharing: existing practices and challenges » (« Création, gestion et partage des données linguistiques : pratiques et enjeux »). Elle y a partagé son expérience des données linguistiques. Conférencière dans diverses universités en Belgique, Nathalie est également consultante auprès de diverses institutions publiques, où elle travaille autour du partage d’ensembles de données utilisés notamment dans le développement d’applications NLP. Sa deuxième casquette de coordinatrice de la traduction chez Untranslate l’a en outre amenée à témoigner sur ce que l’utilisation des données linguistiques peut impliquer. Quelles en sont les conditions légales ? Comment convertir le format des fichiers originaux pour répondre aux normes de l’industrie et qu’ils puissent être importés dans les différents outils d’aide à la traduction ? Comment s’assurer que des données en constante évolution soient toujours maintenues à jour ? Et enfin : comment s’y retrouver dans la quantité gigantesque de ressources, d’outils et d’informations disponibles sur Internet ?
Le panel a ensuite été suivi d’une session interactive pour laisser l’occasion aux participants de poser leurs questions après les présentations fascinantes de Prof. Dr. Véronique Hoste, Prof. Dr. Lieve Macken, François Thunus et Dr. Tom Vanallemeersch.
Tout le monde a donc pu être remis au fait de l’état actuel de l’IA, de la traduction automatique neuronale et de la plateforme du CEF (le système de traduction automatique de la Commission européenne) !
Pour plus d’infos, rendez-vous sur https://lr-coordination.eu/belgium3