Industries de la langue

Jean-Claude LEJOSNE

Introduction

On notera tout d'abord que l'expression industries de la langue, posée au début des années 80, est de plus en plus souvent remplacée par des formes probablement ressenties comme plus politiquement correctes et plus gratifiantes pour les promoteurs des activités professionnelles concernées, à savoir génie linguistique ou encore ingénierie linguistique. On trouvera aussi (cf. titre ci-dessous) des variantes transformant l'épithète linguistique en relation objective des langues. Ces expressions rappellent leurs équivalents dans d'autres langues de grande diffusion scientifique, en particulier Linguistic engineering de l'anglais. L'allemand et le castillan insistent plus nettement sur la dimension technologique avec leurs expressions Sprachtechnologie et tecnología lingüistíca.

Inversement, ces expressions ont pratiquement banni l'ancienne dénomination de traitement automatique des langues naturelles et l'acronyme correspondant T.A.L.N. Ceci est également vrai de l'équivalent anglais : automatic processing of natural languages.

En tout cas, l'expression ancienne, tout comme les nouvelles, sont des concepts génériques et renvoient à des domaines multiples et composites, comme on le verra dans l'inventaire fait en première partie. Stricto sensu, l'activité traduisante ne représente qu'un aspect de cette large gamme de domaines. En fait, comme on le verra ensuite, les activités relevant du génie linguistique sont omniprésentes et, par rapport à l'opération du/de la traducteur/rice, on les retrouvera à presque tous les niveaux, que ce soit en amont ou en aval, et qu'elles soient prises en charge par les traducteur/rices eux/elles-mêmes, ou par d'autres tâcherons et/ou experts, ou encore parce que l'activité de traduction sera plus ou moins clairement intégrée dans une opération plus complexe (par exemple, le résumé automatique fait directement en français, à partir de textes en anglais, ou inversement).

À partir de cet inventaire, on pourra tenter de donner des éléments de réponse aux questions soumises à la réflexion des participants au colloque, tout en s'appuyant sur l'expérience que l'on peut avoir de la façon dont le génie linguistique se croise avec les compétences que l'on veut apporter à, ou que l'on exigera, des traducteurs/rices.


1.  Rappel : domaines du génie linguistique
     par rapport à l'activité traduisante
La liste suivante est compilée à partir de l'ouvrage le plus récent et le plus générique qui ait été publié en langue française sur le domaine à ce jour, à savoir J. M. PIERREL, Ingénierie des Langues, Paris : Hermès, 2000.
Dans cette liste, les chapitres et sous chapitres n'ayant pas de dimension directement multilingue et n'impliquant pas d'opération de transfert ne seront pas développés en sous-rubriques. Inversement, on soulignera (au sens propre du terme) l'aspect du domaine qui fera appel à des compétences associées à celle du/de la traducteur/rice, c'est-à-dire pouvant opérer en monolingue. On remarquera d'ailleurs que cette idée d'activité langagière, sans sortir du cadre d'un seul et même code linguistique, n'est guère concevable. Même dans le cas des langues enfermées plus ou moins officiellement dans le carcan du purisme, le recours à la comparaison avec d'autres codes s'imposera. Par ailleurs, l'ingénieur des langues, s'il ne doit travailler que sur un seul code, pourra difficilement méconnaître l'information apportée par l'analyse diachronique.

"""""""""""""""""

1.  Outils et formalismes pour le traitement de la langue
     1.1. Mots et niveau lexical
     1.2. Grammaires et analyseurs syntaxiques
     1.3. Sens et sémantique

2.  Création et gestion de ressources linguistiques
     2.1. Annotation automatique de Corpus

           dont : annotation multilingue
     2.2. Étiquetage morpho-syntaxique
     2.3. Alignement de corpus multilingues

            qui nous intéresse comme étape préparatoire aux opérations faites dans le cadre des
            procédures de traduction appelées mémoires de traduction.
     2.4. Codage et normalisation de ressources textuelles
     2.5. Outils d'accès à des ressources linguistiques

            dont : plate-forme éditoriale pour une base terminologique multilingue

3.  Domaines applicatifs
     3.1. Construction de ressources terminologiques
     3.2. Indexation et recherche d'information textuelle
     3.3. Résumé automatique et filtrage sémantique de textes
     3.4. Traduction assistée par ordinateur

            Nous avons là un des domaines, voire le domaine par excellence où s'opère, au moins
            dans l'esprit du grand public, le croisement entre génie linguistique, dans sa dimension
            de technologie, et l'activité traduisante. En conséquence, nous donnerons le détail des
            activités répertoriées pour ce domaine par l'auteur de ce chapitre (Christian BOITET).

    1. État de l'art vu par les utilisateurs

    1.1. Variété des situations traductionnelles
    1.2. Automatisations possibles des différentes étapes
    1.3. Évaluations possibles

    2. Technologie de la TAO actuelle

    2.1. Caractéristiques essentielles et exemples de systèmes
    2.2. Architectures possibles
    2.3. Sources de connaissances
    2.4. Structures de données pour représentations intermédiaires
    2.5. Approches algorithmiques
    2.6. Langages d'implémentation des linguiciels

    3. Paradigmes étudiés et projets en cours

    3.1. Paradigmes étudiés
    3.2. Projets en cours

     3.5. Compréhension automatique de textes
     3.6. Génération automatique de textes
     3.7. Dialogue homme - machine

"""""""""""""""""

2.  Suggestions de réponse aux questions
     soumises et pistes de réflexion

On fera brièvement référence à l'expérience acquise par notre unité d'enseignement et de recherche (Université de Metz) qui a mis en place, il y a maintenant 14 ans (1988), un Diplôme d'Etudes Supérieures Spécialisées (D.E.S.S., correspondant à une formation professionnelle suivie en général en 5e année d'études universitaires dans le système académique français) dont le nom est resté celui en usage à l'époque (Industries de la Langue) mais auquel a été adjoint en 1998 une précision importante quant à son orientation (Outils et Techniques modernes de la Traduction). La formation était évidemment ouverte aux personnes déjà engagées dans la vie professionnelle et venant chercher un complément de formation ou une ouverture nouvelle, dans le cadre d'un contrat de formation continue. Il faut préciser que, dans la pratique et dans le cas présent, les inscrits en formation continue n'ont jamais dépassé le seuil des 5 % (une personne, de temps en temps, sur des promotions de 16 personnes). Il serait intéressant d'enquêter sur les raisons de ce manque d'intérêt :

  • Problème de financement ?
  • Sentiment que l'auto-formation continue supplée avantageusement et à moindre frais une formation continue encadrée ?
  • Inadéquation de la formation (en dépit du degré de satisfaction élevé exprimé dans les enquêtes d'évaluation) ?
  • Toutes ces raisons (et d'autres) à la fois ?

2.1. Question "profil de compétences"

C'est sans conteste l'évolution spectaculaire dans le domaine des techniques et, plus encore, des capacités de traitement automatisé (lire informatique) qui a conduit la commission pédagogique à veiller à ce que les programmes et formateur/trices soient à la hauteur des techniques nouvelles.

Contrastant fortement avec cette évolution, la plupart des domaines de la recherche linguistique donnent l'impression de "stagner", ce qui peut engendrer des sentiments de frustration et d'impuissance marqués, à cause du décalage grandissant qui s'installe entre les capacités de calcul et la difficulté à fournir aux logiciens et aux concepteurs de progiciels, des données formalisables. Ceci est particulier vrai de tout ce qui relève de la logique floue, en particulier la sémantique (problèmes en relation avec le calcul du sens, la dénotation) et la pragmatique associée à la dimension culturelle et à toutes les questions relevant de ce qu'il est convenu d'appeler la localisation.

On peut se demander si la construction annoncée d'un ordinateur capable de simuler les capacités et rapidités de calcul du cerveau humain, d'ici la fin de la décennie, permettra de résoudre le problème. Ce n'est pas certain : il est probable que la description, et encore plus la formalisation, de la "logique" des opérations langagières restera en retard par rapport à la compréhension. Peut-on imaginer, par exemple, que la grammaire donnée à la machine lui permettra de décoder les antiphrases ("je ne te dis pas") comme des antiphrases ?

Dans l'état actuel des choses, la formation comporte trois grands ensembles de modules :

  • logique, automates et informatique (en coopération avec le LORIA - I pour Informatique et A pour Automatique - de Nancy II) ;
  • théorie du traitement automatique des langues et traductologie (partie proprement messine) :
    • niveau lexical et sémantique,
    • niveau morpho-syntaxique ;
  • outils et applications (assuré en quasi-totalité par l'Institut für Angewandte
    Informationsforschung
    - Université de Sarrebruck) :
    • TA et TAO,
    • techniques documentaires en multilingue,
    • E.A.O.

Quant au placement sur le marché, on peut grosso modo diviser les promotions en trois tiers :

  • Changement d'orientation - plus ou moins marqué (de "polyvalent" pour les "problèmes en rapport avec la communication multilingue" dans l'entreprise à "employé" dans un service exigeant des connaissances en langue) - sachant que le marché luxembourgeois absorbe un grand nombre de diplômé(e)s.
  • Organisations et entreprises de R & D (plus à étranger qu'en France), ce segment ayant tendance à diminuer par rapport aux deux autres, que ce soit dans le secteur public ou privé - effet de la crise économique et de la redéfinition des priorités ?
  • Organisations et entreprises consommateurs, avec un partage dans des proportions variables entre :
    • la simple application de produits existants, avec des adaptations aux besoins de l'entreprise ou du reliquat à traiter (ex. Trados),
    • une véritable activité de développement et d'enrichissement de ces programmes ou outils.

Devant cette variété des directions prises par la suite, et sachant que seulement un tiers environ des diplômé(e)s voient leur stage transformé en emploi et leur projet de stage prolongé par la tâche dans laquelle l'entreprise l'/les engage, il est clair que la formation doit garder une certaine polyvalence.


2.2. Question "spécialités" et "langues de spécialité"
A vrai dire, du point de vue du génie linguistique, la question ne semble pas pertinente. Ainsi, la filière "L.E.A" se décline bien en "traduction spécialisée" et non pas en apprentissage de la langue de spécialité, encore moins des langues de spécialité. Ceci, probablement pour plusieurs raisons :
  • la multiplicité des domaines de spécialité (subject-fields) ;
  • le mode d'acquisition des compétences dans telle ou telle spécialité, sachant qu'une large part de celle-ci passera par la pratique, plus par une formation "maison" qu'une formation théorique, tout au moins au delà des fondements ;
  • la question des jargons, en faisant la distinction entre :
    • les jargons par rapport au domaine, sachant que la question ne se pose pas seulement dans les sciences interprétatives et sciences dites "molles" (ex. juridique), mais aussi dans les sciences ou techniques plus "dures" (ex. : nomenclature dans les domaines appelant des expertises, médecine, assurances),
    • les jargons par rapport à une même koinè; par exemple, en langue (ou langage ?) juridique, les variantes du même code, (français juridique des différents pays francophones, allemand juridique des pays germanophones, etc.),
    • le jargon intra-entreprise, appelé vulgairement le "jargon maison"; un phénomène dont l'ampleur est souvent inversement proportionnelle à taille de la société, les petites entreprises cherchant plus résolument à labelliser un procédé ou un produit spécifique ;
  • en fait, il est exceptionnel que les textes s'en tiennent vraiment à une spécialité unique; inversement, la "spécialité" est souvent tellement large qu'elle n'en est plus une (le genre texte technique…)

Les conséquences sont bien connues, pour les traducteurs, qu'ils travaillent avec ou sans recours aux technologies d'aide à la traduction. Dans tous les cas, il reste impératif de faire valider la terminologie avant d'engager le travail de traduction proprement dit, en supposant qu'on a su (ou pu) identifier l'interlocuteur compétent et disponible…

En bref, et surtout pour les traducteurs indépendants, l'objectif essentiel restera d'enseigner des réflexes méthodologiques pour aborder le problème : savoir où et comment trouver l'information ou les données manquantes. A ce propos, on voit que de nombreux cursus et/ou examens de fin d'études, en particulier chez nos voisins, comportent une épreuve de documentation / techniques documentaires (en al. Hilfsmittelkunde : littéralement science des moyens d'aide).


2.3. Question "spécialisations"
  • L'environnement
    Devant l'explosion des instruments de développement et la multiplication des langages pour ce faire, il conviendra de chercher à s'y retrouver dans les évaluations et les controverses sur leur pertinence et leur puissance. En tout cas, les traducteurs, tout comme les ingénieurs langagiers, devront chercher à satisfaire à deux obligations, la seconde étant corollaire de la première :
    • la nécessité de maîtriser des outils de plus en plus variés et (souvent) performants, en particulier dans le domaine du formatage , avec respect absolu des formats de l'original, sauf adaptations imposées par la localisation, et dans celui de la conversion et des échanges de fichiers ;
    • l'exigence de formation continue, selon des modalités qui restent à définir et à mettre en place. L'offre structurée de formation continue pour les traducteurs fait encore cruellement défaut …

  • Le danger de la "super-spécialisation"
    La spécialisation - celle, par exemple, du traducteur travaillant sur l'énorme documentation produite par une grande multinationale, laquelle sera justement traitée avec un grand déploiement d'outils informatiques - peut avoir des effets pervers. En particulier par la mise en place d'automatismes préjudiciables, qui entraînent à leur tour une mise en sommeil de la curiosité et de l'ouverture d'esprit. Or ces qualités sont et doivent rester primordiales chez le/la traducteur/rice.
    Ceci est également valable pour la dimension culturelle. La spécialisation dans un couple de pays source/cible peut également avoir des effets de sclérose désastreux.


3. Quelques conclusions

Pour toutes les questions qui touchent à la dimension non-langagière des questions posées, il est évident que les problèmes concernant les ingénieurs langagiers et les traducteur/rices ne sont pas différents. On pourra donc faire les mêmes remarques pour les uns et les autres quant il s'agira de réfléchir et proposer des solutions à propos de questions aussi diverses que :

  • les programmes de formation initiale ou continue,
  • la nécessité d'introduire des modules de formation à la gestion et à la communication, aussi sur l'organisation des réseaux de communication pour plus de mises en commun des ressources et de création des corpus formatés selon des systèmes compatibles, ce qui prend un relief particulier avec le développement des systèmes de mémoires de traduction,
  • l'organisation de la profession, avec une réflexion sur la déontologie et la statut juridique des produits intellectuels.

C'est dans le domaine de la performance que le concepteur en génie linguistique peut apporter une contribution précieuse au/à la traducteur/rice.

"Performance" sera compris ici comme résultat de l'application d'un ensemble d'outils appliqués dans les situations d'activité traduisante.

Il s'agira, d'une part, d'instruments au sens habituel du terme, justifiant l'adjectif "assisté" dans des expressions du type "… assisté par ordinateur". On pensera en particulier à :

  • programmes pour la post-édition, sur la base d'études linguistiques avancées sur la grammaire des fautes et de l'introduction de macros et d'une interface conviviale pour aider à cette activité réputée fastidieuse,
  • ensembles de sous-programmes, généralement faits de macros (language-specific) pour aider à la rédaction, en se fondant sur diverses procédures dérivées du speedwriting, en s'appuyant d'ailleurs sur des techniques "exotiques" (principes de génération des langues à idéogrammes) ou "jeunes" (SMS, clavardage).

Mais il est essentiel de comprendre, d'autre part, que ces outils ne sont pas uniquement des instruments objectifs, concrets, matérialisables. On fait ici référence au développement des "techniques" en rapport avec l'évaluation et donc le relèvement du niveau de qualité constaté. Comme le rappelle très bien le plus grand consommateur actuel de traductions au monde - l'Union européenne - le/la traducteur/rice est appelé(e) à devenir de plus en plus un réviseur intervenant en aval d'une procédure de traduction plus ou moins déshumanisée. Dans ce cadre, la question de l'analyse des fautes prend un relief particulier.

Or ces fautes sont commises en respectant, comme toute production langagière, une certaine grammaire, propre à l'auteur ou une communauté d'auteurs … ou encore au programme de traduction assistée. C'est de nouveau dans ce domaine à la croisée entre sémantique et pragmatique d'une part, informatique d'autre part, que se posent les défis qui seront probablement les plus difficiles à relever.