Par ÉLÉONORA ALBANO*
Prise en otage par le capitalisme financier, la société de la connaissance n'offre pas de conditions de travail sûres même à ceux qui en font partie
Nous sommes plongés dans un modèle de société qui nous a progressivement éloigné de notre humanité. Nos vies personnelles et professionnelles dépendent de multiples systèmes numériques, avec lesquels nous finissons souvent par nous laisser emporter. Il s'avère qu'une coexistence constructive avec cet état de choses nécessite une certaine préparation pour réagir à la passivité, qui tend à être plus viable pour ceux qui ont accès aux formes de connaissance qui légitiment l'inclusion dans cette même société.
Au passage, force est de constater que les progrès de la science numérique, tout en favorisant les inclus, approfondissent l'exclusion, en soutenant la croissance du système financier, provoquant la rétraction du secteur productif et le chômage de masse conséquent. C'est un phénomène mondial, avec des spécificités régionales nombreuses et distinctes.
C'est pourquoi il est de la responsabilité des scientifiques de réagir à la passivité, en réfléchissant à la résistance que leurs travaux peuvent offrir à la déshumanisation de la société globale. Il nous appartient également de partager ces connaissances de la manière la plus large et la plus transparente possible.
Pour les spécialistes des langues – artistes, critiques, philosophes, scientifiques, etc. – cette tâche ne devrait pas être difficile. Nous savons tous que la possession du langage naturel est ce qui nous humanise. Compte tenu des difficultés cognitives et émotionnelles causées par la privation de langage chez les enfants éloignés de l'interaction humaine en raison d'abus, d'abandon ou de non-respect de la différence.
Cependant, les experts eux-mêmes sont perplexes face à la manipulation des discours favorisée par les nouvelles technologies numériques. Nous avons tendance à les voir comme une vague dévastatrice dont la confrontation nous transcende. En fait, nous ne pouvons pas faire plus d'une journée de travail comme une fourmi. Une façon de le faire est d'essayer d'exposer nos actes de résistance dans des termes accessibles à un public averti, mais pas nécessairement académique.
Ci-dessous, donc, un bref résumé de mes cinquante années d'étude académique du langage, centré sur les choix qui peuvent aujourd'hui être vus comme une résistance à l'avancée de l'anti-humanisme - déjà visible dans les années 1960. à propos de sociétés dystopiques telles que Un nouveau monde admirable, par Aldous Huxley, et 1984, de George Orwell, étaient en circulation.
Technologie de la parole et société du savoir
Dans cette même décennie, la métaphore informatique avait définitivement envahi les études du langage et de l'esprit. Les auteurs des lignées les plus diverses ont adopté un vocabulaire comprenant des termes tels que entrée, sortie, module, processeur, etc.
Maintenant, pour un passionné de philosophie comme moi, cela est vite devenu un sujet de réflexion. En fait, pendant mes études de premier cycle et de cycles supérieurs, il était fascinant d'observer l'émergence de technologies qui imitent la production humaine de mon objet d'étude – les sons de la parole. Il était à la fois passionnant et surprenant que la métaphore de la machine, auparavant appliquée uniquement au corps, ait commencé à se répandre dans différents aspects de l'esprit.
Mais ce n'est que bien après mon doctorat que j'ai décidé de contribuer à la diffusion de ce courant scientifique au Brésil, en construisant, avec des collègues de la Faculté de génie électrique et informatique de l'Unicamp, le premier système concaténatif de conversion texte-parole. pour le portugais brésilien, le Aiuruetê – perroquet brésilien.
Après avoir surmonté le manque de financement de la recherche dans les années 1980, nous avons proposé un projet commun aux organismes de financement dans le domaine de la synthèse et de la reconnaissance vocale. L'objectif était de contribuer à réduire le risque de marginalisation du pays dans la société de la connaissance.
Dans les années 1990, cette société fondée sur les technologies de l'information et de la communication s'est rapidement développée à travers le monde. Ici, cependant, il commence à peine à stimuler la recherche en communication numérique écrite. Il nous a semblé urgent de créer les bases nécessaires pour produire également des recherches en communication numérique parlée.
Au départ, il s'agissait pour nous d'un acte de résistance aux multinationales des télécommunications, qui s'intéressaient déjà à notre langue, en raison de sa masse de locuteurs, considérés comme des consommateurs potentiels. Quelle ne fut pas notre surprise et notre indignation lorsque nous avons dû lutter contre une entreprise brésilienne, que nous avions rejointe non par choix, mais en raison de l'existence préalable d'un accord avec Unicamp.
A cette époque, Unicamp ne réglementait toujours pas la propriété intellectuelle. Les entreprises associées se taillent toujours la part du lion. Le résultat a été que nos « collaborateurs » sur le marché se sont appropriés le premier prototype de notre système et, après quelques modifications, l'ont vendu à une entreprise étrangère, sans aucune considération pour l'Université.
Aiuruetê, créée après la rupture avec l'entreprise, était une tentative d'occuper le terrain et de faire pression sur Unicamp pour sauvegarder sa propriété intellectuelle. Le projet visait non seulement à construire un système de synthèse, mais aussi à former une équipe de jeunes spécialistes de la parole, c'est-à-dire des professionnels formés en linguistique et en ingénierie des télécommunications. Grâce au financement de la Fapesp, le système était à la pointe de la technologie à l'époque et notre effort a réussi à multiplier les formateurs dans la région, qui se sont répandus dans tout le pays.
Heureusement et malheureusement, nous ne sommes pas restés longtemps sur le terrain. Le côté heureux est que nous avons commencé à faire un travail plus créatif et stimulant. Le côté malheureux est que l'intérêt pour l'orthophonie que nous avons suscité dans le pays a servi à alimenter un marché avec lequel nous n'avions aucune affinité.
La raison en est que la production de systèmes de synthèse et de reconnaissance de la parole est devenue de plus en plus automatique et dépendante de l'apprentissage automatique. Il ne s'agissait plus de travailler avec des règles, mais avec des modèles statistiques que la machine découvrait à travers des entraînements répétitifs dans de grandes bases de données, segmentées et étiquetées par les humains – qui, plus tard, perdirent leur utilité.
Derrière ces avancées technologiques se cachent de nouvelles versions d'outils déjà utilisés de manière artisanale par des systèmes pionniers dans le domaine. Par exemple, Aiuruetê a utilisé un réseau de neurones pour apprendre des modèles prosodiques à partir d'une petite base de données segmentée et étiquetée manuellement. Cette structure prosodique est automatiquement attribuée au texte d'entrée, permettant à un autre module du système d'ajuster la hauteur, la durée et le volume des extraits de parole concaténés. A l'époque, ce procédé atteignait, sinon un grand naturel, du moins une intelligibilité compatible avec les systèmes contemporains du reste du monde.
Il convient de noter que les premiers systèmes de technologie de la parole étaient tous faits à la main, c'est-à-dire qu'ils dépendaient de règles et de critères basés sur des connaissances linguistiques et/ou techniques. En revanche, ceux qui habitent maintenant nos voitures, ordinateurs ou téléphones portables ont été fabriqués de manière beaucoup plus automatique, à l'aide de divers types d'apprentissage automatique. Ils sont le résultat de projets financés par des géants comme Apple, Google, Amazon, Microsoft et certaines des plus grandes banques du monde.
Les systèmes d'apprentissage automatique détectent des modèles statistiques dans d'énormes bases de données, généralement compilées à partir de composants fournis par des sociétés tierces spécialisées. Dans la plupart d'entre eux, une main-d'œuvre hautement qualifiée, chargée de la segmentation, de la classification et de l'organisation des données, occupe des emplois très bien rémunérés, mais précaires, car temporaires. Soit dit en passant, tous ont une formation scientifique, c'est-à-dire qu'ils sont linguistes, psychologues, ingénieurs en informatique, ingénieurs en télécommunications, etc.
Ce simple exemple suffit à démontrer que la société de la connaissance n'offre pas de conditions de travail sûres, même à ceux qui en font partie. C'est parce qu'il a été kidnappé, il y a quelque temps, par le capitalisme financier, qui attire une partie des bénéfices tirés de ses produits pour des investissements sur les marchés spéculatifs.
Ainsi, le pillage est partout, y compris dans les bureaux et les laboratoires. À ce stade, les scientifiques sont confrontés à la mission de s'organiser pour protéger non seulement les fruits de leur travail, mais aussi l'État-providence, sans lequel tout travailleur est voué à fonctionner dans un engrenage impersonnel et inhumain. .
Utilisations humanistes des systèmes dynamiques
La lueur d'espoir pour certains scientifiques de mon groupe d'âge est que nous savons qu'aucune de ces avancées n'était destinée à servir le marché, mais à résoudre des problèmes fondamentaux de recherche fondamentale. Cela indique qu'ils sont conceptuellement très puissants et peuvent continuer à semer des progrès socialement constructifs dans d'autres domaines de la connaissance.
L'appropriation indue du travail que nous avons effectué en faveur de la souveraineté du développement scientifique et technologique national a coûté à mon partenaire ingénieur une retraite anticipée et, à moi, de nombreuses attaques de collègues incompréhensibles et/ou opportunistes – auxquelles j'ai résisté du mieux que j'ai pu.
Mais cela ne signifiait pas qu'il pouvait nier l'engagement. Malgré tout, cela m'avait apporté une expérience transdisciplinaire, c'est-à-dire un transit à la frontière entre les sciences humaines et les sciences exactes/technologiques. Dans cet effort, j'ai fini par avoir besoin d'étudier les fondements de certains outils qui avaient joué un rôle crucial dans l'avènement de la société du savoir.
Certains d'entre eux sont directement liés à mes derniers actes de résistance, visant à internationaliser mon laboratoire et mon groupe de recherche. J'ai toujours compris la science comme un patrimoine de l'humanité, dont l'appropriation locale doit être sensible, à la fois, à l'état de l'art et aux injonctions socio-politiques globales et régionales. À mon avis, savoir ce que le monde considère comme avant-gardiste est une condition condition sine qua non pour avancer, innover ou révolutionner n'importe où dans le monde.
Pour illustrer cette position, un exemple suffira. L'un des concepts utilisés dans la technologie numérique qui a des implications directes pour l'étude des sons de la parole est le système dynamique. Les systèmes dynamiques sont des objets mathématiques utilisés pour modéliser des phénomènes physiques dont la description instantanée évolue dans le temps. Bien qu'ils trouvent leur origine dans la physique, ils sont applicables à de nombreux autres domaines, à savoir : l'économie, la finance, l'écologie, les sciences sociales, la médecine diagnostique, etc.
L'idée de base est que tout système dynamique possède un état, c'est-à-dire une description instantanée, suffisante pour prédire ses états futurs sans recourir aux états antérieurs. Ainsi, par exemple, un oscillateur est un système dynamique, car il décrit un mouvement dans lequel tout état, une fois décrit, permet de prédire les suivants. De plus, l'évolution temporelle de ces états peut être comprise comme une séquence ou trajectoire continue à travers un espace constitué par les états possibles du système, appelé espace d'états.
Ces deux propriétés permettent de modéliser des systèmes dynamiques à l'aide d'un outil mathématique bien connu : les équations différentielles. Ces systèmes ont donc un fort pouvoir prédictif – en avant et en arrière dans le temps. Pour les utiliser comme diagnostic, il suffit d'inverser le sens temporel.
Il faut noter que, pour un humaniste, travailler avec la notion de système dynamique ne signifie pas nécessairement le modéliser avec des équations différentielles. Il est tout à fait possible de confier cette tâche à un partenaire transdisciplinaire – mathématicien, ingénieur, informaticien, etc.
En sciences humaines, l'essentiel est de s'intéresser à l'évolution temporelle de l'objet d'étude et de pouvoir utiliser le terme « système dynamique » non pas comme une vague métaphore, mais avec un sens heuristique précis. Pour cela, il faut savoir voir, dans la trajectoire imaginaire de l'objet, les propriétés d'un certain type de système dynamique connu. Il est également souhaitable de savoir collecter au moins quelques données quantitatives, afin de les interpréter à la lumière du concept et d'alimenter la modélisation, lorsque cela est possible et opportun.
Dans l'étude des sons de la parole, il existe un objet important qui se comporte comme un oscillateur. Ce sont précisément les gestes articulatoires qui les produisent. C'est la familiarité avec cette idée qui m'a permis d'adhérer à une ligne de pensée qui prenait son essor dans les années 1990 et est aujourd'hui reconnue comme l'une des premières armes internationales dans le domaine. C'est ce qu'on appelle la phonologie gestuelle ou articulatoire.
Peu à peu, cette position théorique attira vers mon laboratoire la sympathie et le respect de quelques collègues étrangers. Elle a également suscité l'enthousiasme d'une génération de nouveaux talents, grâce à laquelle j'ai construit une conception de l'acquisition du langage qui suppose l'intégration d'habiletés motrices, cognitives et sociales. Cette position rejette la vision traditionnelle selon laquelle la cognition commande l'action au profit d'une autre, plus audacieuse, qui suppose que la cognition se construit à partir d'une action partagée, explicite ou implicite.
Cela ouvre la voie à certaines analyses fines des sons de la parole, qui permettent à leur tour de démystifier certains mythes. Par exemple, il est possible de démêler les relations de parenté entre les prononciations standard et stigmatisées. Ainsi, dans un changement sonore, on peut tracer la trajectoire d'un geste conservateur à un geste novateur, ou inversement. Cela brise le mythe de la « mauvaise » prononciation.
De même, dans les troubles dits de la parole, il est possible de découvrir des relations de parenté entre prononciations typiques et atypiques. Ainsi, on peut observer les tentatives du locuteur d'approcher la prononciation cible, parfois même avec insistance. Même lorsque les différences entre ces tentatives sont inaudibles, des outils physiques et conceptuels rendent leur trajectoire observable. Cela brise le mythe du déficit rédhibitoire.
En conclusion, je dois dire qu'aujourd'hui, c'est un plaisir d'avoir réussi à former des spécialistes de l'acquisition des langues première et seconde capables de détecter et d'interpréter de petites différences dans le mouvement des organes articulatoires. De nombreuses personnes ne sont plus qualifiées d'« anormales » grâce à cette approche, que des professionnels engagés formés dans mon laboratoire font passer du milieu universitaire aux salles de classe et aux bureaux.
Un autre bonheur est d'avoir stimulé la tendance naturelle de ces talents à résister aux formes de conservatisme du milieu environnant. Pour cela, il était indispensable de s'appuyer sur des outils théoriques plus larges, que j'exposerai brièvement ci-dessous.
Retour aux philosophies d'action
Ma passion pour la philosophie est aussi une passion pour la liberté de pensée. De nombreux philosophes ont influencé les gestes de résistance à l'anti-humanisme qui ont marqué ma trajectoire scientifique. Il faut expliquer que cela a commencé pendant la dictature militaire et a eu un long passage à travers le pays des chefs du coup d'État qui l'a institué.
Parmi les philosophes qui m'ont inspiré, Ludwig Wittgenstein est sans doute le plus utile à mon travail d'enseignant, car il me permet de fonder mes choix à la fois sur la psychologie et la phonétique, deux disciplines qui font partie de mon champ de travail au quotidien.
Être un vygotskien en tant que psychologue et un stetsonien en tant que phonéticien sont des choix cohérents, car ils convergent sur l'hypothèse que les racines de la cognition résident dans l'action. Le psychologue russe Lev Vygotsky parlait de la connaissance comme d'une action partagée et intériorisée. Le psychologue et phonéticien américain Raymond Stetson parlait des mouvements audibles comme constitutifs du langage oral. C'est ce type de pensée qui sous-tend la version de la phonologie gestuelle pratiquée dans mon laboratoire depuis plus de deux décennies.
Mais peut-être que Vygotsky et Stetson ne sembleraient pas aussi convaincants aujourd'hui s'ils n'avaient pas eu un philosophe – Wittgenstein – comme contemporain désireux de démolir certains des mythes les plus solides de la théorie de la connaissance, à savoir : définir les traits des classes ; règles fixes; langue privée.
Les trois expressions ci-dessus s'expliquent d'elles-mêmes par le pouvoir de la pensée qui les rejette en soutenant des actes de résistance. Ce récit peut donc s'arrêter ici.
La question qui ne disparaît jamais : comment résister à l'obscurantisme actuel ?
Enfin, je dois avouer que même 50 ans d'expérience académique ne m'ont pas préparé à affronter les formes actuelles d'obscurantisme. Pendant la dictature militaire, cette menace entourait le milieu universitaire et faisait de nombreuses victimes. Mais elle n'a jamais été aussi mondialisée et organisée qu'aujourd'hui.
Les attaques incessantes contre les universités et les agences de développement par le gouvernement actuel appellent à la réflexion et à l'action collectives. Dans un contexte où de nombreux scientifiques sont déjà devenus des entrepreneurs ou des travailleurs externalisés au service du marché, le dernier bastion de la résistance à l'anti-humanisme semble résider dans les syndicats, les organisations étudiantes et les associations scientifiques.
* Eleonora Albano est professeur de phonétique et de phonologie à l'Institut d'études linguistiques de l'Unicamp. Auteur, entre autres livres, de Le geste audible : la phonologie comme pragmatique (Cortez).