Chapitre 8

Déchiffrer l'empreinte

5 min de lecture

8. DÉCHIFFRER L’EMPREINTE

Retournons dans l’atelier. Cette fois, au lieu de construire un prompt pour tirer l’IA vers un style généralisable, nous allons imaginer une architecture visant à déchiffrer une voix particulière.

Je n’ai pas de tests à montrer ici. Pour l’instant, tout cela reste théorique. Cela dit, j’ai commencé, dans mon propre atelier, à construire cette architecture, et d’ici quelques mois, je pourrai me lancer dans les tests et la mise en œuvre.

Je me prendrai comme cobaye pour le bien de l’illustration. Je m’appelle Mahigan Lepage; en soi, cela ne veut rien dire. Je ne suis pas né avec une essence ou une unicité qui s’exprimerait dans mes textes. Je suis le résultat d’une accumulation d’expériences qui ne sont pas singulières en soi, mais qui, en se déposant, se sont cristallisées d’une manière détaillée et particulière. De toute ma vie, ce qui m’a le plus marqué, ce sont les trajets en véhicule : la vision du pays par la fenêtre du pick-up de mon père sur les plateaux où j’ai grandi, la cassure des coulées qui crevassaient le relief; l’approche de Campbellton, puis de Montréal en voiture, usines, ports, ponts, construction de la ville; etc. Ainsi le dehors — visions, territoire, mouvement, mais aussi une foule d’autres éléments liés : visages, figures, mains, récits, etc. — s’est imprimé en moi et a dessiné des formes cristallines définies. Vers la fin de la vingtaine, alors que j’étais en crise (l’université, les relations : tout me souffrait), je me suis mis en quête de la voix. Au cours des deux décennies suivantes, j’ai eu beau courir d’un texte à l’autre (Relief, Carnets du Népal, Vers l’Ouest, Coulées, Fuites mineures, Big Bang City, etc.), je n’ai jamais vraiment été capable de saisir la voix. Je félicite ceux et celles qui ont écrit leur premier livre, leur deuxième, puis leur troisième en étant bien « assis » dans leur voix; ce n’est pas mon cas. La voix m’a toujours échappé, et c’est pour cela que j’ai continué, déplaçant à chaque fois l’angle d’approche, comme un chasseur qui passe sa vie à traquer une bête lumineuse insaisissable.

Je sais que la quête est belle. Je crois qu’elle pourrait arriver à terme.

Voici ce que j’ai commencé à faire. Je suis en train de créer un jeu de données (dataset) comprenant tous mes textes en format Markdown (le plus lisible pour les IA). En dix-neuf années d’écriture, j’ai accumulé énormément de textes, comme tous ceux et celles qui cherchent. Je ne parle pas seulement de mes livres qui peuvent être commandés en librairie; cela, qui répond aux conditions de publication de l’époque, n’est que la partie visible de l’édifice. Il y a aussi tous mes inédits (les textes que les éditeurs ont refusés ou que je n’ai jamais soumis); il y a les textes dont j’ai repris les droits (Vers l’Ouest par exemple); il y a mes vieux billets de blog que j’ai conservés; sans parler des dizaines d’embryons de projets jamais développés, des notes éparses et ainsi de suite. Toutes ces données, y compris les textes que je n’ai jamais écrits — mais que j’ai esquissés dans mes notes —, forment une matière qui pourrait contenir quelque chose comme la clé de ma voix — ou les clés de mes voix, s’il se trouve que je suis habité par une pluralité. En donnant à l’IA un accès à mon corpus de données, je tenterai de décrypter l’empreinte mathématique qui définit ma prose. Les IA excellent dans l’analyse d’une masse de données. Elles peuvent traquer les récurrences, les obsessions, les marqueurs, les idiosyncrasies qui informent le détail de l’empreinte.

Je ne dis pas que je suis « spécial »; on l’aura compris, je crois. Je me prends en exemple, mais j’invite tous les auteurs et autrices à faire de même. Je ne m’attends pas à ce que beaucoup sautent dans l’avion, mais si nous sommes une dizaine ou une centaine à le faire au cours des prochaines années, nous pourrons commencer à éclairer tous les cristaux de voix qui, ensemble, forment une grande richesse.

Je sais que ce que je dis sera vu comme une hérésie. On préfère croire en l’irréductibilité de l’esprit créatif. Je ne crois pas que ce qui parle en nous soit irréductible; j’admets toutefois que cela est complexe. Une complexité sans doute très grande, dont on n’épuisera pas de sitôt la richesse de détails. Il est possible que, loin d’arriver à déchiffrer le code ou les codes de la voix, on ouvre une ère d’interprétabilité — comme on le dit du domaine qui consiste à tenter de comprendre ce qui se passe dans les LLM, qui sont des boîtes noires¹. Mais je persiste à penser qu’avec la complexification des réseaux de neurones artificiels eux-mêmes, on arrivera à une certaine élucidation de l’empreinte, et que ce déplacement n’est pas sans conséquences.

L’interprétabilité mécanistique est un domaine de recherche qui vise à comprendre comment les réseaux de neurones artificiels produisent leurs résultats. Les LLM sont souvent qualifiés de « boîtes noires » parce que leurs processus internes demeurent largement opaques, même pour leurs créateurs. L’interprétabilité tente d’ouvrir la boîte en identifiant les circuits et les motifs d’activation qui sous-tendent les comportements du modèle. ↩