Sommaire
Eh bien les amis, préparez-vous pour une nouvelle folie dans le monde de l’informatique ! Imaginez un fichier de police de caractères qui soit également un LLM (Large Language Model), capable de générer du texte. Ça a l’air dingue, n’est-ce pas ? Et pourtant, c’est exactement ce que propose llama.ttf , un projet aussi insolite qu’innovant.
Qu’est-ce que llama.ttf au juste ?
Pour les non-initiés, un LLM (Large Language Model) est un modèle d’intelligence artificielle entraîné sur d’énormes quantités de données textuelles. Des modèles comme GPT d’OpenAI ou Llama de Meta sont capables de générer du contenu cohérent et pertinent sur une vaste gamme de sujets. Eh bien, imaginez un peu si ce genre de puissance se trouvait… dans un fichier de police de caractères ! (Bien sûr, on parle d’un modèle compact, pas d’une usine à gaz comme ChatGPT.)
C’est le pari fou que relève llama.ttf , un fichier .ttf (l’extension standard des polices de caractères) qui dissimule en son sein un LLM de 15 millions de paramètres. Comment est-ce possible ? Tout repose sur HarfBuzz , une bibliothèque C++ qui gère le « text shaping », c’est-à-dire la conversion des textes Unicode en glyphes (les formes de caractères que vous voyez à l’écran).
HarfBuzz est une bibliothèque peu connue du grand public, mais largement utilisée par les navigateurs web comme Chrome et Firefox pour afficher correctement les textes.
Le fonctionnement de la bête
Voilà, ça devient un peu technique, mais on va y aller doucement. HarfBuzz dispose d’un « shaper » basé sur WebAssembly, qui permet d’exécuter du code arbitraire pour donner forme aux textes. Et devinez quoi ? Ce code peut très bien être un moteur d’inférence pour un modèle de langage comme llama.ttf !
Concrètement, cela signifie que vous pouvez utiliser llama.ttf dans n’importe quelle application compatible avec HarfBuzz et WebAssembly pour générer automatiquement du texte. Un éditeur d’images comme GIMP, un traitement de texte comme gedit, ou même un client de messagerie électronique, tout est possible ! (Finie l’excuse « Oups, j’ai encore oublié de répondre à ce mail important ».)
Mais quel est l’intérêt, me direz-vous ?
L’avantage majeur de llama.ttf, c’est qu’il fonctionne entièrement en local . Pas besoin d’être connecté à un service cloud pour bénéficier de ses capacités de génération de texte. Cela offre un véritable plus en termes de confidentialité et de respect de la vie privée. (Après tout, qui a envie que ses ébauches de roman à l’eau de rose soient analysées par une IA tierce ?)
Comment utiliser llama.ttf ?
Pour profiter de cette petite merveille, rien de plus simple ! Téléchargez le fichier llama.ttf (environ 60 Mo, basé sur le modèle TinyStories) et installez-le comme n’importe quelle autre police de caractères. Assurez-vous cependant que votre application soit compatible avec HarfBuzz et WebAssembly.
Le moyen le plus simple de tester llama.ttf est de compiler HarfBuzz avec l’option « -Dwasm=enabled », puis de compiler wasm-micro-runtime avec « -DWAMR_BUILD_REF_TYPES=1 ». Enfin, ajoutez les bibliothèques partagées libharfbuzz.so.0.60811.0 et libiwasm.so à la variable d’environnement LD_PRELOAD.
Et voilà, vous êtes prêt à explorer cette nouvelle dimension de la génération de texte ! N’hésitez pas à partager vos créations les plus farfelues avec nous. Après tout, qui sait ce que l’avenir nous réserve ? Peut-être que bientôt, nous écrirons nos romans directement dans Microsoft Word grâce à un LLM intégré. (Ou bien est-ce que ça existe déjà ? Pitié, dites-moi que non…)
Résumé / TL;DR
- llama.ttf est un fichier de police de caractères qui cache également un LLM (Large Language Model) capable de générer du texte.
- Ce projet insolite repose sur la bibliothèque HarfBuzz, qui permet d’exécuter du code arbitraire pour le « text shaping ».
- Fonctionnant entièrement en local, llama.ttf offre un avantage en termes de confidentialité et de respect de la vie privée.
- Vous pouvez utiliser llama.ttf dans diverses applications compatibles avec HarfBuzz et WebAssembly pour générer du code, des documents, des légendes, etc.
- Pour profiter de cette merveille, téléchargez le fichier llama.ttf et configurez correctement HarfBuzz et wasm-micro-runtime.