Jean Umani

Ce matin à 7h36, une IA locale m'a envoyé mon briefing

L'IA open-source, le dilemme de l'innovateur, et ce que ça change
Mars 2026

Ce matin, en ouvrant mon téléphone, j'ai trouvé un email que personne n'avait écrit. Un briefing structuré de mes messages de la nuit, trié par urgence, rédigé dans un format HTML propre, signé par un assistant qui s'appelle Hal. L'expéditeur n'était pas un service cloud. C'était un modèle d'intelligence artificielle open-source, tournant sur ma propre machine, dans mon bureau, à Saint-Jean-Cap-Ferrat. Un programme de 35 milliards de paramètres développé par une équipe chinoise chez Alibaba, que n'importe qui peut télécharger gratuitement, et qui a fait ce travail en autonomie complète pendant que je dormais.

Il y a six mois, cette phrase aurait été de la science-fiction. Pas la partie intelligence artificielle. Ça, tout le monde en parle depuis deux ans. La partie locale. La partie autonome. La partie gratuit. Parce que jusqu'à très récemment, pour obtenir ce niveau de performance, il fallait passer par les serveurs d'OpenAI ou d'Anthropic, payer un abonnement mensuel, accepter que ses données transitent par le cloud, et surtout, rester dépendant d'un fournisseur qui peut changer ses prix, ses conditions, ou ses capacités du jour au lendemain.

Ce n'est plus le cas. Et les implications de ce changement sont, je crois, considérablement sous-estimées.

· · ·

Je travaille avec l'intelligence artificielle depuis trois ans et demi, dans un contexte que beaucoup trouveraient inhabituel. Je suis architecte de formation, avec plus de 30 ans de pratique, et j'ai fondé une structure, UMAN[iA], dont l'objet est d'intégrer l'IA dans les métiers de l'architecture, de la recherche et du conseil. Concrètement, cela signifie que je passe mes journées à construire des systèmes qui font des choses utiles : analyser la littérature scientifique pour des chercheurs, automatiser des tâches administratives pour des agences d'architecture, produire des visualisations et des documents qui prenaient auparavant des semaines.

Ce qui me frappe, dans cette pratique quotidienne, ce n'est pas tant la puissance des modèles (elle est réelle, mais tout le monde en parle déjà). C'est plutôt la vitesse à laquelle le rapport de force entre les modèles propriétaires et les modèles open-source est en train de se modifier. Et pour comprendre ce qui se passe, il est utile de faire un détour par un livre de management publié en 1997.

· · ·

Clayton Christensen était professeur à la Harvard Business School. Son ouvrage The Innovator's Dilemma est devenu l'un des textes les plus influents de la stratégie d'entreprise du XXe siècle. Sa thèse, en quelques mots, est la suivante : les entreprises leaders d'un marché ne se font presque jamais battre par un concurrent qui fait mieux qu'elles. Elles se font battre par un concurrent qui fait moins bien, mais qui est suffisant, moins cher, et plus accessible.

C'est contre-intuitif, et c'est pour cela que le phénomène se répète si régulièrement. Le leader regarde vers le haut. Ses meilleurs clients, ses marges les plus élevées, son produit le plus sophistiqué. Pendant ce temps, un nouvel entrant occupe le bas du marché avec une offre que le leader méprise, parce qu'elle est inférieure sur tous les critères qui comptent pour lui. Le problème, c'est que ces critères ne sont pas les mêmes que ceux du marché de masse.

Christensen illustrait cela avec l'industrie sidérurgique américaine. Dans les années 1970, les mini-aciéries produisaient de l'acier de qualité médiocre à partir de ferraille recyclée. Les grandes aciéries intégrées, US Steel et Bethlehem Steel, les ignoraient, parce que cet acier n'était bon que pour les applications les moins exigeantes : les barres d'armature pour le béton. Les mini-aciéries avaient ce marché pour elles seules, parce que les grands ne voulaient pas s'y abaisser. Les marges y étaient trop faibles.

Puis les mini-aciéries se sont améliorées. Pas d'un coup. Progressivement. Elles sont passées des barres d'armature aux poutrelles, puis aux tôles, puis aux aciers plats. À chaque étape, les grands acteurs cédaient le segment inférieur sans s'inquiéter, parce qu'ils montaient eux-mêmes en gamme vers des produits plus rentables. Quand les mini-aciéries ont atteint le sommet de la pyramide, les géants n'avaient plus nulle part où aller. Bethlehem Steel a fait faillite en 2001.

L'histoire s'est répétée avec les disques durs (le 5.25 pouces tuant le 8 pouces, puis le 3.5 tuant le 5.25), avec l'informatique personnelle (le PC tuant le mainframe), avec le streaming (Netflix tuant Blockbuster), avec la photographie numérique (tuant Kodak, qui avait pourtant inventé la technologie).

Le schéma est toujours le même. Le leader fait tout correctement : il écoute ses clients, investit dans la R&D, améliore son produit. Et il perd. Non pas malgré ces bonnes décisions, mais à cause d'elles. Parce que ses meilleurs clients lui demandent des choses que le marché de masse ne valorise pas. Parce que sa structure de coûts l'empêche de descendre en gamme. Parce que la disruption, par définition, n'est visible que lorsqu'il est trop tard pour réagir.

C'est le dilemme du titre. Pas un problème de compétence. Un problème de structure.

· · ·

Je raconte tout cela parce que je crois que nous sommes en train de vivre exactement ce scénario dans l'industrie de l'intelligence artificielle. Et je ne parle pas d'un futur hypothétique. Je parle de ce qui se passe dans mon bureau, en ce moment, tous les jours.

Il y a deux mondes dans l'IA aujourd'hui. Le premier est celui des modèles propriétaires : GPT-5 d'OpenAI, Claude d'Anthropic, Gemini de Google. Ce sont des systèmes extraordinairement puissants, hébergés dans le cloud, accessibles par abonnement ou par API. Ils représentent l'état de l'art absolu sur les tâches les plus complexes : la rédaction scientifique, le raisonnement long, la programmation avancée. Leurs entreprises lèvent des milliards de dollars, emploient les meilleurs chercheurs, et se livrent une course à la performance qui fait les gros titres.

Le second monde est celui des modèles open-source : LLaMA de Meta, Mistral (français), Qwen d'Alibaba, DeepSeek. Ce sont des modèles dont les poids sont publiquement disponibles, que n'importe qui peut télécharger, modifier, et faire tourner sur son propre matériel. Il y a un an, ces modèles étaient sensiblement inférieurs aux modèles propriétaires. La conversation s'arrêtait là.

Elle ne s'arrête plus là.

· · ·

Christensen introduisait un concept qu'il appelait la "courbe de surperformance". L'idée est simple : les leaders finissent toujours par dépasser ce dont le marché a réellement besoin. Ils continuent d'améliorer leur produit sur des axes que leurs meilleurs clients valorisent, mais qui importent de moins en moins au client moyen. À un certain point, le produit premium est trop bon pour la plupart des usages. Et quand cela se produit, les critères de choix changent. Le client ne compare plus la qualité, elle est suffisante partout. Il compare le prix, la simplicité, la rapidité, le contrôle.

Je crois que nous approchons de ce point dans l'IA. Claude Opus 4.6, le dernier modèle d'Anthropic, est probablement le meilleur modèle de langage jamais créé. Sa capacité de rédaction, de raisonnement, de structuration de documents complexes est remarquable. Je l'utilise quotidiennement et je mesure cette qualité. Mais est-ce que j'ai besoin de ce niveau de performance pour trier mes mails le matin ? Pour générer un briefing HTML ? Pour lire un PDF et en extraire les points clés ? Pour envoyer une notification quand un email important arrive ?

Non. Un modèle trois fois plus petit, tournant en local, fait ce travail aussi bien. Parfois mieux, parce qu'il n'y a pas de latence réseau, pas de déconnexion d'API, pas de limite de requêtes, pas de dépendance à un service tiers. Il est là, sur la machine, prêt, permanent. Il ne "tombe" pas. Il ne change pas ses tarifs.

Ce n'est pas une supériorité absolue. C'est une supériorité contextuelle. Et c'est exactement ce type de supériorité qui, selon Christensen, précède les basculements de marché.

· · ·

Il y a un autre concept de Christensen que je trouve encore plus éclairant pour notre situation. Dans son livre suivant, Competing Against Luck (2016), il développe l'idée du "job to be done", le travail à accomplir. Sa thèse est que les gens n'achètent pas un produit pour ce qu'il est. Ils l'embauchent pour faire un travail. Le milkshake du matin n'est pas en concurrence avec les autres milkshakes. Il est en concurrence avec le bagel, la banane, et l'ennui du trajet en voiture. Comprendre le vrai travail que le client cherche à accomplir change tout à la façon dont on conçoit un produit.

Cette idée a profondément influencé ma façon de travailler. Quand un chercheur du CHU de Nice me demande d'analyser la littérature sur le rôle des fibroblastes dans le vitiligo, il ne cherche pas "un outil bibliométrique". Il ne cherche pas "du clustering citationnique" ou "des embeddings sémantiques". Il cherche quelqu'un, ou quelque chose, qui lui dise, en vingt minutes, ce que la littérature raconte sur ce sujet, comment elle s'organise, quels sont les articles fondateurs, et où se trouvent les lacunes. Il embauche un livrable, pas une technologie.

C'est pour cela que, dans ma pratique, je pars toujours du livrable. Pas de l'outil, pas de l'algorithme, pas du modèle. Du résultat final tel que le client le recevra. Et je remonte la chaîne technique à partir de là. Cette approche, que j'ai adoptée par instinct avant de la théoriser, s'inscrit directement dans le cadre de Christensen : c'est en comprenant le job to be done qu'on identifie les opportunités que les acteurs établis ne voient pas.

Les outils bibliométriques existants (VOSviewer, Scopus, Elicit, Consensus) sont chacun excellents dans leur domaine. Mais aucun d'entre eux ne fait le job complet. Ils fournissent des ingrédients : une liste d'articles, un graphe de réseau, un résumé généré, une base de données. L'assemblage, la structuration, la synthèse narrative, c'est-à-dire le travail qui transforme ces ingrédients en connaissance exploitable, reste à la charge du chercheur. Autrement dit, le chercheur reçoit de la matière première, pas un résultat exploitable. La structuration, l'interprétation et la rédaction restent à sa charge, et c'est précisément pour ce travail-là qu'il n'a pas le temps.

Ce que nous faisons avec HAL Biblio, c'est livrer le résultat final : un rapport structuré par clusters thématiques, avec les textes fondateurs identifiés, les synthèses rédigées, et les lacunes pointées. Prêt à être lu, discuté, utilisé.

· · ·

Il y a un aspect du dilemme de l'innovateur que je trouve particulièrement frappant dans le contexte actuel, et que Christensen appelait "l'asymétrie de motivation". L'idée est que le leader et le disrupteur n'ont pas les mêmes incitations. Le leader est structurellement motivé pour monter en gamme, là où sont ses marges, ses meilleurs clients, sa réputation. Le disrupteur est structurellement motivé pour servir le marché que le leader délaisse.

Appliquée à l'IA, cette asymétrie est saisissante. Anthropic ne peut pas, structurellement, descendre en gamme pour concurrencer un modèle gratuit tournant en local. Leurs investisseurs attendent des revenus sur des contrats d'API à grande échelle. Leur culture d'entreprise est tournée vers la sécurité et la performance au sommet. Leur communication vise les entreprises du Fortune 500, les agences gouvernementales, les grandes institutions de recherche. Proposer un modèle open-source que des consultants indépendants feraient tourner sur leur Mac pour zéro euro serait économiquement irrationnel dans leur cadre.

C'est exactement la position d'IBM face au PC dans les années 1980. IBM comprenait parfaitement que l'informatique personnelle allait se développer. Ils ont même lancé leur propre PC. Mais ils n'ont jamais pu s'y investir pleinement, parce que chaque dollar consacré au PC était un dollar retiré aux mainframes, où les marges étaient cent fois supérieures. Le résultat est connu.

Je ne dis pas qu'Anthropic ou OpenAI vont disparaître. Je dis que leur marché va se rétrécir à mesure que le "suffisamment bon" open-source s'améliore. Et je dis que cette amélioration est plus rapide que la plupart des observateurs ne le pensent, parce qu'ils comparent les modèles sur des benchmarks académiques plutôt que sur des livrables réels.

· · ·

C'est peut-être le point le plus important de cette réflexion. Les benchmarks traditionnels (MMLU, HumanEval, GSM8K) mesurent des capacités isolées : résolution de problèmes mathématiques, génération de code, compréhension de texte. Sur ces métriques, les modèles propriétaires maintiennent un avantage mesurable. Mais ces métriques ne capturent pas ce qui fait la différence en production.

En production, ce qui compte c'est la capacité à s'intégrer dans un workflow complet. C'est l'accès direct au système de fichiers sans couche d'abstraction. C'est la persistance du contexte d'une session à l'autre. C'est la latence de réponse quand on travaille en temps réel. C'est la stabilité d'un service qui ne dépend d'aucune connexion internet. C'est la possibilité de connecter le modèle à ses propres outils, sa messagerie, ses bases de données, ses API, sans demander la permission à un tiers.

Sur tous ces critères, un modèle local présente des avantages structurels qu'aucune amélioration du cloud ne peut compenser. Non pas parce que le modèle local est meilleur, mais parce qu'il est . Présent. Permanent. Intégré. C'est la différence entre avoir un collaborateur à demeure et appeler un consultant externe à chaque question. Le consultant peut être plus brillant. Mais le collaborateur connaît la maison.

· · ·

Je ne veux pas donner l'impression d'un enthousiasme naïf pour le tout-local. Les limites sont réelles et il serait malhonnête de les passer sous silence.

Les modèles open-source de 35 milliards de paramètres ne produisent pas, aujourd'hui, la qualité de rédaction scientifique que je peux obtenir d'un Claude Opus sur une synthèse bibliométrique complexe. Quand il faut croiser 14 clusters d'articles, identifier les textes fondateurs de chaque communauté citationnelle, et rédiger une synthèse narrative qui tienne la route face à un comité de lecture, le modèle propriétaire reste supérieur. Pour l'instant.

La dépendance à un modèle unique est aussi un risque. Si Qwen décide de changer sa licence, si Meta modifie les conditions de LLaMA, si le modèle que j'utilise aujourd'hui n'est plus maintenu demain, il faut pouvoir pivoter. Le local offre l'indépendance vis-à-vis du cloud, mais pas vis-à-vis de l'écosystème open-source lui-même. Ce risque est atténué par la multiplicité des acteurs (Meta, Alibaba, Mistral, Google, qui publie aussi des modèles ouverts), mais il existe.

Enfin, faire tourner un modèle de 35 milliards de paramètres en local exige une machine puissante. Mon Mac Pro M2 Ultra avec 192 Go de RAM le gère confortablement. Un laptop standard, non. L'accessibilité n'est pas encore universelle, même si les Apple M5 annoncées hier changent significativement la donne.

Ces limites sont réelles. Mais elles sont en train de se réduire, trimestre après trimestre, à une vitesse que je n'avais pas anticipée il y a un an. Et c'est la trajectoire qui compte, pas la photographie du moment.

· · ·

Dans mon travail quotidien, la répartition s'est organisée naturellement. J'utilise Claude, le modèle propriétaire d'Anthropic, pour les tâches qui exigent le plus haut niveau de qualité intellectuelle : les études comparatives, les documents de recherche, les synthèses bibliométriques destinées à des professionnels exigeants. Pour ces livrables, le surcoût est justifié, parce que la qualité est visible et mesurable par le destinataire.

Pour tout le reste (et "tout le reste" représente peut-être 70% de mon activité), le modèle local fait le travail. Les briefings matinaux. Le tri des emails. La surveillance des boîtes de réception. La génération de drafts. Les tâches répétitives qui, prises individuellement, ne justifient pas un appel API à 3 centimes le message, mais qui, cumulées, représentent une charge cognitive considérable.

Cette répartition n'est pas un compromis temporaire en attendant que l'open-source rattrape le propriétaire. C'est, je crois, la configuration durable de notre rapport à l'IA. Un modèle premium pour les tâches critiques. Un modèle local pour le quotidien. L'intelligence artificielle comme commodité domestique, pas comme service cloud facturé à l'usage.

· · ·

Si cette lecture de la situation est correcte (et je peux me tromper), les implications pour nos métiers sont significatives.

Pour les architectes, cela signifie que les outils de visualisation, d'analyse de site, de génération documentaire vont se démocratiser bien plus vite que prévu. Ce qui était réservé aux grandes agences disposant de licences logicielles coûteuses et d'équipes spécialisées va devenir accessible à un praticien seul, équipé d'un bon ordinateur et d'une compréhension claire de ce qu'il veut produire. La valeur ne sera plus dans l'accès à l'outil, mais dans la pertinence de la question posée.

Pour les chercheurs, cela signifie que l'analyse bibliométrique automatisée, c'est-à-dire la cartographie structurée d'un champ de recherche, va cesser d'être une spécialité réservée aux méthodologistes formés à la bibliométrie. Un clinicien-chercheur pourra obtenir, en quelques minutes, une vue d'ensemble structurée de la littérature sur son sujet, avec identification des clusters thématiques, des textes fondateurs, et des lacunes. Pas un résumé superficiel, mais une cartographie argumentée, citationnelle, vérifiable.

Pour les entreprises en général, cela signifie que la souveraineté technique n'est plus un discours de salon. C'est une option réelle, accessible, fonctionnelle. Le choix n'est plus "cloud ou rien". C'est "cloud quand la qualité l'exige, local par défaut". Et ce choix a des conséquences directes en matière de confidentialité, de coût, de résilience et d'indépendance.

· · ·

Je termine par une observation que Christensen faisait souvent, et qui me semble particulièrement juste dans le moment présent. Il disait que les technologies disruptives, au moment de leur émergence, sont toujours décevantes pour les utilisateurs les plus exigeants. C'est normal. Elles ne sont pas conçues pour eux. Elles sont conçues pour des gens qui n'avaient rien avant. Et c'est précisément parce qu'elles semblent insuffisantes aux yeux des experts qu'elles ne sont pas prises au sérieux.

Les modèles locaux de 2026 sont les 486 DX2 de 1994. Lents, limités, inadaptés aux usages avancés de l'époque. Mais quelqu'un qui les regardait en 1994 et ne voyait que leurs limites passait à côté de l'essentiel. L'essentiel, c'était la trajectoire. La loi de Moore appliquée à un écosystème qui n'en était qu'à ses débuts.

Aujourd'hui, quand je vois un modèle de 35 milliards de paramètres lire mes emails et m'envoyer un briefing à 7h36 depuis mon propre bureau, je ne me demande pas si c'est aussi bon que GPT-5. Je me demande ce que fera le modèle de 2028.

Et cette question, je crois, devrait intéresser tout le monde.

· · ·

Mise à jour, 5 mars 2026, 10h44. Pendant la rédaction de cet article, Claude, le modèle propriétaire d'Anthropic que j'utilise quotidiennement, m'a affiché un message m'invitant à payer davantage pour continuer à travailler. Nous en étions au passage sur la courbe de surperformance de Christensen. La démonstration par l'exemple n'était pas prévue.

Jean Umani
UMAN[iA]
Saint-Jean-Cap-Ferrat, mars 2026