IA pas que la Data - Reprendre le contrôle sur tout ce qui se dit autour de l’intelligence artificielle | #34 - De l'arrangement musical au "Vibe Coding" : Portrait d'un builder avec Sacha Morard

Dans cet épisode de "IA pas que la Data", nous avons eu le plaisir d'accueillir Sacha Morard, entrepreneur visionnaire et ancien CTO du Groupe Le Monde.

De musicien professionnel à bâtisseur technologique — Sacha nous livre une analyse sans langue de bois sur la révolution de l'IA. Avec lui, on explore les coulisses de sa nouvelle aventure entrepreneuriale, Edgee, et comment il aide les entreprises à passer d'une consommation effrénée de tokens à une utilisation intelligente et maîtrisée de l'IA.

Au programme de cet échange passionnant :
🔹 Parcours : Comment se réinventer radicalement dans un monde qui bouge vite.
🔹 Productivité : Pourquoi les développeurs de demain seront des "vibe-coders".
🔹 FinOps IA : Comment Edgee optimise les coûts des modèles (LLMs) grâce à la compression de prompts et au routage.
🔹 Le futur : L’IA est-elle un simple outil ou une véritable hybridation avec l'humain ?
🔹 Enjeux : Privacy, sécurité et la fin de l'artisanat pur dans le code ?

Nous espérons que cette discussion vous plaira !
Bonne écoute.

(00:00) - Introduction : Parcours atypique, de la musique à la tech de Sacha Morard
(05:03) - Le dénominateur commun : la créativité
(13:59) - L'IA et le bouleversement des modèles économiques
(15:26) - La genèse d'Edgey : pivoter pour trouver sa voie
(20:46) - Agent Gateway : le nouveau défi des tokens
(34:36) - Privacy, sécurité et agnostisme technologique
(43:00) - Le futur du métier : "Vibe-coders" vs artisans
(52:32) - L'IA comme multiplicateur de vélocité

Créateurs et invités

Hôte

Pierre Vannier

Fondateur et PDG Flint, Dev Backend / IA, agitateur Tech ✨

Hôte

Thomas Meimoun

Machine Learning Engineer / Data Scientist

Invité

Sacha Morard

Co-founder at Edgee - formerly CTO at Le Monde

Qu'est-ce que IA pas que la Data - Reprendre le contrôle sur tout ce qui se dit autour de l’intelligence artificielle ?

Reprendre le contrôle sur tout ce qui se dit autour de l’intelligence artificielle, voilà pourquoi nous avons créé ce podcast IA pas que la Data !

Tous les mois, nous aurons le plaisir d’accueillir des experts de l’IA, de la data et de la tech, qui nous partageront leur opinion et regard critique sur cette révolution.

Technophiles, ce podcast vous apportera un éclairage sur ce qui se cache derrière l’IA et vous permettra de prendre de la hauteur sur ce que l’on entend quotidiennement.

#IA #GenAI

Thomas (00:13)
Bonjour à tous et bienvenue dans ce nouvel épisode de IA pas que la Data. Je sais toujours pas quel numéro d'épisode on aime et c'est toujours un plaisir de vous retrouver. Je suis Thomas Meimoun Team Lead Data Scientist à BRP. est toujours beaucoup trop tôt pour moi. Je suis toujours accompagné de Pierre, mon acolyte. Salut Pierre. J'espère que tu vas bien aujourd'hui.

Pierre Vannier (00:29)
Salut Thomas !

Oui, mais moi il est moins tôt, tu vois.

Thomas (00:35)
et on est surtout aujourd'hui accompagné de Sacha Morard qui va avoir le plaisir de se présenter mais salut Sacha c'est un plaisir de t'avoir avec nous aujourd'hui

Sacha (00:44)
Salut à vous deux.

Pierre Vannier (00:46)
Salut Sacha

Thomas (00:47)
Bon, d'habitude on fait une petite introduction de la personne, mais moi j'aime vraiment bien ton CV, j'aime vraiment par là où tu as commencé. Sacha, je vais peut-être te laisser l'honneur de te présenter, de voir là où tu décides de t'arrêter. On va reprendre ensuite l'introduction ensemble, si tu le veux bien.

Sacha (01:04)
Ok, ouais, avec plaisir. Bon, déjà, merci pour l'invitation. C'est toujours un plaisir de répondre à plein de questions. C'est un plaisir aussi de pouvoir le faire avec toi, Pierre, qu'on se connaît déjà un petit peu. Thomas, ravi de te rencontrer aussi. Alors, je vais expliquer mon parcours. Je le fais assez souvent parce que comme il est assez bizarre, mon parcours, il peut peut-être aider certains à changer de vie parce que c'est ce que j'ai fait en 2008. Je suis né dans les Alpes. J'ai passé toute ma jeunesse à faire du ski et de la musique puisque mon papa était directeur d'une école de musique.

prof de ski, moniteur de ski. Donc voilà, ça a résumé mes 20 premières années. Donc très naturellement, je suis devenu musicien professionnel, ce qui veut dire en gros être chômeur puisque c'est intermittent du spectacle. Mais c'est quand même être vif de sa musique, vif de sa passion. Et c'était génial, mais c'était très difficile. Ça a duré six ans. n'ai pas réussi à faire plus que ça. Mes spécialités dans la musique, c'était surtout d'enregistrer des albums pour différents artistes et donc d'être ce qu'on appelle arrangeur.

Je passais beaucoup de temps en studio et j'organisais déjà un peu des productions entre les musiciens, les concerts, tout comme ça. Mais bon, j'ai dû me réinventer parce que je n'arrivais plus à manger, je du coup, j'ai appris à coder. Et ça m'a ouvert un champ des possibles considérables. Je me suis aperçu qu'en codant, le temps que je passais à apprendre avait un retour sur un investissement beaucoup plus important que celui du temps que je passais dans la musique.

Et en fait, j'ai pris ce rythme effréné d'apprendre à coder, coder, apprendre à coder, coder, etc. Je suis devenu manager et j'ai monté une autre entreprise. Et puis après, j'ai terminé CTO du Parisien, puis j'ai remonté une entreprise et puis, et puis j'ai atterri au Groupe Le Monde. J'ai eu la chance de diriger la technique du Groupe Le Monde pendant six ans. Ça a été une période formidable pour moi, avec beaucoup de gens de talent et très intelligents, où j'ai énormément appris sur les infrastructures.

bien sûr le métier de journaliste aussi, mais les infrastructures pour délivrer du média. Et voilà où j'en suis après cette aventure d'avoir créé Edgee pour refaire de nouveau de l'entrepreneuriat.

Pierre Vannier (03:12)
L'avantage, je me permets une petite joke, c'est que au moins t'as pas entendu ton père qui te dit « oui mais c'est quoi ton vrai boulot ? » Parce qu'en fait, c'est ça le truc, parce que tu vois, t'as toujours le truc « oui je vais aller faire de la musique ou du ski ou... » Non mais va trouver un vrai boulot. Toi t'as commencé, fait l'inverse d'abord. C'est le boulot passion.

Sacha (03:32)
Ouais, j'ai fait le boulot passion. D'ailleurs, c'était pas pour autant que c'était bien réfléchi, parce que c'était assez naturel.

Pierre Vannier (03:38)
C'était naturel du goutoukou dans ton environnement familial en fait, Ouais, ça a glissé comme ça, t'as appris la musique avec ton père et...

Sacha (03:46)
On était tous musiciens, donc mon père était musicien, mes frères étaient musiciens, donc c'était normal de continuer ce fait. C'est un métier qui très difficile. Je n'ai pas eu le problème du soutien de mes parents. Mes parents m'ont toujours soutenu, quoique je fasse de toute manière. Mais peut-être aussi parce que dans notre famille, il a cette culture de je sais apprendre et j'ai peur de pas grand chose. Je sais apprendre à me renouveler. Eux aussi n'ont pas été musiciens toute leur vie.

Mon père a fait plusieurs métiers, dont garagiste, vous voyez, ça n'a rien à voir. Et donc, en fait, je pense qu'on se fait souvent une fausse idée de ce qu'on peut faire dans la vie et notre destin. Et en vérité, on en a peut être plusieurs. Et je vous dis ça très sincèrement, parce qu'aujourd'hui, je fais de la tech, je crée une entreprise, mais il n'est pas exclu que dans dix ans, je fasse complètement, enfin, quelque chose de complètement différent. Et ça, pour moi, c'est, il n'y a aucun problème, même devenir boule en jeu. Je ne pourrais ça vraiment venir.

Thomas (04:38)
Et ça c'est

Et ça c'est vraiment beau. Et tu te considères plus entrepreneur ou développeur actuellement ?

Sacha (04:47)
Je pense que je suis entrepreneur, en fait je suis un builder. Si j'essaie de résumer ce que je sais faire, c'est construire des choses. Donc je sais construire des logiciels, sais construire une entreprise, je sais construire des équipes, mais comme je sais également construire des maisons, je pense.

Pierre Vannier (05:03)
C'est marrant parce que c'est comme le, tu vois, tu disais arrangeur, mais finalement développeur ou entrepreneur, c'est aussi quelque part une sorte d'arrangeur, arrangeur du code, arrangeur des process pour entrepreneur. Donc c'est et finalement, c'est tu dis builder, mais quand tu crées un morceau, quand tu crées une musique, tu pars d'une feuille blanche. Quand tu crées une boîte, tu pars d'une feuille blanche. Quand tu crées un morceau de code ou un logiciel, tu pars d'une feuille blanche. fait, tu as un aspect créatif.

qui est quand même super important dans nos métiers et je pense que c'est le dénominateur commun finalement des jobs un peu que tu as fait j'ai l'impression.

Sacha (05:41)
Je suis content que tu le verbalises comme ça, que j'essaie aussi de le... C'est ce que j'assume également, et je sais que je suis de temps en temps en contradiction avec quelques collègues techniciens. Je trouve qu'il a un processus extrêmement créatif dans le code. Il ne pas simplement écrire des lignes, bon maintenant d'ailleurs on en écrit beaucoup moins, mais en tout cas il faut pas produire un code informatique, il faut aussi se projeter sur les fonctionnalités, sur ton utilisateur.

sur comment tout cela va être digéré, compris par le end user. Et c'est très proche finalement du processus de création d'une chanson, tu vois, par exemple. Moi je trouve ça extrêmement créatif. Et c'est peut-être d'ailleurs ce qui m'a distingué de certains autres et d'avoir eu la chance d'être en responsabilité technique de grandes équipes. C'est qu'à un moment donné, il faut savoir parler le langage de l'utilisateur final ou de ton patron. Mais en tout cas, il faut savoir s'adapter à qui tu as en face.

Pierre Vannier (06:20)
carrément.

vraiment.

Thomas (06:41)
C'est vraiment intéressant parce que quand tu... je sais pas combien de temps on va s'arrêter sur cette partie mais quand tu t'es introduit et tu vas parler de la musique, il y a un lien très naturel qui s'est fait entre ce que tu as fait dans la musique et ce que tu as fait dans le code, c'est à dire quand tu disais que tu étais arrangeur et que tu passais beaucoup de temps à connecter les points entre eux, je pense que c'est à peu près la même chose que tu as fait quand tu as appris à coder. Et c'est aussi ça, mon prochain point c'est... t'as appris à coder tout seul ?

En fait, c'est peut-être ça le point de départ, c'est comment tu t'es dit, à un moment tu t'es dit la musique c'est plus fait pour moi parce que j'arrive pas, t'as mentionné le terme, pas réussir à me nourrir. Pourquoi le code ?

Sacha (07:21)
Alors très exactement, je suis passé d'abord par la casse design. Je pense que c'est important quand on change de voie, quand on se réinvente, de capitaliser un minimum sur ses compétences et ses connaissances, parce qu'il faut que le chemin vers le succès soit le plus court possible. Alors c'est très beau, on peut se dire ok je vais apprendre quelque chose que je ne sais absolument pas, je commence de 0,0 et puis je vais aller le plus loin possible. Ça c'est hyper valeureux, c'est cool, mais moi je suis pas comme ça, moi j'essaie de capitaliser sur ce que je maîtrise plus ou moins.

À l'époque, mise à part la musique, je savais faire du Photoshop sur tout ça. Je savais maîtriser des logiciels de montage audio assez complexe et des montages vidéo assez complexes. Et c'était à peu près tout. Donc ça me rapprochait un peu plus du métier de designer. Donc j'ai réussi à me faire embaucher comme designer dans une boîte qui était une boîte très tech, fait, c'était un opérateur hébergeur internet. Et en fait de fil en aiguille au bout d'un an, une demi...

en voyant tous mes collègues qui codaient, qui faisaient de l'infra, en fait ça m'a intéressé et c'est là où j'ai commencé vraiment à m'intéresser au métier de la programmation. Et donc j'ai appris tout seul. C'est possible d'apprendre tout seul, même des métiers extrêmement complexes. C'est aussi très bien de passer par une école. Ça ne vous donne pas toutes les clés, mais ça vous en donne plein. Donc je dis pas que l'école, c'est inutile. Pour ma part, moi, je pense que c'est la meilleure façon pour moi d'apprendre, c'est de le faire moi-même.

Thomas (08:47)
Tu viens de quelle époque quand tu fait cette transition ? parle de quelle année à peu près ? Ouais, où tu as fait ta transition entre le design, le code et la musique.

Sacha (08:54)
A quelle année j'ai fait cette transition ?

C'était entre

2008 et 2010. Donc il a pas si longtemps que ça finalement.

Thomas (09:04)
Non

? Enfin, ça dépend dans quel univers on parle, pour de l'ia 15 ans c'est toute une vie mais... Non non, ok, je comprends très bien. Je voulais revenir sur une partie avec la partie, comment dire, journalistique. Bon, t'as pas fait du journalisme, mais est-ce que t'as vécu les époques où les journaux ont eu du mal à se réinventer avec la tech ? Où t'es arrivé un petit peu après ?

Sacha (09:28)
Non, non, j'ai été en train de danser.

Pierre Vannier (09:31)
Je

rigole parce que je connais un peu ce milieu-là et comment ça se passe et en fait ils en sont pas encore complètement sortis, il n'y a pas toutes les réponses mais je pense que tu étais bien dedans Sacha.

Sacha (09:44)
J'étais bien dedans et maintenant il y a une nouvelle ère qui s'impose, qui est l'ère de l'IA, qui bouscule encore plus les rédactions qu'avant. Moi, je suis arrivé au moment où vraiment le web, le cloud, malmenait beaucoup les rédactions. Les journaux, les médias, enfin surtout les journaux, produisaient beaucoup de papiers. C'était le modèle économique le plus puissant qui soit quand tu faisais du média il a encore 20 ans.

On vendait des journaux papier. Et puis en fait, du jour au lendemain, l'usage est basculé complètement vers le web. Mais sauf que les rédactions ne vont pas exactement à la même vitesse. C'est-à-dire qu'un journaliste qui est habitué à écrire sur du papier, il n'est pas nécessairement formé et habitué à écrire sur du web. Et en vérité, ce changement culturel de l'information ne s'opère pas en un claquement de doigt. Quand je suis arrivé aux Parisiens en 2012, on était en pleine transition du numérique.

Donc j'espère avoir aidé un petit peu ce fabuleux titre à pouvoir démarrer sa transition vers le numérique. Ce n'est pas évident pour le Parisien, qui est un journal très très populaire et dont le papier est encore très présent dans certaines tables de famille, le dimanche par exemple. Et ce n'est pas un réflexe pour les gens d'aller sur le site du Parisien autant que d'aller sur un site comme Le Monde quand tu veux t'informer d'un sujet très particulier. Généralement tu vas sur le Parisien quand c'est plus du fait d'hiver, etc.

Donc en fait, la transition pour certains titres comme le parisien d'un journal papier vers le journal numérique est plus délicate que certains autres médias qui ont déjà une audience très très affinitaire. Et quand tu es arrivé au Monde en 2018, la transition était déjà très bien nommée, si j'ose dire. Tout ça porté par la direction du groupe.

et je n'ai fait que appuyer sur l'accélérateur, je Voilà.

Thomas (11:43)
je considère que le journalisme a vraiment été touché par la dématérialisation, les réseaux sociaux et aujourd'hui l'intelligence artificielle. Quand toi tu as quitté le monde, donc pense que ta dernière expérience en tant que CTO et avant de monter ton entreprise dont on va parler juste après, c'était quoi les challenges du... je ne sais pas si on peut dire du journalisme.

si c'est un bon terme, en tout cas des journaux.

Sacha (12:10)
Ouais, des journaux... Ouais, le challenge c'était vraiment de pivoter vers un modèle économique un peu plus pérenne. Le journalisme, c'est avant tout de la vente d'informations sous différentes formes. Papiers, syndications, partenariats, abonnements numériques. Et puis aussi, il a de la publicité, aussi bien sur papier que en ligne.

Et en fait, le modèle économique publicitaire d'un journal est en train de s'effondrer. Ça fait quelques années, de toute manière qu'il en déclin, il est en train de s'effondrer. C'est-à-dire qu'on ne pas compter que sur la publicité pour faire vivre une rédaction, ce n'est pas possible. Donc en fait, les journaux ont très vite mis un gros focus sur l'abonnement numérique, parce qu'on se disait que ce modèle économique est beaucoup plus pérenne. Du moment qu'on arrive à capter un lecteur, l'intérêt d'un lecteur est de le convertir en abonné.

c'est quelqu'un sur lequel vraiment on va pouvoir compter AdVita Méternum. Quand je suis arrivé au monde, il avait 170 000 abonnés numériques, je en surpartie, on avait 600 000. Et l'idée, c'est vraiment de créer un pilier économique qui soit le pilier économique de l'avenir pour le journalisme. Et puis c'est vachement plus intéressant d'ailleurs, parce que tu te dis, je vis un peu moins de la publicité, je compte beaucoup plus sur mes lecteurs pour me financer, sur des médiums qui sont alignés par rapport à l'usage de...

aujourd'hui, c'est à dire le web en fait, le numérique, et comme ça, ça me fait voir un avenir certain. Sauf que depuis, il l'IA qui est arrivé. Et là aujourd'hui, on a des jeunes, des très jeunes, qui pour s'informer parlent à Tchadjipiti avec leur téléphone. Et ça, change radicalement les choses, parce que Tchadjipiti, ça envoie pas du trafic vers des plateformes, ça envoie pas du trafic vers des sites médias par exemple. Donc là, c'est de nouveau une nouvelle révolution qu'il faut...

Pierre Vannier (13:59)
Ok, ok.

Sacha (14:04)
pour laquelle il faut s'emparer vraiment de réagir très très vite pour que le journalisme continue d'exister avec ces nouvelles plateformes. Et ce n'est pas une réponse simple.

Pierre Vannier (14:14)
après six ans de CTO au Groupe Le Monde, tu as décidé de te relancer parce que j'ai l'impression que tu as des expériences de salarié. Au fur et mesure, tu viens chercher ta petite piqûre d'entrepreneur de temps en temps. Tu viens relancer une startup dont tu vas nous parler qui s'appelle du coup EGIE.

deux œufs. déjà peut-être nous dire qu'est-ce qui t'a poussé à créer cette startup à ce moment-là peut-être. Et puis on va voir que cette startup elle a quand même une histoire un peu marrante. C'est que une startup tu la lances avec une idée mais au final c'est peut-être pas forcément ton idée initiale que tu vas développer et parce que je pense que vous êtes passé par pas mal de pivots. Donc première question déjà, pourquoi tu t'es lancé sur Edgee à ce moment-là et avec cette idée-là ?

Et puis ensuite, on rentrera un petit peu dans le vif du sujet, tout en annonçant aussi, en ayant un petit chapitre sur Serena, que tu connais, puisque ils sont investisseurs aussi dans ta société. Et on salue Juliette Ast, qu'on a eu dernièrement en tant qu'invité aussi.

Sacha (15:26)
Alors pourquoi j'ai décidé de revenir à l'entrepreneuriat ? Parce que je pense qu'en fait je suis un entrepreneur depuis toujours. J'étais déjà un entrepreneur dans la musique et que c'est un cycle qui me rattrape presque. Je ne pas de grande distinction entre le fait d'être salarié et le fait d'être entrepreneur, puisqu'en vérité, les moments où j'étais salarié, j'ai trouvé ça vraiment super et finalement je construisais des choses quasiment de la même façon que si j'étais entrepreneur.

Après six ans passé au groupe Le Monde, avoir appris énormément de choses, je pense que j'avais besoin d'un nouveau challenge. Cette carrière est pas mal, assez vertigineux même de se dire que je suis né dans les Alpes, que j'étais musicien et que je finis CTO du groupe Le Monde. Et en toute humilité, je me disais en fait, tu n'as rien gagné de tout ça, c'est super, fait tu as appris beaucoup, mais ce n'est pas pour autant que...

il faut croire que tu sais tout accomplir. Si vraiment tu veux savoir si tu es capable d'accomplir quelque chose de grand, l'entrepreneuriat c'est la plus grande démontagne à gravir. Donc ça me semblait évident que partir du monde c'était pour faire de l'entrepreneuriat. C'est une marque fantastique avec une aura internationale. Probablement j'aurais pu avoir la chance de travailler pour d'autres marques derrière et d'autres choses très alléchantes ou en tout cas des grandes marques.

mais je voulais retrouver le sel de l'entrepreneuriat. Je ne pas déçu du tout. C'est un sacré challenge et en effet, crois qu'on en est à notre cinquième pivot au bout de deux ans et demi.

Pierre Vannier (17:11)
Alors

du coup, qu'est-ce que vous voulez faire Edgee au début ? Et ensuite, comment ça s'est transformé peut-être ? Aujourd'hui, qu'est-ce que c'est aujourd'hui

Sacha (17:17)
Alors, je démarre par un truc qui est assez intéressant. Au plus on est senior dans la vie, au plus on pense qu'on a raison sur tout. Quand tu montes une boîte et que tu as la chance d'avoir un parcours comme le mien, et le parcours de mon associé aussi, Gilles Raymond, qui est un sale entrepreneur, qui a déjà revendu une boîte, etc., qui a fait plein de choses exceptionnelles dans sa vie, quand on pense avoir la bonne idée et qu'on trouve en des investisseurs pour miser sur nous et notre idée,

On se dit que cette idée est géniale, elle va marcher. En vérité, c'est un peu le danger quand on est senior, parce qu'on ne se remet pas en question suffisamment rapidement. Donc on était parti sur l'idée de travailler sur ce qu'on appelle la collecte de données. J'avais vu que les mécanismes de collecte de données, type Google Analytics, Amplitude, etc. ont un problème quand il s'agit de collecter de la donnée avec des ad-blockers, avec la régulation, à cause des problèmes de réperférences, etc.

on avait inventé une technologie qui permettait de supprimer ces problèmes-là. Donc ça marche très très bien, la technologie fonctionne très bien, mais le problème c'est qu'elle est complexe, elle est difficile à vendre, il fallait aligner autour de la table aussi bien des Chief Marketing Officer que des Chief Technical Officer que des Chief Data Officer, et donc ça devenait compliqué vraiment dans notre cycle produit de vendre cette solution même si elle était unique et qu'elle s'est collectée 100 % de la donnée. Donc on a essayé de pivoter vers des choses...

un petit peu plus tendance et porteuse. Et en l'occurrence, là notre dernier pivot qu'on a livré il a deux mois, là on commence à être vraiment convaincu que c'est le bon parce qu'on a une traction qui est quand même assez importante depuis deux mois. EGIS est une gateway d'agents, Agent Gateway. C'est un système que tu places devant Cloud Code, Codex, donc les outils de coding assistant. Donc tu places EGIS devant ces trucs là et ça te permet d'économiser des tokens.

Aujourd'hui, cette révolution qui est l'intelligence artificielle, le modèle économique de l'Internet a déjà changé. Il a 20 ans, tout était autour de la bande passante. C'était la période du web. Donc on achetait de la bande passante finalement et c'est comme ça qu'on existait sur le web. Ensuite, avec le cloud, tout a pivoté vers le computing. On achetait des puissances de calcul du computing distribués, plein de serveurs dans le monde entier, des DB distribués, etc.

et grâce à ça, en fait, on était présents sur Internet. Aujourd'hui, tout est en train de changer avec l'IA, on achète des tokens et c'est grâce à ça qu'on est présents sur Internet. Tout est à base de tokens. Et les tokens, c'est Anthropic, c'est OpenAI, bien évidemment, il y a un peu d'AWS et beaucoup de Google qui vendent également ces tokens. Ça coûte de plus en plus cher, on en est qu'au début de cette histoire-là et on a besoin de systèmes pour contrôler les coûts de ces tokens-là. C'est ce que fait Edgee en se mettant devant les Coding Assistants.

devant les agents en général. C'est pour ça qu'on appelle ça une agent gateway. Et comment on fait en sorte de faire des économies de tokens ? On a créé un système de compression qui permet que quand on envoie une requête pour récupérer ces tokens là, on envoie une requête à des modèles, on vient compresser la requête, on enlève ce qui est inutile dans la requête pour que le modèle ingère moins de mots. Et comme il ingère moins de mots, ça coûte moins cher.

et sa réponse est d'autant plus fiable. Voilà le mécanisme.

Thomas (20:46)
Est-ce que c'est... Alors moi j'entends beaucoup parler de ça en Amérique du Nord. Est-ce que ça pourrait se comparer, à ce qu'on appelle du magical prompting dans une certaine mesure. par exemple Adobe où en fait c'est souvent des designers qui vont aller utiliser les A. Mais c'est pas spécialement les personnes les plus à l'aise avec ce domaine là. Ils ont plein plein de choses à apprendre dedans. Et en fait ils vont prompter.

rend compte que les prompts ne pas du tout optimisés, non pas en termes de compression mais en termes de demandes et d'informations qui est désirée en tant que tel. Donc je parle pas de l'infrastructure en tant que tel mais c'est vraiment la demande et donc il y a des risques que l'output à la fin ne corresponde pas à ce qu'il désire puisque le prompt n'est pas cohérent, il n'y a pas de structure, on ne pas trop où ils vont mais en fait il a une sorte d'interface au milieu qui va regarder, donc bien sûr ça consomme des tokens et tout ça, je parle pas de la compression en tant que tel, je parle juste du besoin qui est de dire je lis le prompt,

en compte qui ne te répond pas à ce que les AI, on va prendre l'exemple de Claude ou de OpenAI, vont comprendre dont je le bonifie pour que ça soit plus cohérent. Est-ce qu'on est dans quelque chose de cet ordre là ?

Sacha (21:48)
Non, on n'est pas tout à fait dans ce ordre

là, on est plutôt dans le sens inverse. Et pourquoi ? Parce qu'en fait, moi je m'aperçois qu'aujourd'hui dans l'IA, la majeure partie de la consommation des tokens est effectuée par les développeurs. Ce sont les développeurs qui utilisent des Calling Assistants et qui consomment énormément de tokens. Et puis également, il a une partie en production où tu peux avoir des applications. Je ne pas, moi ça peut être un chat bot comme ça peut être tout autre chose. Maintenant, il y a tout un tas de solutions qui sortent, qui consomment que des tokens.

Ces agents consomment énormément de tokens. Là où on intervient, c'est dans cette consommation pour la réduire et la contrôler. Ce que tu cites aujourd'hui, c'est plutôt du prompt optimization où on va prendre quelque chose qui est assez court, pas très bien formaté et on va l'améliorer avant de l'envoyer au LLM. Ce processus-là consomme beaucoup de tokens.

Pierre Vannier (22:45)
Finalement vous, fonctionne avec des systèmes de cash, d'optimisation, de tokens qui sont doublés ou de dédoublonnage, de choses comme ça, de mécanismes vraiment plutôt assez bas niveau quelque part.

Dès que vous voyez passer quelque chose en double ou dès que vous voyez, je ne pas, vous avez probablement dans les API qui sont appelés pour appeler les LLM, il y a aussi tout un tas de tokens et de promptes administratifs ou logistiques ou de monitoring, etc. Donc finalement, votre truc, c'est d'un petit peu dépouiller un maximum tout ce qui sort pour réduire la facture.

réduire la facture. Vous voulez faire une espèce de cure d'amégrissement en fait à tout ce qui sort de ces coding agents quelque part.

Sacha (23:42)
Oui, c'est exactement ça. On vient nettoyer, the fly, quand on reçoit la requête, les éléments qui ne sont pas importants pour le modèle. Je te donne un exemple. Quand tu lances un coding assistant comme Cloud Code, que tu commences à itérer avec lui, tu lui dis, crée moi un site, change moi cette page, fabrique moi une base de données, etc. La conversation grandit. Dans cette conversation, il y a plein d'éléments qui peuvent être nettoyés. Par exemple,

quand l'agent demande à votre poste d'avoir accès à la liste des fichiers sur lequel il est en train de travailler. Cette liste de fichiers peut être très verbeuse, il y a plein d'éléments qui ne pas utiles. Donc ça, quand on voit passer cette liste de fichiers, on la nettoie et on la rend très simple. Voilà, ça c'est un exemple. Mais également, tu peux avoir tout un tas d'outils, des tools, qui sont disponibles pour ton modèle, que tu déclares automatiquement quand tu lances ton Coding Agent. Ces outils-là ne pas nécessairement tous utiles.

en vérité quand tu effectues ton travail.

Pierre Vannier (24:42)
Alors que tu

te balades dessus dans ton contexte, tu te balades avec tout ça aussi. C'est comme si tu partais pour une petite balade, sauf que tu prends tes crampons, ton piolet, ton sac à dos de 50 kilos et 40 kilos de vivres, alors qu'en fait tu pars trois heures.

Sacha (24:56)
C'est cool !

Exactement, c'est une très bonne image. Nous, est juste là avant que la balade démarre. dit attends, en fait, tu vas juste de ce point à un point B. On sait analyser que tu vas de ce point à un point B. Donc, tu n'as pas besoin de tes crampons enlève les, tu n'as pas du pioler, il n'y a pas de glace. Tu vois ce genre de choses là. Donc, on enlève tous les tools inutiles on the fly et si jamais tu en as besoin, on les remet. Puis après, il a un autre truc, c'est que la compression se fait à deux niveaux. Tu as l'input, donc ce que tu envoies au modèle et tu as l'output, ce que le modèle.

Pierre Vannier (25:12)
Hmm.

que tu reçois.

Sacha (25:29)
L'input c'est 99 % du volume de tokens consommés, 99 % de ce qu'on voit chez nos clients et on processe plus de 80 milliards de tokens par mois déjà donc ça commence à être pas mal. Donc 99 % du volume. L'output c'est seulement 1 % mais sauf que l'output coûte beaucoup plus cher que l'input. Et l'output on sait également influer sur le coût de l'output en mettant des mécanismes d'injection dans le prompt.

d'injection dans les instructions qui demandent au modèle de rester le moins verbeux possible. Donc il a des systèmes comme Caveman, c'est une solution open source qui est apparue il n'y a pas très longtemps, qui est très très populaire, qui permet exactement ça, qui demande au modèle de parler comme un homme des cavernes par exemple. C'est génial, tu vois, c'est le truc tout bête, c'est une injection prompte. Tu dis juste au modèle, attends, à chaque fois que tu vas me parler d'un truc,

Pierre Vannier (26:22)
Le nom est superbe, je trouve.

Sacha (26:27)
tu réponds comme un homme des cavernes donc forcément il n'y a pas de oui ok j'ai bien compris ce que tu voulais me dire ne t'inquiète pas je suis là pour toi tout ça dégage tu vois on n'en a pas besoin tu me réponds juste avec l'essentiel bien nous on a ce mécanisme là aussi qui vient de dire au modèle attend s'il plaît tu restes le plus le plus bref possible

Pierre Vannier (26:44)
en mode télégraphique quelque part en fait, transforme sa verbosité en quelque chose de beaucoup plus où tous les tokens et sont utiles en fait.

Sacha (26:53)
Exactement. Et donc au bout du compte on arrive à jusqu'à 40 % de coût gagné grâce à tous ces systèmes cumulés sur Edgee.

Thomas (27:02)
Et il y a plein de fugés là. Parce qu'on en parlait pendant le dernier épisode avec Pierre justement que en fait on contrôlait pas, justement les outputs coutaient de plus en plus cher aussi et qu'en fait on contrôlait pas du tout la sortie en tant que telle et maintenant de plus en plus on a, ça fait longtemps que ça existe, à la fin tu sais ils te proposent de nouvelles questions un peu pour que tu restes avec eux.

Pierre Vannier (27:24)
Le bon Darkpattern.

Bah oui.

Thomas (27:26)
Ouais voilà,

sauf que bas ça en fait indirectement tu le payes pas tout le temps mais en tant que tel quand tu consommes des tokens tu le

Pierre Vannier (27:32)
moi je me posais quand même la question de savoir aussi qu'est-ce qui empêchait les grosses boîtes justement OpenAI, Anthropic, etc. de fournir ce service.

ou ce service eux-mêmes en fait. C'est peut-être une question complètement idiote mais finalement l'idée c'est de se dire parce qu'aujourd'hui on tu sais on se dit à chaque fois qu'il une keynote, open AI ou Anthropic ou je sais pas quoi tu tu reilles tout un pan d'industrie et tu tues 50 startups et en fait je me posais la question de savoir votre service est-ce qu'il peut être

Alors j'ai un peu une partie de ma réponse, c'est que vous allez être agnostique au niveau des providers de LLM j'imagine. Donc ça, voudrait dire aussi que s'il a Cantropic ou OpenAI qui le fait, c'est plus gênant. Mais qu'est-ce qui les empêcherait de faire ça et de fournir ce service finalement ?

Sacha (28:22)
Aujourd'hui avec l'IA, rien n'empêche personne de construire quelque chose, ça c'est sûr. Mais quand on parle des laboratoires comme Anthropy, Kopenai, donc ces entreprises-là doivent vendre du token. D'accord. Donc au plus ils en vendent, mieux ils portent.

Pierre Vannier (28:36)
Oui, donc ce n'est pas dans leur intérêt de vendre aussi une solution d'optimisation.

Sacha (28:43)
Je dirais que c'est pas dans leur intérêt premier. Leur intérêt premier c'est de construire des modèles qui soient extrêmement efficaces et que les gens utilisent. Et après optimiser la consommation, et d'ailleurs la consommation électrique d'énergie, des GPU sur lesquels sont ces modèles là, en fait c'est un vrai sujet pour eux. Mais tu peux pas délivrer les batailles tout en même temps. Ne serait-ce qu'EnTropiq qui livre un super modèle, Opus par exemple,

prépare déjà le modèle suivant. OpenAI fait exactement la même chose au même moment. Google fait exactement la même chose au même moment. Donc c'est plutôt la course à qui va sortir le meilleur des modèles. Et nous, comme tu l'as dit, on est agnostique. On sait compresser que ce soit sur Cloud Code, que ce soit sur Codex, que ce soit sur Cursor, que ce soit sur plein de systèmes en fait. Et en fait, c'est notre spécialité. Donc à mon avis, il y a beaucoup plus de probabilités que notre technologie soit intégrée chez eux via du partenariat ou de l'achat de techno, peu importe, un jour.

qu'en fait ils se mettent à copier le système parce qu'en vérité nous on a du trafic, on a de l'avance sur cette question là et c'est pas si simple que ce qu'on pense.

Pierre Vannier (29:51)
et c'est

pas vraiment leur métier en fait. comprends ce que tu veux dire aussi et puis après si tu fournis un service à tes clients qui est finalement... T'as quand même un parti pris... Il y a un conflit d'intérêt énorme de mettre un système d'économie de tokens sur une boîte dont le business repose sur la vente de tokens quelque part. Donc c'est bien d'avoir un provider tierce pour éviter d'avoir ce genre de conflit un peu quelque part.

Sacha (30:18)
Et il y a aussi

un dernier pilier qui rend la chose un peu plus complexe pour eux, qui est le routing. On est une gateway, donc quand on reçoit un prompt, quand on reçoit une requête, bien sûr on sait l'envoyer naturellement là où elle devrait atterrir, logiquement. Vous êtes sur Cloud Code, elle doit atterrir sur Anthropic. Mais en vérité, si vous atteignez la limite d'usage, aussi Anthropic a un incident, ce qui arrive quasiment tous les jours, disons-le.

nous on s'est routé la requête vers un autre modèle. Que ce soit chez votre propre compte AWS ou Vertex, aussi sur du modèle Anthropique, mais que ce soit aussi sur des modèles qui sont alternatifs et open source. Je pense notamment à KimiK2, à GLM, à GEMA, des modèles qui sont de plus en plus performants, franchement semblables en termes d'efficience que ce qu'on peut avoir chez Anthropique.

Et ça en terme de gestion des coûts et maîtrise justement des coûts, c'est... oui, bah oui.

Pierre Vannier (31:20)
quelque part, c'est ça, on est

là dedans, dans une approche phinopses, d'économiser, d'avoir une approche de ne pas dépenser trop et d'avoir une vraie monitoring finalement de tout ce qui se passe dessous.

Sacha (31:34)
Exactement. pouvez avoir une centaine de développeurs qui aujourd'hui sont sur Cloud Code et qui vous coûtent X millions d'euros par mois parce qu'ils vont taper dans un modèle anthropique systématiquement. Et puis du jour au lendemain quand vous vous on a atteint la limite ce mois-ci, là on va pas dépenser plus, on les envoie vers du Kimi K2, ça fonctionne très bien, mais grâce à ça c'est Edgee qui peut nous aider.

Thomas (31:56)
J'aime bien le cas du router mais est-ce que tu considères plus que Edgee a un rôle de raffineur ou de contrôleur pour les promptes

Sacha (32:07)
Ooooo

Je sais pas, pas facile de répondre à ça. C'est un peu des deux en vrai.

Thomas (32:16)
Non mais justement

je voulais avoir ta vision puisque en fait tu peux contrôler les flux dans une certaine façon ou tu peux quand je dis raffineur c'est optimiser les flux bien sûr quand en vrai tu fais les deux en même temps mais la volonté de départ elle était indirecte de bas je voulais te poser la question avant de parler du routine mais pour moi un routeur est un contrôleur dans une certaine mesure elle fait des switches elle s'assure qu'on a un bon débit en tant que tel

Mais est-ce que c'était la volonté première où vous vouliez juste initialement raffiner le token et dire en fait vous n'allez pas, enfin pas les tokens, promptes et donc dire vous n'allez pas payer aussi cher. Et si tu veux je peux même aller sur une autre question au début c'est la volonté initiale de EJ est-ce que c'était de dire on ne paye pas actuellement le vrai prix de l'EI ou c'était une autre volonté ?

Sacha (33:05)
Le fait qu'on ne paye pas aujourd'hui le vrai prix de l'AI, c'est justement ce qui me fait créer ce système-là, parce qu'un jour l'autre on va vraiment payer le prix de l'AI. Et donc il nous faut des systèmes pour pouvoir contrôler, beaucoup mieux contrôler le prix de l'AI et le réduire systématiquement. Donc je trouve que ton analogie elle est bonne, contrôleur, raffineur, en fait dans notre cas d'usage ça va très très bien ensemble, c'est le même métier.

Et ça a beaucoup plus de valeur d'ailleurs d'avoir ces deux en même temps, c'est ce qu'on offre nous, que d'avoir simplement un contrôleur d'un côté et un raffinaire de l'autre.

Thomas (33:43)
Je suis obligé de parler protection des données en tant que telles, vous vous êtes complètement agnostique, c'est-à-dire que vous prenez le prompt à un instant T, vous le décortiquez tout de suite et vous oubliez cette information ou justement vous créez une sorte de... Si ça va dans les deux sens, ça peut être vu positivement, dénativement ou est-ce que vous aussi vous gardez cette information pour améliorer votre process à travers le temps puisque j'imagine qu'actuellement, en fait non, ça existe depuis deux ans, trois ans, vous devez vivre à toutes les évolutions de modèles qui existent en permanence

toutes les aussi je veux utiliser encore le terme raffinement mais je sais pas quoi utiliser les puisque des fonds en apparaissant je pense à clottes sonner 4.6 c'est pas plus qu'ils s'appellent toujours 4.6 qu'ils le mettent pas à jour en tant que tel il ya toujours des changements comment vous faites pour vivre dans le mois est un peu négatif mais positif pour vous dans cette incertitude permanente d'être toujours au courant et de proposer une solution optimisée pour vos clients tant le tel ouais c'est ça

Pierre Vannier (34:36)
Instabilité quelque part, instabilité

de la course effrénée des nouveaux modèles ou des modèles en permanence etc. Comment vous vous tenez à jour en fait ? Comment vous arrivez à vous maintenir dans la même course sur le même tapis roulant que tous les autres finalement ?

Sacha (34:53)
C'est pas simple, mais c'est du travail. Je ne vais vous dire combien d'heures je travaille par semaine et combien d'heures mon équipe par semaine, mais c'est considérable. On travaille énormément. Après, ça fait partie de notre mission et de notre métier.

Pierre Vannier (35:09)
Et tu parlais des data aussi, coup Thomas en fait, par rapport aux data qui transitent chez vous, parce qu'il a une question de confidentialité, de privacy qui est déjà quand même hautement un petit peu touchy, un petit peu chaude pour tout le monde en fait.

Sacha (35:11)
Ouais.

Merci de poser la question parce qu'en fait je devrais même le marteler systématiquement à chacune de mes prises de parole. On ne stocke pas les prompts. On ne les stocke pas. On les traite en mémoire quand on reçoit la requête et après en effet on les oublie complètement, ils ne sont pas stockés. Donc ce qui nous permet d'être compliant sur plein de niveaux. Et même si toutefois ça, ça n'est pas suffisant, on a aussi des mécanismes enterprise qui permettent que la Gateway soit installée sur les serveurs de nos clients.

et qui ne touchent pas du notre infra. En fait, a plein de systèmes pour pouvoir sécuriser vraiment le flux. Mais de base, quand tu actives Edgee, on ne stocke pas les prompt du tout, on les optimise simplement en defly, on route, on fait le routing, on ne garde que simplement les informations de consommation de tokens et de routage, et après c'est tout. Si tu veux qu'on stocke les prompt,

active le debug et là dans ce cas là tu as accès dans la plateforme d'Edgee à tout le détail de toutes tes promptes etc mais ça c'est parce que toi tu veux debuguer donc on est un peu obligé de les stocker mais on finira par les effacer bien sûr.

Pierre Vannier (36:25)
Ça pose quand même des questions par rapport aux différents épisodes qu'on a pu faire et aussi au fait qu'on voit de plus en plus notamment aux Etats-Unis l'émergence dans les entreprises qui utilisent beaucoup beaucoup d'éhailles. Donc principalement en tout cas une boîte par exemple comme Meta et d'autres boîtes sont aujourd'hui en train de mettre en place des systèmes de monitoring assez avancés notamment pour les développeurs mais pour tout le monde avec des métriques.

d'usage de l'IA, c'est à dire qu'en fin d'année lors de ton bilan annuel, il va falloir que tu montes pas de blanche et que tu as utilisé de l'IA, etc. Est-ce qu'un outil finalement comme le vôtre, il faudrait pas beaucoup pour en faire un outil qui sera complètement différent, mais finalement de monitoring et sur vraiment l'usage qu'en font les développeurs, comment ils les utilisent, quel est leur...

leur qualité ou leur expertise par rapport au prompt engineering, etc. Parce que finalement, c'est une grosse grosse boîte noire et vous vous situez, comme tu l'as dit, en getaway, donc vous voyez tout passer et vous pourriez avoir une analyse aussi sémantique et plus qualitative que quantitative sur tout ce que vous voyez passer quelque part.

Sacha (37:41)
Alors, c'est un sujet qui revient très souvent dans les discussions qu'on a avec les clients et les prospects.

Pierre Vannier (37:48)
C'est une demande peut-être, enfin en tout cas c'est une interrogation par rapport à ça.

Sacha (37:51)
Ça a été tellement une demande qu'on l'a fabriquée en fait. C'est bien de parler du coût de l'IA, mais c'est aussi bien de parler de la retournée par ce qu'on a dépensé en token. Et comment nous on arrive à connecter les deux points ? Donc on a sorti une offre qui s'appelle l'offre team qui permet justement d'unborder toute une équipe complète dans Edgee et de voir la consommation de chaque développeur en termes de token, etc. Et de relier cette consommation-là avec les pool requests, avec les repo GitHub, etc. Et au plus on avance.

on va aller dans un mécanisme d'observabilité de la valeur ajoutée des tokens de plus en plus importante, en tout cas dans la plateforme Edgee. D'ailleurs, si vous allez sur edgee.ai, vous allez voir que dans le menu, vous avez un onglet leaderboard, et dans le leaderboard, vous avez déjà les organisations qui sont connectées à Edgee, qui consomment du token, et vous verrez qui consomme quoi. C'est un peu comme les pages GitHub, voyez, où vous voyez... Voilà, exactement. Nous, c'est des petites briques violettes, mais c'est clairement inspiré de ce que fait GitHub.

Pierre Vannier (38:44)
Avec les petites briques vertes là.

Sacha (38:50)
Donc oui, je pense que c'est important de pouvoir publier en tant qu'entreprise, en tant que développeur combien de tokens tu consommes et surtout quelle valeur tu as en retour.

Thomas (39:01)
Est-ce que tu imagines qu'un jour Edgee soit vu comme une menace pour open AI, anthropique ou mistral, ce genre de choses ? Et qu'en fait il bloque un certain point. Non ?

Sacha (39:13)
Non,

je pose pas cette question là. La mission des G, ce n'est pas de consommer moins d'IA, c'est de consommer mieux de l'IA. C'est-à-dire quand tu commences à avoir des factures qui dépassent les 100 000 euros de tokens par mois alors que tu es une organisation qui fait 10 millions de chiffres d'affaires, tu as un vrai problème, on est d'accord ? Donc en fait, l'exercice et l'intérêt de tout...

Thomas (39:32)
Au revoir.

Pierre Vannier (39:36)
Ça, ça existe, excuse-moi. Mon

Sacha (39:38)
Bien sûr, ce sont des petites policies de clients ça.

Oui, mais parce que je pense que les entreprises ont compris que consommer des représentait une valeur considérable. On est dans ce monde-là en fait. Au plus on consomme de tokens, il a même le token maxing à San Francisco, tout le monde parle de ça, au plus tu consommes de tokens, au plus en gros tu démontres qu'en fait tu sais faire du business.

Pierre Vannier (40:04)
Mais est-ce que ça a un sens ça ?

Sacha (40:07)
Je pense que ça va finir par avoir un sens si on s'est connecté les points et qu'on se dit ok j'ai consommé tant de tokens mais en vérité voici tout ce que j'ai créé grâce à cette consommation de tokens et la valeur ajoutée que j'ai pu apporter.

Pierre Vannier (40:18)
Parce que finalement, qu'est-ce que tu pourrais dire vis-à-vis de quelqu'un qui consomme finalement très peu de tokens parce que la qualité de ses promptes ou la qualité du contexte, parce qu'on a beaucoup parlé la dernière de contexte d'engineering, mais finalement on parle toujours de ça.

c'est de remplir ton contexte avec un maximum d'informations, aux bons endroits, aux bons moments, avec les bons fichiers, etc. et d'éviter que ton contexte devienne tout pourri au fur et mesure de ton développement. Finalement, est-ce que quelqu'un qui ne consomme pas peu de tokens...

dans son usage en mode peut-être slow token ou low consumption token, est-ce que ce serait pas quelqu'un justement une espèce de vieux sage ou un Yoda du code qui à chaque prompt tu retires un mot au prompt qui veut plus rien dire et est une espèce de quintessence d'un prompt absolu par cette personne là.

Sacha (41:15)
Je ne pense pas que ce soit aussi binaire, malheureusement. En tout cas, le monde dans lequel on vit maintenant, pense que ce ne soit pas aussi simple que ça. Tu à l'époque, quand on commençait à regarder les profils GitHub, donc les pages GitHub des développeurs, on s'en servait beaucoup pour savoir si le gars était productif ou pas productif.

Pierre Vannier (41:31)
On

regardait juste les cases vertes en fait. Si tu as un maximum de cases vertes, t'étais un bon développeur.

Sacha (41:36)
⁓ t'étais pas nécessairement un bon développeur, mais en tout cas tu pouvais te dire que le mec est actif quoi. En tout cas, la personne a des contributions, fait des commis, fait des trucs. Aujourd'hui, tu dois te cette question là quand t'embauches des développeurs. Je pense que ce serait une erreur de ne pas se poser cette question là, clairement. Dans le monde dans lequel on vit, si un développeur n'utilise pas l'IA pour faire son travail, pour moi c'est un red flag. C'est pas normal. Parce que ça veut dire qu'on est complètement déconnecté.

de là où on va en fait. Le monde est en train de changer, les développeurs sont en train radicalement de devenir des nouvelles personnes, c'est un nouveau job quasiment, et donc il faut prendre cette vague là.

Pierre Vannier (42:21)
ou ne pas l'apprendre.

Sacha (42:24)
Si tu fais le choix de ne pas l'apprendre, veut dire que tu deviens un artisan du code quand tous les autres sont passés à un autre truc. Et c'est ton choix, tant mieux pour toi, mais il ne pas s'étonner si demain il a un patron qui te dit « moi j'ai besoin de quelqu'un qui avance 100 fois plus vite qu'un artisan du code, et donc pour ça il a que l'IA qui peut permettre de le faire. Donc je ne t'embrasse pas.

Pierre Vannier (42:42)
Et si tu

devais toi redémarrer ta carrière comme tu l'as fait pour réapprendre le code etc. aujourd'hui, première question c'est 1 est ce que tu le ferais, est que ça t'intéresserait vu la façon dont le métier évolue et 2 est ce que tu pourrais trouver ton premier job en fait en tant que junior avec aucune expérience ?

Sacha (43:00)
Je pense que oui, la question des juniors est sensible. Comment tu peux être un bon vibe codeur, on va l'appeler comme ça, quand tu n'as pas les bases des connaissances en programmation informatique ? En vérité, on se pose aujourd'hui cette question-là, mais dans six mois, on ne la posera plus. Je vois déjà tout un tas de gens qui commencent à utiliser Cloud Code et qui sont pas du tout des techniciens et pas du tout des développeurs. Ils font des choses incroyables.

Et d'ici 6 mois 1 an, fait, ce gap où on a vraiment besoin de comprendre l'architecture informatique, le code pour pouvoir construire des logiciels qui sont efficaces, scalable, etc. À mon avis, ce gap sera comblé par la puissance des modèles. Donc un junior, d'ici quelques mois, peut-être quelques années, n'aura pas nécessairement besoin d'avoir appris un langage informatique pour devenir un vrai vibe-coder. C'est ce que je...

Pierre Vannier (43:54)
Parce

que de toute façon, par définition, ça sera déjà plus un informaticien.

Sacha (43:58)
Exactement. Ce sera quelqu'un d'autre, c'est un nouveau métier qui est en train de se créer.

Pierre Vannier (44:02)
Mais du coup, cette part de créativité que toi qui t'as fait quand même venir aussi à ce métier là, est ce que tu penses pas que petit à petit on a tendance à l'éroder ou à l'effacer quelque part ? Avec une transformation de type machine-outil où finalement le développeur qui était quand même sur un travail un peu artisanal se retrouve aujourd'hui un peu superviseur ou dompteur d'IA et puis peut-être plus tard simplement validateur en cliquant sur des boutons toute la journée pendant qu'il attend que ces promptes qui se terminent.

Sacha (44:31)
Je comprends que ça puisse faire peur ou que ce soit quelque chose que certains considèrent comme regrettable. Cela dit, le monde avance dans sens-là. Je sais d'ailleurs que, entre Pierre et moi, on n'a pas tout à fait le même avis là-dessus. Aujourd'hui, écoute, moi j'écris quasiment plus une ligne de code. Je n'ai jamais été autant productif de ma vie. Jamais.

Pierre Vannier (44:49)
Mais c'est bien, c'est ça qui est intéressant.

Sacha (44:58)
franchement c'est pas 10 fois, c'est peut-être proche de 100 fois mon niveau de productivité aujourd'hui. Je pense que ce que l'IA emmène sur la partie technologique, c'est qu'elle rend la technologie accessible à tout un tas d'individus qui jusqu'alors ne pouvaient pas prétendre à devenir techniciens. On le voit également dans la musique d'ailleurs, je parler de la musique, mais on voit sur les plateformes, Spotify, etc. tout un tas de morceaux apparaître.

Qui sont produites par des IA, on ne le sait même pas et on les adore ces morceaux-là. Donc ça veut dire que les pauvres petits artistes qui écrivent leurs chansons encore, qui vont en studio pour enregistrer leur album, sont en compétition avec des systèmes qui sont bien plus forts qu'eux en vérité. Alors on peut le regretter. N'empêche que le gars qui a créé le morceau avec l'IA et qui fait un tube, qui est écouté par des milliers et des milliers de personnes, il y a trois ans il n'était pas capable de le faire. Aujourd'hui il sait le faire.

Comme aujourd'hui, il sait peut-être fabriquer une image incroyable qui va faire le tour du monde parce que je sais pas, elle va avoir un impact particulier. Aujourd'hui, il est peut-être capable de développer quelque chose qui va avoir un succès considérable parce que justement avant il était pas capable de le faire. Ça aligne un peu les compétences. Moi je trouve pas ça nécessairement négatif. En revanche, en revanche se pose la question de quelle place on garde et on laisse à l'artisanat. Et je pense que cette place là elle...

Pierre Vannier (46:24)
Est-ce qu'on en veut encore en fait quelque part aussi ? C'est ça la question, parce qu'aujourd'hui dans un monde de technocapitalistes assez avancé, l'artisanat, on parle plus aujourd'hui de créer des outils du consommable quelque part. Et l'outil en tant que outil de l'artisan se perd de plus en plus. Son métier aussi.

Sacha (46:44)
Oui, tout à fait. Mais je pense que les artisans continueront d'exister et notamment dans des endroits où on a besoin de quelque chose qui est extrêmement problématique, extrêmement complexe. D'ailleurs, on parle de l'IA en vrai, parce que pour construire des systèmes agentiques, a ça commence. T'as toujours besoin de l'humain pour pouvoir entraîner des modèles. Mais bon, ce qui sûr, c'est que tout est en train de changer. On ne peut pas y faire grand chose.

Pierre Vannier (47:15)
Thomas, tu voulais peut-être switcher sur un sujet

Thomas (47:19)
Mais Pierre, obligé de te le dire. C'est comme si à un moment, tu avais un dessinateur il y a 300 ans et qu'ensuite la photo est arrivée et que les gens qui prenaient des photos et des appareils photo, les dessinateurs disaient, mais vous nous remplacez. C'est juste pas la même chose. Ça reste des images du créatif et c'est pas la même chose. Derrière toi, tu as des milliers de livres. Tu peux pas me garantir. Mets ton livre derrière toi.

Pierre Vannier (47:36)
Ça n'a jamais été la même chose. n'a jamais été la même chose. Je m'inscris

en faux par rapport au photo. Tu pourras lire un livre sur la photo. La photo, c'est de l'analogique. C'est une reproduction très fidèle de la réalité par une impression sur une plaque de argentique. Donc, ça n'a rien à voir avec une transformation vers une production uniquement machinique, numérique. L'appareil photo est analogique. Pardon ?

Thomas (47:42)
Mais c'est la même chose.

Ben là tu me parles du PSVD.

Mais après tu peux tu peux dupliquer ta photo. Tu peux dupliquer ta

photo. Tu peux pas dupliquer ton dessin en tant que tel.

Pierre Vannier (48:04)
Mais c'est pour ça qu'en fait, entre le dessin et la photo, tu auras des choses qui sont différentes et tu des valeurs qui sont différentes aussi. Mais le dessinateur comme le photographe sont des artisans. L'un n'a pas tué l'autre.

Thomas (48:10)
Et c'est la même chose pour le code, c'est la même chose pour tout. Mais derrière toi, tu as des livres.

Mais derrière toi, tu as des livres. Tu ne pas me garantir qu'un livre qui fait 300 pages est forcément mieux qu'un livre qui fait 100 pages. Analogie auto-chain aussi. C'est toute la même chose. Quand tu parles du match prompting, de la sachasse par exemple, c'est où on est en train de comparer des choses qui ne juste pas comparables. la philosophie qu'il derrière. Aujourd'hui, on vit dans un monde qui est basé sur les Excel où l'objectif, c'est d'être quantitatif. La base, elle part de là.

on ne plus en avant le qualitatif. revient aussi au point du dessin vis-à-vis de la photo, ça revient au point de l'artisanat vis-à-vis de l'usine en tant que telle, c'est-à-dire production en masse, mais ça n'enlève rien que tu as beau. pense que Sacha, je te pose la question différemment. Aujourd'hui, tu ne plus de musique, je pense que c'est toujours un plaisir pour toi, des fois, de prendre une guitare ou faire des morceaux de piano, par exemple. Mais puisque ça fait partie de ton plaisir créatif à toi. Sans le gain financier derrière.

Pierre Vannier (49:06)
Parce que c'est de l'art.

Thomas (49:07)
son art.

Sacha (49:09)
Oui, après, je ne pas si tu ne pas considérer que tu peux faire aussi de l'art avec de l'IA. En tout cas, ce qui est sûr, c'est que la période dans laquelle on vit impose un changement qui est beaucoup plus important que toutes les révolutions industrielles qu'on a vécues jusqu'alors.

Pierre Vannier (49:27)
Ça on est d'accord là-dessus.

Sacha (49:28)
la tectonique derrière est considérablement différente.

Pierre Vannier (49:32)
Et d'ailleurs

moi je m'élève en faux sur les gens qui pensent que ce sont uniquement des outils. Ce sont des systèmes dans lesquels on s'hybride en fait. L'homme et la machine s'hybrident. Donc c'est beaucoup plus puissant qu'un outil. Un outil marteau tu t'hybrides pas dans un marteau et le marteau s'hybride pas dans toi. Ça reste un outil que tu prends pour lequel tu tu tu tu tu tu martel un clou et ça rentre. C'est pas un système.

un assemblage homme-machine qui évolue et qui en plus en feedback s'auto-nourrit parce que l'homme nourrit le modèle et le modèle nourrit la conscience de l'homme aussi. Moi j'ai vu des gens qui commencent à discuter avec les mêmes artefacts que Claude quand il parle. Donc je vois commencer à arriver des tics de langage qui sont issus de gens qui mimiquent et qui font de la mimétique par rapport aux outputs des modèles qu'ils ont. Donc t'as une double feedback en fait.

sur l'homme et sur le LLM. C'est pour ça que c'est plus des hybridations et des systèmes complexes que des outils et des simples outils à mon sens.

Sacha (50:29)
Tout à fait Pierre, je suis tout à fait d'accord avec toi, n'hésite pas si tu as d'autres questions.

Thomas (50:35)
Mais je vais rebondir sur ça par rapport à justement, j'en avais parlé aussi dans le suivi des modèles. Aujourd'hui, est-ce que tu es capable de nous dire à peu près le temps que vous passiez dans l'entreprise en tant que tel sur améliorer la solution Edgee d'un point de vue ?

donc LLM en tant que tel, combien de temps ça vous prend le suivi des améliorations technologiques de la part des modèles provider, par exemple Anthropic, OpenAI et ce genre de choses, et en fait l'amélioration en termes d'infra. J'imagine qu'il a plein d'autres pans dans ton entreprise, mais Slow, y a un temps dédié sur tous les lundis, faut qu'on suive absolument ce qui se passe dans les modèles, il faut qu'on les reteste et ce genre de choses.

Sacha (51:18)
Non, il a pas de temps dédié. tout cas, on n'en est pas à ce stade-là, très sincèrement. La vie du start-up, tu sais, elle est quand même fortement guidée par ce que t'indiques ton marché, les clients avec qui tu signes, avec qui tu signes pas, les feedbacks que tu as des utilisateurs qui sont contents et mécontents. Donc, c'est beaucoup plus simple que ça, en vrai. On a un truc qui arrive sur la table, on le traite.

et on gère les urgences au fur et mesure qu'elles arrivent. Quand il a un nouveau modèle qui apparaît, exemple, ce n'est pas très compliqué de rajouter un modèle chez nous, ça prend 3 minutes, le modèle était rajouté dans notre plateforme, ce pas très compliqué. En revanche, l'impact potentiel de ce modèle, le drift potentiel sur notre technologie, il existe et donc là, ça va prendre peut-être un jour ou deux pour essayer de comprendre si jamais il a vraiment quelque chose à corriger de notre côté. Là, tu vois, on a intégré KimiK2 comme modèle de routing

il y a des trucs qui fonctionnent pas donc il faut qu'on y terre dessus, ça peut prendre une semaine tu vois. Mais c'est important parce qu'en l'occurrence là on a un client qui nous demande donc en fait c'est notre focus là du moment et la semaine prochaine ce sera autre chose ce sera intégrer copilot, plein de trucs.

Pierre Vannier (52:32)
Et vous êtes combien dans la boîte au dev ou à la tech dans ta startup ? Et finalement la question derrière c'est si tu avais dû monter ce type de boîte pré LLM ou pré IA, combien il t'aurait fallu de gens en fait ? J'imagine que vous êtes évidemment tout le monde est augmenté et dopé à l'IA, c'est forcé, tout le monde va e-code etc. Est-ce que du coup ça a permis en fait d'atteindre une vélocité beaucoup plus importante d'avoir une

Petite équipe réduite mais avec tout le monde qui est ultra-dopé à l'IA.

Sacha (53:06)
Oui, tout à fait. On est 8 aujourd'hui. 7 sur les 8 sont des profils techniques. Plus précisément, a un chercheur, a 4 ingénieurs, a une PM qui a un profil technique. Donc il a moi, je continue quand même de faire du code de toute manière. Et mon associé qui, pour le coup, est le seul à ne pas avoir de profil technique, mais c'est pas pour autant qu'il n'utilise pas Claude Code tous les jours.

Pierre Vannier (53:32)
Pour tout le reste

en fait, tout ce qui n'est pas technique.

Sacha (53:34)
Non mais même pour des sujets techniques, par exemple il a codé notre CRM via Cloud Code. En fait, typiquement, voilà, c'est une très très bonne illustration de comment tu...

Pierre Vannier (53:44)
L'exemple du CRM, bien sûr, on en avait parlé.

Sacha (53:46)
Ouais ouais. Et comment tu peux utiliser les A pour au lieu d'être 50, être 8 et faire fonctionner une boîte comme si t'es 50. Et si demain on devait squeler, beaucoup plus que cela, je suis pas sûr que ce soit nécessaire d'embaucher 50 personnes. Je pense que déjà 10 de plus ce serait considérable. À voir, Mais bon, en tout cas, c'est un peu... Je trouve que c'est un peu le monde dans lequel on vit, quoi.

Pierre Vannier (54:10)
Ça permet de faire beaucoup plus avec beaucoup moins aujourd'hui.

Sacha (54:12)
Ce qui d'ailleurs

pose plein de problèmes au niveau du marché parce qu'il a plein de développeurs qui sont en train d'essayer de trouver du travail aujourd'hui et qui n'en trouvent pas malheureusement.

Thomas (54:21)
au réveil moi je regarde les réseaux sociaux, c'est encore mon petit défaut à mon âge et je suis tombé sur une vidéo, alors attention il faut voir les vidéos, ce pas des petits chats qui chantent, mais c'est Arthur Mensch de Mistral qui a dit, alors je ne pas sa date de temps, mais qui disait que ses développeurs n'utilisaient que de l'AI maintenant pour coder et justement ça reprend un peu tout votre débat que vous avez eu où en fait ils se occupent plus de faire du code l'artisanat.

Pierre Vannier (54:26)
Bah bravo.

Thomas (54:48)
artisanat du code. Est-ce que pour vous dans une entreprise que vous êtes en train de monter actuellement Sacha, vous utilisez aussi uniquement des outils de code ? C'est une question qui m'intéresse profondément, vous utilisez uniquement des outils de code ou vous faites encore un peu d'artisanat, il a des choses où vous avez peur que le code, je prends le code mais on pourrait dire codex ou peu importe les noms, sachent des choses sur votre entreprise ou vous êtes en paix avec ça ?

Sacha (55:14)
Non, on est assez en paix avec ça, notamment parce qu'on maîtrise, on dog-food énormément. Donc, en fait, on utilise Edgee pour faire tout ce qu'on Et donc, c'est très facile pour nous d'envoyer les systèmes un peu sensibles, les proms sensibles ou les tâches sensibles vers des modèles qui sont privés, hébergés sur nos propres serveurs ou hébergés sur notre propre compte AWS, Google, peu importe. C'est comme ça qu'on voit le truc.

C'est en ça qu'on arrive à créer un produit qui a de la valeur pour les clients dont la question de la privacy et de la security sont très importantes.

Thomas (55:39)
Ok.

Ça veut dire que vous êtes conçu au moment où vous envoyez... J'extrapole peut-être un peu mais quand vous faites le prompt il y a des choses qui sont sensibles, ça doit pas aller sur ce genre d'outils. Cloud, codex et tout ça, il a des choses où vous vous en foutez, l'objectif c'est juste de... Les termes sont pas bons, je sais pas... Ouais, de chipper, de cracher du code qui va vous permettre de répondre à une feature bien précise où il a pas d'enjeux de data, d'informations personnelles et tout ça, c'est ça ? Hyper intéressant.

Pierre Vannier (56:02)
de chipper.

Sacha (56:12)
Exactement. exemple,

on refait la home page du site et quelques éléments graphiques. On s'en fiche de savoir si on utilise le modèle anthropique, ça va très bien. n'y a pas de données sensibles qui transigent. Il n'y a pas de données personnelles, a pas les comptes des utilisateurs. C'est juste de l'Ui. On envoie, avance et puis il a pas de soucis.

Thomas (56:22)
Tout à fait.

Pierre Vannier (56:30)
Et est-ce que votre système, juste je pensais à ça, est-ce que votre système permet d'imaginer en fonction de la complexité des tokens et des prompts qui arrivent, de router automatiquement ou de proposer sur des modèles plus petits ou des modèles open source etc. ou pas pour l'instant ou est-ce que c'est dans vos cartons ?

Sacha (56:50)
Alors en fait c'était dans les cartons en début d'année et on l'a tombé. Je te dire pourquoi, parce qu'en fait on fait beaucoup beaucoup de discoveries, prend énormément de feedback des utilisateurs, on pose des questions aussi à des prospects et à des utilisateurs pour savoir où est-ce qu'on met nos priorités. Au départ on s'était dit, router vers le modèle le moins cher, le plus intelligent, le plus équivalent, etc. peut être vraiment une super feature. En vérité, le choix du modèle aujourd'hui est encore un sujet d'adhésion.

Pierre Vannier (56:53)
Ok.

Sacha (57:21)
Donc tu as la majorité des développeurs, on va dire au moins 90%, qui décident d'utiliser les modèles d'Anthropic et qui veulent surtout pas utiliser d'autres modèles. Et quand on a notamment sorti la fonctionnalité de fallback ou de routing, tu sur Cloud Code, tu veux envoyer la requête sur autre chose qu'Anthropic, en fait le choix des modèles qu'on laisse, il est guidé par la volonté des clients à avoir tel ou tel modèle. On se dit pas ok, il a pléthore de systèmes et où on va les rouler automatiquement. Non, en fait, ils doivent adhérer

Pierre Vannier (57:27)
Ok.

Sacha (57:49)
l'efficacité d'un modèle ou la potentielle efficacité d'un modèle ils disent ok je vais utiliser KimiK2 parce que je sais que dans les benchmarks il est bon et j'adhère à leur concept ou alors j'utilise GLM parce que j'aime bien ZDI et donc du coup voilà je c'est presque une adhésion tu vois c'est ok j'aime ce modèle

Pierre Vannier (58:05)
Ils ont

leurs habitudes quelque part en fait finalement, ils veulent pas sortir de ça quoi.

Sacha (58:10)
En plus, y a un truc qui assez... Et c'est là où je rejoins ce que tu Pierre tout à l'heure, c'est-à-dire qu'il a une espèce d'entremêlement entre ce que l'humain peut ressentir et ce que le modèle sait te faire ressentir. Il y en a plein qui me disent, ben voilà, j'ai activé la compression, mais j'ai l'impression que le modèle est plus rapide. Tu peux peut-être le ressentir, ça me fait plaisir, mais en vérité, ça va pas. C'est en romantique, tu vois, tu ressens que le modèle réagit, tu te rends compte de ce qu'il est en train de dire.

Pierre Vannier (58:33)
ça vient pas de nous. Ouais, c'est ça.

Sacha (58:40)
c'est derrière, de la statistique tu vois. Et donc il y en a certains qui vont se dire le modèle de Z de AI il est tout aussi peint formant que le modèle d'anthropique opus. Ouais tu peux le considérer si tu veux, les benchmarks vont dire peut-être vont le prouver ou l'inverse.

Pierre Vannier (58:55)
C'est encore un peu beaucoup de doigts mouillés en fait, quelque part tout ça, parce qu'il des effets boîte noire, parce que c'est des systèmes non déterministes, parce que on ne pas s'ils ont allumé la bonne instance sur le bon data center, etc. Ou il a trop d'américains qui sont réveillés et qui vibe code au même moment. Enfin, il y a plein plein plein de conditions. Ecoute, super Sacha, va traditionnellement, la précédente invitée était Juliette Ast.

Sacha (59:13)
Et c'est tout !

Pierre Vannier (59:22)
et qui te pose une question. Du coup, elle ne savait pas que c'était toi. elle ne savait pas qui serait le prochain invité, mais elle nous a posé la question suivante. Quelle est l'entreprise que tu souhaiterais créer demain ? Donc, ça, c'est la question de Juliette. Et puis, je vais te laisser ensuite poser toi-même la question au prochain invité dont tu ne connais pas non plus. Tu ne sais pas qui ce sera.

Sacha (59:44)
Alors, quelle entreprise je souhaiterais créer demain ? Après Edgee, si tout le fois je devais créer une nouvelle entreprise, comprends. question venant de mon investisseur, c'est assez intéressant de répondre, pourquoi pas. Merci Juliette pour la question. Après, quand on est entrepreneur, cerveau fourmi dit...

Pierre Vannier (1:00:01)
Elle

t'en demande en fait quel est ton next step.

Sacha (1:00:04)
Ouais,

mon cerveau fourmille toujours d'idées. pense qu'il y a toujours un truc. Et comme j'ai pas peur d'apprendre, si tu veux, je peux avoir la folie de penser que je serais capable demain de développer une technologie de fusion nucléaire, exemple, quelque chose qui m'intéresse énormément. Et je pense que c'est vraiment l'avenir ou d'interface cerveau machine, par exemple, ou de robotique. Je pense que ces trois sujets là sont vraiment les sujets d'avenir. Fusion nucléaire, parce qu'on parle de token.

Pierre Vannier (1:00:33)
Parce qu'on va

avoir besoin de beaucoup beaucoup beaucoup beaucoup d'énergie évidemment.

Sacha (1:00:34)
⁓ yeah !

L'énergie est au centre de tout et donc la personne qui est capable de pouvoir créer des mini-centrales nucléaires de fusion, je pense qu'elle a beaucoup d'avenir devant elle. D'ailleurs, il plein de startups qui font des choses super là-dessus. Interfaces servomachines, c'est déjà en cours, mais je pense que c'est aussi l'avenir. Et la robotique, évidemment, ça va devenir le truc.

Pierre Vannier (1:01:00)
Et du coup, quelle est toi ta question pour le prochain invité ?

Sacha (1:01:04)
Alors moi j'aimerais poser la question suivante, quelle est la conviction sur l'IA que tu défendais il y a un an et que tu as complètement changé depuis

Pierre Vannier (1:01:15)
intéressant, très très intéressante question et je pense qu'il a beaucoup de gens qui seraient capables d'y répondre puisque de façon ça vient tellement choquer et entrechoquer et chambouler nos existences que ça vient aussi se bouger des convictions ou des préjugés ou des opinions qu'on avait il y a un an et qui ont changé effectivement au fur et mesure de ces déferlements.

Super moment avec toi Sacha. Merci beaucoup d'avoir été avec nous. Et plein de bonnes choses pour Edgee, qui a de toute façon fait le lever de fond, qui a de plus en plus de clients. étais la semaine dernière encore aux États-Unis, à San Francisco, à droite, à gauche. Donc ça fait aussi du bien d'avoir une belle boîte française par un entrepreneur comme toi qui se lance, qui se relance dans l'entrepreneuriat. Mais ce ne pas la dernière.

Merci beaucoup Sacha, merci Thomas. À bientôt !

Thomas (1:02:17)
Merci à vous.

Sacha (1:02:19)
Merci.

IA pas que la Data - Reprendre le contrôle sur tout ce qui se dit autour de l’intelligence artificielle

Plus d'épisodes

Chapitres

Créateurs et invités

Qu'est-ce que IA pas que la Data - Reprendre le contrôle sur tout ce qui se dit autour de l’intelligence artificielle ?