Insights

Leçons d'IA en production.

Notes terrain sur les agents vocaux, RAG, systèmes autonomes, et les arbitrages qui comptent quand l'IA rencontre la production.

Agents·15 juin 2026

La semaine où un gouvernement a coupé le meilleur modèle d'Anthropic

Fable 5 suspendu par décret américain le 12 juin, deux modèles legacy retirés le 15, et le SDK livre le fallback pour tous les triggers. La semaine a posé le risque et la réponse en même temps. Voici comment durcir votre stack.

7 min de lecture

Agents·8 juin 2026

Le middleware du SDK Anthropic : arrêtez d'écrire vos propres wrappers d'observabilité

Le SDK Anthropic livre une API middleware native, le SDK agent enchaîne 10 releases en 7 jours, et Nuxt 4.4.7 est un correctif de sécurité. Les revues de dépendances trimestrielles sont devenues trop lentes pour l'AI en production.

7 min de lecture

Agents·1 juin 2026

Opus 4.8 et Dynamic Workflows : Claude Code vient de se doter d'une couche d'orchestration

Claude Code v2.1.154 a livré Opus 4.8 avec les dynamic workflows — orchestration multi-agents en arrière-plan. Voici ce qui a réellement changé et ce que ça implique pour les équipes qui construisent des agents.

6 min de lecture

Agents·25 mai 2026

La semaine où Anthropic a pris le contrôle de la pile complète

Project Glasswing en bêta publique, acquisition de Stainless, sept releases SDK en quatre jours. La question n'est plus 'quel modèle' — c'est 'quelle plateforme'.

7 min de lecture

Agents·18 mai 2026

Six releases en onze jours : ce que le sprint pré-I/O de Google annonce

@google/genai a livré les API Agent et Environment aujourd'hui — à quelques jours de Google I/O. La cadence du SDK vous dit ce qui arrive avant le keynote.

6 min de lecture

Agents·16 mai 2026

L'infrastructure agent se durcit — Ce qu'il faut posséder, ce qu'il faut déléguer

Le Claude Agent SDK est passé en 0.3.x, Remote Agents est en production, le SDK Gemini a livré quatre versions en huit jours. La couche infrastructure agent est en mouvement.

6 min de lecture

Leçons·10 mai 2026

Construire des pipelines de worldbuilding IA : 4 romans, 4 albums, 7 champions

La plupart des agences IA construisent des produits. Nous construisons des mondes : Codemachia, 4 romans publiés, 4 albums, 7 champions, bilingue EN/FR.

14 min de lecture

Plateformes·9 mai 2026

Choisir son LLM en 2026 — Claude, Gemini, Mistral, OpenAI par cas d'usage

Ne choisissez pas sur les benchmarks. Choisissez par cas d'usage. Voici l'arbre de décision que nous appliquons à chaque nouveau produit IA, avec le modèle que nous livrons réellement pour chaque tâche.

12 min de lecture

Agents·9 mai 2026

Tool calling forcé — Comment tuer la phrase à-peu-près-juste dans les chatbots en production

Le mode de défaillance qui fait tomber la plupart des agents conversationnels en production n'est pas l'hallucination — c'est la phrase qui sonne juste et qui est presque correcte. Voici l'architecture qui règle le problème.

11 min de lecture

Leçons·9 mai 2026

Un pipeline d'éval LLM en 2 jours, pas en 2 semaines

La plupart des équipes livrent leurs features IA sans éval et tirent à pile ou face à chaque PR. Un jeu d'éval bien construit prend deux jours et rapporte indéfiniment — voici la version minimale viable.

11 min de lecture

Plateformes·9 mai 2026

Multi-tenancy en SaaS IA — Isolation des orgs, quotas et facturation

La plupart des SaaS ratent le multi-tenant. Les patterns qui tiennent : isolation des orgs, quotas, RBAC, et quand migrer vers schema-per-tenant.

12 min de lecture

Plateformes·9 mai 2026

Prompt Caching avec Claude — Ce que `cache_control: ephemeral` économise vraiment

Le prompt caching d'Anthropic peut réduire votre facture de 80–95% sur les bonnes formes. Mal ordonnez vos blocs, et il ne fait rien du tout. Les patterns, les pièges et les chiffres de production.

10 min de lecture

IA vocale·22 avr. 2026

ElevenLabs vs Vapi vs Retell — Comparatif des plateformes voix IA en 2026

Comparaison détaillée des trois principales plateformes voix IA en 2026 — latence, langues, tarifs, intégrations, et ce que nous déployons en production chez Ikki.

9 min de lecture

RAG·8 avr. 2026

RAG vs Agentique — Comment choisir, et comment livrer du RAG quand c'est le bon choix (2026)

La plupart des équipes font du RAG par réflexe. La plupart n'en ont pas besoin. Comment décider, et comment bien livrer quand c'est le bon choix.

12 min de lecture

IA vocale·25 mars 2026

Coût d'un agent vocal IA : combien ça coûte vraiment en 2026 ?

Chiffres réels de projets voice AI livrés en production : coût de build, coût mensuel de run, dépenses cachées, et comment éviter les pièges classiques.

8 min de lecture

Leçons·12 mars 2026

Ce qu'on a appris en livrant des produits IA

Ce qu'on a appris en livrant des agents vocaux, plateformes RAG, moteurs fintech et IA civic — les patterns qui tiennent, ceux qui cassent, et ce que personne ne dit.

11 min de lecture

Plateformes·12 févr. 2026

Pourquoi nous avons choisi Nuxt 4 pour nos produits IA en 2026

Après avoir mis des produits IA en production, voici l'architecture sur laquelle nous avons convergé — Nuxt 4 + Fastify + MongoDB — et pourquoi elle devance Next.js, Astro et SvelteKit pour notre cas d'usage.

9 min de lecture

SHIP LOG

SHIP-0247·CODEMACHIA·v1.4.2—DEPLOYED 2026-06-18 14:22 UTC