Blog & Actualités

Insights & Actualités Tech

Découvrez nos derniers articles sur le développement web, le design et les technologies digitales qui façonnent l'avenir

Recherche pour : "benchmarks"
Effacer les filtres
Glasswing - L'IA d'Anthropic qui déniche des milliers de zero-days

Glasswing - L'IA d'Anthropic qui déniche des milliers de zero-days

Anthropic vient de lâcher une bombe ! Le labo derrière Claude a dévoilé le Projet Glasswing , une initiative de cybersécurité qui embarque un nouveau modèle, Claude Mythos, tellement efficace pour trouver des failles qu'ils ont décidé de ne pas le rendre public. En gros, l'IA est devenue meilleure...

Qwen3.6-Plus : nouveau fer de lance d’Alibaba dans les IA qui codent

Alibaba lance une nouvelle version de son LLM qui met l’accent sur le codage. Des benchmarks mettent Qwen3.6-Plus devant ses concurrents chinois et au coude à coude avec les modèles haut de gamme Opus 4.5 d’Anthropic et Gemini 3 Pro de Google.

MemPalace - Quand Milla Jovovich code de l'IA open source

MemPalace - Quand Milla Jovovich code de l'IA open source

Milla Jovovich a un compte GitHub !! Oui, l'actrice des films Resident Evil, celle qui découpe des zombies depuis 2002 et qui a également incarné Leeloo dans un film qui est cher à mon cœur a mis en ligne son premier repo. Ça s'appelle MemPalace , et c'est un système de mémoire pour IA, qui vient...

Apfel - Le LLM caché de votre Mac enfin libéré

Apfel - Le LLM caché de votre Mac enfin libéré

J'sais pas si vous saviez mais Apple a planqué un LLM dans votre Mac et ne veut pas que vous y touchiez... enfin, pas directement. En effet, leur modèle est là, intégré au système via le framework FoundationModels, il tourne sur le Neural Engine sans connexion internet mais Apple l'a verrouillé...

TurboQuant - Un LLM de 104B sur un MacBook, merci Google

TurboQuant - Un LLM de 104B sur un MacBook, merci Google

Vous faites tourner des LLMs en local comme le gros fifou de Hipster IA que vous êtes et, Ô drame, la VRAM de votre ordinateur explose dès que le contexte dépasse 8000 pauvres malheureux tokens ? Le problème c'est le KV cache les amis ! Le KV cache c'est ce truc qui stocke les clés et valeurs...

The Download: gig workers training humanoids, and better AI benchmarks

The Download: gig workers training humanoids, and better AI benchmarks

This is today’s edition of The Download, our weekday newsletter that provides a daily dose of what’s going on in the world of technology. The gig workers who are training humanoid robots at home  When Zeus, a medical student in Nigeria, returns to his apartment from a long day at...

AI benchmarks are broken. Here’s what we need instead.

For decades, artificial intelligence has been evaluated through the question of whether machines outperform humans. From chess to advanced math, from coding to essay writing, the performance of AI models and applications is tested against that of individual humans completing tasks.  This...

There are more AI health tools than ever—but how well do they work?

There are more AI health tools than ever—but how well do they work?

Earlier this month, Microsoft launched Copilot Health, a new space within its Copilot app where users will be able to connect their medical records and ask specific questions about their health. A couple of days earlier, Amazon had announced that Health AI, an LLM-based tool previously restricted...

Composer 2 : Cursor lance son nouveau LLM et lance une guerre des prix

Composer 2 : Cursor lance son nouveau LLM et lance une guerre des prix

Cursor annonce Composer 2. Une des ambitions de l'éditeur est de le proposer à des tarifs agressifs : 0,5 $ par millions de tokens en entrée et 2,5 $ par million de tokens en sortie. Il veut ainsi concurrencer GPT-5, Opus. Composer est le LLM de codage de Cursor. Il se dédie avant tout à Cursor et...