『L'IA aujourd'hui épisode du 2026-01-11』のカバーアート

L'IA aujourd'hui épisode du 2026-01-11

L'IA aujourd'hui épisode du 2026-01-11

無料で聴く

ポッドキャストの詳細を見る

このコンテンツについて

Bonjour et bienvenue dans le podcast de l'IA par l’IA qui vous permet de rester à la page !Aujourd’hui : Gmail se dote d’une AI Inbox, agents de cybersécurité et risques, IA clinique et qualité des raisonnements, Copilot et “IA slop”, domination des modèles ouverts chinois, ChatGPT Santé et fiabilité, et virage du marché au-delà des LLM.Commençons par Google, qui teste “AI Inbox” dans Gmail. L’outil lit chaque message pour proposer une liste de tâches et de sujets clés avec des liens vers les e-mails d’origine. Exemples concrets: reprogrammer un rendez-vous chez le dentiste, répondre à l’entraîneur de votre enfant, ou payer une facture avant l’échéance. Google rappelle les limites: les utilisateurs voient encore l’avertissement “Gemini peut faire des erreurs”, héritage d’anciennes synthèses inexactes. Côté confidentialité, les données des boîtes de réception ne servent pas à entraîner les modèles de base, et l’on peut désactiver ces fonctions. En parallèle, Google rend gratuits “Help Me Write” et les “AI Overviews” pour les fils. Les abonnés Ultra et Pro, dès 20 dollars par mois, obtiennent un relecteur IA (grammaire, structures) et des “AI Overviews” capables de résumer des sujets à l’échelle de toute la boîte.Sécurité maintenant. Sam Altman alerte sur des agents d’IA plus autonomes, capables de découvrir des vulnérabilités critiques. Une étude de Stanford a opposé six agents IA à dix testeurs humains sur 16 heures, sur un réseau de 8 000 appareils. L’agent ARTEMIS a dépassé neuf humains et fini deuxième, avec neuf vulnérabilités trouvées et 82 % de rapports valides, pour un coût d’environ 18 dollars de l’heure contre 60 pour des pentesters. Son atout: créer des sous-agents en parallèle. Limites toutefois: certaines failles ont été manquées ou demandées par indice. Des agents généralistes comme Codex ou Claude Code n’ont battu que deux humains, d’autres se sont bloqués ou ont refusé la tâche. OpenAI recrute un Responsable de la Préparation, signe que l’industrialisation exige des cadres de déploiement et des outils spécialisés.Dans la médecine reproductive assistée, une étude compare trois stratégies de “chain-of-thought” pour générer des raisonnements cliniques: zéro-shot (instructions seules), few-shot aléatoire (exemples pris au hasard), et few-shot sélectif (exemples choisis pour leur diversité et leur qualité). Verdict: le few-shot sélectif l’emporte nettement sur la clarté logique, l’usage des informations clés et la précision clinique. Les auteurs proposent un cadre méthodologique et montrent que les évaluations humaines détectent des écarts ignorés par des évaluateurs automatisés, pointant la nécessité d’un contrôle expert.Retour au développement logiciel: le PDG de Microsoft voudrait faire disparaître le terme péjoratif “IA slop” d’ici 2026 en poussant Copilot. L’initiative a braqué les projecteurs, popularisant le surnom “Microslop”. Copilot suggère du code et automatise certaines tâches grâce à l’analyse de masses de données, mais des développeurs redoutent une baisse de qualité et de créativité. Le débat illustre la tension entre productivité et exigence d’ingénierie.Côté écosystème ouvert, la dynamique bascule vers la Chine. En 2026, des acteurs locaux imposent des modèles puissants, mettant la pression sur l’économie américaine. Qwen s’impose, soutenu par DeepSeek. En 2025, Z.ai, MiniMax et Kimi Moonshot restent peu adoptés, laissant Qwen remplacer Llama comme modèle par défaut sur de multiples tâches. Llama demeure toutefois le plus téléchargé côté occidental. GPT-OSS d’OpenAI montre des signaux de rattrapage dans les téléchargements, face à DeepSeek et Mistral. Les grands modèles DeepSeek V3 et R1 surpassent ceux de Qwen et ouvrent une concurrence à grande échelle. Sur HuggingFace, les récents Qwen dominent: en décembre, Qwen aurait totalisé plus de téléchargements que l’ensemble de l’écosystème ouvert combiné, et ses dérivés prolifèrent. Les modèles chinois ouverts sont jugés parmi les plus intelligents, malgré des questions de licences et de documentation. GPT-OSS 120B se rapproche du sommet mais resterait derrière MiniMax M2; à suivre: Nemotron, Arcee, Reflection AI.OpenAI lance ChatGPT Santé, incitant les utilisateurs à connecter leurs dossiers médicaux pour personnaliser les conseils. Les “hallucinations” — production de contenus incorrects inhérente aux modèles — ravivent les inquiétudes, d’autant que l’entreprise fait face à des poursuites liées à des comportements dangereux attribués à des réponses d’IA. Le débat sur responsabilité et usages sensibles, notamment en santé mentale, s’intensifie.Plus largement, les LLM plafonnent et le marché se réoriente: modèles de monde, agents, objets connectés, voire ...
まだレビューはありません