『L'IA aujourd'hui épisode du 2025-11-26』のカバーアート

L'IA aujourd'hui épisode du 2025-11-26

L'IA aujourd'hui épisode du 2025-11-26

無料で聴く

ポッドキャストの詳細を見る

このコンテンツについて

Bonjour et bienvenue dans le podcast de l'IA par l’IA qui vous permet de rester à la page !Aujourd’hui : un appareil sans écran signé Jony Ive et Sam Altman, l’IA qui bouscule l’école, un nouveau cadre web pour agents baptisé VOIX, le démenti de Google sur Gmail et l’offre d’assistants d’Abacus AI.D’abord, Jony Ive et Sam Altman travaillent sur un appareil d’IA présenté comme une réinvention de l’usage de l’ordinateur. Pas d’écran, pas le format d’un téléphone, mais un objet discret, de la taille d’un iPod Shuffle, à porter autour du cou ou glisser dans une poche. Il capte le contexte grâce à des microphones et des caméras, sans être pour autant une paire de lunettes, une montre ou des écouteurs. Les deux partenaires visent un “troisième appareil central” après le MacBook et l’iPhone, pensé comme ludique et apaisant, “comme une cabane au bord d’un lac”. La commercialisation est annoncée dans moins de deux ans.Cap sur l’école, où l’IA générative s’est invitée depuis fin 2022. Des enseignants voient des élèves jusque-là moyens rendre des devoirs parfaitement structurés. Derrière l’effet de surprise, une inquiétude : déléguer le raisonnement pourrait affaiblir la pensée critique, au point de déplacer la fonction de l’élève lui‑même. Là où Internet avait surtout bousculé l’accès aux ressources, l’IA semble menacer à la fois le professeur et l’apprenant. Pour avancer, certains proposent de reconnaître l’usage de l’IA comme une donnée de départ et de réinventer les pratiques. Des professeurs de lycée ont déjà supprimé les devoirs à la maison. Autre angle mort mis en lumière : l’obsession de la note et du classement, renforcée par Parcoursup. Pour limiter l’effet “optimisation des notes”, il faut repenser l’évaluation. La discussion et l’exposé oral, réintroduits par la réforme du lycée, restent sous‑exploités alors qu’ils offrent une voie vers une appréciation plus qualitative des apprentissages.Dans le monde du web, des chercheurs de l’Université technique de Darmstadt proposent VOIX, un cadre qui ajoute deux balises HTML, et , pour rendre les sites “actionnables” par des agents d’IA sans passer par la vision d’écran. Concrètement, liste les actions disponibles avec nom, paramètres et description, reliées à la logique JavaScript; expose l’état courant de l’application. Au lieu de deviner où cliquer, l’agent appelle directement l’action, par exemple pour créer une tâche. Les rôles sont séparés : le site déclare ses fonctions, un agent de navigateur sert d’intermédiaire, et le fournisseur d’inférence décide des actions à entreprendre en s’appuyant sur ces données structurées.Les auteurs mettent en avant la confidentialité: les conversations partent vers le fournisseur de LLM sans passer par le site, et l’agent ne voit que les données explicitement exposées. VOIX fonctionne côté client, sans coût d’inférence pour les éditeurs. Lors d’un hackathon de trois jours avec 16 développeurs, six équipes ont bâti des applications sans expérience préalable du cadre; la note d’utilisabilité (SUS) a atteint 72,34, au‑dessus de la moyenne de 68. Les démos incluaient un outil de design graphique contrôlé à la voix (“tourne ceci de 45 degrés”), une app de fitness générant en une requête un plan d’entraînement intensif d’une semaine pour le dos et les épaules, un créateur de paysages sonores (“fais‑le sonner comme une forêt tropicale”), et un Kanban qui génère des tâches.Côté performances, VOIX a réalisé des tâches entre 0,91 et 14,38 secondes, quand des agents de navigateur classiques varient de 4,25 secondes à plus de 21 minutes. Pour faire pivoter un triangle vert de 90 degrés, VOIX a mis une seconde, contre 90 secondes pour Perplexity Comet. Les approches basées sur la vision perdent du temps à analyser des captures d’écran et à vérifier leurs essais; certaines tâches complexes échouent. Reste des défis : synchroniser les déclarations VOIX avec des interfaces évolutives ou héritées, définir le bon périmètre d’actions et équilibrer fonctions de base et commandes plus “intentionnelles”. Une extension Chrome de référence, avec chat et voix, fonctionne avec toute API compatible OpenAI, en local ou dans le cloud; le cadre a été testé avec Qwen3‑235B‑A22B. Dans un contexte où OpenAI et Perplexity imaginent des navigateurs IA (Atlas, Comet) et où l’injection de prompts persiste, VOIX se positionne comme une brique possible de nouvelles normes, aux côtés d’initiatives comme llms.txt ou MCP.Sur la confidentialité, Google dément avoir modifié ses conditions pour exploiter les e‑mails et pièces jointes Gmail afin d’entraîner Gemini. L’entreprise affirme n’avoir changé aucun paramètre et ne pas utiliser le contenu de Gmail pour l’...
まだレビューはありません