『KI im Wettlauf der Großmächte: China, OpenAI und die neue Ära von Agentenarbeit und Robotik』のカバーアート

KI im Wettlauf der Großmächte: China, OpenAI und die neue Ära von Agentenarbeit und Robotik

KI im Wettlauf der Großmächte: China, OpenAI und die neue Ära von Agentenarbeit und Robotik

無料で聴く

ポッドキャストの詳細を見る

概要

China erhöht den Druck auf die US-KI-Branche entlang mehrerer Fronten: Bei generativer Video-KI, bei günstigen und schnell iterierenden Sprachmodellen sowie bei Robotik-Infrastruktur. ByteDance hat am 12. Februar 2026 Seedance 2.0 offiziell gestartet, ein Audio-Video-Joint-Modell, das multimodale Referenzen und 15‑Sekunden‑Clips mit Ton unterstützt und bereits über Dreamina und Doubao verfügbar ist. Die niedrige Zugangshürde verschärft die Debatte um Urheberrecht, Stilkopien und Deepfakes, nachdem in den USA realistische, an bekannte Filme und Stars angelehnte Beispiele viral gingen. Branchenverbände und Gewerkschaften kritisieren fehlende Schutzmechanismen und drohen mit rechtlichen Schritten, während die Diskussion um Haftung, Trainingdaten und Verbreitung über Plattformen weiter anzieht. Parallel beschleunigt sich der Wettbewerb bei LLMs aus China: Zhipu AI positioniert GLM‑5 als MoE-Ansatz für Coding und agentische Workflows und setzt dabei auf schnelle Iteration und eine Verbreitung über offene Gewichte, um Fähigkeiten rascher in Produkte und Entwickler-Ökosysteme zu bringen. MiniMax rückt mit MiniMax M 2.5 in die preisaggressive Richtung; große Kontextfenster und Tool-Use-Funktionen treffen auf Tokenpreise, die in vielen Benchmarks-nahen Coding-Szenarien die Eintrittsbarrieren deutlich senken. In der Robotik zeigt Peking zugleich Industrialisierungsambitionen: Das Beijing Innovation Center of Humanoid Robotics meldet eine Pilotfertigung mit bis zu 5.000 humanoiden Robotern pro Jahr und eine Infrastruktur, die Test-, Validierungs- und Montagezyklen standardisiert und damit den Übergang von Prototypen zu Pilotserien beschleunigen soll. Dynamische Demo-Clips werden dabei als Signal für Regelung, Balance und Hardware-Policy-Integration gelesen, also genau jene Fähigkeiten, die später in Logistik, Industrie oder Einsatzszenarien zählen. Auf US-Seite kontert OpenAI vor allem mit Geschwindigkeit und Produktisierung. Am 12. Februar 2026 stellte OpenAI GPT‑5.3‑Codex‑Spark als extrem latenzoptimierte Coding-Variante vor, die in Kooperation mit Cerebras auf Nicht‑Nvidia‑Hardware läuft und laut OpenAI mehr als 1.000 Tokens pro Sekunde erreicht. Gleichzeitig betont OpenAI, dass Änderungen an Streaming, Session-Setup und API-Overhead nicht nur dieses Modell betreffen, sondern die Serving-Architektur insgesamt beschleunigen sollen. In Robotik rückt der Datenaspekt wieder in den Vordergrund: Die zentrale Botschaft lautet, dass robuste Robotik-Fähigkeiten weniger an Demos hängen als an skalierbaren Datenpipelines und großen Mengen sauberer Demonstrationsdaten. Bei der Monetarisierung testet OpenAI in den USA Werbung in den günstigsten Tarifen (Free und Go), während höhere Pläne werbefrei bleiben. Das verschiebt die Akzeptanzfrage von klassischer Websuche in den Chat-Kontext, in dem Nutzer typischerweise mehr persönliche Details preisgeben; 2026 wird damit auch ein Test für Vertrauen, Transparenz und „Sponsored“-Grenzziehung in dialogbasierten Interfaces. Anthropic steht parallel für die zweite große Strömung: Agentic Coding wird operationalisiert, indem Entwicklung zunehmend als Orchestrierung spezialisierter Agenten verstanden wird und menschliche Architekturkompetenz sowie QA wichtiger werden. Am 12. Februar 2026 meldete Anthropic zudem eine neue Finanzierung über 30 Milliarden US‑Dollar bei einer Bewertung von 380 Milliarden US‑Dollar, was den Skalierungsdruck im Markt unterstreicht. Ein praktischer Engpass für Agenten-Workflows bleibt Echtzeit-Websuche. Exa wirbt mit „Instant Search“ im Februar 2026 und sub‑200‑ms‑Latenz für agentische Rückkopplungsschleifen, während das Open-Source-Projekt browser-use die Automatisierung von Webseiten für Agents adressiert. Auch Google erhöht den Druck im Reasoning-Segment: Gemini 3 Deep Think bekam am 12. Februar 2026 ein Upgrade und wird als spezialisierter Modus für Wissenschaft und Technik vermarktet; genannt werden 48,4 Prozent auf Humanity’s Last Exam (ohne Tools) und 84,6 Prozent auf ARC‑AGI‑2 (verifiziert). Zum Schluss ordnet die Episode die Super‑Bowl‑Verwirrung ein: Neben realer Codex-Werbung kursierte ein angeblich geleakter OpenAI-Spot zu einem Earbud-/Device‑Konzept, den OpenAI öffentlich als Fälschung zurückwies; Berichte zur OpenAI‑Hardwareentwicklung deuten eher auf einen späteren Zeitplan als auf einen schnellen Kopfhörer-Launch. Quellen: Official Launch of Seedance 2.0 (ByteDance Seed) https://seed.bytedance.com/en/blog/official-launch-of-seedance-2-0 Seedance 2.0 (Produktseite, ByteDance Seed) https://seed.bytedance.com/en/seedance2_0 Viral AI video of Tom Cruise fighting Brad Pitt leaves Hollywood flabbergasted (Entertainment Weekly) https://ew.com/viral-ai-video-tom-cruise-fighting-brad-pitt-leaves-hollywood-flabbergasted-11906898 ‘This is unacceptable’ – SAG-AFTRA reacts to viral Seedance 2.0 clip (TechRadar) https://www.techradar.com/...
まだレビューはありません