エピソード

  • 41【触れ込みは本物か?】MiniMax M3を4モデル横並び比較
    2026/06/05
    今回は、僕がずっと心待ちにしていたMiniMax M3がついに登場したので、無料でも試せるOpenCodeにそのまま載せて、手元のバグ調査で使い倒した感触をお話ししています。 比較対象はClaude Code経由のClaude Opus 4.8、そしてOpenCode経由のGPT-5.5とDeepSeek V4 Pro。同じお題を横並びで追わせました。僕がMiniMaxに惚れ込んでいた理由は、速さと安さ、コーディング以外にも使えるトークンプランの自由さ、100万トークンでも失速しないという触れ込みに加え、動画のネイティブ理解です。期待値だけなら誰よりも高かったはず。対する阿部さんはDeepSeek V4 Proにすっかり満足していて、まずは僕のレビュー次第、という温度差からの幕開けでした。 結論そのものは番組に譲りますが、ベンチマークの数字と実際の手触りはどうしてもズレる、という地点へ何度も引き戻されます。白黒つけたというより、次に確かめたい宿題がくっきり残った回になりました。 ちなみに今回から試験的に映像も回しているのは、編集をAIに委ねたいから。だからこそM3が前面に掲げる動画理解はまだ試しきれておらず、ここは改めて続報としてお届けします。 ▼MiniMax M3 https://www.minimax.io/blog/minimax-m3 ▼DeepSeek V4 Pro https://www.deepseek.com/ ▼OpenCode https://opencode.ai/ --- stand.fmでは、この放送にいいね・コメント・レター送信ができます。 https://stand.fm/channels/68dc82a9036795923c400b4f
    続きを読む 一部表示
    16 分
  • 40【一晩で何サイクル回せる?】CodexやClaude Codeの使い方
    2026/06/01
    今回は、僕がエンジニアの手を借りずにポッドキャストの編集自動化を作り切った体験を起点に、AI駆動開発で生産性を最大化する進め方について語っております。 驚いたのは、AIが僕の想像の外から技術を見つけてきて実装してしまったこと。「頭の良さより、考えを更新し続ける姿勢が3倍効く」というスーパー予測者の研究とも重なり、AIとの向き合い方を更新させられました。 僕は「設計を詰めるより、まず実装させて一晩でイテレーションを回す方が速い」と考えているのですが、エンジニアの阿部さんは「それには適用範囲がある」と。インフラや外部連携、責務境界が絡むと、そう単純ではないようで。この違いはどこから来るのか? 「次に詰まるのは人間なのでは」という観点も含め、最後まで意見は平行線。それでも、議論しがいのある回になったと思います。 後半は、DeepSeek-V4 Proが主力になりつつある驚きや、Claude Code・Codex・opencodeの使い分けについても話しています。 ▼Claude Code https://claude.com/product/claude-code ▼Codex https://openai.com/codex/ ▼opencode https://opencode.ai/ ▼Claude Design https://www.anthropic.com/news/claude-design-anthropic-labs ▼DeepSeek https://www.deepseek.com/ --- stand.fmでは、この放送にいいね・コメント・レター送信ができます。 https://stand.fm/channels/68dc82a9036795923c400b4f
    続きを読む 一部表示
    55 分
  • 39 【AI駆動開発に最適なターミナルは?】期待の新星Muxyとは
    2026/05/22
    今回は、AI駆動開発で日々の作業場となったターミナルに何を求めるか、そして阿部さんが見つけてきたMuxyというターミナルを起点に語っております。 僕はこれまでiTerm2からkitty、Ghostty、そしてWarpへと渡り歩いてきました。Warpをかなり気に入っていた僕に対して、阿部さんはあっさり不採用の判断。この違いはどこから来るのか? 純正のターミナルにこだわる阿部さんと、リッチな機能に惹かれる僕。ターミナルへの向き合い方の違いが全然違うなと感じました。 後半は、阿部さんがターミナルに求める条件を深掘り。ZedやCursor、Googleが出したAntigravityにも触れながら、なぜ多くの開発環境が「あと一歩」なのかを話しています。Muxyが本当に運用に乗るのか、引き続き検証していきます。 ▼Muxy https://muxy.app/ ▼Warp https://www.warp.dev/ ▼Ghostty https://ghostty.org/ ▼kitty https://sw.kovidgoyal.net/kitty/ --- stand.fmでは、この放送にいいね・コメント・レター送信ができます。 https://stand.fm/channels/68dc82a9036795923c400b4f
    続きを読む 一部表示
    46 分
  • 38【Claude Designの活用法】とあるChrome拡張機能との合わせ技
    2026/05/16
    今回は、Claude Designを阿部さんが実際に触ってみての感想と、デザイン作業から実装までのワークフローをどう組み立てるかについて語っております。 僕がここ数回プッシュし続けてきたClaude Designに対して、エンジニア視点の阿部さんが触ったらどう感じるのか?「革命的」と評する一方で、自社システムのデザインを土台にAIへ的確に指示を出すには一工夫必要だったようで、そこをどう乗り越えたのか興味深いポイントでした。 特に阿部さんが見つけた、あるChrome拡張機能を使った合わせ技には、僕も「これは応用できそうだ」と気づきの多い時間となりました。 後半では、実体を先に作ってからデザインを改善する開発フローの考え方や、Moonshot AIが出したKimi Web Bridgeと組み合わせたときに広がる可能性についても触れています。 Claude Design 関連リンク https://claude.ai/design SingleFile 関連リンク https://chromewebstore.google.com/detail/singlefile/mpiodijhokgodhhofbcjdecpffjipkle Kimi Web Bridge 関連リンク https://www.kimi.com/features/webbridge --- stand.fmでは、この放送にいいね・コメント・レター送信ができます。 https://stand.fm/channels/68dc82a9036795923c400b4f
    続きを読む 一部表示
    44 分
  • 37【中華モデルにオーケストレーターを任せる】DeepSeek-V4Pro登場
    2026/05/11
    今回は、「中華モデルにオーケストレーター役(親エージェント)を任せる日は本当に来るのか?」というテーマで、DeepSeekが公開したDeepSeek-V4-ProとDeepSeek-V4-Flashについて語っております。 これまでGLM-5.1やKimi K2.6、MiniMax M2.7を試してきた僕ですが、長時間駆動や複雑なワークフローではどこかで限界を感じていました。100万トークンコンテキストとハイブリッドアテンション設計を備えた今回のモデル、巷で噂される「研究者気質で硬い」評価はどう転ぶのか?阿部さんとの実機検証は、世間の評判とはまた違った景色が見える時間となりました。 加えて、月10ドルから始められるサブスクリプションOpenCode Go経由での運用構成にも触れています。コスト感も含めて開発スタイルがどう変わりうるのか、気になる方はぜひ聞いてみてください。 ▼DeepSeek-V4 Preview リリースノート https://api-docs.deepseek.com/news/news260424 ▼DeepSeek-V4-Pro(openrouter) https://openrouter.ai/deepseek/deepseek-v4-pro ▼DeepSeek-V4-Flash(openrouter) https://openrouter.ai/deepseek/deepseek-v4-flash ▼OpenCode Go https://opencode.ai/go --- stand.fmでは、この放送にいいね・コメント・レター送信ができます。 https://stand.fm/channels/68dc82a9036795923c400b4f
    続きを読む 一部表示
    27 分
  • 36【実装が先?デザインが先?】Claude Designで変わる開発フロー
    2026/05/09
    今回は、「Claude Designを実際の開発で使ってみた」という体験を起点に、AI駆動開発のワークフローについて語っております。 実装後のスクショを渡してClaude Designで洗練させていく僕に対して、以前Pencilでデザインを先に固めようとしていた阿部さん。「先に実装か、先にデザインか」という根本的な順序の話で、かなり意見が分かれるポイントでした。 お互いの試行錯誤を共有しながら、Claude Codeとの連携も含めて現時点でワークしそうなフローを探っていく、気づきの多い時間となりました。 後半は、Subquadraticが出した1200万トークンの新モデルSubQや、エージェント時代を見据えた分散データベースTursoにも話が広がっております。これらが実用レベルなら、開発の前提そのものが変わるかもしれません。 Claude Design 関連リンク https://www.anthropic.com/news/claude-design-anthropic-labs Pencil 関連リンク https://pencil.dev/ SubQ (Subquadratic) 関連リンク https://subq.ai/ Turso 関連リンク https://turso.tech/ --- stand.fmでは、この放送にいいね・コメント・レター送信ができます。 https://stand.fm/channels/68dc82a9036795923c400b4f
    続きを読む 一部表示
    27 分
  • 35【GPT-5.5は短文でOKは本当?】公式プロンプトガイドを読み込んだ結果
    2026/05/02
    今回は、OpenAIが公開したGPT-5.5の公式プロンプトガイドを起点に、新モデルの使用感とプロンプト設計の本質について語っております。 「アウトカムだけ伝えれば短いプロンプトで動く」というガイドの主張に対して、僕は『結局、踏ませたいステップは書くしかなくないか?』という違和感を抱いていて、プロンプトガイドを読み込んできてくれた阿部さんも近い感触を持っているようでした。一方で、5.5になってから増えた"勝手に作業を始めてしまう"振る舞いには、お互いかなり手を焼いている様子。 そこから話は、AIに余白を残しながら高品質を引き出す"マジックワード"論や、コンテキストをクリーンに保つコツ、Cognition AIが論じる文脈管理の話まで広がり、お互い気づきの多い時間となりました。モデル更新のたびにプロンプトをどう見直すべきか、その判断軸についても踏み込んでいます。 ▼GPT-5.5 プロンプトガイド https://developers.openai.com/api/docs/guides/prompt-guidance?model=gpt-5.5 ▼Cognition AI「Don't Build Multi-Agents」 https://cognition.ai/blog/dont-build-multi-agents --- stand.fmでは、この放送にいいね・コメント・レター送信ができます。 https://stand.fm/channels/68dc82a9036795923c400b4f
    続きを読む 一部表示
    36 分
  • 34【AIがデザインシステムを作る?】Claude Designを触ってみた衝撃
    2026/04/26
    今回は、最近触ってみて想像を大きく超える体験だったClaude Designについて語っております。スライド生成やデザイン作成ツール、というのが事前の印象だったのですが、実際に使ってみるとその枠を超えた驚きがありました。 僕はYouTube動画用のアイコンやフレーム、サムネイル生成のために使い始めたのですが、気づけばAIが「デザイン管理システム」のようなものを勝手に組み上げ始めていて。一貫性のあるアセットを再現性高く量産できる仕組みが、対話の中から自然に立ち上がってくる感覚は、これまでのデザインツールとは何かが根本的に違うように感じました。 後半では、Shopifyやfreeeが進めるMCP公開戦略と、マネーフォワードが出すCoworkとの方向性の違いについても触れています。サービス内にAIを搭載するのか、外部のAIから操作できる環境を提供するのか。これからのサービス設計の前提条件が変わりつつあるのを感じる回となりました。 Claude Design 関連リンク https://claude.ai/design Claude Design 公式発表ブログ https://www.anthropic.com/news/claude-design-anthropic-labs --- stand.fmでは、この放送にいいね・コメント・レター送信ができます。 https://stand.fm/channels/68dc82a9036795923c400b4f
    続きを読む 一部表示
    22 分