『名古屋ではたらく社長のITニュースポッドキャスト』のカバーアート

名古屋ではたらく社長のITニュースポッドキャスト

名古屋ではたらく社長のITニュースポッドキャスト

著者: ikuo suzuki
無料で聴く

このコンテンツについて

システムサーバーの社長である鈴木生雄が気になるITニュースをピックアップして数分のコンテンツとしてお届けする番組です。主に取り上げるニュースはAI、半導体、ビッグテック企業です。ikuo suzuki 政治・政府
エピソード
  • Ep.657 ChatGPT Atlas登場──“ブラウザそのものが相棒”になる日(2025年10月23日配信)
    2025/10/22

    発表は2025年10月21日、OpenAIの公式ブログでした。ChatGPT Atlasは“ChatGPTを中核に据えたブラウザ”。検索やQ&Aをタブの外に出すのではなく、ページの脇に常駐させ、見ている内容をその場で理解して段取りまで手伝うという考え方です。新規タブでは検索リンク・画像・動画・ニュースのタブ切り替えで結果を素早く絞り込み、フォーム入力欄ではインラインの書き直し支援が立ち上がるなど、日々の操作をChatGPTが面倒見よく支える構成になりました。


    柱の一つが「Browser memories」。オンにすると、閲覧したサイトの“要点”を自分のアカウントだけに紐づくメモとして保持し、後から「先週見ていた求人をまとめて」「あの調査の続きを」と頼むと、記憶を呼び出して会話に混ぜてくれます。メモは設定画面で一覧・アーカイブ・削除ができ、アドレスバーのトグルでページ単位に“見せない”指定も可能。履歴を消せば関連メモも消える、という“自分で握れる”設計が明示されています。


    もう一つの肝が「Agent mode」。Atlasでは、閲覧中の文脈を握ったままエージェントがタブを開き、リンクをたどり、作業を進めます。買い物のカート詰めや予定の調整、チーム資料の横断読みと要点整理など、ページを跨ぐ反復作業を肩代わりできるようにしつつ、安全面では“コード実行・ファイルダウンロード・拡張インストールは不可”“金融など特定サイトでは操作前に一時停止”“ログアウト状態での実行も選べる”といった制限を併設。隠れた命令(プロンプトインジェクション)への対策やレッドチームの結果もSystem Cardで整理されています。


    提供は本日からmacOSで開始。FreePlusProGoは即日、Businessはベータ、EnterpriseEduは管理者が有効化した場合に利用できます。Windows・iOS・Android版は“coming soon”。初回起動時にサインインし、他ブラウザからブックマークやパスワード、履歴をインポートして乗り換えられる導線です。


    開発者・サイト管理者向けの配慮も用意されています。Atlasの検索・要約に自サイトを確実に載せるにはOAI-SearchBotをブロックしない、トレーニング除外はGPTBotの拒否で示す、といった運用指針がFAQに明記。さらに、ボタンやフォームにWAI-ARIAのロール・ラベルを適切に付けることで、Atlasのエージェントがページ構造を理解して精度高く操作できる、とされています。Apps SDKのアプリもAtlasのサイドバーで動作し、今後は発見性の向上が計画されています。


    要するに、Atlasは“検索するブラウザ”から“一緒に作業するブラウザ”への転換点です。記憶で文脈をつなぎ、エージェントで手を動かし、安全策で“やりすぎ”を抑える。業務では調査から資料作成までの往復が短くなり、個人利用でも買い物や予約の“こまごま”を任せやすくなる。ブラウザが日常のハブである以上、ここにAIを住まわせる意味は大きい──そんな実感を伴うアップデートです。

    続きを読む 一部表示
    5 分
  • Ep.656 DeepSeek-OCR──“画像で圧縮するLLM”が長文処理の常識を変える(2025年10月23日配信)
    2025/10/22

    発表は2025年10月21日、サウスチャイナ・モーニング・ポストが第一報を掲載しました。DeepSeekは長大な文書を“直接テキストで食わせる”のではなく、まず画像表現に置き換えてから処理する新手法を公開。これにより、LLMが扱うトークン数を7〜20分の1に削減できたと述べ、長文対応の計算コストを劇的に抑える方向性を示しました。モデルは「DeepSeek-OCR」としてHugging FaceとGitHubでオープン提供されています。


    仕組みはシンプルかつ大胆です。エンコーダ側の「DeepEncoder」が長文テキストを視覚表現へマッピングして“ビジョントークン”に圧縮し、デコーダ側の「DeepSeek3B-MoE-A570M」がそこから言語を復元します。DeepSeekは公式ブログでこの二段構成を明示し、“LLM視点からビジョンエンコーダの役割を再定義した”と説明。圧縮率を高めても意味保持をできる限り維持する“視覚圧縮”は、長文の取り回しに新しい設計余地を与えます。


    実装はすでに開発者向けに整っており、Hugging FaceのモデルカードとGitHubのリポジトリには、TransformersやvLLMで動かす手順が公開済み。必要ライブラリ、推奨CUDA、そして簡単な推論コードまで揃っており、試すハードルは低めです。コミュニティのSpaceでもデモが立ち上がり、実際に画像→Markdown抽出や超長文の圧縮復号を試せる環境が出回っています。


    効果の中身について、報道・技術解説は“トークン節約のインパクト”を強調します。SCMPは7〜20倍の削減幅をそのまま伝え、The Decoderは「10倍圧縮でも情報の約97%を維持」と紹介。要は、1,000トークン級の段落を100前後のビジョントークンで“持ち運べる”イメージで、長期文脈を扱う際のメモリと速度のボトルネックが大きく緩む、という見立てです。


    文脈として、DeepSeekはこの一年、性能とコストの“比”で攻めてきました。ReutersはV3やR1、そして9月末の実験版モデルまで、効率と価格を武器に競合を追い上げる動きを継続報道。今回のDeepSeek-OCRも、長文処理の実費を削ることで、検索連携RAGや社内文書アシスタント、ログ分析のような業務AIに“現実的なスケール”を持ち込む意図が透けて見えます。


    開発現場の手触りも早速出ています。個人ブログやコミュニティでは6.6GB級モデルをローカルGPUで動かした記録が共有され、Hacker NewsやRedditでも「テキストを画像にするなんて逆説的だが理にかなう」という議論が活発です。長文の“忘却”を意図的に進めるため、圧縮率を時間経過で上げる運用案など、プロダクト側の工夫に直結するアイデアも出ています。


    総じて、DeepSeek-OCRは“長文=高コスト”という常識を崩すための実験であり、すでに実用フェーズへ片足を踏み出しています。研究・社内ナレッジ・法務や顧客サポートのログなど、“長いが価値のある”情報を安く運べるなら、エンタープライズAIの設計は一段とシンプルになります。圧縮で起こる微細な情報損失と、その対価として得られるスループット――そのトレードオフをアプリ側でどう最適化するか。ここからが、プロダクト作りの腕の見せどころですね。

    続きを読む 一部表示
    5 分
  • Ep.655 Claude Code、WebとiOSに登場──“並列エージェント”を安全サンドボックスで走らせる新ワークフロー(2025年10月23日配信)
    2025/10/22

    発表は2025年10月20日、Anthropicの公式ニュースです。Claude Codeを“ブラウザからそのまま使える”新機能「Claude Code on the web」が公開され、研究目的のベータとしてPro/Maxユーザーに開放されました。GitHubレポジトリを接続して要望を記述すると、クラウド上の隔離環境で実装・テスト・自動PR作成まで走り、進捗はリアルタイムに追えます。しかも複数レポジトリ・複数タスクを並列に回せるのが目玉です。モバイルではiOSアプリからの利用も“早期体験”の扱いで始まりました。


    裏側の要がサンドボックスです。Anthropicはエンジニアリングブログで、許可プロンプト多発による“承認疲れ”を避けつつ安全性を上げる狙いから、ファイルシステム隔離とネットワーク隔離の“二重の壁”を実装したと説明。社内検証では許可プロンプトを84%削減できたとし、OSレベル機能(Linuxのbubblewrap、macOSのseatbelt)とプロキシを組み合わせ、外部通信は許可ドメインのみに制限、ファイル操作も指定ディレクトリ外は遮断する構成を示しました。


    とくにGitの扱いは慎重です。Claude Code on the webはサンドボックス内に機密資格情報を置かず、カスタムのGitプロキシが中継して認証・操作内容・プッシュ先ブランチを検査したうえで、必要最小のトークンを付与して実行します。これにより、もし実行環境が攻撃を受けても“機密鍵の持ち出し”や“想定外のプッシュ”を防ぐ設計です。


    利用の始め方はシンプルで、claude.com/codeからレポジトリを接続するだけ。クラウド実行のレート制限は他のClaude Code利用と共有されます。ドキュメントには、サンドボックスの有効化手順、許可ドメインの指定、企業のIAM/ポリシーとの併用などが詳細にまとまっており、現場のセキュリティ基準に合わせた運用が可能です。


    今回のサンドボックス実装はオープン化も特徴です。Anthropicは軽量ランタイムを研究プレビューとして公開し、CLIのbashツールやローカルのMCPサーバー、任意プロセスを同様の境界内で動かせるようにしました。開発者コミュニティからは「安全に自律度を上げる設計」として関心が寄せられています。


    外部メディアも、Web/iOSでの“どこでも並列コーディング”を評価しつつ、競合ひしめくコーディングエージェント市場での差別化要因として「安全な自律運転」と「ブラウザ完結の運用性」を挙げています。TechCrunchや9to5Macは、研究プレビューとしての提供形態や並列実行・自動PRなどの実務的な効用を整理しました。


    実務の目線で言えば、開発チームの“積ん読バグ”や定型修正を、ブラウザから一気に“投げて回して、出てきたPRをレビュー”へと置き換えられる可能性が出てきます。安全側に倒したサンドボックスを前提に自律度を上げる思想は、承認クリックの連打とヒヤリ・ハットを同時に減らし、スループットを底上げする処方箋になりそうです。まずは小さめのバックログから、レポジトリ横断の並列処理で効果を体感するのが良さそうですね。

    続きを読む 一部表示
    5 分
まだレビューはありません