『株式会社ずんだもん技術室AI放送局』のカバーアート

株式会社ずんだもん技術室AI放送局

株式会社ずんだもん技術室AI放送局

著者: 株式会社ずんだもん技術室AI放送局
無料で聴く

このコンテンツについて

AIやテクノロジーのトレンドを届けるPodcast。平日毎朝6時配信。朝の通勤時間や支度中に情報キャッチアップとして聞いてほしいのだ。(MC 月:春日部つむぎ、火水木:ずんだもん、金:お嬢様ずんだもん)
エピソード
  • マジカルラブリー☆つむぎのピュアピュアA.I.放送局 podcast 20250609
    2025/06/08
    関連リンク AIの著作権問題に終止符か? 8TBの巨大オープンデータセット「Common Pile」登場、Llama 2に匹敵するLLMもリリース XenoSpectrum 近年、生成AIは膨大なデータを学習して進化しましたが、その中には著作権保護コンテンツも多く含まれ、無断利用による著作権問題が深刻化しています。これによりAI開発企業は学習データの詳細を公開せず、研究の透明性が失われる「透明性の冬」という状況に陥っていました。 このような状況を打破するため、EleutherAIを中心とする共同研究チームが、画期的なテキストデータセット「Common Pile v0.1」を公開しました。これは8テラバイト(TB)もの膨大なデータ量を持つ点が特徴です。最大のポイントは、パブリックドメイン(著作権が消滅したものなど、誰もが自由に使える状態のコンテンツ)と、オープンライセンスのコンテンツ(使用、研究、変更、再配布が自由に許諾されているもの)のみで構築されている点です。特に「オープンの定義2.1版」という厳格な基準を採用し、誰もが自由に利用できるライセンスのコンテンツだけを選び、商用利用や改変が制限されるライセンスは排除されています。 Common Pileは、データ量だけでなく内容も非常に多様です。オープンソースのソースコード、政府・法律関連文書、学術論文など、30種類もの信頼できるソースから収集されています。また、インターネットに存在する誤ったライセンス表記(ライセンスロンダリング)や、個人情報、有害なコンテンツ、重複するデータなどを徹底的に取り除き、高品質を維持するための厳しい管理が行われています。 さらに驚くべきは、この「クリーンな」Common Pileで学習させた新しい言語モデル「Comma v0.1」が、Meta社の「Llama 2」など、ライセンスの透明性が低いデータで学習された既存の高性能モデルに匹敵する、あるいは一部で凌駕する能力を示したことです。これは「著作権を遵守すると高性能なAIは作れない」という従来の常識を覆す画期的な成果と言えます。 Commaモデルの高性能は、Common Pileに含まれる多様なデータソースの「混ぜ方(データミキシング)」を工夫した点にあります。品質の高いデータを優先的に学習させることで、限られた計算資源で効率的に知識を習得できました。 この「Common Pile」は、過去のデータセットにおける著作権問題の反省を活かし、法的・倫理的な正当性を最優先に据えた「The Pileの正統進化形」と位置づけられます。Common Pileの登場は、AI開発における著作権リスクを低減し、透明で倫理的なAI研究を加速させるための大きな一歩となるでしょう。これにより、開発者は安心してAIを開発でき、社会全体として説明可能で信頼できるAIの実現に貢献すると期待されています。 引用元: https://xenospectrum.com/8tb-massive-open-dataset-common-pile-now-available/ うさぎでもわかる🐰ヤバすぎclaude-bridgeでClaude CodeにGPT、Gemini、ローカルLLMを接続!無料でエージェント機能使い放題の革命的ツール この記事では、AI開発ツール「Claude Code」をさらに便利にするオープンソースツール「claude-bridge」を紹介します。これまでClaude CodeはAnthropic社のAIモデルに限定されていましたが、「GPT-4oのような新しいモデルも試したいけど、そのためだけに別のツールを覚えるのは大変…」と感じていたエンジニアの皆さんに朗報です。claude-bridgeを使えば、Claude CodeからOpenAIのGPTシリーズ、GoogleのGemini、さらにはご自身のPCで動かせるローカルLLMまで、様々なAIモデルを利用できるようになります。 claude-bridgeは、Claude Codeが出すAIへのリクエストを「翻訳」し、指定された他のAIプロバイダーが理解できる形式に変換して転送する「プロキシ」として機能します。これにより、Claude Codeは普段通りに動作しますが、裏では自由に選んだAIモデルと連携できる「魔法」を実現しています。 このツールの最大の魅力は、特に「Ollama」というツールと組み合わせることで、自宅のPCに高性能なGPU(画像処理装置)があれば、AIエージェント機能を完全に無料で、そして無制限に使い放題にできる点です。これにより、高額なAPI利用料を気にすることなく、またプライベートなコードや...
    続きを読む 一部表示
    1分未満
  • 私立ずんだもん女学園放送部 podcast 20250606
    2025/06/05
    関連リンク Open Source AI Agent: Build Full Stack Apps この記事は、「app.build」という、オープンソースのプロジェクトを紹介しています。これは、AI技術を活用した「AI Agent」という仕組みを使って、Webアプリケーション開発の初めの一歩を助けてくれるツールです。具体的には、データベースからユーザーインターフェース(画面)まで一通り揃った「フルスタック」と呼ばれるアプリケーションの基本的なコードを、コマンド一つで自動的に生成してくれます。 使い方はとても簡単で、ターミナルでnpx @app.build/cliというコマンドを実行するだけです。生成されるアプリは、主にNeonというクラウド上で動くデータベースサービスなどを利用することを想定していますが、設定を変えたり、独自のテンプレートを使ったりすることも可能です。 app.buildの大きな特徴は、コードが全て公開されている「オープンソース」であることです。これにより、開発の仕組みを透明に見ることができ、誰もが自由に利用したり、改善に貢献したりできます。また、「ローカルファースト」が重視されており、皆さんの手元のPCですぐに動かして試せるように作られています。これは、これからWebアプリ開発を始めたい新人エンジニアの方にとっても、手軽にプロジェクトのひな形を作れる便利な出発点となるでしょう。 このプロジェクトは開発者向けに作られており、特にNeonのようなプラットフォーム上で動くコードをAIに自動生成させるツールを作る際の「参照実装」、つまりお手本となることを目指しているそうです。 プロジェクトのコードは、全てGitHubリポジトリで公開されています。興味があれば、どのようなコードでこのAI Agentが作られているのかを覗いてみることもできます。 このように、AIがソフトウェア開発の一部を自動化し、より効率的にアプリ開発を進められるようにする動きが進んでいます。app.buildは、AI Agentが実際にどのようにアプリケーションコードを生成できるかを示す具体的な例であり、今後の開発スタイルを考える上で参考になるプロジェクトと言えるでしょう。 引用元: https://www.app.build/ AI Agentで動くSNS人格に、ベクトル検索MCPで外部知識を持たせる 前回の記事で作成した、SNS上で活動するAI Agent(架空の友達、今回はプリキュアオタクギャル)には、「最新情報や専門知識が足りない」という課題がありました。LLM(大規模言語モデル)は学習時点より新しい情報を持っていないため、例えば最新のプリキュア作品について尋ねても正確な情報を返せないことが確認されました。 この課題を解決するために、LLMに外部の知識を参照させる仕組み、RAG(Retrieval Augmented Generation)の考え方を取り入れました。具体的には、プリキュアに関する大量の文書(Wikipediaなどから収集・整理)を「ベクトル検索」できるようにデータベース化し、それをAI Agentが使える「ツール」として提供することにしました。このツールはMCP (Model Context Protocol) Serverとして実装しました。 文書をベクトル化(文章の意味を数値のまとまりに変換)する際には、使用するモデルによって検索精度が変わるため、いくつかのモデルを試しました。データベースに保存することで、AI Agentは質問や投稿内容に関連する文書を素早く探し出せるようになります。 AI Agentにこのツールを使わせるためには、「プリキュアに関する話題は確認してから話す」といった人格設定や、ツールの説明文に「正確な事実確認に使う」といったガイドを追加しました。これにより、AI Agentが自律的にツールを使うことを促しました。 実験の結果、AI Agentが自分でツールを使って正しい情報を取得し、投稿や返信を修正する成功例も生まれました。しかし、ツールを使わなかったり、期待と違う情報を取得してしまう失敗例も多く、LLMが自律的に外部ツールを適切に使いこなすのは難しい現状も見えました。これはLLM自体の性能や、ツールの活用を促すためのさらなる工夫(例えば、別のAIがチェックする仕組みなど)が必要であることを示唆しています。 今回、AI Agentが自ら判断して外部ツールを使い、正確な情報を基に投稿する一連の...
    続きを読む 一部表示
    1分未満
  • 株式会社ずんだもん技術室AI放送局 podcast 20250605
    2025/06/04
    関連リンク Stockmark-2-VL-100B:日本語に特化したドキュメント読解のためのChain-of-Thought視覚言語モデル ストックマーク株式会社が、日本語のドキュメント理解に特化した新しいAIモデル「Stockmark-2-VL-100B」を開発し、公開しました。このモデルは、画像とテキストの両方を同時に理解できる「視覚言語モデル(VLM)」と呼ばれるもので、特に日本のビジネスでよく使われる、グラフや図が含まれたPDFやプレゼン資料などを正確に読み解くことを目指しています。 日本のビジネス文書は、文字だけでなく図や表、写真などが混ざっていることが多く、これらをまとめて理解するのはAIにとって難しい課題でした。Stockmark-2-VL-100Bは、このような文書から重要な情報を抽出し、質問に答えることができます。 このモデルの大きな特徴は、「Chain-of-Thought(CoT)」、つまり回答に至るまでの「思考過程」を詳細に示す能力を持っていることです。これにより、AIがなぜその回答を出したのか、どのような情報(画像やテキストのどこを見ればよいか)を根拠にしたのかが分かりやすくなります。これは、AIがもっともらしい間違った情報(ハルシネーション)を生成することを抑え、AIの回答の信頼性を高める上で非常に重要です。 このモデルは、国のGENIACプロジェクトの支援を受けて開発されました。1000億パラメータを持つ大きなモデルで、大規模な日本語データや、ビジネス文書に特化したデータを集めて、段階的に学習させることで高い性能を実現しています。特に、他の大規模なAIモデルを使って、日本語の高品質な学習データを新しく作り出した工夫も紹介されています。 開発されたモデルは、日本語のドキュメント読解に関する様々な評価データセットでテストされました。その結果、他の日本のVLMモデルを大きく上回り、特定のビジネスドキュメント読解タスクにおいては、GPT-4oよりも高い性能を示すことが確認されました。一般的な画像に関する質問応答でも高い性能を持っています。 今回発表された「Stockmark-2-VL-100B」モデルは、HuggingFace Hubで公開されており、誰でも利用できるようになっています。また、モデルの評価に使われたビジネススライドの質問応答データセット「BusinessSlideVQA」もGitHubで公開されています。 このモデルの登場は、日本のビジネス文書をAIでより正確に、そして信頼性高く処理する可能性を広げるものと言えるでしょう。 引用元: https://stockmark-tech.hatenablog.com/entry/2025/06/03/101007 やさしいClaude Code入門 このSpeaker Deck資料は、KDDIアジャイル開発センターの御田稔さん(みのるんさん)による、「やさしいClaude Code入門」の発表内容をまとめたものです。主に、Anthropic社が提供する最新のLLM(大規模言語モデル)であるClaude 4と、そのコード生成に特化したAIエージェント「Claude Code」について、日本のエンジニア、特に新人の方に向けて分かりやすく解説しています。 まず、先日(2025年5月23日)リリースされたばかりのClaude 4に触れています。これはClaudeシリーズの最新モデルで、「軽量」なHaiku、バランスの取れたSonnet、パワフルなOpusなどのモデルがあります。Claudeシリーズ全体の特徴として、OpenAIやGoogle Geminiにも負けない高い賢さ、特にコーディング能力が地球最強クラスであること、そして安全性を重視しているため企業での利用にも向いている点が挙げられます。また、自然でこなれた日本語の生成が得意で、日本語の図表や写真の解釈も優秀とのことです。 次に本題のClaude Codeについて解説されています。Claude Codeは、Anthropicが提供するCLI(コマンドラインインターフェース)ベースのAIコーディングエージェント製品です。2025年2月にプレビュー版が登場し、Claude 4と同時に5月に正式リリースされました。この正式リリースで特に注目されたのが、VS Codeへの対応です。これにより、CLI操作のとっつきにくさが解消され、多くのユーザーが利用し始めています。 Claude Codeの大きな特徴は、コード生成に使われるLLMがClaudeであるため、生成されるコードの品質が非常に高いことです。CLIで指示を出しつつも、コードの編集結果はVS CodeなどのGUIで差分表示されるため、...
    続きを読む 一部表示
    1分未満

株式会社ずんだもん技術室AI放送局に寄せられたリスナーの声

カスタマーレビュー:以下のタブを選択することで、他のサイトのレビューをご覧になれます。