エピソード

  • #36 Apache HiveからみたOpen Table Format (OTF)
    2026/03/24

    OTF Talk 第36回は、Apache Hive PMCメンバーのおくみんさんに「Apache HiveからみたOTF」についてお話をうかがいました。


    Apache Hiveとは何か/Apache Hiveへの貢献とPMC/HiveとOpen Table Format/Apache Iceberg対応/Apache Hiveコミュニティ


    OTF Talk は、OTF = Open Table Format の技術的な解説や最新トピック等を、ゲストをむかえてお話をうかがうPodcastです。

    https://www.otftalk.com/


    guest: guest:@okumin おくみん Apache Hive PMC メンバー / Treasure Data ソフトウェアエンジニア

    host: @simosako 下佐粉 昭 AWSのソリューションアーキテクト。 専門はデータレイク 、データウェアハウス


    ※感想は #OTFTalk でポストいただけると励みになります。

    ※発言は各個人のものであり、所属組織を代表するものではありません。


    --------------------


    参考)

    おくみんさん Xアカウント - https://x.com/okumin


    Apache Iceberg活用入門 オープンテーブルフォーマットによるデータレイク&データレイクハウス (書籍) https://book.impress.co.jp/books/1124101072


    Apache HiveとIceberg: 2025年春 (おくみんさんによる、HiveのIceberg関連プロジェクト解説) https://blog.okumin.com/entry/2025/05/30/110000


    --------------------

    ※AI生成の目次です。ご参考までに。


    [00:00] ゲスト紹介とHive PMCとしての活動


    ゲストのおくみんさん(トレジャーデータ)は、約10年のビッグデータ歴を持ち、Apache HiveのPMCメンバーとして開発を主導している。


    共著(寄稿)した書籍『Apache Iceberg活用入門』の話題。


    [05:22] Apache Hiveとは何か? モダンな構成への変化


    Hiveは「メタストア」と「SQLクエリエンジン」の2つの主要コンポーネントで構成される。


    実行エンジンはMapReduceからApache TezやLLAPへ移行し、高速化を実現している。


    [11:13] Open Table Format(OTF)とHiveの親和性


    HiveはApache Icebergを強力にサポートしており、Sparkに次ぐ機能網羅性を誇る。


    カタログ機能だけでなく、データのコンパクション(最適化)やクリーンアップなどのメンテナンス機能もHive単体で完結できる「Best of Suite」としての利点。


    [16:47] 最新の開発トピック:KubernetesとIceberg v3


    HelmチャートによるKubernetesへのデプロイ対応が進んでおり、インフラ管理が容易になりつつある。


    Iceberg v3スペックへの対応や、複数テーブルを跨ぐトランザクション機能の実装が進んでいる。


    [25:31] Hiveコミュニティの熱量と今後の展望


    100名以上のコミッターが在籍し、AI時代やデータレイクハウスの進展に合わせて今なお熱意を持って進化し続けている。

    続きを読む 一部表示
    24 分
  • #35 ハイトラフィックな更新処理が必要な環境でのApache Iceberg検証
    2025/12/16

    OTF Talk 第35回は、Repro チーフアーキテクトの joker1007さんに「ハイトラフィックな更新処理が必要な環境でのApache Iceberg検証」についてお話をうかがいました。


    既存環境の課題/Icebergでデータとコンピュートを分離する/データ更新と参照ラグ/コンパクションの課題と工夫/今後の展望


    OTF Talk は、OTF = Open Table Format の技術的な解説や最新トピック等を、ゲストをむかえてお話をうかがうPodcastです。

    https://www.otftalk.com/


    guest: guest:@joker1007 Repro チーフアーキテクト

    host: @simosako 下佐粉 昭 AWSのソリューションアーキテクト。 専門はデータレイク 、データウェアハウス。


    ※感想は #OTFTalk でポストいただけると励みになります。

    ※発言は各個人のものであり、所属組織を代表するものではありません。


    --------------------


    参考)

    joker1007さんXアカウント - https://x.com/joker1007


    ReproでのApache Icebergの技術検証結果 https://tech.repro.io/entry/2025/11/13/161646

    前回のOTF Talkでのご出演 - Hudiの話 (#19, #20) https://www.otftalk.com/2024/11/ep9.html

    前回検証結果のブログ https://tech.repro.io/entry/2024/10/28/170721

    続きを読む 一部表示
    33 分
  • #34 Apache Kafka と Open Table Format
    2025/10/28

    OTF Talk 第34回はConfluent 清水 亮夫 さんに、「Apache Kafka と Open Table Format」についてお話をうかがいました。


    リアルタイム処理とOTF/Kafkaの特徴/Kafkaと他システムとの連携/Kafka Connector/Iceberg Sink Connectorの機能と注意点


    OTF Talk は、OTF = Open Table Format の技術的な解説や最新トピック等を、ゲストをむかえてお話をうかがうPodcastです。

    https://www.otftalk.com/


    guest: Confluent ソリューションエンジニアの清水 亮夫 さん


    host: @simosako 下佐粉 昭

    AWSのソリューションアーキテクト。 専門はデータレイク 、データウェアハウス。


    ※感想は #OTFTalk でポストいただけると励みになります。

    ※発言は各個人のものであり、所属組織を代表するものではありません。


    参考)

    清水さん X https://x.com/shmza

    Apache Iceberg Meetup Japan #3 https://iceberg.connpass.com/event/364492/

    発表資料 https://speakerdeck.com/shmza/kafkawoli-yong-sitaiceberghenodetasutorimingu


    Apache Kafka https://kafka.apache.org/

    Kafka connectors https://docs.confluent.io/platform/current/connect/kafka_connectors.html

    Apache Iceberg Sink Connector https://github.com/apache/iceberg/tree/main/kafka-connect

    Kafka-delta-ingest https://github.com/delta-io/kafka-delta-ingest


    続きを読む 一部表示
    28 分
  • #33 大規模データ分析環境での Apache Iceberg + Snowflake 活用の経験
    2025/10/21

    OTF Talk 第33回はNTTドコモ 松原 侑哉 さんに、「大規模データ分析環境での Apache Iceberg + Snowflake 活用の経験」についてお話をうかがいました。


    ペタバイト級データを処理するインフラの変遷/Iceberg評価の背景とモチベーション/ベンチマークの方法と結果/今後について


    OTF Talk は、OTF = Open Table Format の技術的な解説や最新トピック等を、ゲストをむかえてお話をうかがうPodcastです。

    https://www.otftalk.com/


    guest: NTTドコモ プリンシパルデータエンジニア 松原 侑哉 さん


    host: @simosako 下佐粉 昭

    AWSのソリューションアーキテクト。 専門はデータレイク 、データウェアハウス。


    ※感想は #OTFTalk でポストいただけると励みになります。

    ※発言は各個人のものであり、所属組織を代表するものではありません。


    参考)


    Apache Iceberg Meetup Japan #3

    https://iceberg.connpass.com/event/364492/


    松原さん発表資料

    https://speakerdeck.com/y_matsubara/apache-iceberg-meetup-japan-number-3-da-gui-mo-snowflake-plus-anoicebergnohuo-yong


    続きを読む 一部表示
    21 分
  • #32 広告配信システムのデータ基盤におけるApache Iceberg活用
    2025/10/14

    OTF Talk 第32回はマイクロアド 高橋 唐樹 さんに、「広告配信システムのデータ基盤におけるApache Iceberg活用」についてお話をうかがいました。


    広告配信システムの前処理/HiveからTrinoに移行/Iceberg化のメリット/ストレージとコンピュートの分離によるメリット


    OTF Talk は、OTF = Open Table Format の技術的な解説や最新トピック等を、ゲストをむかえてお話をうかがうPodcastです。

    https://www.otftalk.com/


    guest: マイクロアド 高橋 唐樹 さん


    host: @simosako 下佐粉 昭

    AWSのソリューションアーキテクト。 専門はデータレイク 、データウェアハウス。


    ※感想は #OTFTalk でポストいただけると励みになります。

    ※発言は各個人のものであり、所属組織を代表するものではありません。


    --------------------


    参考)


    発表資料 https://sd-portal.microad.co.jp/slides/2025-03-01_deim2025.html


    DEIM2025 https://pub.confit.atlas.jp/ja/event/deim2025


    OTF Talk 「マイクロアドでのOTF活用とIcebergテーブルの最適化」#28 https://www.otftalk.com/2025/09/ep14.html


    OTF Talk 「LINEヤフーにおけるHiveからIcebergへの移行」(#17, #18) https://www.otftalk.com/2024/11/ep8.html


    続きを読む 一部表示
    24 分
  • #31 Fin Tech領域における Open Table Format
    2025/10/07

    OTF Talk 第31回は鈴木 研吾 さんに、「Fin Tech領域における Open Table Format」についてお話をうかがいました。


    セキュリティ・キャンプ2025 全国大会/データマネジメントの重要性/Fin Tech領域とOpen Table Formatのメリット/AI時代のセキュリティ


    OTF Talk は、OTF = Open Table Format の技術的な解説や最新トピック等を、ゲストをむかえてお話をうかがうPodcastです。

    https://www.otftalk.com/


    guest: @ken5scal (ken\d\x) 鈴木 研吾 さん


    host: @simosako 下佐粉 昭

    AWSのソリューションアーキテクト。 専門はデータレイク 、データウェアハウス。


    ※感想は #OTFTalk でポストいただけると励みになります。

    ※発言は各個人のものであり、所属組織を代表するものではありません。


    --------------------


    参考)


    鈴木さん X https://x.com/ken5scal (ken\d\x)


    セキュリティ・キャンプ2025 全国大会【専門】Dクラス

    https://www.ipa.go.jp/jinzai/security-camp/2025/camp/zenkoku/program/d.html


    講義資料

    https://speakerdeck.com/ken5scal/aishi-dai-noda-gui-mo-detahuo-yong-tosekiyuriteizhan-lue


    LayerX Fintech事業部ブログ

    https://tech.layerx.co.jp/archive/category/Fintech%E4%BA%8B%E6%A5%AD%E9%83%A8


    SIEM https://ja.wikipedia.org/wiki/Security_information_and_event_management

    続きを読む 一部表示
    24 分
  • #30 柔軟性のある分析基盤構築のためにApache Icebergを活用した経験
    2025/09/30

    OTF Talk 第30回は坂本 泰規さんに、「柔軟性のある分析基盤構築のためにApache Icebergを活用した経験」についてお話をうかがいました。


    Apache Iceberg採用のモチベーション/マルチクラウド/クエリエンジンを併用 - SnowflakeとAthena/性能と注意点


    OTF Talk は、OTF = Open Table Format の技術的な解説や最新トピック等を、ゲストをむかえてお話をうかがうPodcastです。

    https://www.otftalk.com/


    guest: @sambaiz 坂本 泰規さん


    host: @simosako (下佐粉 昭)

    AWSのソリューションアーキテクト。 専門はデータレイク 、データウェアハウス。


    ※感想は #OTFTalk でポストいただけると励みになります。

    ※発言は各個人のものであり、所属組織を代表するものではありません。


    --------------------


    参考)


    坂本さん X https://x.com/sambaiz


    「AJA SSP が Apache Iceberg と AWS Glue Data Catalog でペタバイトスケールのデータ基盤の柔軟なクエリエンジンの選択とクエリの高速化を実現」(AWSブログ)

    https://aws.amazon.com/jp/blogs/news/aja-ssp-adopts-iceberg-and-glue-data-catalog-in-peta-byte-scale-data-platform-to-get-flexible-query-engines-and-faster-queries/


    OTF Talk #13 「DWH利用者からみた Iceberg の魅力」

    https://www.otftalk.com/2024/10/ep6.html


    続きを読む 一部表示
    24 分
  • #29 関西でのOTFコミュニティ活動
    2025/09/23

    OTF Talk 第29回は、さくらインターネットの永富 安和さん(やっさん)に「関西でのOTFコミュニティ活動 」についてお話をうかがいました。


    OTFSGとコミュニティ活動/OTF周辺での関心領域/関西でのコミュニティ活動/OTFSG今後の予定


    OTF Talk は、OTF = Open Table Format の技術的な解説や最新トピック等を、ゲストをむかえてお話をうかがうPodcastです。

    https://www.otftalk.com/


    guest: @yassan168 永富 安和さん(やっさん)

    さくらインターネット ソフトウェア開発エンジニア


    host: @simosako (下佐粉 昭)

    AWSのソリューションアーキテクト。 専門はデータレイク 、データウェアハウス。


    ※感想は #OTFTalk でポストいただけると励みになります。

    ※発言は各個人のものであり、所属組織を代表するものではありません。


    --------------------

    参考)

    やっさん X https://x.com/yassan168


    OTFのコミュニティ OTF Study Group (OTFSG) https://otfsg-tokyo.connpass.com/

    (OTFSG Slack への招待リンクも上記URLに記載されています)


    資料 「マイクロアドのData LakehouseとIcebergテーブルの最適化について」

    https://docs.google.com/presentation/d/1w4mY_coUKPfMBbpvi-fJygmUZIvmh0q6ipG-BM1PxiM/edit?slide=id.g22df57b2e5d_0_0


    上記発表の録画 https://youtu.be/jEH17or26b0?si=uv6-rO2UTBQSNeIc&t=284


    RUSTFS (MiniIO alternative) https://github.com/RustFS/RustFS


    Lake Keeper https://docs.lakekeeper.io/

    --

    ホストしているもう1つのPodcast : SKO Radio

    https://www.skoradio.com/


    続きを読む 一部表示
    20 分