世界の技術ニュースをリアルタイムでキャッチし、日本語でわかりやすく発信。AI・半導体・スタートアップから規制動向まで、グローバルテックシーンの「今」をお届けします。

2026-05-24

Gemma 4とCrewAIで「データに話しかける」AIチャットを作った話

この記事のキーポイント

CSVやExcelをアップロードして、自然文で質問できるデータチャットツールを作った記事
バックエンドは DuckDB でファイルを直接読み込み、SQL を実行
Gemma 4 が、自然文からSQLを作る役を担当
CrewAI で「スキーマ確認」「SQL生成」「実行」という流れを分業化
Supabase Edge Functions と Google Cloud Run を組み合わせて、フロントとバックエンドをきれいに分離
実際に null率の確認 や カテゴリ別売上集計 などを、SQLを書かずにこなせるのが面白い

「データに質問する」って、地味だけどかなり強い

元記事は、ポートフォリオアプリの中にAIデータチャットを組み込んだという話です。
やっていることはシンプルで、ユーザーがCSVやXLSXなどのファイルをアップロードして、たとえば

「売上が一番高いカテゴリは？」
「各列のnull率を出して」
「上位10行を見せて」

みたいに日本語や英語の自然な質問を投げると、AIが中身を読んで答えてくれる、というもの。

これ、ぱっと見は「またAIで何でもやる系かな？」と思うかもしれません。
でも実際はかなり実用的です。というのも、データを扱う現場では、SQLを書ける人に毎回頼るほどでもない小さな確認作業が山ほどあるからです。
「ちょっとこの列の欠損率見たい」「カテゴリごとの売上をざっくり見たい」みたいなやつですね。こういう場面で、自然文で聞けるのはかなり便利だと思います。

仕組みはかなり筋がいい

元記事の構成をざっくり言うと、こんな流れです。

Next.js のフロントエンドでファイルをアップロード
Supabase Edge Functions がリクエストを受けて中継
Google Cloud Run 上の FastAPI がファイルを受け取る
DuckDB でファイルを読み込み、スキーマを確認
CrewAI が役割分担して、SQLを生成
Gemma 4 が自然文→SQLの頭脳として動く
実行結果をチャットUIに返す

ここで重要なのは、AIにいきなり「答えを考えさせる」のではなく、先にファイルの構造をちゃんと見せていることです。
これがかなり大事で、AIが列名を勝手に想像してしまう事故を減らせます。
個人的には、この「まず観察、次に推論」という流れがとても良いと思いました。AIっぽい派手さはないけれど、実運用ではこういう地味な設計のほうが強いんですよね。

使われている技術をかんたんに整理

元記事では、フルスタック構成が表でまとめられています。要点だけ抜き出すとこうです。

Frontend: Next.js
Edge Middleware: Supabase Edge Functions
Backend API: FastAPI on Google Cloud Run
AI Agents: CrewAI
SQL Engine: DuckDB
LLM: Gemma 4 via Hugging Face Inference API
対応ファイル: CSV、XLSX、Parquet、JSON、Arrow IPC

ここで初心者向けに補足すると、

DuckDB は、手元のファイルをそのままSQLで扱いやすい分析用DBです。重い基盤を用意しなくても動かしやすいのが魅力。
CrewAI は、AIに複数の役割を持たせて、順番に仕事させるための仕組みです。
Gemma 4 は Google DeepMind のオープンモデル群で、特に reasoning（筋道立てて考えること）を意識した使い方に向いている、と元記事では紹介されています。

Gemma 4をなぜ使ったのか

元記事では、Gemma 4 の複数モデルについても紹介されています。
特にこのプロジェクトでは、google/gemma-4-31B-it と google/gemma-4-26B-A4B-it を Hugging Face のエンドポイント経由で使っているとのことです。

大きな特徴は、長いコンテキストを扱えること。
コンテキストというのは、AIが一度に覚えていられる文脈の長さのことです。ファイルのスキーマ情報やユーザーの意図をまとめて渡すには、ここがけっこう重要です。

元記事では、Gemma 4 が

テキスト
画像
音声
動画

を扱えるモデルとして紹介されていますが、このデータチャットでは主にSQL生成のためのテキスト推論に使っています。
派手なマルチモーダル機能そのものよりも、複雑な指示をちゃんとSQLに落とし込めるかが勝負、というわけです。

CrewAIの役割分担がわかりやすい

CrewAIの説明も、元記事の見どころです。
AIを1体の万能ロボットとして扱うのではなく、役割を分けます。

たとえば、

Schema Inspector: 列名や型を確認する
SQL Writer: ユーザーの質問をSQLに変換する
Result Formatter: 結果を見やすく整える

みたいな感じです。

こういう設計の良さは、何をしているのか追いやすいことだと思います。
AIアプリって、裏側がブラックボックスだと怖いんですよね。
でも役割が分かれていれば、「今どこで間違ったのか」を見つけやすい。これは開発者にとってかなりありがたいです。

実際の処理フローがちゃんと現実的

バックエンド側の流れも、かなり実用寄りです。

1. ファイルを受け取る

ユーザーがアップロードしたファイルを一時ディレクトリに保存します。

2. ファイル形式を判定する

CSV、Parquet、Arrow、JSON、XLSX などを見分けます。

3. DuckDBに読み込む

読み込んだデータをDuckDBのテーブルとして扱えるようにします。

4. スキーマを取得する

DESCRIBE data のような形で、列名や型を確認します。
同時に総行数も数えます。

5. AIに渡す

スキーマ情報、行数、ユーザーの質問をまとめて CrewAI + Gemma 4 に渡します。

6. SQLを実行する

生成されたSQLをDuckDBで実行し、結果を返します。

この順番がとてもまともです。
「AIに全部おまかせ」ではなく、まずデータを観察してからSQLを書く。
当たり前に聞こえるかもしれませんが、こういう基本を守るアーキテクチャは強いです。

デモで何ができたのか

元記事では、49行・18列のe-commerce売上CSVを使って6つの質問を試しています。
ここがかなり楽しいところです。

1. 「上位10行を見せて」

生成されたSQLはシンプルに

SELECT * FROM data LIMIT 10

です。
これは当然といえば当然ですが、まず最初の確認としては理にかなっています。
「中身をざっと見る」という行為は、データ分析の入口としてすごく大事です。

2. 「主要列とnull率を教えて」

ここがちょっと面白いです。
Gemma 4 は各列について、欠損がどれくらいあるかを全部計算するSQLを作っています。

つまり、ただのSELECTではなく、データ品質チェックまで自動化しているわけです。
結果としては、49行・18列すべてで null率0% だったとのこと。

これは地味にすごいです。
普通は、こういう確認のために列ごとにSQLを書くのが面倒で、つい後回しになりがちです。
でも自然文で聞いて一発で出るなら、かなり使い勝手がいいと思います。

3. 「売上と利益率で上位カテゴリを出して」

記事では途中までしか見えませんが、カテゴリごとの集計SQLを生成していることがわかります。
SUM(sales) や SUM(profit) を使って、売上合計と利益率を出す流れです。

このへんになると、もはや単なる検索ではなく、分析の入口をAIが肩代わりしている感じがあります。
個人的には、このレベルまで自然文でこなせるのはかなり実用的だと思いました。

この仕組みの一番の価値は「AIっぽさ」ではない

この記事で本当に面白いのは、AIの派手さよりも、データ分析の面倒を削る設計にあります。

たとえば現場では、

ファイルを開く
列名を確認する
型を確認する
SQLを書く
実行して、ミスがあれば直す

という手順が必要です。
これを毎回やるのは、正直かなりだるい。
元記事のツールは、その最初の数段をかなり短縮してくれます。

もちろん、AIが作ったSQLは常に正しいとは限りません。
そこは過信しないほうがいいです。
でも、「たたき台を高速で出す」という役割なら、かなり有望だと思います。

率直に言うと、かなり好きな構成

個人的には、このプロジェクトはかなり好印象です。
理由は3つあります。

実データで動く
裏側が説明可能
SQLが見える

特に3つ目が大事で、結果だけ返すAIは便利な反面、どうやってその答えに至ったのかが見えにくいです。
でもこのツールは、実際にどのSQLが走ったかをUIに表示するので、納得感があります。
これはデータ系のアプリとしてかなり誠実だと思います。

こういう人に刺さりそう

この手の仕組みは、次のような人に向いていそうです。

SQLに不慣れだけどデータを見たい人
CSVやExcelをよく触る人
ポートフォリオに「ただの見た目だけじゃない」機能を入れたい人
AIエージェントやLLMアプリの構成を学びたい開発者

逆に、厳密な分析や本番の意思決定では、まだ人間のチェックは必要です。
でも、探索の初速を上げるツールとしてはかなり魅力的だと思います。

まとめ

元記事は、Gemma 4、CrewAI、DuckDB、Supabase Edge Functions、Google Cloud Run を組み合わせて、「データに自然文で質問できるチャット」を実装した話でした。

このプロジェクトの良さは、AIをただ飾りとして使っているのではなく、
スキーマ確認 → SQL生成 → 実行 → 結果表示 という流れをきれいに分業しているところです。

つまりこれは、「AIがなんとなく答えるデモ」ではなく、
実際のデータ分析をちょっと楽にするための、かなり筋のいい設計なんですよね。
こういう実装は、見た目以上に価値があると思います。

参考: I Built an AI Data Chat Tool in My Portfolio App Using Gemma 4, CrewAI, DuckDB, Supabase Edge Functions & Google Cloud Run 🚀

同じ著者の記事

【2026年7月版】Outlookが「起動しない・クラッシュを繰り返す」最新事情 — 6月末の一斉クラッシュはビルド2605が原因、直し方はほぼ一択

「昨日まで普通に使えていたClassic Outlookが、右クリックした瞬間に落ちる」「起動してもすぐ強制終了し、次はセーフモードで開く」——2026年6月末から、この手の悲鳴がまた一気に増えた。半年前・1年前に書かれた「Outlookが起動しない完全解決ガイド」的な記事が今また読まれているのは、まさに今、Classic Outlookのクラッシュが立て続けに起きているからだ。本稿は、2026年前半に発生した複数のクラッシュ事案を発生時期・影響ビルド・原因・修正状況で整理し直し、「自分のケースはどれで、何をすれば直るか」を最短で切り分けられるようにしたものだ。結論から言うと、直近の主犯は更新プログラムの回帰（リグレッション）で、多くは“Officeを最新へ更新するだけ”で直る。設定を9個いじる前に、まずここを見たほうが早い。 > ⚠️ 先に結論: 2026年6月29日ごろから急にClassic Outlookが落ち始めたなら、疑うべきは自分の設定ではなく **Microsoft 365 Apps バージョン2605（Build 20026.20182

papoo.work

【2026年7月版】Outlookの「送信済みメールが消える」が再燃 — 犯人はWindows更新プログラム KB5074109 の可能性

「送信は成功したのに、送信済みアイテムに残っていない」——Outlookの定番トラブルが、2026年に入ってから再び相談件数を増やしている。半年前(2026年1月)に出回った解説記事の手順は今でも基本として有効だが、2026年に急増した“送信済みが消える”の主犯は、従来の設定ミスではなく Windows のセキュリティ更新プログラムそのものであることが分かってきた。本稿はその現況を、切り分け順に整理し直したものだ。 > ⚠️ 先に結論: 1月中旬以降にClassic Outlook(デスクトップ版)で急に「送信済みに入らない」「Outlookが固まる」が始まったなら、まず疑うべきは自分の設定ではなく 更新プログラム KB5074109 と PSTファイルの置き場所(OneDrive配下かどうか) だ。設定を10個いじる前に、ここを先に見たほうが早い。 --- 2026年1月のWindowsセキュリティ更新 KB5074109 導入後、**Classic Outlookで送信メールが「送信済みアイテム」に記録されない／Outlookが終了しない・フ

papoo.work

【続報】サナエトークン、ついに「当事者2人の法廷闘争」へ――三崎優太氏が溝口勇児氏に内容証明、いまどこまで進んだか

前回まで、私たちはサナエトークン騒動を「補償」「金融庁」「高市首相の否定」という3つの軸で追ってきた。補償は6月10日に申請サイトが開き、金融庁の損失相談は6月時点で5件、首相は国会で改めて全面否定――というのが直近の現在地だった。ところが騒動はここへ来て、まったく別の局面に入っている。行政・補償の話から、当事者どうしの個人間紛争、それも法廷闘争へと重心が移ったのだ。本稿はその続報である。 https://papoo.work/doc/7de9f0cf1b564dc9 実業家の三崎優太氏（元「青汁王子」）が、実業家の溝口勇児氏に内容証明を送付したと明かし、「きっと裁判になる」と法廷闘争を予告した。三崎氏は溝口氏とみられる人物の会議音声を公開し、「責任を他人になすりつけている（＝トカゲの尻尾切り）」と批判。溝口氏は「編集で切り取っている」「補償対応はやっている」と反論した。 6月26日、三崎氏は両者が共同運営していたYouTube番組「REAL VALUE」からの脱退を表明。ただし本稿執筆時点（7月7日）で、**正式な「提訴」の公

papoo.work

ブラウン大学で起きた「AIカンニング」騒動、大学の信頼はどう守るのか

ブラウン大学の経済学者ロベルト・セラーノ教授が、担当科目の試験で少なくとも50人がAIを使って不正をしたと訴えている。問題になったのは、持ち帰って解く形式の試験。自宅でじっくり考えられる反面、ChatGPTのようなAIを使いやすい。期末試験では平均点が一気に落ち、欠席者の多くが前回満点だったことから、教授は「証拠は圧倒的」と見ている。ブラウン大学の反応は鈍く、教授は「大学全体で学問の誠実さを守る議論が必要だ」と主張している。背景には、米国の名門大学で広がるAI利用の誘惑と、教育のあり方そのものを揺さぶる問題がある。ブラウン大学で起きたこの話、かなり重いです。しかも、ただの「試験でズルした人がいました」という話では終わりません。大学が長年かけて築いてきた信頼、つまり「ここで学んだ学生の成績には意味がある」という前提そのものが、AIの登場でぐらついている。この記事は、その現場で何が起きているのかをかなり生々しく伝えています。中心にいるのは、ブラウン大学の著名な経済学者ロベルト・セラーノ教授です。彼は、数学的経済学の上級学部生向け講義 ECON 1170 を担当していて、

papoo.work

AIにMRIを読ませたら、医師と真逆の答えが出た話

肩が痛い。だからMRIを撮った。そこまではよくある話です。ところがこのブログ記事は、そこで終わりません。著者はそのMRI画像を、OpenAI系のモデルではなく、Claude Code上で動かしたOpus 4.8に読ませて、「もう一つの診断」を引き出そうとします。で、出てきた答えがかなり衝撃的でした。医師は「腱板の部分断裂（Grade III）」と見たのに、AIは「腱は保たれている」と判断したんです。この差、かなり大きいです。しかも著者は、ただAIに雑に投げたわけではありません。DICOM形式のMRIデータを用意し、Claude Codeに必要なパッケージを入れさせ、かなり本気で解析させています。単なるお遊びではなく、「AIが医療画像をどこまで読めるのか」を自分の体で試した記録、と言ったほうが近いです。肩の痛みでMRIを撮った著者が、AIに画像の再読影をさせた人間の医師は「Grade IIIの部分断裂」と判断した Opus 4.8は最初、「腱は正常」と報告したその後、別の条件で再比較させた結果、AIは「明らかな断裂は見当たらない」と結論づけたただし著者自身は、AIも医師も完全に

papoo.work

AIコーディングは「レビュー」より「テスト」で殴るほうが強い、という話

著者は、AI coding を使っていると「人間なら即クビ」レベルの妙な挙動に何度も遭遇したが、それでも利用をやめるどころか、さらに使い込むようになった。この記事の中心テーマは、AI にコードを書かせるときは code review 以上に test process が大事 だ、という主張。その根拠として、著者は昔働いていた CPU 設計会社 Centaur のテスト文化を紹介する。そこでは、手書きテストより fuzzing や random testing を重視し、unit test はほぼ使わず、専任の test engineer がいた。著者は、AI 時代の開発でも「人間が全部レビューする」より、「大量の自動テストで叩く」ほうが現実的で、しかも強いと考えている。ただし、これは単なる理想論ではなく、実際にバグを見つけて直してきた現場の感覚から来ている。本文を読んでまず面白いのは、著者の出発点がかなり変わっていることです。AI coding を「便利な補助輪」ではなく、かなり攻めた実験装置として見ています。しかも、その最初の印象がすごい。バ

papoo.work

Apple Neural Engineの中身を、かなり踏み込んで覗いた研究

Appleの「Neural Engine」、通称ANEは、iPhoneやMacの中で静かに働く専用チップです。顔認識、写真の補正、音声処理、生成AIの一部まで、裏側でかなり多くの仕事を抱えています。ふだんはCore MLというApple公式の仕組み越しにしか使えないので、一般の開発者から見ると「中はブラックボックス」の代表格でした。今回のarXiv論文は、そのブラックボックスをかなり本気で分解したものです。しかも単なる憶測ではなく、Apple silicon上での直接計測と、private runtime、compiler、kernel driver、firmwareの静的解析を組み合わせている。こういう研究は地味に見えて、実はとても面白いです。Appleが“使わせるつもりのない層”にまで手を伸ばして、仕組みを記述しているわけですから。この論文は、Apple Neural Engineのアーキテクチャ、プログラミング方法、性能の限界をまとめた「リバースエンジニアリングのガイド」です。対象はA11世代のiPhone/iPadチップからA18、そしてM1からM5まで。かなり広い。特に

papoo.work

AMDでもここまで速い。GLM-5.2を“安く速く”動かしたWaferの話

Waferは、GLM-5.2をAMDのMI355X GPU上で動かし、かなり高い性能を出した。しかもポイントは「速い」だけでなく、「Blackwell系より2倍以上安いのに性能効率が高い」こと。ただし、AMDで最先端LLMをそのまま使うのは簡単ではなく、quantizationやinference frameworkの調整がかなり効いている。 speculative decode という高速化手法のために、ROCm向けの小さな修正も必要だった。個人的には、ここで見えるのは「GPUの勝負」だけではなく、「ソフトウェアの面倒をどこまで減らせるか」が勝負になってきた、という現実だと思う。 Waferの記事は、タイトルの通りかなりストレートです。要するに「1ドルあたりの性能、まだ伸ばせるし、しかも安くできる」という話です。対象はGLM-5.2というオープン系の大規模言語モデルで、これをAMD MI355X上でかなりうまく動かした、という内容でした。まず数字が強いです。Waferは、20k input / 1k output、cache hit rate 60% という条件で、1ノードあ

papoo.work

Codexに「見ちゃダメなファイル」を教える仕組みがほしい、という話

GitHubのopenai/codexリポジトリに、ちょっと地味だけどかなり重要な要望が出ています。内容はシンプルで、AIエージェントに読ませたくないファイルを明示的に除外したい、というものです。これ、派手さはないんですが実際にはかなり大事です。AIにコードを書かせる時代になっても、「これは見せていい」「これは絶対にダメ」の線引きは、人間がしっかり持っていないと危ない。そこをちゃんと仕組みにしよう、という提案です。このIssueで求められているのは、エージェントが読み込んだり、モデルに送ったりしてはいけないファイルやパスを明示できる機能です。しかも単なる一時的な指定ではなく、次の2段階を想定しています。リポジトリごとの設定ユーザー全体のグローバル設定たとえば、プロジェクト内に `.codexignore` のようなファイルを置いて「このリポジトリではこのファイル群は触るな」と定義する。一方で、ユーザー側にも「どのプロジェクトでも `.env` や秘密鍵っぽいものは見せない」という共通ルールを持てるようにしたい、という考えです。ここで面白いのは、**“プロジ

papoo.work

文字を画像にしてトークンを節約する、かなり変わったProxy「pxpipe」

Claude CodeのようなLLM向けツールで、長いテキストをそのまま送らず、画像に変換してからモデルに渡す仕組み文字がぎゅっと詰まった内容ほど得をしやすく、場合によってはトークン使用量を大きく削減できるただし万能ではなく、IDやハッシュのような“1文字でも間違えたら困る情報”は危ないだからこそ、安くなる場面と危ない場面を見極める設計になっている発想はかなり攻めているが、実務の痛点をちゃんと突いていて面白い pxpipeは、ひとことで言うと「LLMに渡す長文を、必要に応じて画像に圧縮してしまうローカルProxy」です。Proxyというのは、アプリとAPIのあいだに入って通信を中継する仕組みのこと。ブラウザの世界でいう“中継サーバー”みたいなものだと思えば大きく外れていません。普通、LLMにたくさんの文章を読ませると、そのぶんトークンが増えます。トークンは、AIが文章を扱うときの細かい単位で、課金やコンテキスト長の計算に使われます。つまり、長文を入れるほどお金も容量も食う。これは避けようがない、と思われがちです。でも pxpipe はそこに逆張りをします。大量のテキストをP

papoo.work