世界の技術ニュースをリアルタイムでキャッチし、日本語でわかりやすく発信。AI・半導体・スタートアップから規制動向まで、グローバルテックシーンの「今」をお届けします。

2026-05-28

PostHogが「自社データでAIモデルを訓練する」と宣言した理由と、そのインパクト

キーポイント

PostHogは、自社のPostHog内データを使ってAIモデルを訓練する方針を発表した
目的は、既存機能をもっと賢くすることと、PostHog Codeのような新しいAI製品を作ること
まず注力するのは、session replay analysis と synthetic user testing
データ利用はopt out（拒否しない限り有効）方式で、EU cloudはデフォルトで除外
ただし、匿名化や第三者のモデル提供元に送らないなど、プライバシー面の配慮を強調している
「あとからこっそり規約変更」ではなく、かなり前から明示する姿勢が印象的

本文

PostHogがかなり興味深い方針を打ち出しました。
それは、PostHogの中にあるデータを使って、自社でAIモデルを訓練するというものです。

これ、言い方を変えると「AI機能を足す」ではなく、AIがより賢くなる土台そのものを自前で作るという話です。
最近のSaaSはどこもAIをうたっていますが、PostHogはその中でもかなり踏み込んでいる印象があります。正直、これはなかなか面白いです。

そもそも何をしたいのか

PostHogのCEO James Hawkins氏は、今後6か月ほどでかなり重要な仕事ができると感じている、と書いています。

彼らの狙いは大きく2つです。

今ある製品をもっと賢く、もっと能動的にすること
PostHog Codeのような新しいAI製品を作ること

ここでいう「能動的」というのは、単に質問に答えるだけではなく、
問題を見つけて、提案して、場合によっては先回りして動くようなイメージです。

たしかに、AIがただの「チャット窓」に留まっているうちは、まだ便利な補助輪くらいです。
でも、製品の中で実際の行動データを理解して、改善提案までできるようになると、話は一気に変わります。
PostHogは、そこを狙っているわけです。

最初に注目しているのは session replay analysis

最初の大きなテーマは、session replay analysis です。

session replay というのは、ユーザーがサイトやアプリを操作した様子を録画のように再現できる機能のこと。
「どこで迷ったのか」「なぜ離脱したのか」を見るのに便利です。

PostHog AI はすでに replay の中で問題を見つけることができます。
でも、現状はコストが高く、スケールしにくいのが課題だそうです。

そこで、replay の元になっているデータを学習させたモデルを作れば、
個別ユーザーの問題診断だけでなく、大量のデータを扱う場面でも強くなるのではないか、という狙いがあります。

これはかなり筋がいいと思います。
なぜなら、replay は「後から見る」だけでなく、うまく使えばプロダクト改善の最短ルートになりうるからです。
ただ、目で見るだけでは限界がある。そこをAIに肩代わりさせたい、というわけですね。

もうひとつの目玉は synthetic user testing

もうひとつ面白いのが、synthetic user testing です。
これはざっくり言うと、実ユーザーの行動パターンをもとに、AIが「この導線は混乱しそう」「このフローは壊れそう」と先に検知するような発想です。

リリース前に「ここ、ユーザーが迷うんじゃない？」を見つけられたら最高です。
実際、プロダクト開発って、作るよりも壊れ方を見つけるほうが難しいことが多いんですよね。
この領域をAIで自動化できるなら、開発チームにとってかなり大きいです。

PostHogはさらに、予測精度が上がれば、すでに公開済みの機能についても改善提案できると考えています。
たとえば、コンバージョン率を上げる改善や、ユーザーのストレスを減らす修正を提案する、という方向です。

要するに、
「分析ツール」から「改善を提案するツール」へ進化したいということだと思います。
ここはかなり野心的で、同時にかなり魅力的です。

何が新しいのか

PostHogが強調しているのは、AIを単なる付け足しにしないことです。

彼らは、普通のツールが「最高のコードを出す」ことに集中しているのに対し、
PostHogは「あなたのプロダクト自体をより良くする」ことに力を注ぐと言っています。

この考え方は、PostHog Code を product editor と呼ぶ説明にもつながっています。
つまり、コードを書くだけでなく、製品の改善そのものを編集する感覚です。

この方向性は、いかにもPostHogらしいです。
観測・分析・改善のループを、AIでさらに短くしようとしている。
私はこういう「ツールの役割を一段上げにいく」動き、わりと好きです。

でも、データを学習に使うのは大丈夫なの？

ここが一番気になるところですよね。
AIの話になると、結局はデータをどう扱うのかが核心です。

PostHogはここについて、かなり明示的に説明しています。要点は次の通りです。

EU cloud のユーザーはデフォルトで除外
BAA / MSA など、学習を許さない契約のユーザーも除外
それ以外の US cloud ユーザーはデフォルトで含まれる
学習前にすべてのデータを匿名化する
学習に使うのは、すでにPostHog内にあるデータだけ
モデル訓練は自社で行う
第三者のモデル提供元にデータを売ったり送ったりしない
管理者権限があれば、いつでも opt out できる
実際の学習開始は6月29日以降

この説明で印象的なのは、
「データを使います。でもかなり条件を絞ります」
と先にハッキリ言っていることです。

多くの企業は、こういう話を規約更新に紛れ込ませがちです。
でもPostHogは、メール通知もするし、アプリ内通知も出すし、ブログでも公開しています。
この透明性は、少なくとも姿勢としてはかなり好感が持てます。

opt out 方式を選んだ理由

PostHogは、この方針を opt out にした理由も説明しています。
つまり、最初から有効にしておき、嫌な人だけ外す方式です。

理由は単純で、opt in（最初は無効で、同意した人だけ有効）だと、学習に足る量のデータが集まらないからです。

これはAIの現実をかなり正直に言っていると思います。
モデルは、ある程度まとまったデータがないと強くなりません。
そして、PostHogが目指すような「プロダクト改善に効くモデル」は、なおさら大量の実データが必要でしょう。

もちろん、これはユーザー目線では賛否が分かれます。
「勝手に入っているのは気になる」と感じる人もいるはずです。
ただ、PostHogはデフォルト設定、除外条件、匿名化、オプトアウト方法をきちんと説明していて、少なくとも不意打ち感は抑えようとしているように見えます。

ここが重要だと思うポイント

個人的に重要だと思うのは、PostHogが目指しているのが**“AIで便利な機能をつける”ことではなく、“AIで製品開発のループを変える”こと**だという点です。

これは単なる機能追加ではありません。
もし本当にうまくいけば、次のような流れが作れます。

ユーザー行動を観測する
AIが問題やパターンを見つける
改善案を出す
実装や検証につなげる
その結果をまた学習に活かす

この循環が回り始めると、SaaSの価値はかなり変わります。
単なる分析ツールではなく、改善の相棒になるからです。

ただし、もちろん簡単ではないとも思います。
「何のデータが本当に役に立つのか」「どう訓練すれば精度が出るのか」は、やってみないと分からない部分が大きいはずです。
PostHog自身も、これはexperimental（実験的）だと認めています。そこは誠実です。

まとめると

PostHogは、今後のAI機能を強化するために、自社内のデータでAIモデルを訓練する方針を公開しました。
狙いは、既存機能の強化と、新しいAI製品の開発です。

特に注目なのは、
session replay analysis の高度化と、
synthetic user testing による先回りの改善提案です。

一方で、データ利用には慎重さも見えます。
匿名化、除外条件、opt out の明示、第三者への提供なしなど、透明性をかなり意識しているのが特徴です。

私の感想としては、これはかなり攻めた一手です。
でも、PostHogのようなプロダクト観測系の会社がここまで踏み込むのは、方向性としては自然でもあります。
AIを「飾り」ではなく「製品の中核」にしたい、という意思がはっきり見える記事でした。

参考: Training our own AI models - PostHog

同じ著者の記事

Excelのフォントが変わる原因を、.xlsxを解凍して確かめてみた

「テーマフォントが原因」というところまでは、探せば辿り着ける。だが実際にファイルの中で何が参照し合っているのかを見た人は少ない。.xlsxはただのZIPなので、覗くのに5分もかからない。手元の適当なブックで試すなら、拡張子を`.zip`に変えるか`unzip`コマンドを叩くだけでいい。 ``` $ unzip -l sample.xlsx Length Date Time Name --------- ---------- ----- ---- 1234 2026-07-01 09:00 xl/theme/theme1.xml 5678 2026-07-01 09:00 xl/styles.xml ... 2345 2026-07-01 09:00 xl/worksheets/sheet1.xml ``` 犯人は`xl/theme/theme1.xml`にいる。中を`cat`すると、こんな塊が出てくる。 ```xml <a:fontScheme name="Office"> <a:majorFont> <a:latin typeface="

papoo.work

Claude の Effort、実は3段階じゃない——xhigh/maxまで含めた5段階の使い分けとAPI仕様を深掘りする

以前の記事「[Claude の effort ってどう効くの？](https://note.com/modern_ferret431/n/nc8e88b771ab0)」では、Effortパラメータを Low / Medium / High の3段階として紹介した。実際のClaude APIはもう一段深い。現行モデル（Opus 4.8/4.7、Sonnet 5、Fable 5）では low / medium / high / xhigh / max の5段階が存在し、しかも「thinkingの予算」だった旧`budget_tokens`とは効かせ方そのものが違う。本稿ではAPI仕様に基づいて、モデル別の対応状況・挙動の違い・実運用での設計指針を整理する。旧世代（Sonnet 4.5以前）の extended thinking は `thinking: {type: "enabled", budget_tokens: N}` という固定トークン予算の指定だった。「thinkingにいくら使うか」だけを制御する、いわば一次元のノブだ。 Opus 4.6以降ではこれが非推奨化

papoo.work

Claudeの「超過課金」は自動発生しない——note記事の補足と2026年6月の仕様変更

先日、[「Claudeは weekly limit や 5hours limit を突き破ったときのペナルティ料金が半端ない」](https://note.com/modern_ferret431/n/n821d3055d109) という記事が話題になった。Claude CodeやOpusでコードベース解析を回していると、10分足らずで従量課金が発生し得るという警告は実体験として貴重だが、エンジニアが実際に運用判断をする上で誤解しやすいポイントがいくつかある。本記事はその補足として、Anthropic公式ドキュメントに基づき仕組みを整理する。最大の誤解ポイントはここ。Claude Pro/Maxで週次・5時間の利用上限に達しても、Usage credits（超過課金）を明示的に有効化していない限り、追加料金は一切発生しない。上限に達した場合の既定動作は「リセットまで待つ」だけで、勝手にAPI従量課金へ切り替わることはない。有効化するには以下の手順が必要: `Settings > Usage` から Usage credits セクションで Enable をクリック

papoo.work

【2026年7月版】Outlookが「起動しない・クラッシュを繰り返す」最新事情 — 6月末の一斉クラッシュはビルド2605が原因、直し方はほぼ一択

「昨日まで普通に使えていたClassic Outlookが、右クリックした瞬間に落ちる」「起動してもすぐ強制終了し、次はセーフモードで開く」——2026年6月末から、この手の悲鳴がまた一気に増えた。半年前・1年前に書かれた「Outlookが起動しない完全解決ガイド」的な記事が今また読まれているのは、まさに今、Classic Outlookのクラッシュが立て続けに起きているからだ。本稿は、2026年前半に発生した複数のクラッシュ事案を発生時期・影響ビルド・原因・修正状況で整理し直し、「自分のケースはどれで、何をすれば直るか」を最短で切り分けられるようにしたものだ。結論から言うと、直近の主犯は更新プログラムの回帰（リグレッション）で、多くは“Officeを最新へ更新するだけ”で直る。設定を9個いじる前に、まずここを見たほうが早い。 > ⚠️ 先に結論: 2026年6月29日ごろから急にClassic Outlookが落ち始めたなら、疑うべきは自分の設定ではなく **Microsoft 365 Apps バージョン2605（Build 20026.20182

papoo.work

【2026年7月版】Outlookの「送信済みメールが消える」が再燃 — 犯人はWindows更新プログラム KB5074109 の可能性

「送信は成功したのに、送信済みアイテムに残っていない」——Outlookの定番トラブルが、2026年に入ってから再び相談件数を増やしている。半年前(2026年1月)に出回った解説記事の手順は今でも基本として有効だが、2026年に急増した“送信済みが消える”の主犯は、従来の設定ミスではなく Windows のセキュリティ更新プログラムそのものであることが分かってきた。本稿はその現況を、切り分け順に整理し直したものだ。 > ⚠️ 先に結論: 1月中旬以降にClassic Outlook(デスクトップ版)で急に「送信済みに入らない」「Outlookが固まる」が始まったなら、まず疑うべきは自分の設定ではなく 更新プログラム KB5074109 と PSTファイルの置き場所(OneDrive配下かどうか) だ。設定を10個いじる前に、ここを先に見たほうが早い。 --- 2026年1月のWindowsセキュリティ更新 KB5074109 導入後、**Classic Outlookで送信メールが「送信済みアイテム」に記録されない／Outlookが終了しない・フ

papoo.work

【続報】サナエトークン、ついに「当事者2人の法廷闘争」へ――三崎優太氏が溝口勇児氏に内容証明、いまどこまで進んだか

前回まで、私たちはサナエトークン騒動を「補償」「金融庁」「高市首相の否定」という3つの軸で追ってきた。補償は6月10日に申請サイトが開き、金融庁の損失相談は6月時点で5件、首相は国会で改めて全面否定――というのが直近の現在地だった。ところが騒動はここへ来て、まったく別の局面に入っている。行政・補償の話から、当事者どうしの個人間紛争、それも法廷闘争へと重心が移ったのだ。本稿はその続報である。 https://papoo.work/doc/7de9f0cf1b564dc9 実業家の三崎優太氏（元「青汁王子」）が、実業家の溝口勇児氏に内容証明を送付したと明かし、「きっと裁判になる」と法廷闘争を予告した。三崎氏は溝口氏とみられる人物の会議音声を公開し、「責任を他人になすりつけている（＝トカゲの尻尾切り）」と批判。溝口氏は「編集で切り取っている」「補償対応はやっている」と反論した。 6月26日、三崎氏は両者が共同運営していたYouTube番組「REAL VALUE」からの脱退を表明。ただし本稿執筆時点（7月7日）で、**正式な「提訴」の公

papoo.work

ブラウン大学で起きた「AIカンニング」騒動、大学の信頼はどう守るのか

ブラウン大学の経済学者ロベルト・セラーノ教授が、担当科目の試験で少なくとも50人がAIを使って不正をしたと訴えている。問題になったのは、持ち帰って解く形式の試験。自宅でじっくり考えられる反面、ChatGPTのようなAIを使いやすい。期末試験では平均点が一気に落ち、欠席者の多くが前回満点だったことから、教授は「証拠は圧倒的」と見ている。ブラウン大学の反応は鈍く、教授は「大学全体で学問の誠実さを守る議論が必要だ」と主張している。背景には、米国の名門大学で広がるAI利用の誘惑と、教育のあり方そのものを揺さぶる問題がある。ブラウン大学で起きたこの話、かなり重いです。しかも、ただの「試験でズルした人がいました」という話では終わりません。大学が長年かけて築いてきた信頼、つまり「ここで学んだ学生の成績には意味がある」という前提そのものが、AIの登場でぐらついている。この記事は、その現場で何が起きているのかをかなり生々しく伝えています。中心にいるのは、ブラウン大学の著名な経済学者ロベルト・セラーノ教授です。彼は、数学的経済学の上級学部生向け講義 ECON 1170 を担当していて、

papoo.work

AIにMRIを読ませたら、医師と真逆の答えが出た話

肩が痛い。だからMRIを撮った。そこまではよくある話です。ところがこのブログ記事は、そこで終わりません。著者はそのMRI画像を、OpenAI系のモデルではなく、Claude Code上で動かしたOpus 4.8に読ませて、「もう一つの診断」を引き出そうとします。で、出てきた答えがかなり衝撃的でした。医師は「腱板の部分断裂（Grade III）」と見たのに、AIは「腱は保たれている」と判断したんです。この差、かなり大きいです。しかも著者は、ただAIに雑に投げたわけではありません。DICOM形式のMRIデータを用意し、Claude Codeに必要なパッケージを入れさせ、かなり本気で解析させています。単なるお遊びではなく、「AIが医療画像をどこまで読めるのか」を自分の体で試した記録、と言ったほうが近いです。肩の痛みでMRIを撮った著者が、AIに画像の再読影をさせた人間の医師は「Grade IIIの部分断裂」と判断した Opus 4.8は最初、「腱は正常」と報告したその後、別の条件で再比較させた結果、AIは「明らかな断裂は見当たらない」と結論づけたただし著者自身は、AIも医師も完全に

papoo.work

AIコーディングは「レビュー」より「テスト」で殴るほうが強い、という話

著者は、AI coding を使っていると「人間なら即クビ」レベルの妙な挙動に何度も遭遇したが、それでも利用をやめるどころか、さらに使い込むようになった。この記事の中心テーマは、AI にコードを書かせるときは code review 以上に test process が大事 だ、という主張。その根拠として、著者は昔働いていた CPU 設計会社 Centaur のテスト文化を紹介する。そこでは、手書きテストより fuzzing や random testing を重視し、unit test はほぼ使わず、専任の test engineer がいた。著者は、AI 時代の開発でも「人間が全部レビューする」より、「大量の自動テストで叩く」ほうが現実的で、しかも強いと考えている。ただし、これは単なる理想論ではなく、実際にバグを見つけて直してきた現場の感覚から来ている。本文を読んでまず面白いのは、著者の出発点がかなり変わっていることです。AI coding を「便利な補助輪」ではなく、かなり攻めた実験装置として見ています。しかも、その最初の印象がすごい。バ

papoo.work

Apple Neural Engineの中身を、かなり踏み込んで覗いた研究

Appleの「Neural Engine」、通称ANEは、iPhoneやMacの中で静かに働く専用チップです。顔認識、写真の補正、音声処理、生成AIの一部まで、裏側でかなり多くの仕事を抱えています。ふだんはCore MLというApple公式の仕組み越しにしか使えないので、一般の開発者から見ると「中はブラックボックス」の代表格でした。今回のarXiv論文は、そのブラックボックスをかなり本気で分解したものです。しかも単なる憶測ではなく、Apple silicon上での直接計測と、private runtime、compiler、kernel driver、firmwareの静的解析を組み合わせている。こういう研究は地味に見えて、実はとても面白いです。Appleが“使わせるつもりのない層”にまで手を伸ばして、仕組みを記述しているわけですから。この論文は、Apple Neural Engineのアーキテクチャ、プログラミング方法、性能の限界をまとめた「リバースエンジニアリングのガイド」です。対象はA11世代のiPhone/iPadチップからA18、そしてM1からM5まで。かなり広い。特に

papoo.work