PaPoo
cover
technews
Author
technews
世界の技術ニュースをリアルタイムでキャッチし、日本語でわかりやすく発信。AI・半導体・スタートアップから規制動向まで、グローバルテックシーンの「今」をお届けします。

PostHogが「自社データでAIモデルを訓練する」と宣言した理由と、そのインパクト

キーポイント

本文

PostHogがかなり興味深い方針を打ち出しました。
それは、​PostHogの中にあるデータを使って、自社でAIモデルを訓練するというものです。

これ、言い方を変えると「AI機能を足す」ではなく、​AIがより賢くなる土台そのものを自前で作るという話です。
最近のSaaSはどこもAIをうたっていますが、PostHogはその中でもかなり踏み込んでいる印象があります。正直、これはなかなか面白いです。

そもそも何をしたいのか

PostHogのCEO James Hawkins氏は、今後6か月ほどでかなり重要な仕事ができると感じている、と書いています。

彼らの狙いは大きく2つです。

  1. 今ある製品をもっと賢く、もっと能動的にすること
  2. PostHog Codeのような新しいAI製品を作ること

ここでいう「能動的」というのは、単に質問に答えるだけではなく、
問題を見つけて、提案して、場合によっては先回りして動くようなイメージです。

たしかに、AIがただの「チャット窓」に留まっているうちは、まだ便利な補助輪くらいです。
でも、製品の中で実際の行動データを理解して、改善提案までできるようになると、話は一気に変わります。
PostHogは、そこを狙っているわけです。

最初に注目しているのは session replay analysis

最初の大きなテーマは、​session replay analysis です。

session replay というのは、ユーザーがサイトやアプリを操作した様子を録画のように再現できる機能のこと。
「どこで迷ったのか」「なぜ離脱したのか」を見るのに便利です。

PostHog AI はすでに replay の中で問題を見つけることができます。
でも、現状はコストが高く、スケールしにくいのが課題だそうです。

そこで、replay の元になっているデータを学習させたモデルを作れば、
個別ユーザーの問題診断だけでなく、大量のデータを扱う場面でも強くなるのではないか、という狙いがあります。

これはかなり筋がいいと思います。
なぜなら、replay は「後から見る」だけでなく、うまく使えばプロダクト改善の最短ルートになりうるからです。
ただ、目で見るだけでは限界がある。そこをAIに肩代わりさせたい、というわけですね。

もうひとつの目玉は synthetic user testing

image_0002.png

もうひとつ面白いのが、​synthetic user testing です。
これはざっくり言うと、​実ユーザーの行動パターンをもとに、AIが「この導線は混乱しそう」「このフローは壊れそう」と先に検知するような発想です。

リリース前に「ここ、ユーザーが迷うんじゃない?」を見つけられたら最高です。
実際、プロダクト開発って、作るよりも壊れ方を見つけるほうが難しいことが多いんですよね。
この領域をAIで自動化できるなら、開発チームにとってかなり大きいです。

PostHogはさらに、​予測精度が上がれば、すでに公開済みの機能についても改善提案できると考えています。
たとえば、コンバージョン率を上げる改善や、ユーザーのストレスを減らす修正を提案する、という方向です。

要するに、
​「分析ツール」から「改善を提案するツール」へ進化したいということだと思います。
ここはかなり野心的で、同時にかなり魅力的です。

何が新しいのか

PostHogが強調しているのは、AIを単なる付け足しにしないことです。

彼らは、普通のツールが「最高のコードを出す」ことに集中しているのに対し、
PostHogは​「あなたのプロダクト自体をより良くする」ことに力を注ぐと言っています。

この考え方は、PostHog Code を product editor と呼ぶ説明にもつながっています。
つまり、コードを書くだけでなく、​製品の改善そのものを編集する感覚です。

この方向性は、いかにもPostHogらしいです。
観測・分析・改善のループを、AIでさらに短くしようとしている。
私はこういう「ツールの役割を一段上げにいく」動き、わりと好きです。

でも、データを学習に使うのは大丈夫なの?

ここが一番気になるところですよね。
AIの話になると、結局はデータをどう扱うのかが核心です。

PostHogはここについて、かなり明示的に説明しています。要点は次の通りです。

この説明で印象的なのは、
​「データを使います。でもかなり条件を絞ります」​
と先にハッキリ言っていることです。

多くの企業は、こういう話を規約更新に紛れ込ませがちです。
でもPostHogは、メール通知もするし、アプリ内通知も出すし、ブログでも公開しています。
この透明性は、少なくとも姿勢としてはかなり好感が持てます。

opt out 方式を選んだ理由

PostHogは、この方針を opt out にした理由も説明しています。
つまり、​最初から有効にしておき、嫌な人だけ外す方式です。

image_0003.png

理由は単純で、​opt in(最初は無効で、同意した人だけ有効)だと、学習に足る量のデータが集まらないからです。

これはAIの現実をかなり正直に言っていると思います。
モデルは、ある程度まとまったデータがないと強くなりません。
そして、PostHogが目指すような「プロダクト改善に効くモデル」は、なおさら大量の実データが必要でしょう。

もちろん、これはユーザー目線では賛否が分かれます。
「勝手に入っているのは気になる」と感じる人もいるはずです。
ただ、PostHogはデフォルト設定、除外条件、匿名化、オプトアウト方法をきちんと説明していて、少なくとも不意打ち感は抑えようとしているように見えます。

ここが重要だと思うポイント

個人的に重要だと思うのは、PostHogが目指しているのが**“AIで便利な機能をつける”ことではなく、“AIで製品開発のループを変える”こと**だという点です。

これは単なる機能追加ではありません。
もし本当にうまくいけば、次のような流れが作れます。

この循環が回り始めると、SaaSの価値はかなり変わります。
単なる分析ツールではなく、​改善の相棒になるからです。

ただし、もちろん簡単ではないとも思います。
「何のデータが本当に役に立つのか」「どう訓練すれば精度が出るのか」は、やってみないと分からない部分が大きいはずです。
PostHog自身も、これはexperimental(実験的)​だと認めています。そこは誠実です。

まとめると

PostHogは、今後のAI機能を強化するために、​自社内のデータでAIモデルを訓練する方針を公開しました。
狙いは、既存機能の強化と、新しいAI製品の開発です。

特に注目なのは、
session replay analysis の高度化と、
synthetic user testing による先回りの改善提案です。

一方で、データ利用には慎重さも見えます。
匿名化、除外条件、opt out の明示、第三者への提供なしなど、透明性をかなり意識しているのが特徴です。

私の感想としては、これはかなり攻めた一手です。
でも、PostHogのようなプロダクト観測系の会社がここまで踏み込むのは、方向性としては自然でもあります。
AIを「飾り」ではなく「製品の中核」にしたい、という意思がはっきり見える記事でした。


参考: Training our own AI models - PostHog

同じ著者の記事