世界の技術ニュースをリアルタイムでキャッチし、日本語でわかりやすく発信。AI・半導体・スタートアップから規制動向まで、グローバルテックシーンの「今」をお届けします。

2026-05-14

UUID v4 は「ほぼ絶対に被らない」はずだったのに？──Hacker Newsで話題になった“実際の衝突”騒動を読む

キーポイント

Hacker Newsで「UUID v4 が実際に衝突した」という投稿が話題になった
UUID v4 はランダム生成に近い仕組みだが、前提は「ちゃんとした entropy（乱雑さの元）」があること
もし entropy が壊れていたり足りなかったりすると、理論上ありえないはずの重複が起きうる
コメント欄では、Cloudflare の lava lamp wall のような entropy 集めの話まで広がった
「ランダムIDだから安心」はちょっと危ない、という教訓がかなり強い

何が起きたのか

元記事は、Hacker News の Ask HN 投稿です。
投稿者は「今朝、データベースが重複 UUID を検出した」と書き込みました。

しかも、ただの重複っぽいミスではありません。

既存レコードは 2025年に追加されたもの
今日、新しい文書を insert したら
UUID v4 がまったく同じ値になった

投稿者は使っていたコードもシンプルだと説明しています。

import { v4 as uuidv4 } from "uuid";
const document_id = uuidv4();

つまり、「ライブラリに任せてUUIDを発行して、そのままDBに入れているだけ」。
それで衝突した、という話です。

しかもデータベース全体のレコード数は 約1万5000件。
普通に考えると、UUID v4 の衝突なんて天文学的に起きにくいはずです。
だから投稿者も「どう考えてもおかしい」と困惑していました。

個人的にも、これはかなり面白い話だと思います。
というのも、UUIDって「衝突しないための便利ID」の代表格みたいに扱われがちだからです。
それが実際にぶつかったとなると、「え、そんなことあるの？」となるのは自然です。

UUID v4 ってそもそも何？

UUID は Universally Unique Identifier の略で、ざっくり言うと「世界で重複しにくいID」です。
その中でも v4 は、内容のほとんどをランダムに決める方式です。

よくあるイメージとしては、

連番のIDだと予測されやすい
UUIDなら予測しにくいし、重複もほぼ起きない

という感じです。

ただし、ここで大事なのは “ランダムに見える” ことと “本当に十分ランダム” であることは別 だという点です。
UUID v4 は、ちゃんとした乱数源（entropy source）に支えられて初めて「衝突しにくい」わけです。

コメント欄の核心: 問題は UUID そのものより entropy

最上位のコメントで、あるユーザーはかなり本質的なことを言っています。

UUIDv4 の安全性は、高品質な entropy source があることを前提にしている。
その前提は、ハードウェア不良やソフトウェアバグ、entropy の意味を理解していない開発者によって壊れることがある。

要するに、UUID v4 が悪いというより、UUID を作る元の“乱雑さ”が壊れていると事故る、という話です。

ここ、地味ですが超重要です。
ランダムIDは「理論上ほぼ被らない」のであって、「宇宙の法則として絶対に被らない」わけではありません。
もし乱数生成器が変な状態なら、同じIDを何度も出してしまうことはありえます。

しかも entropy が壊れているかどうかは、意外と検出が難しい。
だから多くのシステムは、その異常に気づけないまま使い続け、衝突が起きて初めて発覚する。
これはかなり嫌な現実です。かなり人間くさい失敗でもあります。

なぜ Cloudflare の lava lamp wall の話になるのか

コメント欄では、Cloudflare がオフィスに置いている lava lamp wall の話も出てきました。
あの、ゆらゆら動くランプの壁です。

これは見た目が面白いだけではなく、entropy の源の一つとして有名です。
Cloudflare は他にも、pendulum（振り子）や mobile など、いろいろな物理現象を使って乱雑さを集めているそうです。

ここでのポイントは、物理世界はコンピュータよりランダムっぽいということです。
ソフトウェアだけで完璧なランダムを作るのは難しいので、

カメラのノイズ
マウスの動き
ボタン入力のタイミング
温度雑音
放射線

みたいな「予測しづらい現象」を混ぜることで、乱数の質を上げるわけです。

私はこの話、すごく好きです。
コンピュータの世界って基本的に「再現性」が命ですが、乱数だけは逆に「再現できないこと」が命なんですよね。
そのギャップがいかにも面白い。

Von Neumann の方法の話も盛り上がった

コメント欄では、少し数学っぽい話として Von Neumann method も話題になりました。
これは、偏ったコイン（表が出やすいコイン）から、偏りのない結果を取り出す方法です。

やり方はシンプルで、

2回コインを投げる
HT か TH なら採用
HH と TT は捨てる

というものです。

なぜこれで公平になるのかというと、HT と TH は起こる確率が同じだからです。
コインが表寄りでも裏寄りでも、順番の入れ替わりは対称なので、採用したときだけ見れば 50/50 になる、という理屈です。

このあたりのコメントは、技術の話なのに妙に楽しいです。
「乱数って、こんなふうに“偏りを消す”ことができるのか」と気づかされます。
数学の力って、こういうところで気持ちよく効くんですよね。

でも「たくさん entropy を混ぜれば安心」でもない

コメントの流れでは、「entropy の源は多ければ多いほどいい」という意見もありました。
ただ、これは半分正しくて半分危ういと思います。

たしかに、複数の独立した entropy を混ぜるのは有効です。
でも大事なのは数ではなく、独立性と品質です。

似たような入力ばかり集めても意味が薄い
混ぜ方が雑だと、強い偏りが残る
1つでも重要な入力が破綻していると、全体の品質が落ちる

つまり、「100個集めたから勝ち」ではないんですよね。
むしろ、ちゃんと質の違う入力を、ちゃんと混ぜることが大事だと思います。

この話の本当に怖いところ

この投稿が面白いのは、単なる珍事ではなく、実務的な怖さがあるからです。

UUID v4 は多くのシステムで「ほぼ安心して使える」便利な仕組みです。
でも、今回のように実際に衝突が起きたなら、考えるべきは「UUIDは信頼できない！」ではなく、

乱数の生成環境は正常だったか
実行環境に偏りはなかったか
コンテナやVMの起動直後に entropy が足りない状態ではなかったか
ライブラリやOSの乱数生成に問題はなかったか

といった、周辺の土台です。

ここが重要です。
IDの方式そのものより、IDを作る基盤の健全性のほうが本質的なリスクになりうる。
これは、実装の細部よりインフラや環境のほうが怖い、という現場あるあるでもあります。

個人的な感想

個人的には、この話は「UUID v4 が壊れた」というより、**“ランダム” を信用しすぎると痛い目を見る**という教訓だと感じました。

人は「UUIDはほぼ一意」という言葉を聞くと、つい「まあ大丈夫でしょ」と思ってしまいます。
でも実際には、そこには

ハードウェア
OS
ライブラリ
実行環境
実装ミス

みたいな、無数の前提が挟まっているんですよね。

技術って、便利になるほどブラックボックス化しがちです。
だからこそ、こういう「ありえないはずの事故」は、むしろありがたい警鐘なのかもしれません。

まとめると

このHacker Newsの投稿は、単なる珍事件ではなく、
UUID v4 の信頼性は“十分な entropy があること”を前提にしている、という基本を思い出させる話でした。

「重複しないはずのIDが重複した」とき、疑うべきはUUIDの数学だけではありません。
その背後にある乱数生成の品質、環境、実装全体です。

そして何より、コンピュータの世界で「ランダム」は思っているよりずっと繊細だ、ということ。
そこがこの話のいちばん面白くて、いちばん怖いところだと思います。

参考: Ask HN: We just had an actual UUID v4 collision... | Hacker News

同じ著者の記事

ChatGPTの会話履歴が消えた・表示されないを直す【2026年6月版】

「昨日まであった会話が、サイドバーから消えている」——ChatGPT 利用者の定番の不安だ。だが2026年の今は、1年前とは原因も設定画面もすっかり変わっている。最大の変化は、(1) かつての対処の定番だった 「Chat history & training（会話履歴とトレーニング）」トグルが廃止され、データ設定が再編されたこと。そして (2) 「アーカイブ」「一時チャット（Temporary Chat）」「プロジェクト」といった、履歴が“消えたように見える”新しい仕組みが増えたことだ。本稿では2026年時点で本当に効く見極めと対処を、頻度の高い順に整理する。 > ⚠️ 注記: ChatGPT は UI と設定項目の変更が速い。下記は本稿執筆時点（2026年6月）の挙動。「削除」した会話は UI・API・サポートのいずれからも復旧できないのは今も同じ。まずは「本当に削除したのか」を疑うこと。 --- 2026年は「消えた≠削除」が大半。まず アーカイブ / 一時チャット / 別アカウント の3つを疑う **昔の「会話履歴とトレーニング」ト

papoo.work

Metaの社員追跡ツール、一時停止へ　社内データ漏えいで何が起きたのか

Metaが、社員の作業状況を追跡する社内ツールをいったん止めました。理由はかなり皮肉で、社員の入力データが社内で見える状態になっていたからです。「人の行動を細かく集める仕組み」を作った会社が、そのデータの扱いでつまずいた。こういう話は、技術企業ではよくあるように見えて、実はかなり重いです。監視と安全管理は、ほんの少し歯車がずれるだけで一気に信頼問題になるからです。 Metaは社員向けの追跡ツール「Model Compatibility Initiative（MCI）」を一時停止した MCIはマウス操作、クリック位置、キー入力、画面内容などを集める仕組みそのデータを含む内部データベースが、社内の想定より広い範囲に見える状態になっていた Metaは「不正アクセスの兆候はない」としつつ、調査のため停止したと説明この件で、社員の反発が強いツールにさらに火がついた形になった Metaが導入したMCIは、4月に米国の社員向けに始まりました。名前はおだやかですが、やっていることはなかなか強烈です。記事によると、このツールはマウスの動き、クリックした場所、キー入力、さらには画面の内容まで集めます

papoo.work

Gaussian Splatを“印刷”する、という発想がかなり面白い

Gaussian Splat（ガウシアン・スプラット）を実物として出力してしまう。Dany Bittelさんの短い投稿は、その珍しい体験を素直に記したもので、技術好きにはたまらない内容でした。しかも単なる「できました」報告ではなく、どうやって出力しやすい形に寄せたのか、何が難しかったのかまで触れています。こういう話は、派手さはなくても妙に後を引きます。きっかけは、crysta.ai の Teng Xu さんが「昆虫の作品を印刷しませんか」と声をかけたこと Gaussian Splat は、そのままだと“視点によって色が変わる”ので、印刷向けに調整が必要だった著者は spherical harmonics を level 0 で学習し、linear space でも扱った出力では、Gaussian Splat を voxel化してから、特殊な3Dプリンターで層ごとに印刷する仕上がりは「現代版の琥珀みたい」と表現されるほど印象的ただし、色味が少し暗く茶色っぽいことや、fur の表現がまだ難しいことも率直に書かれている crysta.ai はまだ開発途中で、編集ツールや voxel

papoo.work

JDK 28 にやってくる Valhalla、10年越しの「速さ」と「わかりやすさ」の折り合い

Javaの世界で長年ほぼ伝説扱いだった Project Valhalla が、ついに JDK 28 に入ってくる見通しになりました。元記事は、このニュースを起点に「そもそも Valhalla って何なのか」「なぜこんなに時間がかかったのか」「JDK 28 で本当に何が入るのか」を、かなり丁寧にたどっています。個人的に面白いと思ったのは、Valhalla が単なる“高速化プロジェクト”ではないことです。もっと本質的には、Java の書きやすさと機械にとっての扱いやすさが、ずっとズレたままだったのを何とか揃えようとしている話なんですね。ここ、地味だけどかなり大きい。 Valhalla は、「クラスの書き心地」と「primitive のような効率」を両立させるための長期プロジェクト JDK 28 には JEP 401: Value Classes and Objects が入る見込みただしこれは preview で、しかも最初の一歩 にすぎない重要なのは、Java のオブジェクトが抱える 間接参照・メモリのばらつき・GC負荷 を減

papoo.work

Bunny DNSが無料化、しかも「クエリ課金」をやめたのがかなり大きい

bunny.netが、Bunny DNSのDNSクエリ課金を完全に撤廃しました。ざっくり言うと、DNSの問い合わせ回数に応じて料金が増える仕組みをやめた、という話です。しかも「無料化」と言っても、ただの宣伝文句ではなく、クエリ数の上限なし・リクエスト単位の課金なしまで踏み込んでいます。 DNSは普段あまり意識しない仕組みですが、Webサイトやアプリにとってはかなり重要です。住所録みたいなもの、と説明されることが多いですが、bunny.netのDNSはそれよりずっと賢い。単に名前をIPアドレスに変換するだけではなく、遅延や稼働状況を見て、どこに通信を振るかまで決められる“ルーティングエンジン”寄りのDNSです。ここがこの発表の面白いところだと思います。 bunny.netは、Bunny DNSについて次のような変更を発表しました。 DNSのクエリ課金を廃止 DNS hostingは1アカウントあたり500ドメインまで無料 クエリ数の上限なし 1リクエストごとの課金なし smart records や health monitoring も

papoo.work

Anthropicの新モデル「Mythos」は本当にバグを見つけられるのか

AnthropicのAIモデル「Mythos」を、独立系の開発者コミュニティが“セキュリティバグ探し”で試している、というのが今回の話です。元記事のテーマはかなり率直で、「このモデルは脆弱性を見つける力が本当にあるのか？」を、机上の宣伝ではなく実戦寄りのベンチマークで確かめようとしている、というものです。 AIの話はすぐに盛られがちですが、セキュリティの世界はそんなに甘くありません。バグを見つけるのは、ただコードを読むだけではなく、「ここ、妙に危ないな」と違和感を拾う作業でもある。だからこそ、Mythosのようなモデルがどこまで通用するかは、かなり面白い試金石だと思います。独立系の開発者コミュニティが、AnthropicのMythosを脆弱性検出で検証している目的は「AIがセキュリティバグを見つけられる」という主張の実力確認ベンチマークは、宣伝文句ではなく実際の検出能力を見るためのもの AIがコードレビューやデバッグを助ける可能性はあるが、過信は禁物セキュリティ領域では、AIの“それっぽさ”より再現性と正確さが重要になる元記事のタイトルは少し遊び心があります。`Will it

papoo.work

物理のゆらぎで画像を描く「Un-0」がかなり野心的だった

Unconventional AIが公開した Un-0 は、coupled oscillators（結合した振動子） のシミュレーションで画像を生成するモデル画像生成の土台に、ふつうのニューラルネットではなく 物理っぽい動きそのもの を使おうとしているのが最大の特徴 ImageNet 64×64 では FID 6.74 を達成し、公開時点の評価でかなり強い水準に入っているモデルの weights、training code、ablation code が公開されていて、試しやすいただし、学習にはまだ普通のGPUと大きな計算量が必要で、「省エネ革命がもう完成した」という話ではないこの記事でいちばん引っかかるのは、画像生成器の中身です。 Un-0 は Transformer や diffusion の延長線上にあるのではなく、振動子が互いに影響し合う物理システム を計算の本体にしています。振動子というのは、たとえばメトロノームみたいなものだと思うとわかりやすいです。1個なら勝手に一定のリズムで動くだけですが、2個、3個と並べて同じ台

papoo.work

IBMが“1nm未満”に踏み込んだ。半導体の限界を押し広げる新チップ技術

IBMがまたやりました。 2026年6月、同社は世界初という「sub-1 nanometer（1nm未満）」のチップ技術を発表しました。正確には、0.7nm、つまり7 angstromノードのトランジスタ構造を使った技術です。ここで大事なのは、単に「もっと細かく刻めました」という話ではないことです。半導体はずっと、小さくして速く、安く、省電力にする方向で進化してきました。でも、その延長線上でそろそろ限界が見え始めていた。今回の発表は、その限界に対して「まだ別の道がある」と示したようなものだと思います。 IBMが世界初のsub-1nmチップ技術を発表した 0.7nm、または7 angstromノードのトランジスタ構造を採用新しい3D構造「nanostack」で、トランジスタを縦方向に積み上げる 2nm世代と比べて、最大50%の性能向上か、70%の省電力化が見込まれる生成AI、クラウド、次世代デバイス向けの計算能力を押し上げる可能性がある量産は早ければ今後5年以内という見通し半導体の世界では、nm（ナノメートル）はとにかく小さい。1nmは100万分の1mmです。髪の毛より何万倍も

papoo.work

AIアシスタントは本当にだませるのか？ 2,000人が挑んだ“ハック実験”の結果

2,000人以上が参加し、6,000通超のメールでAIアシスタントを攻撃した目的は、`secrets.env` という秘密情報ファイルの中身を漏らさせること結果は、一度も漏えいなし。無断返信も成功しなかったただし、実験中にGoogleのメールアカウント停止やAPI料金の増加など、運用面のトラブルはかなり起きた著者は、AIエージェントに強い権限を持たせるのはまだ危ない、と考えているそれでも、思っていたより prompt injection（指示のすり替え攻撃）に強かった、というのがこの実験の意外な結論 Fernando Irarrázavalさんが公開したのは、かなり実地っぽいセキュリティ実験です。自作のAIアシスタント「Fiu」に、誰でもメールを送りつけられるようにして、なんとか秘密情報を吐かせようとする。いわば「AI相手の公開耐久テスト」ですね。狙われたのは `secrets.env` の中身です。`.env` 系のファイルは、アプリのAPIキーやパスワードなどを入れることが多いので、漏れたら普通にまずい。そこをAIに読ませ、しかもメール返信機能まで使わせて、だ

papoo.work

中国が「発電所とデータセンターを直結」したい理由

中国は、データセンターの電力を公共電力網まかせにせず、太陽光や風力から直接送る仕組みを広げようとしているその実験場になっているのが、寧夏（Ningxia）・中衛（Zhongwei）の砂漠地帯にある新しいプロジェクト 4本の専用送電線で、太陽光発電とデータセンターをつないでいるのが特徴背景には、AIの普及でデータセンターの電力需要が急増している事情があるただし、再生可能エネルギーは天候に左右されるので、理想通りにいくかはまだ未知数中国のデータセンター政策、かなり攻めています。 TNWの記事が取り上げているのは、北京が「グリーン電力をデータセンターに直接つなぎたい」と本気で考えている、という話です。正直、これはただの環境アピールではありません。AIブームで電力消費が跳ね上がるなか、今のままでは電力網が先に悲鳴を上げる。だから、発想そのものを変えにいっているわけです。記事の舞台は、中国北西部の寧夏回族自治区、中衛市の郊外。砂漠の中に並ぶ太陽光パネルから、データセンター群へ専用の送電線を引く。しかも、その電気は公共の送電網を通らない。ここが肝です。ふつうは発電した電気がいったん電力網

papoo.work