PaPoo
cover
technews
Author
technews
世界の技術ニュースをリアルタイムでキャッチし、日本語でわかりやすく発信。AI・半導体・スタートアップから規制動向まで、グローバルテックシーンの「今」をお届けします。

Coinbaseに起きた「最悪の一週間」:人員削減、赤字、そしてAWS障害で7時間停止

キーポイント

何が起きたのか

Coinbaseにとって、この週はかなりえげつない展開でした。

月曜日に約700人のレイオフ、木曜日に約3億9400万ドルの四半期損失、そして金曜日にはAWSのデータセンター障害で約7時間のサービス停止。
順番だけ見ても「ついてない」では済まないレベルです。しかも最後の障害原因が、サイバー攻撃でもソフトウェアのバグでもなく、​データセンターが熱くなりすぎたことだったのが面白いところです。いや、面白いというより、かなり象徴的だと思います。

7時間止まった理由は「建物が暑すぎた」

Coinbaseによると、障害はAWSの米国バージニア州・北バージニアの施設で起きました。
AWSの説明では、​1つのデータセンター内の温度上昇が原因で、EC2(仮想サーバー)やEBS(ストレージ)に電源関連の障害が起きたとのことです。

ここで出てくる「データセンター」とは、ざっくり言うとサーバーを大量に置いている巨大な建物です。
コンピューターは動くと熱を出すので、冷却が命です。冷やせなくなると、当然サーバーは止まります。

image_0002.jpg

Coinbaseは、​取引、送金、コア機能をすべて停止し、アプリも性能が落ちたと説明しました。
つまり利用者側から見ると、「売買したいのにできない」「送金したいのに反応が遅い」という状態です。暗号資産の世界でこれはかなり痛い。価格変動が激しい市場では、数分止まるだけでもストレスが大きいのに、7時間は長いです。

なぜこれが重要なのか

今回の件でまず目を引くのは、​Coinbase自身がサーバーを持っていたわけではないことです。
CoinbaseはAWSのようなクラウドサービスを使って動いています。クラウドというのは、簡単に言えば「自前のサーバーを持たず、他社の巨大な計算機を借りて使う仕組み」です。

便利です。とても便利。
でも、その裏側では他人の建物・他人の電源・他人の冷却設備に依存します。今回のように、物理的なトラブルが起きると、自分たちがどれだけソフトウェアを工夫していても止まるときは止まるわけです。

個人的には、ここがいちばん本質的だと思います。
「クラウドだから安心」ではなく、​**クラウドは“自分で管理しない代わりに、失敗の種類も管理できない”**ということなんですよね。

image_0003.jpg

AWSのUS-EAST-1は、やっぱり“強すぎる”がゆえに弱点もある

記事では、AWSのUS-EAST-1地域が何度も登場します。これはバージニア州北部にある、AWSで最も古く、最も使われているリージョンのひとつです。
リージョンは、クラウド事業者が地域ごとに設けているデータセンター群のまとまりだと思えば大丈夫です。

ここは多くの企業が使っていて、インターネットの重要インフラがかなり集中しています。
つまり、ここで何か起きると影響が広がりやすい。実際、CoinbaseだけでなくCME GroupやFanDuelにも影響が出たと報じられています。

便利さの裏返しで、みんなが同じところを使いすぎると、​​「1か所の失敗が大きな連鎖障害になる」​んですよね。
これはクラウドの弱点として、かなり前から指摘されてきた問題です。

“AIで効率化”と言った週に、現場は止まった

Coinbaseの1週間が象徴的なのは、障害だけではありません。
月曜にはCEOのBrian Armstrong氏が、​全体の約14%、約700人を削減すると発表しました。理由としては、AIを前提に組織を作り直すためだと説明しています。

image_0004.jpg

記事によると、同氏は「非技術部門も本番コードを書いている」「業務の多くは自動化されつつある」と述べ、管理職を減らして、技術も見る“player-coaches”に置き換える方針を打ち出しました。

この流れ、最近のテック業界ではかなり定番です。
​「AIで生産性が上がるから人を減らす」​という話ですね。
正直、この言い方はとても強いし、経営としてはわかりやすい。でも現場からすると、そんなに簡単じゃないはずだと思います。

しかも、その週の最後に起きたのが「AIで速くなる未来」ではなく、​建物が熱を持ちすぎて全停止というのが皮肉です。
未来志向のメッセージを出した直後に、物理世界の都合で止まる。これ、すごく現代的なコントラストだと感じます。

業績もかなり重い

木曜日に発表された四半期決算も厳しいものでした。

image_0005.jpg

一方で、明るい材料もゼロではありません。
Coinbaseは**世界の暗号資産取引量の8.6%**を占め、過去最高だったほか、デリバティブ取引量は前年同期比169%増だったそうです。

つまり、​市場シェアは伸びているのに、収益は苦しいという状態です。
これはかなりしんどい。シェアが伸びていても、市場全体が冷えていると売上や利益に結びつきにくい。
「勝っているのか、負けているのか、よく分からない」感じがあって、経営としては相当難しい局面だと思います。

依存のリスクは、ソフトではなく“構造”にある

今回の記事がうまいのは、単なる障害速報で終わらず、​構造的なリスクを指摘している点です。

image_0006.png

Coinbaseのような金融性の高いサービスが、

の上に乗っている。
これって、普段は意識しないけれど、かなり怖い話です。

しかもクラウドは、AWS・Microsoft Azure・Google Cloudのような少数の巨大事業者に集中しています。
これが便利さの源泉でもある一方で、​​「止まるときはまとめて止まる」​というリスクにもつながるわけです。

この記事の最後の一文はかなり印象的でした。
“The cloud is someone else’s computer. This week, it was also someone else’s thermostat.”
要するに、「クラウドは他人のコンピューターだ。今週は他人のサーモスタット(温度調節装置)でもあった」ということ。
しゃれているけど、かなり本質を突いています。

image_0007.jpg

私見:AIより先に“冷やす力”を見直したほうがいいのでは

この記事を読んで思ったのは、テック業界は今、AIの話に寄りすぎていないか、ということです。
もちろんAIは重要です。でも、どれだけ賢いソフトを作っても、土台の電源、冷却、冗長性(予備を用意して止まりにくくする設計)が弱いと、全部ひっくり返ります。

特に金融や暗号資産みたいに、止まること自体が大きな損失になるサービスでは、
​「AIで何ができるか」より「インフラが何をしのげるか」​のほうが大事ではないか、と思います。

今回のCoinbaseは、まさにその弱さを見せつけました。
人を減らし、AIを語り、業績は苦しく、最後はデータセンターの熱で止まる。
派手さはないけれど、かなり現代的で、しかも残酷なニュースです。

まとめ

Coinbaseの1週間は、単なる不調ではなく、​テック企業の脆さが全部まとめて出た週でした。

image_0008.jpg

表面だけ見るとバラバラの出来事ですが、実はすべて「AI時代に会社はどうあるべきか」「インフラにどこまで依存してよいか」という同じ問いにつながっています。
個人的には、このニュースは暗号資産業界だけの話ではなく、​クラウドに乗るすべてのサービスにとっての警告だと思います。


参考: Coinbase cut 700 jobs on Monday, lost $394 million on Thursday, and went dark on Friday because a data centre overheated

同じ著者の記事