世界の技術ニュースをリアルタイムでキャッチし、日本語でわかりやすく発信。AI・半導体・スタートアップから規制動向まで、グローバルテックシーンの「今」をお届けします。

2026-05-22

4.8万ドルのGPUサーバーは元が取れたのか？自作かクラウドか、独立研究者のリアルな採算報告

記事のキーポイント

著者はFAANG企業を辞め、独立研究者になるために 6枚の RTX 6000 Ada を積んだGPUサーバー「grumbl」を自作した
価格は 約4.8万ドル。かなり高いが、「仕事を早く進められるなら投資になる」という発想で購入
住んでいるのがアパートだったため、電源制約が大きな壁になり、2つの電源を別回路のコンセントに分ける構成にした
自前サーバーの利用率は 平均76%、2025年以降に絞ると 85%
2026/3/13時点の試算では、クラウドで同等の計算資源を借りるより 約1.7万ドル安かった
ただし、自分の作業時間・構築や保守の手間はコスト計算に入っていない
結論としては「節約のため」よりも、面白いものを作るための投資だった、というのが著者の本音

まず、この話が面白い理由

GPUサーバーを4.8万ドルで買う、という時点でだいぶ普通ではありません。
でもこの記事の面白さは「豪遊しました」ではなく、自分の働き方そのものを変えた結果として、その投資が合理的だったのかを、かなり真面目に検証しているところです。

しかも著者は「FAANGの仕事を辞めて独立研究者になった」と書いています。つまりこれは単なるガジェット自慢ではなく、収入が不安定になりうる立場で、計算資源をどう持つかという現実的な話です。ここがかなり重要だと思います。

何を買ったのか

著者が作ったのは「grumbl」という、6枚の RTX 6000 Ada GPU を載せたサーバーです。
名前の由来は「GPUs」をうまく綴れなかったから、という軽いノリ。こういう肩の力の抜け方、個人的には好きです。

RTX 6000 Ada は、ざっくり言うと AIや機械学習向けに強い高性能GPU です。
普通の人がゲーム用に買うGPUとは違って、LLMの学習や推論、つまり「AIに大量の計算をさせる」用途で使われます。

著者が候補にしたのは主に A100、H100、RTX 6000 Ada。
A100は古めで、FP8 に対応していないうえ推論性能も新世代より弱いので外し、H100と6000 Adaで比較した結果、価格と性能のバランスで6000 Adaを選んだ、という流れです。

いちばん現実的な壁は「電気」

自作GPUサーバーって、性能の話より先に電源で詰まるんですよね。
この記事でもそこが大きな山でした。

著者はアパート住まいで、データセンターみたいに電気設備を自由に増強できません。
6GPUを載せると、1つの家庭用回路では足りないので、電源ユニットを2つ使い、別々のコンセント回路に分けて接続したそうです。

ただし、ここはかなり危ない領域です。
ネットで「PCを複数のコンセントにつなぐ」と検索すると、火災の警告だらけになる、というのも当然です。なので著者は、安全確認のためにプロのPCビルダーを雇ったとのこと。
正直、これは賢い判断だと思います。数十万円の節約を狙って家を燃やしたら、笑えませんからね。

しかも面白いのは、電源制約を前提に設計したのに、後で親の家の地下室に移したので、結局は回路を増やせたこと。人生ってこういう「最初の前提、あとで崩れる」がよくあります。

自作サーバー vs クラウドGPU

この記事の核心はここです。

著者は「自分で買うのが得か、クラウドで借りるのが得か」を、実際の使用量から比較しています。
比較方法はシンプルで、GPUを使った時間をログに取り、その分を当時のクラウド料金に当てはめる、というものです。さらに、消費電力のログも取り、電気代も計算しています。

ここで重要なのは、著者が見ているのは「GPUの利用効率」ではなく、借りた場合と同じだけの時間使ったらいくらかかるかという点です。
たとえばGPU使用率が10%でも、その1時間に1回でも使っていれば「その時間は使った」とみなしています。
これはかなり保守的というか、クラウド側に有利な比較になっています。理由は、クラウドだと少しのアイドル時間でもサーバーを止める判断をする可能性があるからです。

利用率はどうだったのか

著者は1分ごとに各GPUの使用状況を記録するスクリプトを書き、グラフ化しています。

そこから見えたのは、次のような傾向です。

3回の停止期間があり、保守作業が必要だった
2025年6月以降に、明らかに利用が増えた
それ以前は小さな実験が多く、開発時間と実験時間が近かったので、待ち時間が目立った
2025年6月以降は、より大きなプロジェクトに入り、複数GPUを常時回すようになった

利用率の平均は 76%。
2025年1月1日以降に絞ると 85% です。

著者は「24/7で実験していて、次の実験待ちもあるのに、95%以上いくと思っていた」と少し残念がっています。
この感覚、すごくわかります。人間は「忙しい感覚」と「実際に機械を回していた割合」を混同しがちです。実験って、待ち時間や準備時間が意外と多いんですよね。

いくら得したのか

最終的な計算では、2026/3/13時点で：

同等の計算資源をクラウドで借りた場合の費用は 約6.8万ドル
電気代は 約3000ドル
差し引きで、約1.7万ドルの節約

という結果になっています。

さらに現在のレートだと、以後は 1日あたり90〜105ドル ほど浮く計算だそうです。
ここまでくると、GPU群が「ただの高価な箱」ではなく、ちゃんと稼働資産になっている感じがあります。

ただし、これはあくまで機材代と電気代の比較です。
著者自身も書いているように、構築にかかった時間、保守、トラブル対応の手間は入っていません。ここを含めると、損得はかなり変わるかもしれません。

でも本当に大事なのは「節約」ではない

この記事でいちばん印象的だったのは、著者が最後にかなり率直に書いている点です。

買った理由はお金を節約するためではなく、かっこいいものを作るためだった

これ、かなり本質的だと思います。
GPUサーバーを持つと、クラウドの「使うたびに課金される」という心理的負担から解放されます。逆に、使わないことのほうが損に感じるようになる。これは所有の強みでもあり、ちょっと危ない魔力でもあります。

著者はその感覚の変化もはっきり書いていて、

レンタル時代は「この実験、本当に価値ある？」と毎回考えた
所有後は「使わないほうがもったいない」と感じる
クラウドの起動・停止の面倒がなくて快適

と述べています。

このへん、すごく人間っぽいです。
合理性だけならクラウドが勝つ場面も多いけれど、研究や創作は気分と勢いがめちゃくちゃ重要なんですよね。そこに投資した、という話として読むと、ぐっと納得感が出ます。

反省点と、もしやり直すなら

著者は「もしもう一度やるなら、カスタムビルドはしない」とも書いています。
代わりに、標準的なデータセンター用サーバーを買って、コロケーション（データセンターに置くサービス）を使うほうがよかったかもしれない、と述べています。

これはかなり現実的な反省です。
家庭内に高性能GPUを置くと、電源、冷却、騒音、保険、保守、故障切り分けまで、ぜんぶ自分で背負うことになります。
自由はあるけれど、面倒も増える。そこを著者は身をもって知ったわけです。

また、いくつかの故障はriser（GPUをマザーボードから延長して接続する部品）に起因していたそうで、デバッグには Nathan Odle の riser 調査が役立ったと書いています。
このあたりは、自作ハードの世界らしい泥臭さがあります。GPU本体より、周辺部品で死ぬ。これ、かなり“あるある”です。