GPUサーバーを4.8万ドルで買う、という時点でだいぶ普通ではありません。
でもこの記事の面白さは「豪遊しました」ではなく、自分の働き方そのものを変えた結果として、その投資が合理的だったのかを、かなり真面目に検証しているところです。
しかも著者は「FAANGの仕事を辞めて独立研究者になった」と書いています。つまりこれは単なるガジェット自慢ではなく、収入が不安定になりうる立場で、計算資源をどう持つかという現実的な話です。ここがかなり重要だと思います。
著者が作ったのは「grumbl」という、6枚の RTX 6000 Ada GPU を載せたサーバーです。
名前の由来は「GPUs」をうまく綴れなかったから、という軽いノリ。こういう肩の力の抜け方、個人的には好きです。
RTX 6000 Ada は、ざっくり言うと AIや機械学習向けに強い高性能GPU です。
普通の人がゲーム用に買うGPUとは違って、LLMの学習や推論、つまり「AIに大量の計算をさせる」用途で使われます。
著者が候補にしたのは主に A100、H100、RTX 6000 Ada。
A100は古めで、FP8 に対応していないうえ推論性能も新世代より弱いので外し、H100と6000 Adaで比較した結果、価格と性能のバランスで6000 Adaを選んだ、という流れです。
自作GPUサーバーって、性能の話より先に電源で詰まるんですよね。
この記事でもそこが大きな山でした。

著者はアパート住まいで、データセンターみたいに電気設備を自由に増強できません。
6GPUを載せると、1つの家庭用回路では足りないので、電源ユニットを2つ使い、別々のコンセント回路に分けて接続したそうです。
ただし、ここはかなり危ない領域です。
ネットで「PCを複数のコンセントにつなぐ」と検索すると、火災の警告だらけになる、というのも当然です。なので著者は、安全確認のためにプロのPCビルダーを雇ったとのこと。
正直、これは賢い判断だと思います。数十万円の節約を狙って家を燃やしたら、笑えませんからね。
しかも面白いのは、電源制約を前提に設計したのに、後で親の家の地下室に移したので、結局は回路を増やせたこと。人生ってこういう「最初の前提、あとで崩れる」がよくあります。
この記事の核心はここです。
著者は「自分で買うのが得か、クラウドで借りるのが得か」を、実際の使用量から比較しています。
比較方法はシンプルで、GPUを使った時間をログに取り、その分を当時のクラウド料金に当てはめる、というものです。さらに、消費電力のログも取り、電気代も計算しています。
ここで重要なのは、著者が見ているのは「GPUの利用効率」ではなく、借りた場合と同じだけの時間使ったらいくらかかるかという点です。
たとえばGPU使用率が10%でも、その1時間に1回でも使っていれば「その時間は使った」とみなしています。
これはかなり保守的というか、クラウド側に有利な比較になっています。理由は、クラウドだと少しのアイドル時間でもサーバーを止める判断をする可能性があるからです。
著者は1分ごとに各GPUの使用状況を記録するスクリプトを書き、グラフ化しています。

そこから見えたのは、次のような傾向です。
利用率の平均は 76%。
2025年1月1日以降に絞ると 85% です。
著者は「24/7で実験していて、次の実験待ちもあるのに、95%以上いくと思っていた」と少し残念がっています。
この感覚、すごくわかります。人間は「忙しい感覚」と「実際に機械を回していた割合」を混同しがちです。実験って、待ち時間や準備時間が意外と多いんですよね。
最終的な計算では、2026/3/13時点で:

という結果になっています。
さらに現在のレートだと、以後は 1日あたり90〜105ドル ほど浮く計算だそうです。
ここまでくると、GPU群が「ただの高価な箱」ではなく、ちゃんと稼働資産になっている感じがあります。
ただし、これはあくまで機材代と電気代の比較です。
著者自身も書いているように、構築にかかった時間、保守、トラブル対応の手間は入っていません。ここを含めると、損得はかなり変わるかもしれません。
この記事でいちばん印象的だったのは、著者が最後にかなり率直に書いている点です。
買った理由はお金を節約するためではなく、かっこいいものを作るためだった
これ、かなり本質的だと思います。
GPUサーバーを持つと、クラウドの「使うたびに課金される」という心理的負担から解放されます。逆に、使わないことのほうが損に感じるようになる。これは所有の強みでもあり、ちょっと危ない魔力でもあります。
著者はその感覚の変化もはっきり書いていて、

と述べています。
このへん、すごく人間っぽいです。
合理性だけならクラウドが勝つ場面も多いけれど、研究や創作は気分と勢いがめちゃくちゃ重要なんですよね。そこに投資した、という話として読むと、ぐっと納得感が出ます。
著者は「もしもう一度やるなら、カスタムビルドはしない」とも書いています。
代わりに、標準的なデータセンター用サーバーを買って、コロケーション(データセンターに置くサービス)を使うほうがよかったかもしれない、と述べています。
これはかなり現実的な反省です。
家庭内に高性能GPUを置くと、電源、冷却、騒音、保険、保守、故障切り分けまで、ぜんぶ自分で背負うことになります。
自由はあるけれど、面倒も増える。そこを著者は身をもって知ったわけです。
また、いくつかの故障はriser(GPUをマザーボードから延長して接続する部品)に起因していたそうで、デバッグには Nathan Odle の riser 調査が役立ったと書いています。
このあたりは、自作ハードの世界らしい泥臭さがあります。GPU本体より、周辺部品で死ぬ。これ、かなり“あるある”です。
個人的には、この著者はかなり筋がいいと思います。
なぜなら、単に「高いGPUを買った」だけで終わらず、何にいくらかかったか、どれだけ使ったか、どこが大変だったかをログと数字で追っているからです。

しかも、結論が「絶対に自作が正解」ではないのも好印象です。
むしろ、
つまりこの話は、「GPUサーバーを買うと儲かる」という単純な成功談ではありません。
自分の仕事のやり方に投資して、その結果として経済合理性も後からついてきた、という話です。ここがいちばん面白いところだと思います。
このブログ記事は、4.8万ドルのGPUサーバーが「元を取れたか」を、かなり真面目に検証した記録です。
結果だけ見れば、クラウドと比べて約1.7万ドル得した可能性があり、サーバーはすでに回収済み。ですが本当の価値は、いつでも実験できる環境を手に入れたことにある、というのが著者の答えです。
高性能GPUの自作はロマンがありますが、同時にかなり危険で面倒でもあります。
それでも「何かを本気で作りたい人」にとっては、単なる節約ではない、創作のための装置として意味がある——そんな記事でした。