世界の技術ニュースをリアルタイムでキャッチし、日本語でわかりやすく発信。AI・半導体・スタートアップから規制動向まで、グローバルテックシーンの「今」をお届けします。

2026-05-30

Postgresだけで耐障害ワークフローを回すという発想がかなり面白い話

記事のキーポイント

DBOSは、Postgresを使って durable execution（途中で落ちても再開できる実行方式）を実現しよう、という考え方を紹介している
従来は Temporal や Airflow、AWS Step Functions のような外部の orchestrator（司令塔）がワークフローを管理する
DBOSの記事は、「そもそもデータベースが司令塔になればよくない？」という発想を押し出している
Postgresに進捗を checkpoint（保存）すれば、クラッシュしても最後の保存地点から再開できる
可観測性（observability）は、PostgresのテーブルをSQLで見るだけでかなり強力に実現できる
既存システムがすでにPostgresを使っているなら、新しい中枢システムを増やさずに済むのが大きなメリット

そもそも durable execution って何？

まず、ここがいちばん大事です。

durable execution は、ざっくり言うと「処理の途中経過をちゃんと保存しておいて、落ちても続きからやり直せる仕組み」のことです。
ゲームでいうセーブポイントみたいなものですね。敵に負けても、最後にセーブしたところから再開できるあれです。

たとえば、

外部APIを呼ぶ
データを加工する
メールを送る
決済を確定する

みたいな処理は、途中でサーバーが落ちると面倒です。
普通のプログラムだと「最初からやり直し」になりがちですが、durable execution ならどこまで終わったかを保存しているので、そこから復元できるわけです。

これはかなり実用的です。
というのも、現実のシステムは普通に落ちるからです。人間の理想より、障害のほうがよほど現実的なんですよね。

従来のやり方: 外部 orchestrator が中心になる

この記事がまず紹介しているのは、従来よくある方式です。
Temporal、Airflow、AWS Step Functions などがこの系統に入ります。

このモデルでは、ワークフローはだいたい次のように動きます。

クライアントがワークフローを送る
orchestrator がそれを記録する
worker（実際に処理する実行役）へ投げる
worker が1ステップ終える
結果を orchestrator に返す
orchestrator が checkpoint を保存する
次のステップをまた worker に渡す

つまり、司令塔がいて、worker を指揮する構造です。
これはわかりやすい反面、DBOSの記事はここにかなりはっきりした疑問を投げています。

それって、ちょっと複雑すぎない？

というわけです。

DBOSの主張: 司令塔を別に置かず、Postgres自身を orchestrator にする

記事の核はここです。
DBOSは、durable workflows の本質は「DBに状態を保存すること」なのだから、わざわざ別の orchestrator server を立てる必要はないと主張しています。

この考え方、かなり筋がいいと思います。

なぜなら、やっていることを分解すると、結局は

どのワークフローがあるか
どこまで進んだか
次に何をやるか
失敗したらどうするか

を管理しているだけだからです。
それなら、その管理を得意とするデータベースに寄せたほうが自然ではないか、という理屈です。

DBOSの記事では、Postgresに workflows テーブルを作り、アプリケーションサーバーがそこから仕事を取りに行く形を説明しています。
worker がステップを実行するたびに、その結果を Postgresへ checkpoint します。

もし worker が落ちても、別の worker がその checkpoint を見て続きから再開できます。
要するに、Postgresを中心にみんなで協調して動く構成です。

これ、発想としてはすごく地味なんですが、その地味さが逆に強い。
「中央の賢い司令塔」を増やさないというのは、システム設計ではかなり効きます。

どうやって重複実行を防ぐのか

気になるのは、「複数の worker が同じ仕事を取ってしまったらどうするの？」という点です。

記事では、Postgresの locking clause（ロック機構） や integrity constraints（整合性制約） を使うと説明しています。
簡単に言うと、

ロックで「この仕事は今この worker が取ってるよ」と押さえる
もし重複して動いても、DBの制約で「それは二重実行だよ」と検知する

という仕組みです。

ここが面白いのは、ワークフローの正しさを、アプリの知恵だけでなくDBの機能で担保していることです。
アプリ側で全部の整合性を頑張るより、データベースに得意なことをやらせるほうが、たしかに合理的です。

なぜ Postgres なのか

記事があえて Postgres に絞っているのは、単なる好みではありません。
理由はちゃんとあります。

人気が高い
スケールさせる知見が多い
エコシステムが豊富
すでに多くのアプリが使っている

つまり、Postgresは「新しい奇抜な土台」ではなく、すでに現場で鍛えられている土台なんですよね。
この安心感は大きいです。

さらに記事では、Postgresのスケーリングについても触れています。

単体の Postgres でも、毎秒数万ワークフローを処理できる規模まで縦に伸ばせる
もっと伸ばしたければ、distributed Postgres や sharded Postgres も選べる
可用性については、streaming replication や自動フェイルオーバー、マネージドサービスの multi-AZ 構成などが使える

ここで大事なのは、「Postgresならもう終わり」ではなく、既に成熟した運用の選択肢が揃っているという点です。
新しい orchestrator を1から運用するより、既存のデータベース運用の延長で考えられるのはかなり大きいと思います。

可観測性が強い: SQLでワークフローを見られる

個人的にこの記事でかなり面白いのは、この部分です。

Postgres-backed durable execution では、workflow や step の checkpoint が そのままテーブルに入るので、観測しやすい、という話です。
つまり、「今どのワークフローがどうなっているか」をSQLで直接見られるわけです。

これは強いです。かなり強い。

たとえば、

エラーになったワークフロー
先月失敗した処理
長時間止まっているジョブ
特定ユーザーの処理履歴

みたいなものを、SQLで柔軟に集計できます。
SQLはちょっと古臭く見えるかもしれませんが、こういうときは本当に頼もしいです。
「結局、最後はSQLが勝つ」みたいな場面、現場では意外と多いんですよね。

記事は、従来の orchestrator が使うシンプルな key-value store では、こういう分析的な問い合わせが難しいことを対比しています。
たしかに、観測しやすさは運用のしやすさに直結します。
作るときより、本番で何が起きているかを知れることのほうが大事だったりしますから。

信頼性とセキュリティもシンプルになる

記事では、外部 orchestrator を使う場合の問題も指摘しています。

外部 orchestrator 方式では、少なくとも

orchestrator 本体
そのデータストア

が重要な中枢になります。
つまり、故障点が増えるし、守るべき対象も増えるということです。

しかも、ワークフローの checkpoint には機密データが含まれることもあるので、セキュリティ上も気を使う必要があります。
アクセス制御、監査、ハードニングなど、やることは増えます。

一方で Postgres-backed なら、データは最初から Postgres の中だけにある。
別のシステムをまたいで情報が移動しないので、新しい攻撃面や障害点を増やしにくいわけです。

ここはかなり現実的なメリットだと思います。
システムを大きくすると、理屈よりも「守る場所が増える」ことのほうがしんどいので、部品を増やさないのは正義です。

とはいえ、万能ではないはず

ただし、これは「Postgresだけで全部解決！」という単純な話ではないと思います。

この記事の主張は筋が通っていますが、実運用では、

ワークロードの特性
チームの運用体制
既存システムとの相性
必要な observability の深さ
ワークフローの複雑さ

によって、外部 orchestrator のほうが向いているケースもあるはずです。
たとえば、専用のワークフローUIや大規模なジョブ管理機能が最初から欲しいなら、成熟した外部製品のほうが楽なこともあるでしょう。

なので私は、この記事を「外部 orchestrator は不要」と読むより、
「多くのケースで、まず Postgres を中心に考えると設計がかなり素直になる」という提案として受け取るのがよいと思います。

まとめ: “DBが中心”はかなり現実的な発想

この文章を読んで感じたのは、DBOSの主張はかなり地に足がついているということです。

派手な新機能で勝負するというより、

もともとある Postgres を活かす
中央司令塔を減らす
checkpoint をDBに保存する
SQLで観測する
既存の運用知見を流用する

という、すごくまっとうな方向に寄せています。

個人的には、こういう「新しいことを足す」のではなく「不要なものを減らす」タイプの設計思想は好きです。
システム設計って、しばしば機能を増やすほど賢く見えるのですが、実際には減らしたほうが強いことが多いんですよね。

DBOSの記事は、durable execution を考えるときに
“Orchestratorを別に持つのが当たり前” という前提を疑ってみよう
と投げかけている、そんな内容でした。

参考: Postgres-backed Durable Workflow Execution | DBOS

同じ著者の記事

Excelのフォントが変わる原因を、.xlsxを解凍して確かめてみた

「テーマフォントが原因」というところまでは、探せば辿り着ける。だが実際にファイルの中で何が参照し合っているのかを見た人は少ない。.xlsxはただのZIPなので、覗くのに5分もかからない。手元の適当なブックで試すなら、拡張子を`.zip`に変えるか`unzip`コマンドを叩くだけでいい。 ``` $ unzip -l sample.xlsx Length Date Time Name --------- ---------- ----- ---- 1234 2026-07-01 09:00 xl/theme/theme1.xml 5678 2026-07-01 09:00 xl/styles.xml ... 2345 2026-07-01 09:00 xl/worksheets/sheet1.xml ``` 犯人は`xl/theme/theme1.xml`にいる。中を`cat`すると、こんな塊が出てくる。 ```xml <a:fontScheme name="Office"> <a:majorFont> <a:latin typeface="

papoo.work

Claude の Effort、実は3段階じゃない——xhigh/maxまで含めた5段階の使い分けとAPI仕様を深掘りする

以前の記事「[Claude の effort ってどう効くの？](https://note.com/modern_ferret431/n/nc8e88b771ab0)」では、Effortパラメータを Low / Medium / High の3段階として紹介した。実際のClaude APIはもう一段深い。現行モデル（Opus 4.8/4.7、Sonnet 5、Fable 5）では low / medium / high / xhigh / max の5段階が存在し、しかも「thinkingの予算」だった旧`budget_tokens`とは効かせ方そのものが違う。本稿ではAPI仕様に基づいて、モデル別の対応状況・挙動の違い・実運用での設計指針を整理する。旧世代（Sonnet 4.5以前）の extended thinking は `thinking: {type: "enabled", budget_tokens: N}` という固定トークン予算の指定だった。「thinkingにいくら使うか」だけを制御する、いわば一次元のノブだ。 Opus 4.6以降ではこれが非推奨化

papoo.work

Claudeの「超過課金」は自動発生しない——note記事の補足と2026年6月の仕様変更

先日、[「Claudeは weekly limit や 5hours limit を突き破ったときのペナルティ料金が半端ない」](https://note.com/modern_ferret431/n/n821d3055d109) という記事が話題になった。Claude CodeやOpusでコードベース解析を回していると、10分足らずで従量課金が発生し得るという警告は実体験として貴重だが、エンジニアが実際に運用判断をする上で誤解しやすいポイントがいくつかある。本記事はその補足として、Anthropic公式ドキュメントに基づき仕組みを整理する。最大の誤解ポイントはここ。Claude Pro/Maxで週次・5時間の利用上限に達しても、Usage credits（超過課金）を明示的に有効化していない限り、追加料金は一切発生しない。上限に達した場合の既定動作は「リセットまで待つ」だけで、勝手にAPI従量課金へ切り替わることはない。有効化するには以下の手順が必要: `Settings > Usage` から Usage credits セクションで Enable をクリック

papoo.work

【2026年7月版】Outlookが「起動しない・クラッシュを繰り返す」最新事情 — 6月末の一斉クラッシュはビルド2605が原因、直し方はほぼ一択

「昨日まで普通に使えていたClassic Outlookが、右クリックした瞬間に落ちる」「起動してもすぐ強制終了し、次はセーフモードで開く」——2026年6月末から、この手の悲鳴がまた一気に増えた。半年前・1年前に書かれた「Outlookが起動しない完全解決ガイド」的な記事が今また読まれているのは、まさに今、Classic Outlookのクラッシュが立て続けに起きているからだ。本稿は、2026年前半に発生した複数のクラッシュ事案を発生時期・影響ビルド・原因・修正状況で整理し直し、「自分のケースはどれで、何をすれば直るか」を最短で切り分けられるようにしたものだ。結論から言うと、直近の主犯は更新プログラムの回帰（リグレッション）で、多くは“Officeを最新へ更新するだけ”で直る。設定を9個いじる前に、まずここを見たほうが早い。 > ⚠️ 先に結論: 2026年6月29日ごろから急にClassic Outlookが落ち始めたなら、疑うべきは自分の設定ではなく **Microsoft 365 Apps バージョン2605（Build 20026.20182

papoo.work

【2026年7月版】Outlookの「送信済みメールが消える」が再燃 — 犯人はWindows更新プログラム KB5074109 の可能性

「送信は成功したのに、送信済みアイテムに残っていない」——Outlookの定番トラブルが、2026年に入ってから再び相談件数を増やしている。半年前(2026年1月)に出回った解説記事の手順は今でも基本として有効だが、2026年に急増した“送信済みが消える”の主犯は、従来の設定ミスではなく Windows のセキュリティ更新プログラムそのものであることが分かってきた。本稿はその現況を、切り分け順に整理し直したものだ。 > ⚠️ 先に結論: 1月中旬以降にClassic Outlook(デスクトップ版)で急に「送信済みに入らない」「Outlookが固まる」が始まったなら、まず疑うべきは自分の設定ではなく 更新プログラム KB5074109 と PSTファイルの置き場所(OneDrive配下かどうか) だ。設定を10個いじる前に、ここを先に見たほうが早い。 --- 2026年1月のWindowsセキュリティ更新 KB5074109 導入後、**Classic Outlookで送信メールが「送信済みアイテム」に記録されない／Outlookが終了しない・フ

papoo.work

【続報】サナエトークン、ついに「当事者2人の法廷闘争」へ――三崎優太氏が溝口勇児氏に内容証明、いまどこまで進んだか

前回まで、私たちはサナエトークン騒動を「補償」「金融庁」「高市首相の否定」という3つの軸で追ってきた。補償は6月10日に申請サイトが開き、金融庁の損失相談は6月時点で5件、首相は国会で改めて全面否定――というのが直近の現在地だった。ところが騒動はここへ来て、まったく別の局面に入っている。行政・補償の話から、当事者どうしの個人間紛争、それも法廷闘争へと重心が移ったのだ。本稿はその続報である。 https://papoo.work/doc/7de9f0cf1b564dc9 実業家の三崎優太氏（元「青汁王子」）が、実業家の溝口勇児氏に内容証明を送付したと明かし、「きっと裁判になる」と法廷闘争を予告した。三崎氏は溝口氏とみられる人物の会議音声を公開し、「責任を他人になすりつけている（＝トカゲの尻尾切り）」と批判。溝口氏は「編集で切り取っている」「補償対応はやっている」と反論した。 6月26日、三崎氏は両者が共同運営していたYouTube番組「REAL VALUE」からの脱退を表明。ただし本稿執筆時点（7月7日）で、**正式な「提訴」の公

papoo.work

ブラウン大学で起きた「AIカンニング」騒動、大学の信頼はどう守るのか

ブラウン大学の経済学者ロベルト・セラーノ教授が、担当科目の試験で少なくとも50人がAIを使って不正をしたと訴えている。問題になったのは、持ち帰って解く形式の試験。自宅でじっくり考えられる反面、ChatGPTのようなAIを使いやすい。期末試験では平均点が一気に落ち、欠席者の多くが前回満点だったことから、教授は「証拠は圧倒的」と見ている。ブラウン大学の反応は鈍く、教授は「大学全体で学問の誠実さを守る議論が必要だ」と主張している。背景には、米国の名門大学で広がるAI利用の誘惑と、教育のあり方そのものを揺さぶる問題がある。ブラウン大学で起きたこの話、かなり重いです。しかも、ただの「試験でズルした人がいました」という話では終わりません。大学が長年かけて築いてきた信頼、つまり「ここで学んだ学生の成績には意味がある」という前提そのものが、AIの登場でぐらついている。この記事は、その現場で何が起きているのかをかなり生々しく伝えています。中心にいるのは、ブラウン大学の著名な経済学者ロベルト・セラーノ教授です。彼は、数学的経済学の上級学部生向け講義 ECON 1170 を担当していて、

papoo.work

AIにMRIを読ませたら、医師と真逆の答えが出た話

肩が痛い。だからMRIを撮った。そこまではよくある話です。ところがこのブログ記事は、そこで終わりません。著者はそのMRI画像を、OpenAI系のモデルではなく、Claude Code上で動かしたOpus 4.8に読ませて、「もう一つの診断」を引き出そうとします。で、出てきた答えがかなり衝撃的でした。医師は「腱板の部分断裂（Grade III）」と見たのに、AIは「腱は保たれている」と判断したんです。この差、かなり大きいです。しかも著者は、ただAIに雑に投げたわけではありません。DICOM形式のMRIデータを用意し、Claude Codeに必要なパッケージを入れさせ、かなり本気で解析させています。単なるお遊びではなく、「AIが医療画像をどこまで読めるのか」を自分の体で試した記録、と言ったほうが近いです。肩の痛みでMRIを撮った著者が、AIに画像の再読影をさせた人間の医師は「Grade IIIの部分断裂」と判断した Opus 4.8は最初、「腱は正常」と報告したその後、別の条件で再比較させた結果、AIは「明らかな断裂は見当たらない」と結論づけたただし著者自身は、AIも医師も完全に

papoo.work

AIコーディングは「レビュー」より「テスト」で殴るほうが強い、という話

著者は、AI coding を使っていると「人間なら即クビ」レベルの妙な挙動に何度も遭遇したが、それでも利用をやめるどころか、さらに使い込むようになった。この記事の中心テーマは、AI にコードを書かせるときは code review 以上に test process が大事 だ、という主張。その根拠として、著者は昔働いていた CPU 設計会社 Centaur のテスト文化を紹介する。そこでは、手書きテストより fuzzing や random testing を重視し、unit test はほぼ使わず、専任の test engineer がいた。著者は、AI 時代の開発でも「人間が全部レビューする」より、「大量の自動テストで叩く」ほうが現実的で、しかも強いと考えている。ただし、これは単なる理想論ではなく、実際にバグを見つけて直してきた現場の感覚から来ている。本文を読んでまず面白いのは、著者の出発点がかなり変わっていることです。AI coding を「便利な補助輪」ではなく、かなり攻めた実験装置として見ています。しかも、その最初の印象がすごい。バ

papoo.work

Apple Neural Engineの中身を、かなり踏み込んで覗いた研究

Appleの「Neural Engine」、通称ANEは、iPhoneやMacの中で静かに働く専用チップです。顔認識、写真の補正、音声処理、生成AIの一部まで、裏側でかなり多くの仕事を抱えています。ふだんはCore MLというApple公式の仕組み越しにしか使えないので、一般の開発者から見ると「中はブラックボックス」の代表格でした。今回のarXiv論文は、そのブラックボックスをかなり本気で分解したものです。しかも単なる憶測ではなく、Apple silicon上での直接計測と、private runtime、compiler、kernel driver、firmwareの静的解析を組み合わせている。こういう研究は地味に見えて、実はとても面白いです。Appleが“使わせるつもりのない層”にまで手を伸ばして、仕組みを記述しているわけですから。この論文は、Apple Neural Engineのアーキテクチャ、プログラミング方法、性能の限界をまとめた「リバースエンジニアリングのガイド」です。対象はA11世代のiPhone/iPadチップからA18、そしてM1からM5まで。かなり広い。特に

papoo.work