世界の技術ニュースをリアルタイムでキャッチし、日本語でわかりやすく発信。AI・半導体・スタートアップから規制動向まで、グローバルテックシーンの「今」をお届けします。

2026-05-18

Firecrawl・OpenRouter・GitHub Actionsでニュースソース追加を自動化した話

記事のキーポイント

手作業でやっていた「ニュースソース追加」を、月1回の自動処理に置き換えた
まず Firecrawl でランキングページをきれいな Markdown に変換する
OpenRouter の無料で使える複数の LLM を順番に試し、ニュースサイトのURLを抽出する
さらに web_search ツールでURLの妥当性を確認し、壊れたURLや誤検出を減らす
生成した YAML を重複チェックしたうえで保存し、GitHub Actions が PR を自動作成する
マージ後は既存の CI が検証・反映まで行い、ライブダッシュボードにすぐ表示される

手作業の「地味に面倒」な部分をAIで消した話

この記事は、Source Score というマイクロサービスの開発を続けている筆者が、「ニュースソースの追加」を自動化した記録です。

最初は、ソースはたった5件を手で追加して動作確認していたそうです。まあ、最初の一歩としてはすごく自然です。システムを作るとき、最初から完璧に自動化しようとすると逆に進まないので、まずは人力で土台を作るのはよくあるやり方です。

でも問題は、その先です。
世界中の主要ニュースサイトを定期的に取り込みたいのに、毎回手作業でPRを作るのは正直しんどい。そこで筆者は、

ランキングページを取得する
そこからURLを抜き出す
YAMLファイルに整形する
GitHub ActionsでPRを作る

という流れを、ほぼ全部自動にしたわけです。

この「地味な作業を機械に任せる」感じ、個人的にはかなり好きです。AIの派手さより、こういう実務寄りの使い方のほうがずっと価値があると思います。

まずは Firecrawl でページをきれいに読む

最初の課題は、ニュースランキングが載っているページをどう扱うかでした。
元のHTMLは広告や見出し、脚注などが混ざっていて、そのままでは扱いづらい。そこで使ったのが Firecrawl です。

Firecrawl は、Webページをスクレイピングして、読みやすい形に整えてくれるツールです。ここでいう スクレイピング は、Webページから情報を機械的に集めることです。人間が見る画面そのものではなく、プログラムが処理しやすい形に変えるイメージですね。

筆者は Firecrawl を使って、ページを Markdown に変換しています。Markdown は、見出しや箇条書きをシンプルに表せるテキスト形式です。HTMLよりずっと軽く、LLMにも渡しやすい。
この判断はかなり賢いと思います。AIに長文のゴミだらけHTMLを渡すより、Markdownにしてから投げたほうが、抽出精度が上がりやすいからです。

LLMでURLを抜き出す。ただし1回では終わらない

次に筆者は、OpenRouter を使って LLM にURL抽出をさせています。
OpenRouter は、複数のモデルをまとめて扱えるサービスです。しかも無料枠があるので、コストを抑えながら試せるのが魅力だったようです。

ここで面白いのは、1つのモデルに頼り切っていない ことです。
筆者は無料モデルを3つ用意し、1つが失敗しても次を試す作りにしています。対象モデルは以下です。

gemma-4-31b-it
nemotron-3-nano-omni-30b
gemma-4-26b

LLMは便利ですが、APIが失敗したり、返答が空になったりすることがあります。
なので「ダメなら次へ」という実装は、かなり現実的です。AIを本番運用に組み込むときは、魔法扱いせず、普通のシステムとして壊れ方を想定するのが大事なんですよね。

LLMへの指示はかなりシンプルで、

このドキュメントに載っている人気ニュースサイトのURLを10件出して
余計な説明は不要
1行に1URLだけ

という形です。

ただし、ここで出てくる結果は完璧ではなく、余計な文字が混ざったり、URLが省略されたりすることもあるそうです。
ここが「AIを使えば全部一発で終わるわけじゃない」ポイントです。むしろ、AIは下書きを作るのが得意 で、最終確認は別の工程で補うのが現実的だと思います。

2段階目で web_search を使ってURLを検証する

1回目のLLM出力だけだと不安なので、筆者はもう1回 OpenRouter を使います。今度は web_search ツールを使って、URLの正しさを確認しています。

ここでの考え方はシンプルです。

まずLLMに候補を出させる
次に web_search で実在するURLか確認する
無効なものは捨てる
正しいURLだけを残す

これはすごく堅実です。
LLMはもっともらしい嘘を混ぜることがあります。いわゆる hallucination です。日本語だと「幻覚」と訳されますが、要するに「それっぽいけど実は違う情報」を出してしまう現象です。
だからこそ、最後に検索で検証するのは正解だと思います。AIを信じすぎず、裏取りを自動化する。ここに本当の実用性があります。

URLからYAMLを生成する

URLがきれいに取れたら、次は Source YAML を作ります。
YAML は設定ファイルによく使われる、人間に読みやすいデータ記述形式です。例えば「名前」「URL」「説明」みたいな情報を整理して書けます。

筆者はここでもLLMを使い、既存のYAMLサンプルを「schema例」として与え、その形式に合わせて各ニュースソースのYAMLを生成させています。
つまり、

どんな項目が必要かをサンプルから学ばせる
URL一覧を渡す
各媒体の情報を調べて、同じ形のYAMLを作らせる

という流れです。

これもなかなか面白い使い方です。AIに「文章を書いて」と頼むのではなく、決まった構造のデータを埋めさせる のがポイントです。
LLMは自由作文よりも、「型に沿った生成」で真価を発揮しやすいと思います。

既存データとの重複を避けて安全に保存する

生成したYAMLをそのまま保存すると、同じソースを何度も作ってしまう可能性があります。
そこで筆者は、sources/ 配下の既存YAMLを全部読み込み、name と uri を比較して、すでにあるものは除外しています。

さらに、ファイル名もそのまま使わず、使えない文字を置換して安全な名前にしています。

このへんは地味ですが、とても大事です。
AIでファイルを量産するときは、内容よりも 安全な保存処理 のほうが事故防止に効きます。上書き事故や重複は、本当にあとで面倒なので。

GitHub Actionsで毎月自動実行する

最後の仕上げが GitHub Actions です。
これは GitHub 上で定期実行やCIを動かせる仕組みで、今回のような自動化と相性がいいです。

筆者のワークフローは毎月1日に動き、

リポジトリをチェックアウト
新しいブランチを作成
Python環境をセットアップ
スクリプトを順番に実行
新しいYAMLをコミット
PRを自動作成

という流れです。

PRがマージされると、既存の validate.yml がYAMLの正しさを確認し、post_on_merge.yml がAPIに反映します。
つまり、人間は最後にPRをマージするだけ。それ以外はほぼ自動です。

個人的には、この「自動でPRを作る」という形がとても良いと思います。
いきなり本番反映ではなく、ちゃんとPRレビューの余地を残している。自動化しつつ、人間の確認ポイントも残しているので、安心感があります。

実際の結果はかなり良い

筆者によると、この仕組みで新しいソースは正しいURLと短い説明付きで追加され、CIも問題なく通ったとのことです。
しかも、毎月かかる人間の作業時間は「PRをマージする1分未満」になったそうです。

これはかなり強いです。
「AIで全部置き換える」というより、「退屈な手作業だけを削る」アプローチとして優秀です。こういうのを見ると、AIの価値は派手な生成物より、継続運用の摩擦を減らすこと にあるんだなと改めて思います。

次に狙っているのは claims と proofs

筆者は次の課題として、同じパターンを claims と proofs に広げたいと書いています。
ソース追加よりデータセットが大きく、検証も複雑で、LLMの幻覚が起きやすいので、より難しくなるようです。

ここはまさに本番っぽい話です。
単純なリスト追加は自動化しやすいけれど、検証対象が増えるほどAIの弱点も見えやすくなる。だからこそ、今回の仕組みを土台に次へ進む、という流れは自然です。

まとめ

この記事の面白さは、AIを「賢いチャットボット」として使っているのではなく、スクレイピング・抽出・整形・検証・PR作成 という実務パイプラインの一部として使っている点にあります。

Firecrawlで入力を整え、OpenRouterで候補を作り、web_searchで裏取りし、GitHub Actionsで定期運用する。
この流れは、かなり実用的ですし、再利用もしやすいはずです。

派手さはないけれど、こういう「毎月やる面倒を消すAI活用」こそ、いちばん効くのではないかと思います。
AI導入の本命は、会話のうまさより、面倒な定型作業をちゃんと終わらせる力なのかもしれません。

参考: Source Score: Using AI to automate addition of new sources

同じ著者の記事

Excelの文字が勝手に変わる本当の理由 ―― テーマフォントとAptos騒動

「昨日まで普通だったのに、開いたら文字の形も行の高さも違う」。Excelでこれをやられると地味に腹が立つ。ネット上の解説は「値のみ貼り付けを使え」「条件付き書式を消せ」で止まっているものが多いが、それは症状の一部でしかない。原因の大半は、もっと下のレイヤーにある。フォント名がセルに直接書かれていないこと ―― つまりテーマフォントという仕組みだ。 Excelのフォント一覧を開くと、いちばん上に「テーマのフォント」という区切りがあって、`游ゴシック（本文）` `游ゴシック Light（見出し）` の2つが並んでいる。既定の状態では、あなたが打ち込んだセルはこの「本文のフォント」を参照している。具体的な書体名（游ゴシック）を持っているのではなく、「このブックのテーマが本文用に指定している書体、それが何であれ」という*ポインタ*を持っているだけだ。だから、テーマが変わればセルの見た目も一斉に変わる。ページレイアウトタブの「テーマ」や「フォント」を切り替える、別のテーマが設定されたブックにシートをコピーする、あるいはテーマ設定の異なる環境でファイルを開く ―― どれをやっても、一文字

papoo.work

Outlook「送信済みメールが見つからない」を2026年版で仕分ける — Classic / New Outlook / Exchange Online / OAuth / Recoverable Items

「送信は成功したのに、送信済みアイテムに残っていない」——Outlook 定番のトラブルだが、2026年の対処は1年前と大きく変わった。理由は3つ。(1) New Outlook for Windows が Classic Outlook を段階的に置き換え、`.ost` を持たない Web ベース実装に変わりつつあること。(2) Exchange Online の Basic Auth 廃止が長期化し、レガシー IMAP/POP クライアント側の「送信済み」問題が実運用に響いていること。(3) Copilot for Microsoft 365 のインデックス連携と Retention / Litigation Hold の干渉で、「消えた」ではなく「別階層に隔離された」パターンが増えたこと。本稿では2026年時点の原因を頻度・切り分け順に整理する。 > ⚠️ 前提: 「Outlook」といっても実体は Classic Outlook (Win32 / OL2016〜2024 / M365 Apps)、**New Outlook for

papoo.work

ChatGPTの会話履歴が消えた・表示されないを直す【2026年6月版】

「昨日まであった会話が、サイドバーから消えている」——ChatGPT 利用者の定番の不安だ。だが2026年の今は、1年前とは原因も設定画面もすっかり変わっている。最大の変化は、(1) かつての対処の定番だった 「Chat history & training（会話履歴とトレーニング）」トグルが廃止され、データ設定が再編されたこと。そして (2) 「アーカイブ」「一時チャット（Temporary Chat）」「プロジェクト」といった、履歴が“消えたように見える”新しい仕組みが増えたことだ。本稿では2026年時点で本当に効く見極めと対処を、頻度の高い順に整理する。 > ⚠️ 注記: ChatGPT は UI と設定項目の変更が速い。下記は本稿執筆時点（2026年6月）の挙動。「削除」した会話は UI・API・サポートのいずれからも復旧できないのは今も同じ。まずは「本当に削除したのか」を疑うこと。 --- 2026年は「消えた≠削除」が大半。まず アーカイブ / 一時チャット / 別アカウント の3つを疑う **昔の「会話履歴とトレーニング」ト

papoo.work

AIモデルの政治的な“傾き”を地図にしたTrakkrの実験がかなり面白い

AIに「この政策はどう思う？」とか「どの候補者に近い？」と聞くと、返ってくる答えに妙な一貫性を感じることがあります。Trakkrの「Political bias in AI」は、その“なんとなくの印象”を、かなりきっちり測ろうとしたページです。ざっくり言うと、主要なAIモデルに政治・経済・言論・社会に関する刺激の強い質問を何度も投げ、その答えの傾向を地図に落とし込んでいます。しかもWeb検索はオフ。つまり、ネット上の情報を拾った結果ではなく、そのモデル自身がどんな方向に寄りやすいかを見ているわけです。ここがまずおもしろい。 Trakkrは、主要AIモデルの政治的・社会的な“傾き”を可視化している 1回だけでなく、同じ質問を何度も繰り返し、答えのブレも含めて見ている Web検索はオフなので、「ネットがそう言っていた」ではなく「モデル自体がどう答えるか」を測っている 6モデルのうち、4つが左寄りに見えたただし、どのモデルも一枚岩ではなく、質問によってかなり揺れる自分で同じ質問に答えると、どのモデルに近いかも見られるこのページの芯はとてもシンプルです。 AIモデルに、政治や社会の難し

papoo.work

CUDA kernelを走らせると裏で何が起きているのか

「GPUで計算する」と聞くと、なんだか一瞬で魔法みたいに処理が終わる印象があります。でも元記事は、その裏側にある泥臭い手順を、かなり執念深く追いかけています。しかも題材は、たった1行のベクター加算。`a[i] + b[i]` を並列に足すだけの、いちばん地味なCUDAプログラムです。地味だからこそ面白い。GPUという巨大な装置が、どれだけの段取りを踏んでこの1行を実行しているのかが、くっきり見えてきます。 `nvcc` は1つのコンパイラではなく、複数のコンパイラをまとめて動かす“司令塔”です CUDAのコードは、まずPTXという中間表現になり、その後SASSというGPU実機向け命令に変わります `vadd<<<4096, 256>>>(...)` のような記法は、ホスト側で引数を詰める「stub」に置き換えられます GPUカーネルの引数は、constant bank 0 に載って読み出されます実行時には、CPU側のランタイム、`libcuda.so`、ドライバ、PCIe越しのGPUが連携して動きますただ“GPUに投げた”だけに見える処理の背後で、かなり多くの機械的な準備が走って

papoo.work

「安いAIモデル」が高級ブランドを揺さぶる

Open Weight Models は、モデルの中身を公開して配布するタイプのAIで、誰でも自分の環境に近い形で使いやすい。記事の筆者は、DeepSeek V4 の安さを見て、Anthropic や OpenAI の“フロンティアモデル”との価格差があまりに大きいと感じている。その差は、単に「少し高い」ではなく、トークン単価ベースでほぼ50倍にも見える、というのが衝撃点。さらに筆者は、高価格を維持するために「希少性」を演出する動きがあるのでは、と疑っている。将来の競争軸は、単なる Open Weight ではなく、学習データの流れまで公開する「True Open Source」へ移るのではないか、と見ている。 AllenAI の OLMo や、NSF と Nvidia の支援も、その流れの例として挙げられている。この記事で面白いのは、AIの性能そのものより「値段のつけ方」に真正面から噛みついているところです。ふつうAIの話は「賢い」「速い」「便利」で終わりがちですが、ここではかなり露骨に「その高額料金、本当に必要？」と問いかけています。私はここがかなり重要だと思います。A

papoo.work

黒箱LLMから小型モデルへ知識をどう渡すか、Proxy-KDという発想が面白い

大規模言語モデルの世界は、ここ数年ずっと「でかいモデルが強い」の一強でした。GPT-4のような商用LLMは性能が抜群ですが、中身は見えません。APIの向こう側にいて、内部状態や学習の細部には触れられない。研究する側からすると、これはかなりもどかしい。この論文 `Knowledge Distillation of Black-Box Large Language Models` は、その厄介な壁をどう越えるかを真正面から扱っています。しかもアイデアがわりと気持ちいい。黒箱LLMの出力を、そのまま小型モデルに押し込もうとするのではなく、proxy model という“仲介役”を挟むのです。知識蒸留（knowledge distillation, KD）は、強いモデルの知識を小さいモデルへ移すやり方です。たとえば大きな先生モデルが出した答えを手本にして、軽い生徒モデルを育てるイメージです。ただ、普通の蒸留は先生の内部情報も使えることが多い。どの単語にどれくらい自信があるか、途中でどう考えているか、といった情報ですね。ところが黒箱LLMはそこが見えない。返ってくるのは最終出力だけ

papoo.work

AIエージェントに必要なのは「長い会話」より「本当の記憶」だった

大きな context window は、記憶そのものではない それは「一時的に広い机」を持っているようなもので、セッションが終われば消える以前の会話を毎回ぜんぶ送り直すやり方は、長くなるほど重く、遅くなる Retrieval は「必要な資料だけを本棚から持ってくる」仕組み Compression は中身をなるべく保ったまま、入力を小さくする工夫 Summarization は要点だけ残す方法で、元データは別に保存しておくのが安全 AIエージェントを作るときは、モデルに全部覚えさせるより、DBや検索の役割を分けるほうがうまくいく元記事の主張はかなり明快です。 context window が大きいことと、memory があることは別物だ、という話です。ここでいう context window は、AIモデルが一度に読める文章量の上限です。人間でいうと「机の上に広げて見られる書類の量」に近い。広ければ広いほど便利そうですが、だからといって「その机が記憶装置になる」わけではありません。著者のたとえがわかりやすいです。巨大な机を買って、ファイルキャビネット

papoo.work

Qwen-AgentWorldが狙う「LLMで世界をまるごと動かす」発想

大きなAIモデルを見ていると、最近は「文章をうまく作る」だけでは全然足りないんだな、としみじみ思います。次に来るのは、AIが環境の動きまで頭の中で予測する方向です。今回のarXiv論文 Qwen-AgentWorld: Language World Models for General Agents は、まさにそこを真正面から狙っています。ざっくり言えば、これは「言語モデルを使って、エージェントが置かれた世界の変化をシミュレーションする」研究です。チャットの延長ではなく、AIが「この操作をしたら次に何が起きるか」を考えられるようにする。ここが肝です。正直、この発想はかなりおもしろいです。AIを“答える機械”から“先読みする機械”に近づけようとしているので。 Qwen-AgentWorldは、agentic environment をシミュレートする language world model 35B-A3B版と397B-A17B版の2モデルを公開 **7つのドメインをまたいで、long chain-of-thought reasoning による環境予測

papoo.work

中国版「Mythos」登場、その中身はかなり本気だった

Qihoo 360の創業者・周鴻禕氏が、北京のISC.AI 2026で脆弱性発見AI「Tulong Feng」を発表した。彼はこれを、Anthropicのサイバーセキュリティ向けAI「Claude Mythos」に対する中国版だと位置づけた。同じタイミングで、中国のZ.aiは近い性能を持つモデル「GLM-5.2」をMITライセンスで公開し、誰でも無料で使える形にした。セキュリティ評価では、GLM-5.2が一部のベンチマークでClaude Codeを上回ったとされ、コスト面でもかなり安い。ただし、これは「中国がついに米国に追いついた」と単純に言う話ではなく、AIサイバーセキュリティの覇権争いがかなり露骨になってきた、というニュースだと思う。中国のサイバーセキュリティ業界が、かなりはっきり「うちはうちでやる」と言い始めている。Decryptの記事が伝えているのは、そんな空気感だ。話の中心にいるのは、Qihoo 360の創業者・周鴻禕氏。Qihoo 360は中国では有名なセキュリティ企業で、個人向けの保護ソフトや企業向け防御で存在感がある。その周氏が、北京で開かれたISC.AI

papoo.work