Firecrawl・OpenRouter・GitHub Actionsでニュースソース追加を自動化した話
手作業でやっていた「ニュースソース追加」を、月1回の自動処理に置き換えた まず Firecrawl でランキングページをきれいな Markdown に変換する OpenRouter の無料で使える複数の LLM を順番に試し、ニュースサイトのURLを抽出する さらに web_search ツールでURLの妥当性を確認し、壊れたURLや誤検出を減らす 生成した YAML を重複チェックしたうえで保存し、GitHub Actions が PR を自動作成する マージ後は既存の CI が検証・反映まで行い、ライブダッシュボードにすぐ表示される この記事は、`Source Score` というマイクロサービスの開発を続けている筆者が、「ニュースソースの追加」を自動化した記録です。 最初は、ソースはたった5件を手で追加して動作確認していたそうです。まあ、最初の一歩としてはすごく自然です。システムを作るとき、最初から完璧に自動化しようとすると逆に進まないので、まずは人力で土台を作るのはよくあるやり方です。 でも問題は、その先です。 世界中の主要ニュースサイトを定期的に取り込みたいのに、毎回手作業で
papoo.work