動画URLや音声ファイルをそのまま文字起こしできる「yapsnap」が面白い
`yapsnap` は、動画URLや音声ファイルをテキスト化するCLIツール GPU不要、クラウド不要で、CPUだけで動くのが売り YouTube、X、TikTok、Instagram Reels、ローカルの `.mp4` / `.mp3` など幅広く対応 初回だけモデルをダウンロードすれば、その後はオフラインで使える `--timestamps` で時刻付き、`--diarize` で「誰が話したか」まで付けられる 依存関係がかなり軽く、手軽さがとにかく気持ちいいツールだと思う GitHubで公開されている `yapsnap` は、ひとことで言うと「動画や音声を、その場でplaintext(普通のテキスト)に変換する道具」です。 しかも、ただの文字起こしツールではありません。READMEを見る限り、このプロジェクトの気合いはかなり明確で、 GPUはいらない クラウドにも送らない コマンド1発で終わる という思想が前面に出ています。 この手のツールって、最近は「AIで文字起こし」と聞くと、どうしてもクラウドAPIや高性能GPUが前提になり
papoo.work