#machine-learning

7 件の記事

AI API代を10分で激減させる実践テクニック集：賢くモデルを使い分ける話

AI API代を10分で激減させる実践テクニック集：賢くモデルを使い分ける話

AI API料金は、「最強モデルを何でも使う」だけでかなり無駄になりがち仕事の種類ごとにmodel routing（用途別の振り分け）をすると、コストが大きく下がる安いモデルを先に使い、ダメなら高いモデルに回すtiered routingが効く cache（同じ回答の再利用）は、ほぼ“無料のお金”みたいな節約策長すぎるpromptを短くするprompt compression、まとめて処理するbatch processingも効く著者は、これらの工夫でAPIコストを大幅に削減できたと主張しているこの記事は、AI APIの請求額を一気に減らすための「実践的な節約術」をまとめたものです。主張はかなりストレートで、「みんな最初から高いモデルを使いすぎ」「もっと安いモデルで十分な場面が多い」というもの。たしかに、これはかなり耳が痛い話です。個人的には、この記事の面白さは“AIを賢く使う”というより、“AIの選び方を賢くする”ところにあると思います。同じAI機能でも、モデルの選定や呼び出し方次第でコストが全然変わる。ここを雑

食材をベクトル空間で旅する：Epicureが描く「レシピと言語」と「化学」のあいだ

食材をベクトル空間で旅する：Epicureが描く「レシピと言語」と「化学」のあいだ

Epicure は、食材を数値化して扱う ingredient embeddings の新しいモデル群 4.14M件ものレシピを、11ソース・7言語 から集めて学習しているのがかなり本気食材名はLLMを使うパイプラインで 1,790件の正規化済み項目 に整理 Cooc / Chem / Core の3種類があり、レシピ文脈重視か、化学的関係重視かを変えている「食材同士の関係」を、料理の現場と化学の両方から見ようとする発想が面白いこの論文は、食材を「単語のように」扱って、似た食材どうしが近くに並ぶような表現を学習する研究です。こういう表現は embeddings（埋め込み） と呼ばれます。ざっくり言うと、食材を1本の座標に変換して、距離や方向で関係を見られるようにする技術です。たとえば、料理の世界では「バジルとトマトは相性がいい」とか、「しょうゆとみりんはよく一緒に出る」といった関係がありますよね。一方で化学の世界では、「この食材にはこの香り成分が含まれる」といったつながりがあります。 Epicureは、その両方をうまく見比べよ

データセットがなくても作れる。InstagramとPinterestから“姿勢提案AI”用データを集めた話

データセットがなくても作れる。InstagramとPinterestから“姿勢提案AI”用データを集めた話

既製のデータセットが見つからないなら、自分で作るしかない InstagramとPinterestを使って、自然なポーズ画像を集めたデータは「場所」と「構図」で厳密に分類した MediaPipeで骨格推定を使い、手作業のラベル付けを自動化した albumentationsでデータを増やしたが、左右反転ではラベル修正が必要だったきれいなデータは、派手なモデルよりずっと大事だと実感できる内容今回紹介するのは、「データセットがないなら、作ればいいじゃない」という、かなり実践的で気合いの入ったAI開発の話です。元記事の著者は、ユーザーの背景に合わせて「この場所ならこのポーズが合うよ」と提案するAI、いわば Pose Suggester を作ろうとしました。たとえばカフェ、公園、街中のような背景を見て、画面上に2Dの棒人間みたいな骨格を重ねて、自然なポーズのヒントを出す仕組みです。で、ここが面白いところなんですが――こういう用途にぴったりな公開データセットが、見つからなかったんですね。 KaggleやHugging Faceに「ほら、はいどうぞ」と置いてあると思いきや、そう都合

最前線のLLM、結局どれが強いのか？Redditで起きた「本音ベース」の議論を読む

最前線のLLM、結局どれが強いのか？Redditで起きた「本音ベース」の議論を読む

RedditのMachine Learningコミュニティで、「bleeding-edge（最先端）」のLLMはどれが本当に強いのか、という話題が投げかけられたただし、元投稿の本文はこの抽出では確認できず、内容そのものの詳細は読み取れないそれでも、このテーマ自体がかなり面白い。なぜなら、LLMの評価は「ベンチマークの点数」だけでは決まらないから実際には、推論力、速度、価格、長文への強さ、ツール利用のうまさなど、見るべき軸が多いこうした議論は、「結局どれを使えばいいの？」という現場目線の疑問に直結していて、かなり実用的だと思う今回取り上げるのは、Reddit の `r/MachineLearning` に投稿された「Which LLMs are actually best for bleeding-edge?」という話題です。直訳すると、「本当に最先端で強いLLMはどれなの？」という感じですね。こういう問い、かなり“今っぽい”です。というのも、LLMの世界は新モデルが次々に出てきて、「ベンチマークではAが強い」「でも実際に使うとBのほうが気持ちいい」「いや、長文ならC」とい

オープンAIモデルはクローズドモデルに勝てるのか？Ship-Benchで見えた本音

オープンAIモデルはクローズドモデルに勝てるのか？Ship-Benchで見えた本音

新しめの open-ish frontier model 3種を、実務寄りのコーディングベンチマークで比較した記事対象は Kimi K2.6 / Qwen 3.6 Plus / DeepSeek v4 Pro 品質は3つともかなり高い が、総合では DeepSeek v4 Pro がいちばんバランス良好 Qwen 3.6 Plus は総合点は悪くないものの、Planner段階で gate failure が発生 コスト面では DeepSeek が有利。品質差が小さいなら、ここはかなり重要結論としては、オープン寄りモデルにも十分勝負のチャンスはある、ただし「安いのに高品質」とはまだ言い切れないこの記事は、「オープン寄りの frontier model は、閉じた closed-source model に対抗できるのか？」という、いまのAI界隈でかなり気になるテーマを実験で確かめたものです。ここでいう frontier model は、最先端クラスの大規模AIモデルのこと。 closed-source model は

GGUFには重みだけじゃない：LLMを動かすための「付属情報」と、まだ足りないもの

GGUFには重みだけじゃない：LLMを動かすための「付属情報」と、まだ足りないもの

GGUFは、モデルの重み（weights）だけでなく、実行に必要な周辺情報も1ファイルにまとめるのが強み具体的には、chat template、special tokens、sampler設定、samplingの順番などが入るただし、tool callingの形式、think token、projection model、機能フラグなどはまだ不十分著者は、GGUFが「単一ファイルで扱いやすい」だけでなく、標準として進化できるのが素晴らしいと評価している個人的にも、LLM周りの“面倒な差分”を1ファイルに寄せていく発想はかなり気持ちいいと思う。とはいえ、全部が自動で解決するわけではない、という現実も見えてくる GGUFは、`llama.cpp` で使われる言語モデルのファイル形式です。この形式のいちばんの魅力は、「モデルを動かすのに必要なものが、だいたい1つのファイルにまとまる」こと。たとえば、Hugging Face の safetensors 系のモデルだと、重みのファイルに加

DeepSeek-V4-Flashで「LLM steering」がまた面白くなってきた話

DeepSeek-V4-Flashで「LLM steering」がまた面白くなってきた話

steering は、LLMの内部表現（activations）を直接いじって、出力の傾向を変える手法たとえば「簡潔に答えて」といった性格を、プロンプトではなくモデル内部から強められるただし、軽い調整は prompting で代替できることが多く、万能ではない一方で、拒否を弱める・検閲を外す など、prompting では難しい用途がある Open weights の強いモデルが増えたことで、ローカル環境で steering を試す価値が急に上がったただし著者は、実用面ではまだ懐疑的。結局は fine-tune や prompt のほうが効率的では、と見ているこの記事のテーマは、ざっくり言うと 「LLMの出力を、プロンプトではなく内部から直接いじる技術」 です。これが steering。日本語にするなら「誘導」や「操舵」に近い感じでしょうか。著者 Sean Goedecke は、昔の「Golden Gate Claude」にかなり魅了されたと言います。これは Claude の出力がなぜかゴールデンゲー