GGUFには重みだけじゃない:LLMを動かすための「付属情報」と、まだ足りないもの
GGUFは、モデルの重み(weights)だけでなく、実行に必要な周辺情報も1ファイルにまとめるのが強み 具体的には、chat template、special tokens、sampler設定、samplingの順番などが入る ただし、tool callingの形式、think token、projection model、機能フラグなどはまだ不十分 著者は、GGUFが「単一ファイルで扱いやすい」だけでなく、標準として進化できるのが素晴らしいと評価している 個人的にも、LLM周りの“面倒な差分”を1ファイルに寄せていく発想はかなり気持ちいいと思う。とはいえ、全部が自動で解決するわけではない、という現実も見えてくる GGUFは、`llama.cpp` で使われる言語モデルのファイル形式です。 この形式のいちばんの魅力は、「モデルを動かすのに必要なものが、だいたい1つのファイルにまとまる」こと。 たとえば、Hugging Face の safetensors 系のモデルだと、重みのファイルに加
papoo.work