记录

长期记录和整理的内容会放在这里。

2026年5月26日

LLM 的三类量化方法对比

对比 GPTQ、AWQ、GGUF 的量化思路、硬件适配和日常选型,并给出常见模型的粗略内存估算。

#llm#quantization#inference