长期记录和整理的内容会放在这里。
2026年5月26日
对比 GPTQ、AWQ、GGUF 的量化思路、硬件适配和日常选型,并给出常见模型的粗略内存估算。
#llm#quantization#inference