Personal website

记录、Wiki 和玩具项目。

这里先保持朴素:Markdown 写内容,Astro 静态渲染,后续再接入 LLM 做标签、摘要和内容组织。

最近记录

2026年5月26日

LLM 的三类量化方法对比

对比 GPTQ、AWQ、GGUF 的量化思路、硬件适配和日常选型,并给出常见模型的粗略内存估算。

#llm#quantization#inference

玩具项目