Personal website
这里先保持朴素:Markdown 写内容,Astro 静态渲染,后续再接入 LLM 做标签、摘要和内容组织。
2026年5月26日
对比 GPTQ、AWQ、GGUF 的量化思路、硬件适配和日常选型,并给出常见模型的粗略内存估算。
#llm#quantization#inference
active
Shingo 是一个用 Astro 构建的个人网站,用来发布记录、展示小项目,并呈现由 nemo-knows 维护的知识库。