这里收录与研究相关的笔记,主题包括 AI 系统、TPU、LLM 推理、分布式系统、联邦学习,以及科研方法本身。多数内容来自实际跑过的实验、读过的论文和踩过的坑,而不是二手转述。
#
精选
- LLM Inference on TPU v6e-4 在单台 TPU v6e-4 上对小稠密、大 MoE 和大稠密模型做推理基准测试
- 拆穿 TPU 比 GPU 便宜 4 倍的说法 从 TCO 角度核对 TPU 与 GPU 的真实成本差距
- 垂直联邦学习 Vertical Federated Learning 的原理与隐私保护机制
- TVM AutoTVM 多 GPU 加速 Tuning 用多卡并行加速算子调优
#
分布式系统
#
科研实践
- 科研路上的思考与实践 关于做研究的方法与心态