Parallel Reduction Optimization with CUDA

A step-by-step guide to optimizing parallel reduction operations using CUDA, from basic implementation to advanced optimization techniques.

August 27, 2023 · 9 min · Sherlock

Benchmark for LLM Inference

Introduce some metrics for LLM inference benchmarking

August 20, 2023 · 5 min · Sherlock

RoPE and Length Scaling

Introduce some basic concepts of Position Encoding, RoPE and length extrapolation related it.

August 10, 2023 · 8 min · Sherlock

CodeLLM Training Recipe

一个偏综述的文章,总结 codeLLM 相关 paper 从 data collection 到 training 中间的一些细节

July 26, 2023 · 8 min · Sherlock

WizardLM(Coder) 和 Ocra 的一些理解

介绍一下最近看到的两篇关于 SIFT 数据相关的非常好的论文 WizardLM(WizardCoder) 和 Ocra,以及我对这个问题的一些思考

July 22, 2023 · 6 min · Sherlock

我是如何使用番茄工作法的

记录我如何使用番茄工作法进行提升效率,以及一些使用过程中的心路历程

July 10, 2023 · 1 min · Sherlock

如何做 continued pre-train

介绍一下 continued pre-train

July 4, 2023 · 2 min · Sherlock

如何 Debug PyTorch 和 TensorRT FP16 diff

记录一次找 TensorRT FP16 和 PyTorch 推理结果不一致的经历

February 28, 2023 · 2 min · Sherlock

CSAPP Attack Lab - Code Injection and ROP Attacks

Understanding buffer overflow attacks through CSAPP lab exercises, covering code injection and return-oriented programming techniques.

March 15, 2022 · 8 min · Sherlock

CSAPP 之 Attack Lab

记录在阅读和学习 CSAPP 过程中,完成 AttackLab 的相关内容

March 15, 2022 · 8 min · Sherlock