Posts
All the articles I've posted.
CodeLLM Training Recipe
Posted on:July 26, 2023 at 12:00 AM一个偏综述的文章,总结 codeLLM 相关 paper 从 data collection 到 training 中间的一些细节
WizardLM(Coder) 和 Ocra 的一些理解
Posted on:July 22, 2023 at 12:00 AM介绍一下最近看到的两篇关于 SIFT 数据相关的非常好的论文 WizardLM(WizardCoder) 和 Ocra,以及我对这个问题的一些思考
我是如何使用番茄工作法的
Posted on:July 10, 2023 at 12:00 AM记录我如何使用番茄工作法进行提升效率,以及一些使用过程中的心路历程
如何做 continued pre-train
Posted on:July 4, 2023 at 12:00 AM介绍一下 continued pre-train
如何 Debug PyTorch 和 TensorRT FP16 diff
Posted on:February 28, 2023 at 12:00 AM记录一次找 TensorRT FP16 和 PyTorch 推理结果不一致的经历