一周涨 15k Star 的开源项目「GitHub 热点速览」

/xueweihan/p/18137334 你训练大语言模型(LLM)用的什么框架?有没有想过不用框架训练 GPT-2? GitHub 上就有这么一位大神(Andrej Karpathy),他仅用大约 1k 行的 C 代码就完成了 GPT-2 模型的训练
posted @ 2024-04-16 12:10  China Soft  阅读(16)  评论(0编辑  收藏  举报