From 314b88f5991f248c193358e63c76ec3ce4830744 Mon Sep 17 00:00:00 2001
From: =?UTF-8?q?=E5=82=85=E8=8E=98=E8=8E=98?=
<46443564+zjhellofss@users.noreply.github.com>
Date: Tue, 24 Sep 2024 23:41:41 +0800
Subject: [PATCH] Update README.md
---
README.md | 108 +++++-------------------------------------------------
1 file changed, 9 insertions(+), 99 deletions(-)
diff --git a/README.md b/README.md
index 657fae8f..850d2b33 100644
--- a/README.md
+++ b/README.md
@@ -1,109 +1,19 @@
+# News:新课发布,《动手自制大模型推理框架》
+Hi,各位朋友们好!我是 KuiperInfer 的作者。KuiperInfer 作为一门开源课程,迄今已经在 GitHub 上已斩获 2.4k star。
+如今在原课程的基础上,**我们全新推出了《动手自制大模型推理框架》, 新的课程不仅支持 CPU 推理 Llama 系列模型,还支持 Cuda 加速和 Int8 量化**,自推出以来便广受好评。
-# KuiperInfer (自制深度学习推理框架)
-**我们在本项目的基础上开设了一个全新的课程,《从零自制大模型推理框架》,以下是目录,感兴趣的同学可以扫描二维码或者添加微信 lyrry1997 了解,欢迎大家参加。**
-
-
-
-## 《动手自制大模型推理框架》常见问题
-
-1. **课程更新完了吗?**
-
-主体已经更新完毕,完全可以开始自习。支持cuda, int8推理。
-
-2. **这是收费课程吗?怎么收费,怎么付款,过段时间买可以吗?**
-
-收费课程,256,微信转账。可以,但是我微信好友快满了,隔一段时间会清理,而且不定期会涨价。
-
-3. **为什么b站会贵一点,内容都一样吗?**
-
-现在价格都一样了,推荐还是微信购课
-
-4. **怎么看课**
-
-飞书网盘,打开浏览器就可以看
-
-5. **有答疑吗**
-
-有的,且有答疑群,群友也很热情。
-
-6. **不会cpp可以学吗?**
-
-事在人为,我也尽量深入浅出教学
-
-7. **课程目录有吗**
-
-见下文
-
-9. **作者是干嘛的?**
+## 《动手自制大模型推理框架》课程目录:
-主业就是开发大模型推理框架的,课件已经被人民邮电出版社约稿,同时也是kuiperinfer项目,也就是本项目的发起人,目前全github cpp项目排名120位。
+https://l0kzvikuq0w.feishu.cn/docx/ZF2hd0xfAoaXqaxcpn2c5oHAnBc
-**《动手自制大模型推理框架》项目运行效果fp32模型1.1b参数。**
-![](./imgs/do.gif)
+**如果你对大模型推理感兴趣,想要深入了解并掌握相关技术,那么这门课程绝对不容错过。快来加入我们,一起开启学习之旅吧!
+ 感兴趣的同学欢迎扫一扫课程下方二维码或者添加微信 lyrry1997 参加课程**
-KuipeInfer目前2.3k star,帮助很多人获得了大厂岗位。
-## 《动手自制大模型推理框架》课程目录
-
-**一、项目整体架构和设计**
-
-> 学习架构思维,防止自己只会优化局部实现
-
-1. 环境的安装和课程简介
-2. 资源管理和内存管理类的设计与实现
-3. 张量类的设计与实现
-4. 算子类的设计与实现
-5. 算子的注册和管理
-
-**二、支持LLama2模型结构**
-> 本节将为大家补齐算法工程师思维,在算法层面讲解大模型和Transformer的原理之后,开始对LLama2进行支持
-
-
-6. LLama模型的分析
-7. MMap内存映射技术打开大模型的权重文件
-8. LLama模型文件的参数和权重载入
-9. LLama中各个层的初始化以及输入张量、权重张量的分配和申请
-10. 实现大模型中的KV Cache机制
-
-**三、模型的量化**
-
-> 为了减少显存的占用,我们开发了int8模型量化模块
-
-11. 量化模型权重的导出
-12. 量化系数和权重的加载
-13. 量化乘法算子的实现
-
-**四、Cuda基础和算子实现**
-
-> 带你学Cuda并在实战大模型算子的实现,为大模型推理赋能
-
-14. Cuda基础入门1 - 内容待定
-15. Cuda基础入门2 - 内容待定
-16. Cuda基础入门3 - 内容待定
-17. Cuda基础入门4 - 内容待定
-18. RMSNorm算子的Cuda实现
-19. Softmax算子的Cuda实现
-20. Add算子的Cuda实现
-21. Swiglu算子的Cuda实现
-22. GEMV算子的Cuda实现
-23. 多头注意力机制的Cuda实现
-24. 让框架增加Cuda设备的支持和管理
-25. 完成Cuda推理流程
-
-**五、用推理框架做点有趣的事情**
-
-26. 文本生成
-27. 讲一段小故事
-28. 让大模型和你进行多轮对话
-
-
-**六、学习其他商用推理框架的实现,查漏补缺**
-
-29. LLama.cpp的设计和实现讲解
-30. Miopen(AMD出品,对标CUDNN)的设计和实现讲解
-31. 总结
+
+# KuiperInfer (自制深度学习推理框架)
![](https://github.com/zjhellofss/kuiperinfer/actions/workflows/cmake.yml/badge.svg)
![](./imgs/logo.jpg)