开源大模型使用指南

该项目是一个围绕开源大模型、针对国内初学者、基于 AutoDL 平台的中国宝宝专属大模型教程，针对各类开源大模型提供包括环境配置、本地部署、高效微调等技能在内的全流程指导，简化开源大模型的部署、使用和应用流程，让更多的普通学生、研究者更好地使用开源大模型，帮助开源、自由的大模型更快融入到普通学习者的生活中。

项目主页

该项目的主要内容包括：

基于 AutoDL 平台（可扩展，例如阿里云）的开源 LLM 环境配置指南，针对不同模型要求提供不同的详细环境配置步骤；
针对国内外主流开源 LLM 的部署使用教程，包括 LLaMA、ChatGLM、InternLM 等；
开源 LLM 的部署应用指导，包括命令行调用、在线 Demo 部署、LangChain 框架集成等；
开源 LLM 的全量微调、高效微调方法，包括分布式全量微调、LoRA、ptuning 等。

项目的主要内容就是教程，让更多的学生和未来的从业者了解和熟悉开源大模型的食用方法！任何人都可以前往项目主页提出 issue 或是提交 PR，共同构建维护这个项目。

学习建议：本项目的学习建议是，先学习环境配置，然后再学习模型的部署使用，最后再学习微调。因为环境配置是基础，模型的部署使用是基础，微调是进阶。初学者可以选择 Qwen1.5，InternLM2，MiniCPM 等模型优先学习。

项目意义

什么是大模型？大模型（LLM）狭义上指基于深度学习算法进行训练的自然语言处理（NLP）模型，主要应用于自然语言理解和生成等领域，广义上还包括机器视觉（CV）大模型、多模态大模型和科学计算大模型等。

百模大战正值火热，开源 LLM 层出不穷。如今国内外已经涌现了众多优秀开源 LLM，国外如 LLaMA、Alpaca，国内如 ChatGLM、BaiChuan、InternLM（书生·浦语）等。开源 LLM 支持用户本地部署、私域微调，每一个人都可以在开源 LLM 的基础上打造专属于自己的独特大模型。

然而，当前普通学生和用户想要使用这些大模型，需要具备一定的技术能力，才能完成模型的部署和使用。对于层出不穷又各有特色的开源 LLM，想要快速掌握一个开源 LLM 的应用方法，是一项比较有挑战的任务。

该项目旨在首先基于核心贡献者的经验，实现国内外主流开源 LLM 的部署、使用与微调教程；在实现主流 LLM 的相关部分之后，我们希望充分聚集共创者，一起丰富这个开源 LLM 的世界，打造更多、更全面特色 LLM 的教程。星火点点，汇聚成海。

我们希望成为 LLM 与普罗大众的阶梯，以自由、平等的开源精神，拥抱更恢弘而辽阔的 LLM 世界。

项目受众

本项目适合以下学习者：

想要使用或体验 LLM，但无条件获得或使用相关 API；
希望长期、低成本、大量应用 LLM；
对开源 LLM 感兴趣，想要亲自上手开源 LLM；
NLP 在学，希望进一步学习 LLM；
希望结合开源 LLM，打造领域特色的私域 LLM；
以及最广大、最普通的学生群体。

项目规划及进展

本项目拟围绕开源 LLM 应用全流程组织，包括环境配置及使用、部署应用、微调等，每个部分覆盖主流及特点开源 LLM：

已支持模型

TransNormerLLM
- [ ] TransNormerLLM-7B-Chat FastApi 部署调用 @ml67 ddl=3 月底
- [ ] TransNormerLLM-7B-Chat langchain 接入 @ml67 ddl=3 月底
- [ ] TransNormerLLM-7B-Chat WebDemo 部署 @ml67 ddl=3 月底
- [ ] TransNormerLLM-7B-Chat Lora 微调 @ml67 ddl=3 月底 ß
谷歌-Gemma
- gemma-7b-it FastApi 部署调用 @ 东东 ddl=3 月底
- gemma-7b-it langchain 接入 @ 东东 ddl=3 月底
- gemma-7b-it WebDemo 部署 @ 东东 ddl=3 月底
- gemma-7b-it Peft Lora 微调 @ 东东 ddl=3 月底
BlueLM Vivo 蓝心大模型
- [x] BlueLM-7B-Chat FatApi 部署调用 @acwwt ddl=3 月底
- [x] BlueLM-7B-Chat langchain 接入 @acwwt ddl=3 月底
- [x] BlueLM-7B-Chat WebDemo 部署 @acwwt ddl=3 月底
- [x] BlueLM-7B-Chat Lora 微调 @acwwt ddl=3 月底
InternLM2
- [x] InternLM2-7B-chat FastApi 部署调用 @ 不要葱姜蒜
- [x] InternLM2-7B-chat langchain 接入 @ 不要葱姜蒜
- [x] InternLM2-7B-chat WebDemo 部署 @ 白玉
- [x] InternLM2-7B-chat Xtuner Qlora 微调 @ 白玉
Qwen 1.5
- [x] Qwen1.5-7B-chat FastApi 部署调用 @ 颜鑫
- [x] Qwen1.5-7B-chat langchain 接入 @ 颜鑫
- [x] Qwen1.5-7B-chat WebDemo 部署 @ 颜鑫
- [x] Qwen1.5-7B-chat Lora 微调 @ 不要葱姜蒜
- [x] Qwen1.5-72B-chat-GPTQ-Int4 部署环境 @byx020119
DeepSeek 深度求索
- [x] DeepSeek-7B-chat FastApi 部署调用 @ 不要葱姜蒜
- [x] DeepSeek-7B-chat langchain 接入 @ 不要葱姜蒜
- [x] DeepSeek-7B-chat WebDemo @ 不要葱姜蒜
- [x] DeepSeek-7B-chat Lora 微调 @ 不要葱姜蒜
- [x] DeepSeek-7B-chat 4bits 量化 Qlora 微调 @ 不要葱姜蒜
- [x] DeepSeek-MoE-16b-chat Transformers 部署调用 @Kailigithub
- [x] DeepSeek-MoE-16b-chat FastApi 部署调用 @Kailigithub
- [x] DeepSeek-coder-6.7b finetune colab @Swiftie
- [x] Deepseek-coder-6.7b webdemo colab @Swiftie
MiniCPM
- [x] MiniCPM-2B-chat transformers 部署调用 @Kailigithub
- [x] MiniCPM-2B-chat FastApi 部署调用 @Kailigithub
- [x] MiniCPM-2B-chat langchain 接入 @ 不要葱姜蒜
- [x] MiniCPM-2B-chat webdemo 部署 @Kailigithub
- [x] MiniCPM-2B-chat Lora && Full 微调 @ 不要葱姜蒜
Qwen-Audio
- [x] Qwen-Audio FastApi 部署调用 @ jjyaoao
- [x] Qwen-Audio WebDemo @ jjyaoao
Qwen
- [x] Qwen-7B-chat Transformers 部署调用 @ 娇娇 ddl=12.2
- [x] Qwen-7B-chat FastApi 部署调用 @ 娇娇 ddl=12.2
- [x] Qwen-7B-chat WebDemo @ 娇娇 ddl=12.2
- [x] Qwen-7B-chat Lora 微调 @ 不要葱姜蒜
- [x] Qwen-7B-chat ptuning 微调 @ Hongru0306
- [x] Qwen-7B-chat 全量微调 @ 不要葱姜蒜
- [x] Qwen-7B-Chat 接入 langchain 搭建知识库助手 @ 娇娇
- [x] Qwen-7B-chat 低精度训练 @ Hongru0306 ddl=12.11
- [x] Qwen-1_8B-chat CPU 部署 @ 散步
Yi 零一万物
- [x] Yi-6B-chat FastApi 部署调用 @ Joe ddl=12.15
- [x] Yi-6B-chat langchain 接入 @ Joe ddl=12.15
- [x] Yi-6B-chat WebDemo @ Hongru0306 ddl=12.15
- [x] Yi-6B-chat Lora 微调 @ 娇娇 ddl=12.15
Baichuan 百川智能
- [x] Baichuan2-7B-chat FastApi 部署调用 @ 三山时春い ddl=12.15
- [x] Baichuan2-7B-chat WebDemo @ 三山时春い ddl=12.15
- [x] Baichuan2-7B-chat 接入 LangChain 框架 @ 三山时春い ddl=12.15
- [x] Baichuan2-7B-chat Lora 微调 @ 三山时春い ddl=12.15
InternLM
- [x] InternLM-Chat-7B Transformers 部署调用 @ 小罗 ddl=11.26
- [x] InternLM-Chat-7B FastApi 部署调用 @ 不要葱姜蒜
- [x] InternLM-Chat-7B WebDemo @ 不要葱姜蒜
- [x] Lagent+InternLM-Chat-7B-V1.1 WebDemo @ 不要葱姜蒜
- [x] 浦语灵笔图文理解&创作 WebDemo @ 不要葱姜蒜
- [x] InternLM-Chat-7B 接入 LangChain 框架 @ Logan Zou
Atom (llama2)
- [x] Atom-7B-chat WebDemo @ 凯立 ddl=11.24
- [x] Atom-7B-chat Lora 微调 @ Logan Zou
- [x] Atom-7B-Chat 接入 langchain 搭建知识库助手 @ jjyaoao
- [x] Atom-7B-chat 全量微调 @ Logan Zou
ChatGLM3
- [x] ChatGLM3-6B Transformers 部署调用 @ 丁悦 ddl=12.2
- [x] ChatGLM3-6B FastApi 部署调用 @ 丁悦 ddl=12.2
- [x] ChatGLM3-6B chat WebDemo @ 不要葱姜蒜
- [x] ChatGLM3-6B Code Interpreter WebDemo @ 不要葱姜蒜
- [x] ChatGLM3-6B 接入 LangChain 框架 @ Logan Zou
- [x] ChatGLM3-6B Lora 微调 @ Hongru0306

通用环境配置

[x] pip、conda 换源 @ 不要葱姜蒜
[x] AutoDL 开放端口 @ 不要葱姜蒜
模型下载
- [x] hugging face @ 不要葱姜蒜
- [x] hugging face 镜像下载 @ 不要葱姜蒜
- [x] modelscope @ 不要葱姜蒜
- [x] git-lfs @ 不要葱姜蒜
- [x] Openxlab
Issue && PR
- [x] Issue 提交 @ Hongru0306
- [x] PR 提交 @ Hongru0306
- [x] fork 更新 @ Hongru0306

文章目录

开源大模型使用指南

开源大模型使用指南

项目意义

项目受众

项目规划及进展

已支持模型

通用环境配置

致谢