Skip to content

f1ynn-zhan9/intro-llm.github.io

This branch is 4 commits behind intro-llm/intro-llm.github.io:main.

Folders and files

NameName
Last commit message
Last commit date

Latest commit

b14e661 · Dec 11, 2023

History

40 Commits
Sep 10, 2023
Dec 11, 2023
Jun 17, 2023
Jun 17, 2023
Jun 18, 2023
Jun 17, 2023
Nov 13, 2023
Dec 11, 2023
Jun 17, 2023
Jun 17, 2023
Nov 12, 2023

Repository files navigation

大语言模型(Large Language Models,LLM)是一种由包含数百亿以上权重的深度神经网络构建的语言模型,使用自监督学习方法通过大量无标记文本进行训练。自2018年以来,包含Google、OpenAI、Meta、百度、华为等公司和研究机构都纷纷发布了包括BERT, GPT等在内多种模型,并在几乎所有自然语言处理任务中都表现出色。2021年开始大模型呈现爆发式的增长,特别是2022年11月ChatGPT发布后,更是引起了全世界的广泛关注。用户可以使用自然语言与系统交互,从而实现包括问答、分类、摘要、翻译、聊天等从理解到生成的各种任务。大型语言模型展现出了强大的对世界知识掌握和对语言的理解。本书将介绍大语言模型的基础理论包括语言模型、分布式模型训练以及强化学习,并以Deepspeed-Chat框架为例介绍实现大语言模型和类ChatGPT系统的实践。

About

website

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • CSS 47.7%
  • Python 35.2%
  • Shell 8.1%
  • JavaScript 6.4%
  • HTML 2.6%