GitHub - f1ynn-zhan9/intro-llm.github.io: website

大语言模型（Large Language Models，LLM）是一种由包含数百亿以上权重的深度神经网络构建的语言模型，使用自监督学习方法通过大量无标记文本进行训练。自2018年以来，包含Google、OpenAI、Meta、百度、华为等公司和研究机构都纷纷发布了包括BERT， GPT等在内多种模型，并在几乎所有自然语言处理任务中都表现出色。2021年开始大模型呈现爆发式的增长，特别是2022年11月ChatGPT发布后，更是引起了全世界的广泛关注。用户可以使用自然语言与系统交互，从而实现包括问答、分类、摘要、翻译、聊天等从理解到生成的各种任务。大型语言模型展现出了强大的对世界知识掌握和对语言的理解。本书将介绍大语言模型的基础理论包括语言模型、分布式模型训练以及强化学习，并以Deepspeed-Chat框架为例介绍实现大语言模型和类ChatGPT系统的实践。

Name	Name	Last commit message	Last commit date
Latest commit 郑锐 modify README.md for code/ch5 Dec 11, 2023 b14e661 · Dec 11, 2023 History 40 Commits
chapter	chapter	Update LLM-TAP.pdf	Sep 10, 2023
code/ch5	code/ch5	modify README.md for code/ch5	Dec 11, 2023
css	css	init version	Jun 17, 2023
fonts	fonts	init version	Jun 17, 2023
images	images	add zhengrui's image	Jun 18, 2023
js	js	init version	Jun 17, 2023
slides	slides	update slides	Nov 13, 2023
.DS_Store	.DS_Store	add code for ch5	Dec 11, 2023
README.md	README.md	init version	Jun 17, 2023
favicon.ico	favicon.ico	init version	Jun 17, 2023
index.html	index.html	add ch8 slides	Nov 12, 2023

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

About

Releases

Packages

Languages

f1ynn-zhan9/intro-llm.github.io

Folders and files

Latest commit

History

Repository files navigation

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages