大型语言模型（LLM）的自定义训练：包含代码示例的详细指南

近年来，像 GPT-4 这样的大型语言模型（LLM）因其在自然语言理解和生成方面的惊人能力而受到广泛关注。但是，要根据特定任务或领域定制LLM，定制培训是必要的。本文提供了有关自定义训练 LLM 的详细分步指南，其中包含代码示例和示例。

先决条件

在深入研究之前，请确保您已：

熟悉Python和PyTorch。

访问预先训练的 GPT-4 模型。

足够的计算资源（GPU 或 TPU）。

用于微调的特定域或任务中的数据集。

步骤 1：准备数据集

要微调LLM，您需要一个与目标域或任务一致的数据集。数据准备涉及：

1.1 收集或创建数据集

确保您的数据集足够大，以涵盖域或任务中的变体。数据集可以是原始文本或结构化数据的形式，具体取决于您的需求。

1.2 预处理和标记化

清理数据集，删除不相关的信息并规范化文本。使用 GPT-4 分词器对文本进行标记化，以将其转换为输入标记。

Python

from transformers import GPT4Tokenizer

tokenizer = GPT4Tokenizer.from_pretrained("gpt-4") 
data_tokens = tokenizer(data_text, truncation=True, padding=True, return_tensors="pt")

步骤二：配置训练参数

微调涉及根据自定义数据集调整LLM的权重。设置训练参数以控制训练过程：

Python

from transformers import GPT4Config, GPT4ForSequenceClassification

config = GPT4Config.from_pretrained("gpt-4", num_labels=)
model = GPT4ForSequenceClassification.from_pretrained("gpt-4", config=config)

training_args = {
    "output_dir": "output",
    "num_train_epochs": 4,
    "per_device_train_batch_size": 8,
    "gradient_accumulation_steps": 1,
    "learning_rate": 5e-5,
    "weight_decay": 0.01,
}

替换为数据集中唯一标签的数量。

步骤 3：设置培训环境

使用库中的 and 类初始化训练环境：TrainingArgumentsTrainertransformers

Python

from transformers import TrainingArguments, Trainer

training_args = TrainingArguments(**training_args)

trainer = Trainer(
    model=model,
    args=training_args,
    train_dataset=data_tokens
)

步骤 4：微调模型

通过在实例上调用方法启动训练过程：trainTrainer

Python

trainer.train()

此步骤可能需要一段时间，具体取决于数据集大小、模型体系结构和可用的计算资源。

步骤 5：评估微调模型

训练后，使用实例上的方法评估微调模型的性能：evaluateTrainer

Python

trainer.evaluate()

步骤 6：保存并使用微调模型

保存微调后的模型并将其用于推理任务：

Python

model.save_pretrained("fine_tuned_gpt4")

tokenizer.save_pretrained("fine_tuned_gpt4")

model.save_pretrained("fine_tuned_gpt4")

tokenizer.save_pretrained("fine_tuned_gpt4")

要使用微调的模型，请将其与分词器一起加载：

Python

model = GPT4ForSequenceClassification.from_pretrained("fine_tuned_gpt4")

tokenizer = GPT4Tokenizer.from_pretrained("fine_tuned_gpt4")

model = GPT4ForSequenceClassification.from_pretrained("fine_tuned_gpt4")

tokenizer = GPT4Tokenizer.from_pretrained("fine_tuned_gpt4")

示例输入文本：

Python

input_text = "Sample text to be processed by the fine-tuned model."

标记输入文本并生成模型输入：

Python

									 
									inputs = tokenizer(input_text, return_tensors="pt")

inputs = tokenizer(input_text, return_tensors="pt")

运行微调的模型：

inputs = tokenizer(input_text, return_tensors="pt")

数据提取预测：

Python

									 
									predictions = outputs.logits.argmax(dim=-1).item()

predictions = outputs.logits.argmax(dim=-1).item()

将预测映射到相应的标签：

Python

									 

									 

									 

									 
model = GPT4ForSequenceClassification.from_pretrained("fine_tuned_gpt4")
tokenizer = GPT4Tokenizer.from_pretrained("fine_tuned_gpt4")
​
# Example input text
input_text = "Sample text to be processed by the fine-tuned model."
​
# Tokenize input text and generate model inputs
inputs = tokenizer(input_text, return_tensors="pt")
​
# Run the fine-tuned model
outputs = model(**inputs)
​
# Extract predictions
predictions = outputs.logits.argmax(dim=-1).item()
​
# Map predictions to corresponding labels
label = label_mapping[predictions]
​
print(f"Predicted label: {label}")

替换为从预测指数到其相应标签的特定映射。此代码片段演示如何使用微调的模型对新的输入文本进行预测。label_mapping

虽然本指南为自定义培训 LLM 提供了坚实的基础，但您可以探索其他方面来增强该过程，例如：

试验不同的训练参数，如学习率计划或优化器，以提高模型性能

在训练期间实现早期停止或模型检查点，以防止过度拟合并在训练的不同阶段保存最佳模型

探索先进的微调技术，如逐层学习率计划，这可以通过调整特定层的学习率来帮助提高性能

使用与您的任务或域相关的指标执行广泛的评估，并使用交叉验证等技术来确保模型泛化

调查特定于领域的预训练模型的使用情况，或者如果可用的LLM不能很好地覆盖您的特定领域，则从头开始预训练您的模型

审核编辑：郭婷

阅读全文

gpu(126255) gpu(126255)
python(83366) python(83366)
数据集(24279) 数据集(24279)
LLM(229) LLM(229)

NIOS II自定义指令设计之实例篇

在【原创】SOPC用户自定义指令设计之软件篇和【原创】SOPC用户自定义指令设计之硬件篇中分别讲述了自定义指令在软件和硬件设计中的规范，在本文中，将给出一个具

2010-03-27 17:56:31

2994

揭秘为什么Cloud TPU编写自定义估算器模型？

在本文中，我会逐步介绍编写自定义估算器以便在 Cloud TPU 上运行的全过程。

2018-09-20 09:46:37

4794

Android端自定义铃声 MobPush对安卓端自定义铃声的教程

如何为APP推送设置独特的通知铃声呢？本次带来的是MobPush对安卓端自定义铃声的教程，快来看看吧~

2023-10-21 15:34:05

773

基于YOLOv8实现自定义姿态评估模型训练

Hello大家好，今天给大家分享一下如何基于YOLOv8姿态评估模型，实现在自定义数据集上，完成自定义姿态评估模型的训练与推理。

2023-12-25 11:29:01

968

3MCUSTOM DIE CUT TAPE

自定义 带子 自定义 胶合剂 自定义 自定义 X 自定义

2024-03-14 22:58:08

代码无法绘制所有自定义小部件是为什么？怎么解决？

我遵循了二维码教程。当您只绘制一个自定义小部件时，它会起作用。但是当我在同一屏幕或自定义容器中多次添加相同的自定义小部件时，代码无法绘制所有自定义小部件，似乎绘制功能被中断并且我的二维码不完整。也许关于 HAL？有什么建议吗？我在 4.16 中添加了我的示例项目。

2023-01-06 06:01:26

自定义Keras层官方示例

如何自定义Keras层--以因子分解机(FM)为例

2019-06-14 17:05:35

自定义inputformat的代码

hadoop源码一起看——自定义inputformat过程中recordReader对象创建

2019-10-11 13:17:56

自定义labview错误代码

http://digital.ni.com/public.nsf/allkb/88196115F4BF4BF186257A88000BD267这个网址里详细介绍了错误代码的自定义问题，分享给大家

2015-07-16 09:58:04

LabVIEW自定义数据类型

一直只知道自定义控件，不知道自定义数据类型，直到有一天看到别人的后面板某控件左上角有个黑色小三角形，像这样，才知道有自定义数据类型，类似于C语言中的typedef，譬如你在一个VI中要用到这个簇

2017-03-24 17:24:53

M051通过检查自定义UID来确定IO是否被切换的示例代码

应用程序:通过检查自定义 UID 来确定 IO 是否被切换的示例代码 BSP 版本: M051系列 BSP CMSIS v3.01.001 硬件:Nutini-EVB-M051_V3.0

2023-08-30 08:51:45

OpenHarmony自定义组件介绍

).onClick(() => { this.title = \'Hello ArkUI\'; }) } } 以上示例中，Index页面包含两个自定义组件，一个是被@Entry装饰

2023-09-25 15:36:32

Springboot是如何获取自定义异常并进行返回的

这里看到新服务是封装的自定义异常，准备入手剖析一下，自定义的异常是如何进行抓住我们请求的方法的异常，并进行封装返回到。废话不多说，先看看如何才能实现封装异常，先来一个示例：在这里，您会看到新服务是一

2022-03-22 14:15:08

TP5自定义异常的处理方法

;// 用户自定义异常代码protected string $file ;// 发生异常的文件名protected int $line ; // 发生异常的代码行号/* 方法 */public

2019-09-20 09:05:02

nios 自定义ip问题求助

chipselectaddresswritewritedatareadreaddadabyteenable这些信号什么时候需要全有，什么时候有些信号不需要，望高手解答，或者有哪些书籍有详细介绍如何编写自定义ip核，望高手、前辈解惑。拜谢

2013-11-26 11:11:22

如何自定义Component 属性

鸿蒙java框架中继承DirectionalLayout，自定义属性定义在哪里，如何从AttrSet读取自定义属性DirectionalLayout(Context context

2020-12-21 09:31:58

如何自定义只生成二进制代码的qeexo模型呢

我们需要为我们的命令闪烁 LED我们正在使用 stevalmks1v1b 盒子如何自定义 qeexo 模型，因为它只生成二进制代码

2022-12-21 07:35:02

如何在没有MX生成P2P示例代码的情况下制作自定义ble客户端？

所以我想制作一个具有 mu 自己的服务 UUID 和 128 位特征的自定义客户端，但在 cubeMX 中我只能选择客户端模式：自定义 p2p 客户端。每次我从 MX 生成代码时，它都会删除我在 wpan 代码中的更改，并改用 p2p 示例代码。我还没有找到删除代码生成或选择我自己的服务的方法。

2022-12-06 06:39:53

怎样使用PyTorch Hub去加载YOLOv5模型

导出格式进行推理，包括自定义训练模型。有关导出模型的详细信息，请参阅TFLite、ONNX、CoreML、TensorRT 导出教程。专业提示：在GPU 基准测试中， TensorRT可能比

2022-07-22 16:02:42

我可以编写自定义代码来控制没有Motor Pilot的电机吗？

我得到了 MCSDK 示例，但我怎样才能更进一步？我可以编写自定义代码来控制没有 Motor Pilot 的电机吗？[STEVAL-SPIN3201 // maxon BLDC 电机]

2022-12-22 07:31:53

请问docker容器如何添加自定义hosts？

docker容器添加自定义hosts的方案有哪些？docker容器添加自定义hosts的错误示例

2020-11-05 06:20:06

通过检查自定义UID来确定IO是否被切换的示例代码

应用程序:通过检查自定义 UID 来确定 IO 是否被切换的示例代码 BSP 版本: M051系列 BSP CMSIS v3.01.001 硬件:Nutini-EVB-M051_V3.0

2023-08-23 06:20:03

基于自定义帧的PC与EEPROM串行通信设计

讨论了如何应用9 针的串行端口RS232C 通过编程器建立上位机PC 和EEPROM 之间的通信。详细阐述了自定义帧格式的设计、程序流程、主要函数和代码的实现。

2009-09-01 16:56:43

魅族MP3自定义开机画面教程

2009-12-14 14:59:02

STATCOM自定义建模及动稳态调压分析

STATCOM自定义建模及动稳态调压分析:建立了statcom基于功率注入法的稳态模型和基于受控电流源的动态模型，并利用电力系统分析软件提供的用户自定义功能实现了这些模型，用以

2010-03-18 16:09:45

自定义函数测试学习工程

自定义函数测试学习工程

2010-07-01 16:37:44

用LISP语言自定义AutoCAD命令

用LISP语言自定义AutoCAD命令 AutoLISP语言作为AutoCAD的二次开发工具，虽然在功能、运行速度和保密性等方面比起ARX等工具要逊色一些，但由于

2009-02-14 17:08:47

1940

SOPC中自定义外设和自定义指令性能分析

SOPC中自定义外设和自定义指令性能分析 NiosII是一个建立在FPGA上的嵌入式软核处理器，灵活性很强。作为体现NiosII灵活性精髓的两个最主要方面，自

2009-03-29 15:12:49

1490

万能遥控器代码自定义搜索方法说明

万能遥控器代码自定义搜索方法说明 1、左手先按住“设置”键不松手，再用右手按一下“电源”键，指示灯变成长亮

2009-08-01 16:37:31

3511

制作和使用自定义C库文件

制作和使用自定义C库文件目标 1.制作一个库文件libGetMax.a　，其中包含一个外部函数GetMax　。　函数GetMax的作用是判断

2010-01-16 11:58:25

1203

在Protel中自定义Title Block的方法

详细介绍了在Protel中自定义Title Block的方法

2011-05-24 11:42:56

1602自定义字符

1602液晶能够显示自定义字符，能够根据读者的具体情况显示自定义字符。

2016-01-20 15:43:51

DOS下自定义时间重启

DOS环境下，C语言编写，自定义时间重启。

2016-03-16 09:40:54

自定义系统的About项

Delphi教程自定义系统的About项，很好的Delphi资料，快来下载学习吧。

2016-03-16 14:46:37

JAVA教程之自定义光标

JAVA教程之自定义光标，很好的学习资料。

2016-03-31 11:13:36

Labview之自定义错误

Labview之自定义错误，很好的Labview资料，快来下载学习吧。

2016-04-19 11:17:14

RTWconfigurationguide基于模型设计—自定义目

基于模型设计—自定义目标系统配置指南，RTW自动代码生成相关资料。

2016-05-17 16:41:51

置文件夹自定义图标和背景_源代码

易语言是一门以中文作为程序代码编程语言学习例程：置文件夹自定义图标和背景

2016-06-07 10:41:41

自定义信息框模块

易语言是一门以中文作为程序代码编程语言学习例程：自定义信息框模块

2016-06-07 10:41:41

自定义进度复制文件

易语言是一门以中文作为程序代码编程语言学习例程：自定义进度复制文件

2016-06-07 10:41:41

自定义高级表格边框样式例程

易语言是一门以中文作为程序代码编程语言学习例程：自定义高级表格边框样式例程

2016-06-07 10:41:41

自定义鼠标光标

易语言是一门以中文作为程序代码编程语言学习例程：自定义鼠标光标

2016-06-07 10:41:41

PDH网管盘自定义字节

PDH网管盘 自定义字节

2016-12-26 22:13:18

erlang如何自定义_ERLANG环境搭建

本文详细介绍了erlang 如何自定义 behaviour以及ERLANG环境搭建。要定义一个behaviour，首先你要创建一个模块，它必须导出 behaviour_info/1 这个函数（注意必须带u），函数的定义如下文

2018-02-23 08:42:30

1359

AN958：自定义设计的调试和编程接口

设计中包含调试和编程接口连接器。可能的选项有全面支持STK的所有调试和编程功能，仅限串行线编程。本应用说明介绍了在自定义硬件设计中包括这些连接器接口的优点，并提供了有关这些接口的详细信息。

2018-02-28 15:14:23

怎么样去开发自定义应用程序？

Atmel小贴士如何开发自定义应用程序

2018-07-11 00:05:00

2124

如何配置自定义工具链？

Atmel小贴士如何配置自定义工具链内爱特梅尔公司螺柱

2018-07-10 03:04:00

1759

如何给EOS账号设置自定义权限

EOS 账号默认有 owner 和 active 两个权限，除了默认权限外，我们还可以给EOS账号设置自定义权限，权限的名称和功能都可以根据自己的需要进行自定义。

2019-09-03 10:29:02

1289

如何在LabVIEW中实现自定义控件

本文档的主要内容详细介绍的是如何在LabVIEW中实现自定义控件。

2021-01-14 17:17:00

Xilinx基本自定义OpenRISC系统硬件教程

在检索源代码之后，会出现更复杂的部分：调整源代码。请记住，我们要构建一个“基本自定义OpenRISC系统”：

2021-01-15 13:51:23

如何在TensorFlow2里使用Keras API创建一个自定义CNN网络？

概述本示例工程中我们会在 TensorFlow2 下使用 Keras API 创建一个自定义 CNN 网络，在 Vitis-AI 1.3 环境下编译成 Xilinx DPU 上运行的模型文件，并在

2021-04-15 11:36:30

1877

如何在移动设备上训练和部署自定义目标检测模型

上，目标检测模型的训练和部署的过程：设备端 ML 学习路径：关于如何在移动设备上，训练和部署自定义目标检测模型的分步教程，无需机器学习专业知识。设备端 ML 学习路径 https

2021-08-16 17:09:58

2877

浅析Zephyr应用的代码结构中的自定义驱动

项目纳入到应用代码目录管理 Zephyr应用的代码结构--自定义开发板：将自定义board纳入到应用代码目录管理除了上面两个场景外，我们的硬件可能也有新的驱动需求，而该驱动不被Zephyr支持，如果

2021-08-18 09:08:19

3754

基于HAL库的USB自定义HID设备实现

基于HAL库的USB自定义HID设备实现基于HAL库的USB自定义HID设备实现准备工作CubeMX配置代码实现基于HAL库的USB自定义HID设备实现本文演示利用CubeMX开发USB自定义HID

2021-12-28 20:04:11

占位面积很小的自定义进度指示器progressbutton

概述 1、描述：progressbutton是占位面积很小的自定义进度指示器。默认实现提供了一个pin进度按钮。 2、实现功能： a.自定义圆形进度条。 b.实现根据Slider滑动更新自定义进度条

2022-03-18 14:45:10

OpenHarmony自定义组件:ClearableInput和Keyboard

组件介绍：本示例包含了两个OpenHarmony自定义组件，一个是ClearableInput，另一个是Keyboard。 ClearableInput 定义了一个带清空图标的文本输入框

2022-03-18 15:21:58

OpenHarmony自定义组件FlowImageLayout

组件介绍本示例是OpenHarmony自定义组件FlowImageLayout。用于将一个图片列表以瀑布流的形式显示出来。调用方法

2022-03-21 10:17:38

OpenHarmony自定义组件ProgressWithText

组件介绍本示例是OpenHarmony自定义组件ProgressWithText。在原来进度条的上方加了一个文本框，动态显示当前进度并调整位置。调用方法

2022-03-23 14:03:12

OpenHarmony自定义组件CircleProgress

组件介绍本示例是OpenHarmony自定义组件CircleProgress。用于定义一个带文字的圆形进度条。调用方法

2022-03-23 14:06:38

自定义进度指示器progressbutton

概述 1、描述：progressbutton是占位面积很小的自定义进度指示器。默认实现提供了一个pin进度按钮。 2、实现功能：a.自定义圆形进度条。 b.实现根据Slider滑动更新自定义进度条

2022-03-24 14:26:32

自定义视图组件教程案例

自定义组件 1.自定义组件-particles（粒子效果） 2.自定义组件- pulse（脉冲button效果） 3.自定义组件-progress（progress效果） 4.自定义组件

2022-04-08 10:48:59

应用程序在崩溃时能启动自定义活动的OHOS库

包括：当应用程序在主线程和后台线程中崩溃时启动自定义错误功能。如果未配置自定义错误能力，则启动默认错误能力。使用说明 entity/ 文件夹中提供了一个示例项目，它提供了可运行的代码示例，演示了该项目中类的使用。

2022-04-11 09:32:04

ArkUI如何自定义弹窗（eTS）

自定义弹窗其实也是比较简单的，通过CustomDialogController类就可以显示自定义弹窗。

2022-08-31 08:24:36

1356

KT利用NVIDIA AI平台训练大型语言模型

韩国先进的移动运营商构建包含数百亿个参数的大型语言模型，并使用 NVIDIA DGX SuperPOD 平台和 NeMo Megatron 框架训练该模型。

2022-09-27 09:24:30

915

NVIDIA AI平台为大型语言模型带来巨大收益

随着大型语言模型（ LLM ）的规模和复杂性不断增长， NVIDIA 今天宣布更新 NeMo Megatron 框架，提供高达 30% 的训练速度。

2022-10-10 15:39:42

644

大型语言模型有哪些用途？

通过大规模数据集训练来学习识别、总结、翻译、预测和生成文本及其他内容。大型语言模型是 Transformer 模型最成功的应用之一。它们不仅将人类的语言教给 AI，还可以帮助 AI 理解蛋白质、编写软件代码等等。除了加速翻译软件、聊天机器人

2023-02-23 19:50:04

3887

教程 2：自定义配置文件示例

教程 2：自定义配置文件示例

2023-03-13 19:33:00

教程 3：构建自定义配置文件

教程 3：构建自定义配置文件

2023-03-15 19:39:12

教程 3：自定义配置文件 gatt cmd 示例

教程 3：自定义配置文件 gatt cmd 示例

2023-03-15 19:40:39

NVIDIA 为全球企业带来生成式 AI 推出用于创建大型语言模型和视觉模型的云服务

和运行自定义大型语言模型和生成式AI模型，这些模型专为企业所在领域的特定任务而创建，并且在专有数据上训练。 Getty Images、Morningstar、Quantiphi、Shutterstock公

2023-03-22 13:45:40

261

一套开源的大型语言模型（LLM）—— StableLM

对于任何没有额外微调和强化学习的预训练大型语言模型来说，用户得到的回应质量可能参差不齐，并且可能包括冒犯性的语言和观点。这有望随着规模、更好的数据、社区反馈和优化而得到改善。

2023-04-24 10:07:06

2168

基于STM32单片机自定义汉字显示使用库文件设计源代码

基于STM32单片机自定义汉字显示使用库文件设计源代码

2023-04-26 14:30:35

labview自定义控件

labview自定义精美控件

2023-05-15 16:46:23

什么是预训练AI模型？

预训练 AI 模型是为了完成特定任务而在大型数据集上训练的深度学习模型。这些模型既可以直接使用，也可以根据不同行业的应用需求进行自定义。

2023-05-25 17:10:09

595

自定义算子开发

一个完整的自定义算子应用过程包括注册算子、算子实现、含自定义算子模型转换和运行含自定义op模型四个阶段。在大多数情况下，您的模型应该可以通过使用hb_mapper工具完成转换并顺利部署到地平线芯片上……

2022-04-07 16:11:21

1812

基于Transformer的大型语言模型（LLM）的内部机制

本文旨在更好地理解基于 Transformer 的大型语言模型（LLM）的内部机制，以提高它们的可靠性和可解释性。随着大型语言模型（LLM）在使用和部署方面的不断增加，打开黑箱并了解它们的内部

2023-06-25 15:08:49

991

基于一个完整的 LLM 训练流程

在这篇文章中，我们将尽可能详细地梳理一个完整的 LLM 训练流程。包括模型预训练（Pretrain）、Tokenizer 训练、指令微调（Instruction Tuning）等环节。文末

2023-06-29 10:08:59

1202

教程 2：自定义配置文件示例

教程 2：自定义配置文件示例

2023-07-04 20:50:27

大型语言模型的应用

大型语言模型（LLM）是一种深度学习算法，可以通过大规模数据集训练来学习识别、总结、翻译、预测和生成文本及其他内容。大语言模型（LLM）代表着 AI 领域的重大进步，并有望通过习得的知识改变

2023-07-05 10:27:35

1463

使用NVIDIA NeMo定制LLM的过程

如何创建自定义语言模型

2023-07-05 16:30:33

647

教程 3：构建自定义配置文件

教程 3：构建自定义配置文件

2023-07-06 18:49:28

教程 3：自定义配置文件 gatt cmd 示例

教程 3：自定义配置文件 gatt cmd 示例

2023-07-06 18:50:41

2023年发布的25个开源大型语言模型总结

来源： DeepHub IMBA 大型语言模型(llm)是一种人工智能(AI)，在大量文本和代码数据集上进行训练。它们可以用于各种任务，包括生成文本、翻译语言和编写不同类型的创意内容。今年开始

2023-07-28 12:20:02

440

labview超快自定义控件制作和普通自定义控件制作

labview超快自定义控件制作和普通自定义控件制作

2023-08-21 10:32:58

Meta发布一款可以使用文本提示生成代码的大型语言模型Code Llama

今天，Meta发布了Code Llama，一款可以使用文本提示生成代码的大型语言模型（LLM）。

2023-08-25 09:06:57

885

训练大语言模型带来的硬件挑战

生成式AI和大语言模型（LLM）正在以难以置信的方式吸引全世界的目光，本文简要介绍了大语言模型，训练这些模型带来的硬件挑战，以及GPU和网络行业如何针对训练的工作负载不断优化硬件。

2023-09-01 17:14:56

1046

大语言模型（LLM）预训练数据集调研分析

model 训练完成后，使用 instruction 以及其他高质量的私域数据集来提升 LLM 在特定领域的性能；而 rlhf 是 openAI 用来让model 对齐人类价值观的一种强大技术；pre-training dataset 是大模型在训练时真正喂给 model 的数据，从很多 paper 能看到一些观

2023-09-19 10:00:06

506