揭秘大语言模型可信能力的五个关键维度

It's not the pre-trained, it's the pre-training.

大模型的通用训练流程 [1]

在大语言模型（Large Language Models，LLMs）的训练过程中，预训练阶段消耗了大量资源，也充满了太多未被揭开的秘密。根据OpenAI的研究，InstructGPT在预训练阶段几乎使用了所有的计算和数据资源（高达98%） [2]。有监督微调（Supervised fine-tuning，SFT）和人类反馈强化学习（Reinforment Learning Human Feedback，RLHF）能够激活预训练模型内部已存在的能力，而这些能力仅仅通过提示工程难以发掘。但是，预训练的价值远不止于此，它像一个充满潜力的神秘盒子，等待我们去探索其更深层次的价值和隐藏的机制。

预训练模型就像一个未加控制的野兽，神秘而强大。通过高质量数据进行微调，我们可以使这个野兽适应社会的需要；随后通过RLHF进一步完善，模型更加贴近用户的具体需求。对齐技术如SFT和RLHF等，可以被看作是对这个野兽的驯化。但目标不止如此，我们更希望深入了解它，探究使得LLMs展现出其独特能力的根本过程--The Pre-training。大部分开源LLMs仅提供模型权重和性能测试的结果，但是要真正理解一个模型的行为，需要更多的信息。LLM360 [4] 和 OLMo [5] 的全面开源为研究者和社区提供了全面和深入的信息共享，涵盖了训练数据、算法设置、实现挑战以及性能评估的细节，极大地增加了LLMs预训练过程的透明度，帮助我们理解这些LLMs的工作原理。我们都想知道这个问题的答案，人类可以信任LLMs吗？作为一个观察者，我们尝试从预训练阶段来窥探这个庞然大物。我们致力于理解LLMs在预训练阶段是如何建模可信（Trustworthiness）的，并基于这个理解，探索预训练阶段是否能为增强LLMs的可信提供指导。

论文标题：Towards Tracing Trustworthiness Dynamics: Revisiting Pre-training Period of Large Language Models 论文链接：https://arxiv.org/abs/2402.19465 项目主页：https://github.com/ChnQ/TracingLLM

在此工作中，我们首次给出了如下几个观察： •我们发现LLMs在预训练的早期阶段就建立了有关可信概念的线性表征； •我们发现预训练过程中，LLMs表现出对于可信概念类似于“信息瓶颈”先拟合、再压缩的学习过程； •我们基于表征干预技术，初步验证了LLMs在预训练过程中的切片可以帮助提升最终LLMs的可信性。

简介LLM360 在本文的研究过程中，我们使用了 LLM360[4] 开源项目所提供的丰富LLM预训练资源。该项目基于1.3万亿 Tokens预训练出了基础模型Amber，并均匀地开源了预训练过程中的360个模型切片，供广大研究者参考和使用。此外，LLM360进一步推出了两个微调模型：一是针对指令微调优化的AmberChat模型，二是经过安全对齐处理的AmberS afe模型。上述提及的所有模型以及切片均为7B规模的参数量级。

1 预训练过程中有关可信概念的线性表征

数据集：本文主要探究可信领域下的五个关键维度：可靠性（reliability）、毒性（toxicity）、隐私性（privacy）、公平性（fairness）和鲁棒性（robustness）。为了深入研究这些维度，我们分别选取了这五个维度下具有代表性的相关数据集：TruthfulQA、Toxicity、ConfAIde、StereoSet以及经过特定扰动处理的SST-2。我们根据原数据集的设定，对每个样本进行标注，以标识每句话是否包含不正确、有毒、隐私泄露、有歧视和被扰动的信息。实验设置：本文采用线性探针方法 [6]。具体地，在得到360个切片对于每个数据集的表征以后，我们对于每个切片的每一层都训练一个线性分类器，线性分类器的正确率代表着模型内部表征区分不同标签的能力。前75个切片实验效果如下：从第76个到360的切片的实验结果请移步正文附录，实验趋势大体相同，基本趋于平缓的波动。实验结果说明两点： •随着预训练的进行，在这五个可信维度上，大模型中间层的表征可以很好地区分是否可信 •大模型在预训练的早期阶段就已经可以很好地区分是否可信

2 信息瓶颈视角下有关可信概念的预训练动态 已有理论结果 [7] 证明线性探针的准确率可以用来界定互信息估计器。受到利用互信息来探测模型训练动态的启发 [8]，本文也利用互信息对模型表征的动态变化做了初步探索。类似 [8] 用信息平面研究传统神经网络的训练过程，我们分别研究模型表征T与上面五个原始数据集X的互信息，和模型表征T与数据集标签Y的互信息。实验结果如下：后续预训练过程的变化趋势见附录，几乎保持平缓的波动。分开看这两张图，T和X的互信息先上升后下降，而T和Y的互信息一直在上升。把它们合起来看，这个趋势与经典论文 [8] 中的“fitting”和“compression”两阶段相符：首先，当大语言模型随机初始化时，它不具备保留信息的能力，因此互信息几乎为0；接着，随着预训练的进行，大模型逐渐具备语言理解和概念建模的能力，因此互信息持续增长；最后，随着预训练的进一步进行，大模型逐渐学会提取压缩无关信息并提取有效信息，因此T和X的互信息降低，而T和Y的互信息继续增加。从互信息的角度，这是一个很有趣的发现。即使定义和实验设置不同，预训练大语言模型和传统神经网络，两者的预训练阶段都能分为“fitting”和“compression”两个阶段，这暗示着大模型和传统神经网络训练过程中可能存在的一些相似之处。总体来看，据我们所知，本文首次研究大模型在预训练过程中可信性概念建模的变化情况，我们希望我们的初步探索能帮助领域内的研究者更深入地理解大模型的预训练过程，启发大家用新方法帮助大模型变得更加可信。

3 基于引导向量的表征干预：预训练知识如何助力模型可信能力提升

3.1 Activation Intervention 我们观察到，既然LLMs在其预训练阶段就已经学习到了有关可信概念线性可分的表征，那么不同于现在的大多数技术如SFT，RLHF等在完成预训练的模型上进一步优化，一个很自然的想法是：LLMs在预训练过程中的切片能不能帮助指令微调模型进行alignment呢？我们基于表征干预的技术（Activation Intervention），给予该问题初步的肯定的回答。

表征干预是LLMs领域中一个正在快速兴起的技术，已被多个场景下验证有效 [9-10]。我们以如何让LLMs变得更“Truthful”为例 [9]，简要阐述表征干预技术的基本流程。 1.首先，我们分别使用涵盖真实与虚假信息的正负prompt对来刺激LLMs获得其对应的内部表征 2.然后对正负表征的质心作差获得“指向truthfulness方向的引导向量（steering vector）” 3.最后在LLMs前向推理时每一步产生的表征上加上该引导向量，达到干预输出的目的

不同于上述工作从待干预模型自身抽取引导向量，我们意在从LLMs预训练过程的切片中构建引导向量来干预指令微调模型（SFT Model），试图提升指令微调模型的可信能力，如下图所示。其中，我们使用北京大学团队 [11] 开源的PKU-RLHF-10K数据集 [12] 来构建正负prompt对，该数据集提供了一万条带有安全/非安全回复标注的对话数据，可用于大模型的 RLHF 训练。 3.2 实验结果分析

我们在上文提及的可信领域下五个维度的数据集（TruthfulQA，Toxigen，StereoSet，ConfAIde，SST-2），以及四个常用的大模型通用能力评测数据集（MMLU，ARC，RACE，MathQA）上，评测了四个模型的性能：指令微调模型AmberChat，安全对齐模型AmberSafe，使用来自AmberChat自身的steering vector干预后的AmberChat，使用来自第180个预训练切片的steering vector干预后的AmberChat。

实验结果表明，在使用来自预训练切片的steering vector干预SFT模型（AmberChat）表征后，在三个可信维度（Reliability：TruthfulQA，Toxicity：Toxigen，Fairness：StereoSet）上都有较明显的提升。同时，这种干预对模型通用能力的影响并不显著（在ARC，MMLU上表现出边际损失，在MathQA和RACE上表现出有边际提升）。令人惊讶的是，我们发现使用预训练的中间切片构建的steering vector，相比于来自AmberChat自身的引导向量，能更显著地提升AmberChat模型的可信性能。

4 小结

未来，当我们尝试对齐比人类更强大的模型时（super-alignment），依赖于“人类反馈”的相关微调技术，如RLHF等，或将不再奏效 [13-14]。为了应对这一可能的挑战，多个研究机构正在探索新的解决方案。例如，近期OpenAI提出“弱对强监督”方法 [13]，Meta提出“self-reward”机制 [14]，同时也有越来越多的研究聚焦于“self-alignment”研究方向的探索 [15-16]。我们的研究为解决类似的super-alignment问题提供了一个新的视角：利用LLMs在预训练过程中习得的知识来辅助最终的模型对齐。作为研究的起点，我们深入探究预训练过程中如何建模有关可信的概念。可喜的是，探索初见成效：1）我们发现大模型在预训练的早期阶段就建立了有关可信概念的线性表征 2）我们发现大模型对可信概念类似于信息瓶颈的学习过程。此外，表征干预技术的成功应用也初步验证了预训练中间切片对辅助模型对齐的有效性。我们希望这份工作能够为深入理解LLMs如何动态构建及发展其内在可信属性提供新的视角，并启迪未来在LLMs对齐技术领域的更多创新尝试。我们期待这些研究成果能进一步推动大模型朝着更可信、更可控的方向发展，从而在人工智能伦理与安全道路上迈出坚实的一步。

参考文献

[1] https://huyenchip.com/2023/05/02/rlhf.html

[2] https://openai.com/research/instruction-following

[3] twitter.com/anthrupad

[4] Liu, Z., Qiao, A., Neiswanger, W., Wang, H., Tan, B., Tao, T., ... & Xing, E. P. (2023). Llm360: Towards fully transparent open-source llms. arXiv preprint arXiv:2312.06550.

[5] Groeneveld, D., Beltagy, I., Walsh, P., Bhagia, A., Kinney, R., Tafjord, O., ... & Hajishirzi, H. (2024). OLMo: Accelerating the Science of Language Models. arXiv preprint arXiv:2402.00838.

[6] Belinkov, Y. (2022). Probing classifiers: Promises, shortcomings, and advances. Computational Linguistics, 48(1), 207-219.

[7] Choi, K., Jung, J. W., & Watanabe, S. (2023). Understanding Probe Behaviors through Variational Bounds of Mutual Information. arXiv preprint arXiv:2312.10019.

[8] Shwartz-Ziv, R., & Tishby, N. (2017). Opening the black box of deep neural networks via information. arXiv preprint arXiv:1703.00810.

[9] Li, K., Patel, O., Viégas, F., Pfister, H., & Wattenberg, M. (2024). Inference-time intervention: Eliciting truthful answers from a language model. Advances in Neural Information Processing Systems, 36.

[10] Turner, A., Thiergart, L., Udell, D., Leech, G., Mini, U., & MacDiarmid, M. (2023). Activation addition: Steering language models without optimization. arXiv preprint arXiv:2308.10248.

[11] Ji, J., Liu, M., Dai, J., Pan, X., Zhang, C., Bian, C., ... & Yang, Y. (2024). Beavertails: Towards improved safety alignment of llm via a human-preference dataset. Advances in Neural Information Processing Systems, 36.

[12] https://huggingface.co/datasets/PKU-Alignment/PKU-SafeRLHF-10K

[13] Burns, C., Izmailov, P., Kirchner, J. H., Baker, B., Gao, L., Aschenbrenner, L., ... & Wu, J. (2023). Weak-to-strong generalization: Eliciting strong capabilities with weak supervision. arXiv preprint arXiv:2312.09390.

[14] Yuan, W., Pang, R. Y., Cho, K., Sukhbaatar, S., Xu, J., & Weston, J. (2024). Self-rewarding language models. arXiv preprint arXiv:2401.10020.

[15] Sun, Z., Shen, Y., Zhou, Q., Zhang, H., Chen, Z., Cox, D., ... & Gan, C. (2024). Principle-driven self-alignment of language models from scratch with minimal human supervision. Advances in Neural Information Processing Systems, 36.

[16] Li, X., Yu, P., Zhou, C., Schick, T., Levy, O., Zettlemoyer, L., ... & Lewis, M. (2023, October). Self-Alignment with Instruction Backtranslation. In The Twelfth International Conference on Learning Representations.

审核编辑：黄飞

阅读全文

线性分类器(1409) 线性分类器(1409)
大模型(810) 大模型(810)

如何用语言模型（LM）实现建模能力

当初笔者进入 NLP 的大门，就是相信：由于语言强大的表达能力以及语言模型强大的建模能力，Reasoning 一定就在不久的将来！可惜实际情况却是

2022-08-30 10:08:15

1241

如何利用Transformers了解视觉语言模型

将模型称为 “视觉语言” 模型是什么意思？一个结合了视觉和语言模态的模型？但这到底是什么意思呢？

2023-03-03 09:49:37

665

大型语言模型在关键任务和实际应用中的挑战

大型语言模型在关键任务和实际应用中的可靠性受到挑战。模型产生幻觉可能是由于模型缺乏或错误地理解了相关的知识。当人类思考和记忆事物时，本体知识在我们的思维过程中扮演着重要角色。本体知识涉及类别、属性以及它们之间的关系。它帮助

2023-08-15 09:33:45

1090

大型语言模型的逻辑推理能力探究

最新研究揭示，尽管大语言模型LLMs在语言理解上表现出色，但在逻辑推理方面仍有待提高。为此，研究者们推出了GLoRE，一个全新的逻辑推理评估基准，包含12个数据集，覆盖三大任务类型。

2023-11-23 15:05:16

476

#深入浅出学习eTs#（五）eTs语言初识

，实现极简高效开发。开发框架不仅从组件、动效和状态管理三个维度来提供UI能力，还提供了系统能力接口，实现系统能力的极简调用。请参考基于TS扩展的声明式开发范式API文档，全面地了解组件，更好地开发

2022-12-29 10:02:55

可信编译器L2C的核心翻译步骤及其设计与实现

为了满足国内某安全攸关领域的需求, L2C编译器的开发始于2010年9月, 其目标是设计实现一个经过形式化验证的可信编译器, 其源语言是面向领域的同步数据流语言Lustre*(Lustre语言的一个

2021-12-17 07:36:41

揭秘∑-Δ ADC的工作原理

更愿意选用传统的逐次（SAR ）型ADC 。 Σ- Δ转换器的模拟部分非常简单（类似于一个1 位ADC ），而数字部分要复杂得多，按照功能可划分为数字滤波和抽取单元。由于Σ- Δ型ADC 更接近于数字器件，因而其制造成本非常低廉。揭秘∑-Δ ADC的工作原理

2011-10-21 11:35:11

C语言volatile关键字之间有什么关系？

2021-11-11 07:01:09

C语言的标识符和关键字有哪些

五、C语言的标识符和关键字一个完整的1.C语言的标识符所谓标识符，实际上是一些由程序编写者自定义的名称，类似于PIC单片机汇编语言中给寄存器(RAM)的命名。C语言中所用到的变量名、函数名、数组名

2021-07-15 09:31:18

HarmonyOS/OpenHarmony应用开发-Stage模型ArkTS语言AbilityStage

进行初始化时回调。context接口示例：*附件：HarmonyOSOpenHarmony应用开发-stage模型ArkTS语言AbilityStage.docx

2023-04-07 15:16:35

HarmonyOS/OpenHarmony应用开发-Stage模型ArkTS语言扩展能力基类

\'@ohos.app.ability.ExtensionAbility\'; 接口示例： *附件：HarmonyOSOpenHarmony应用开发-stage模型ArkTS语言扩展能力基类.docx

2023-04-26 10:00:26

HarmonyOS应用开发-关于TS语言的整体理解

范式的方舟开发框架，采用更接近自然语义的编程方式，让开发者可以直观地描述UI界面，不必关心框架如何实现UI绘制和渲染，实现极简高效开发。从组件、动效和状态管理三个维度来提供UI能力，还提供了系统能力

2021-11-30 11:03:36

Java语言学习的六大关键

Java语言学习六大关键

2021-01-01 07:59:00

【书籍评测活动NO.30】大规模语言模型：从理论到实践

多种形式和任务。这个阶段是从语言模型向对话模型转变的关键，其核心难点在于如何构建训练数据，包括训练数据内部多个任务之间的关系、训练数据与预训练之间的关系及训练数据的规模。奖励建模阶段的目标是构建一个文本

2024-03-11 15:16:39

【书籍评测活动NO.31】大语言模型：原理与工程实践

缘起：为什么要写这本书OpenAI的ChatGPT自推出以来，迅速成为人工智能领域的焦点。ChatGPT在语言理解、生成、规划及记忆等多个维度展示了强大的能力。这不仅体现在对特定任务的高效处理

2024-03-18 15:49:46

【视频】C语言知识免费视频教程-C语言关键字-const-连载视频第6集（视频持续更新……）

教程第四集：C语言关键字-staticC语言教程第五集：C语言关键字-registerC语言教程第六集：C语言关键字-constC语言教程第七集：C语言关键字_volatile C语言教程第八集：C语言

2021-04-06 09:44:45

【视频】C语言知识免费视频教程-C语言关键字-register-连载视频第5集（视频持续更新……）

2021-03-26 14:29:42

【视频】C语言知识免费视频教程-C语言关键字-static-连载视频第4集（视频持续更新……）

2021-03-19 13:37:20

【视频】C语言知识免费视频教程-C语言关键字_extern-连载视频第9集（视频持续更新……）

教程第四集：C语言关键字-staticC语言教程第五集：C语言关键字-registerC语言教程第六集：C语言关键字-constC语言教程第七集：C语言关键字_volatileC语言教程第八集：C语言关键字_typedefC语言教程第九集：C语言关键字_extern

2021-04-26 14:04:22

【视频】C语言知识免费视频教程-C语言关键字_signed-unsigned-auto-连载视频第3集（视频持续更新……）

2021-03-12 15:14:29

【视频】C语言知识免费视频教程-C语言关键字_sizeof-连载视频第11集（视频持续更新……）

语言教程第二集：C语言关键字-常量-变量C语言教程第三集：C语言关键字_signed-unsigned-autoC语言教程第四集：C语言关键字-staticC语言教程第五集：C语言关键

2021-05-20 09:10:11

【视频】C语言知识免费视频教程-C语言关键字_typedef-连载视频第8集（视频持续更新……）

2021-04-19 11:39:55

【视频】C语言知识免费视频教程-C语言关键字_void-连载视频第10集（视频持续更新……）

2021-05-13 10:04:44

【视频】C语言知识免费视频教程-C语言关键字_volatile-连载视频第7集（视频持续更新……）

教程第四集：C语言关键字-staticC语言教程第五集：C语言关键字-registerC语言教程第六集：C语言关键字-constC语言教程第七集：C语言关键字_volatileC语言教程第八集：C语言关键

2021-04-12 10:40:51

【视频】C语言知识免费视频教程第2集-C语言关键字-常量-变量（已更新到21集，观看链接已附上）

语言关键字-staticC语言教程第五集：C语言关键字-registerC语言教程第六集：C语言关键字-constC语言教程第七集：C语言关键字_volatile C语言教程第八集：C语言关键

2021-03-04 13:24:14

不同设备如何统一语言编程平台高效开发？本文为你揭秘

HarmonyOS应用。一、什么是ArkCompiler ArkCompiler作为HarmonyOS应用开发的统一编程平台，包含编译器、工具链、运行时等关键部件，支持ArkTS、TS、JS等高级编程语言的开发

2023-05-09 10:01:42

在C语言中关键字static的作用是什么

在C语言中关键字static的作用是什么？用预处理指令#define 声明一个函数，输入天数得到有多少秒？

2021-12-24 06:53:36

如何从五个维度思考电机控制解决方案？

ADI知道，全球更严苛的能源法规要求采用更智能的高效电机控制系统。 ADI允许设计工程师从系统级的角度考虑关键隔离架构，实现系统效率最大化的同时改善系统精度和可靠性。1、从系统角度来看能效由于电机

2018-10-31 11:13:25

如何持续的提高C语言编程能力？

想持续提高C语言编程能力，该怎么做。现在是简单的程序可以写，指针用的很少，指来指去的，编译了全都是错。

2023-09-28 08:31:03

如何提升模型能力？

目标检测的模型集成方法及实验常见的提升模型能力的方式

2021-02-24 07:10:29

嵌入式系统的五个关键特性

无论嵌入式系统多么简单或复杂，开发人员都应密切关注五个关键特性。一些是显而易见的，例如RAM和ROM使用。然而，还有其他人经常被开发人员看过，这很容易成为设计周期中的一个主要问题。一、系统时序询问

2021-10-27 08:50:04

异构计算场景下构建可信执行环境

异构计算场景下，如何构建可信执行环境呢？分布式机密计算是一种思路，将CPU上的技术应用到其他的XPU上是另一种思路，但最关键的问题是怎么用。该问题在AI安全上非常明显，AI模型都在GPU上，TEE想用

2023-08-15 17:35:09

怎么实现c语言简易五子棋的设计？

2021-10-15 07:10:56

物联网安全技术提高区块链应用数据的可信度

等多种安全可信根的企业级区块链客户端可信服务，为区块链云下节点应用提供多维度的安全保障。提交合作需求阿里云 Link TEE简介去阿里云大学深度学习物联网安全立即学习课程预览物联网安全背景丨阿里云Link TEE介绍丨TEE开发入门丨开发一个可信的应用4节课，共30分钟阿里云AIoT技术布局立即了解

2019-11-07 16:34:33

电容器的模型/关键参数/类型

一、电容器的模型实际的电容器模型如下：二、电容器的关键参数二、ESR和ESL对电容器频率响应的影响四、电容器类型

2020-12-01 16:42:00

示波器测量之抖动的四个维度

测量结果的最大值和最小值相减即为峰峰值抖动。但是10的12次方样本很难直接测量出来，因为需要消耗的时间太长，所以就改用数学模型预测的方法进行推导。总结：上面表达中涉及到示波器测量抖动定义的四个维度

2022-11-22 13:50:35

自然语言处理怎么最快入门？

。（2）、HashTF，对应词袋模型的困境，人们首先想到的就是怎么缩小向量的维度，同时表示相同的单词呢，HashTF的基本思想也就是为了解决这个问题，利用Hash的思想，将大量的单词映射到一个小维度

2018-11-28 10:02:37

自然语言处理的语言模型

自然语言处理——53 语言模型（数据平滑）

2020-04-16 11:11:25

谁能帮我找找：学习快速C语言的资料，关键...

谁能帮我找找：学习快速C语言的资料，关键是怎么算法的？我还是比较想了解基础的。

2012-06-02 13:03:02

采用可信供应商防止敌对威胁

。可信晶圆代工计划的一个关键为独有地为美国***提供保证得到前沿的可信微电子服务，用于低量应用。DMEA 与行业供应商合作，确保其工艺达到计划目标，并为能够保障和保护国家安全系统的供应商提供

2018-10-23 09:09:23

非接触五维位移监测仪在滑坡桥梁地表监测墙裂监测中的测量精度？

非接触五维位移以非接触原理的多维度空间位置监测，测量的精度最为关键。

2022-05-31 15:59:24

高维度矩阵怎样实现？

打算用FPGA实现高维度（248维）定点矩阵乘法，开发板为赛灵思Virtex-VII，请问用部分IP核实现还是自己写性能更好？此外，我的课题是FPGA实现高维度（248维）独立成分分析ICA，请问维度这么大FPGA能跑起来么？有什么建议吗？万分感激！

2017-06-02 22:03:59

鸿蒙原生应用/元服务开发-Stage模型能力接口（五）

在Stage模型下使用二、导入模块 import common from \'@ohos.app.ability.common\'; 三、系统能力：以下各项对应的系统能力均为

2023-12-15 15:11:33

Model Inspector — 软件模型静态规范检查工具

Model Inspector （MI）原厂商是韩国 Suresoft，是 KOLAS 公认测评机构，旨在提升安全关键领域软件可信度。 MI 用于开发过程中模型

2022-04-22 13:54:15

基于TPM的可信链模型研究

本文介绍了可信链模型双主线协同设计的思路，提出了由信任主线信任流走向来引导功能主线控制流走向的可信边界扩展思想，给出PC 可信链模型执行流程，并通过与传统恶意代

2009-06-16 08:29:03

基于过程模型的工作流执行语义研究

针对现有工作流建模语言难以兼顾语言的可理解性、执行语义的形式化和描述维度的单一性等问题，提出利用可视化的过程模型作为工作流建模语言。过程模型能从过程、数据、

2009-10-07 11:56:14

Model Inspector—软件模型静态规范检查工具

产品概述 Model Inspector（MI）原厂商是韩国Suresoft，是KOLAS国际公认测评机构，旨在提升安全关键领域软件可信度。MI

2024-03-01 11:29:03

可信路由技术

文章提出可信路由体系结构模型、可信域内路由、可信域间路由等新网络环境下的可信路由参考机制，并对可信路由涉及的关键技术，如映射可扩展技术、路由信任机制、多径路由技术

2011-11-25 16:11:28

1225

揭秘：腾讯云获虚拟网络和视频云两大可信云奖项，有何神通？

2015年可信云服务大会今日在京颁发“2014-2015可信云服务奖”，腾讯云在评选中揽得可信云2014-2015年度“虚拟网络技术创新奖”和可信云2014-2015年度“视频云服务奖”两大奖项，成为云服务的奥斯卡大会的大赢家。

2015-07-31 16:21:12

626

多维度的O2O电子商务声誉计算模型

又无法反映020商务模式的特点，不适用于020商家的声誉计算。针对这些问题，提出了一种新的020商家声誉计算模型ESRep。模型根据020本地服务业的特点进行多维度思考，对商家的运营时间、客流量等因素进行分析，同时也考虑客户的评价、交易价格偏离度、交

2017-11-23 17:11:40

自然语言处理常用模型解析

自然语言处理常用模型使用方法一、N元模型二、马尔可夫模型以及隐马尔可夫模型及目前常用的自然语言处理开源项目/开发包有哪些？

2017-12-28 15:42:30

5382

一种云平台可信性分析模型建立方法

如何使得用户信任云服务提供商及其云平台，是云计算普及的关键因素之一．针对目前云平台可信性所包含的内容与分析评价依据尚不完善的现状，且缺乏从理论层次对于云平台的部分可信属性进行分析与评估方法

2018-01-13 10:12:07

软件可信评估研究综述

了可信评估管理中涉及到的标准、模型和工具，而非关注软件度量本身．首先分析对比了软件可信性、可信评估的定义，并在研究了与可信性密切相关的软件质量的联系与区别之后，从相关国际标准、评估涉及的模型（包括质量属性

2018-01-15 14:35:32

基于数组维度类型程序设计

异构集群多层次异构存储的特点，决定了在其上进行计算时，数据需要进行更多维度的划分．现有集群程序设计语言缺乏对多维数组传输和转置的统一表示机制．介绍多维数组维度转置的表示方法和课题组实现的Parray

2018-01-19 15:19:27

基于关键迹和ASP的CSP模型检测

提取语义模型，但转化过程较为复杂；待验证性质采用CSP语言进行描述，虽然有利于精炼检测（refinement checking），但描述能力较弱，通用性不强．鉴于此，提出了一种新的CSP指称语义模型一一关键

2018-01-23 16:03:53

具有瀑布特征的可信虚拟平台信任链模型

将虚拟化技术与可信计算相结合构建的可信虚拟平台及其信任链模型是目前的一个研究热点。目前大部分的研究成果采用在虚拟平台上扩展传统信任链的构建方法，不仅模型过粗且逻辑不完全合理，而且还存在底层虚拟化平台

2018-03-29 15:31:44

系统仿真模型可信度评估方法研究综述

借鉴国外仿真模型校核与验证（ Verfication.Ⅴ alidation，V&V）标准和规范，提岀了一种系统仿真模型可信度评估通用流程和方法。对模型评估的相关概念进行了阐述，给岀了系统

2021-06-15 14:37:18

基于Python语言的RFM模型讲解

上面步骤可以知道，我们需要有RFM三个维度，根据我们在业务分析方法课程中学到的，业务分析模型离不开指标，而指标是对度量的汇总。因此，在找出RFM三个维度后，需要对每个维度下度量实现不同汇总规则。下面讲述对R、F、M三个维度下的度量如何进行汇总。

2022-03-15 15:38:58

1327

一种基于乱序语言模型的预训练模型-PERT

由于乱序语言模型不使用[MASK]标记，减轻了预训练任务与微调任务之间的gap，并由于预测空间大小为输入序列长度，使得计算效率高于掩码语言模型。PERT模型结构与BERT模型一致，因此在下游预训练时，不需要修改原始BERT模型的任何代码与脚本。

2022-05-10 15:01:27

1173

采用高可信度的MOSFET模型进行基于模型的功率转换器设计

在设计功率转换器时，可以使用仿真模型在多个设计维度之间进行权衡。使用有源器件的简易开关模型可以进行快速仿真，带来更多的工程洞见。然而，与制造商精细的器件模型相比，这种简易的器件模型无法在设计中提

2022-09-21 10:11:26

597

如何充分挖掘预训练视觉-语言基础大模型的更好零样本学习能力

因此，合适的prompt对于模型的效果至关重要。大量研究表明，prompt的微小差别，可能会造成效果的巨大差异。研究者们就如何设计prompt做出了各种各样的努力——自然语言背景知识的融合、自动生成prompt的搜索、不再拘泥于语言形式的prompt探索等等。

2022-10-19 14:39:36

1066

解析ChatGPT的语言能力是如何训出来的（上）

研究这些能力是什么，大型语言模型可以提供什么，以及它们在更广泛的 NLP/ML 任务中的潜在优势是什么。

2023-02-21 10:08:51

565

深入理解语言模型的突显能力

最近，人们对大型语言模型所展示的强大能力（例如思维链 ^[2]^ 、便签本 ^[3]^ ）产生了极大的兴趣，并开展了许多工作。我们将之统称为大模型的突现能力 ^[4]^ ，这些能力可能只存在于大型模型

2023-02-22 11:16:05

675

多维度剖析视觉-语言训练的技术路线

视觉-语言 (Vision-Language, VL) 是计算机视觉和自然语言处理这两个研究领域之间形成的交叉领域，旨在赋予 AI 系统从多模态数据中学习有效信息的能力。受 NLP 预训练语言模型

2023-02-23 11:15:54

608

大型语言模型有哪些用途？

大型语言模型能识别、总结、翻译、预测和生成文本及其他内容。 AI 应用在大型语言模型的帮助下，可用于解决总结文章、编写故事和参与长对话等多种繁重工作。大型语言模型（LLM）是一种深度学习算法，可以

2023-02-23 19:50:04

3887

LeCun新作：全面综述下一代「增强语言模型」

最近图灵奖得主Yann LeCun参与撰写了一篇关于「增强语言模型」的综述，回顾了语言模型与推理技能和使用工具的能力相结合的工作，并得出结论，这个新的研究方向有可能解决传统语言模型的局限性，如可解释性、一致性和可扩展性问题。

2023-03-03 11:03:20

673

大型语言模型有哪些用途？大型语言模型如何运作呢？

大型语言模型能识别、总结、翻译、预测和生成文本及其他内容。

2023-03-08 13:57:00

6989

各种大语言模型是彻底被解封了

基础 LLM 基本信息表，GPT-style 表示 decoder-only 的自回归语言模型，T5-style 表示 encoder-decoder 的语言模型，GLM-style 表示 GLM 特殊的模型结构，Multi-task 是指 ERNIE 3.0 的模型结构

2023-04-20 11:25:44

1071

如何通过一个简单的方法来解锁大型语言模型的推理能力？

近来NLP领域由于语言模型的发展取得了颠覆性的进展，扩大语言模型的规模带来了一系列的性能提升，然而单单是扩大模型规模对于一些具有挑战性的任务来说是不够的

2023-05-10 11:13:17

1377

利用大语言模型做多模态任务

大型语言模型LLM（Large Language Model）具有很强的通用知识理解以及较强的逻辑推理能力，但其只能处理文本数据。

2023-05-10 16:53:15

701

大语言模型的多语言机器翻译能力分析

以ChatGPT为代表的大语言模型（Large Language Models, LLM）在机器翻译（Machine Translation, MT）任务上展现出了惊人的潜力。

2023-05-17 09:56:26

903

邱锡鹏团队提出SpeechGPT：具有内生跨模态能力的大语言模型

虽然现有的级联方法或口语语言模型能够感知和生成语音，但仍存在一些限制。首先，在级联模型中，LLM 仅充当内容生成器。由于语音和文本的表示没有对齐，LLM 的知识无法迁移到语音模态中。

2023-05-22 10:19:29

382

基于预训练模型和语言增强的零样本视觉学习

在一些非自然图像中要比传统模型表现更好 CoOp 增加一些 prompt 会让模型能力进一步提升怎么让能力更好？可以引入其他知识，即其他的预训练模型，包括大语言模型、多模态模型也包括

2023-06-15 16:36:11

277

大型语言模型的应用

大型语言模型（LLM）是一种深度学习算法，可以通过大规模数据集训练来学习识别、总结、翻译、预测和生成文本及其他内容。大语言模型（LLM）代表着 AI 领域的重大进步，并有望通过习得的知识改变

2023-07-05 10:27:35

1463

语言模型的发展历程基于神经网络的语言模型解析

简单来说，语言模型能够以某种方式生成文本。它的应用十分广泛，例如，可以用语言模型进行情感分析、标记有害内容、回答问题、概述文档等等。但理论上，语言模型的潜力远超以上常见任务。

2023-07-14 11:45:40

454

用基于英特尔® SGX 的可信执行环境有效应对大语言模型隐私和安全挑战

1 可信执行环境是什么？大语言模型为什么需要它？ OpenAI 的 GPT 系列大语言模型（Large Language Mode，以下缩写为 LLM）的兴起与应用，也带来了诸如数据泄露、数据滥用

2023-07-14 20:10:07

303

基于MNN在个人设备上流畅运行大语言模型该如何实现呢？

LLM（大语言模型）因其强大的语言理解能力赢得了众多用户的青睐，但LLM庞大规模的参数导致其部署条件苛刻；

2023-07-20 10:49:29

655

中科曙光云多款产品通过信通院可信云认证

级要求和《可信云超融合面向信创场景的评估》标准。为响应国家政策要求及行业用户需求，助力实现一云多芯规范化、高质量的发展目标，中国信通院牵头制定《一云多芯稳定性度量评估模型》。该模型覆盖基础建设、度量维度、管理能力3大能力域，共20个功能模块，是

2023-07-26 09:41:15

554

清华大学大语言模型综合性能评估报告发布！哪个模型更优秀？

近日，清华大学新闻与传播学院发布了《大语言模型综合性能评估报告》，该报告对目前市场上的7个大型语言模型进行了全面的综合评估。近年，大语言模型以其强大的自然语言处理能力，成为AI领域的一大热点。它们

2023-08-10 08:32:01

607

大语言模型“书生·浦语”多项专业评测拔头筹

大语言模型评测8月排行榜和中文通用大模型综合性评测基准SuperCLUE 7月评测榜两项业内权威大模型评测榜单中获得优异成绩。 “ FlagEval是知名人工智能新型研发机构北京智源人工智能研究院推出的大模型评测体系及开放平台。 FlagEval大模型评测体系构建了“能力-任务

2023-08-25 13:00:02

315

FPGA加速器支撑ChatGPT类大语言模型创新

，大型语言模型（Large Language Models，LLM）彻底改变了自然语言处理领域，使机器能够生成类似人类的文本并进行有意义的对话。这些模型，例如OpenAI的GPT，拥有惊人的语言理解和生成能力。它们可以被用于广泛的自然语言处理任务，包括文本生成、翻译、自动摘要、情绪分析等

2023-09-04 16:55:25

345

腾讯发布混元大语言模型

腾讯发布混元大语言模型腾讯全球数字生态大会上腾讯正式发布了混元大语言模型，参数规模超千亿，预训练语料超2万亿tokens。作为腾讯自研的通用大语言模型，混元大语言模型具有中文创作能力、任务执行

2023-09-07 10:23:54

815

虹科分享 | 谷歌Vertex AI平台使用Redis搭建大语言模型

基础模型和高性能数据层这两个基本组件始终是创建高效、可扩展语言模型应用的关键，利用Redis搭建大语言模型，能够实现高效可扩展的语义搜索、检索增强生成、LLM 缓存机制、LLM记忆和持久

2023-09-18 11:26:49

316

大语言模型（LLM）预训练数据集调研分析

大语言模型涉及数据的通常有有多个阶段（Aligning language models to follow instructions [1] ）：pre-train、sft（supervised

2023-09-19 10:00:06

506

什么是可信数据空间可信数据空间关键技术解析

数据流通已经成为释放数据价值的难点与堵点，数据要素市场化需从制度、市场、技术三个方面共同推动，其中可信数据空间是技术的坚实支点。可信数据空间将成为未来数据要素市场的核心组成和数字经济的关键数据基础设施，促进数字经济与实体经济深度融合。

2023-09-20 11:12:15

1690

揭秘编码器与解码器语言模型

Transformer 架构的问世标志着现代语言大模型时代的开启。自 2018 年以来，各类语言大模型层出不穷。

2023-10-24 11:42:05

337

基于检索的大语言模型简介

简介章节讲的是比较基础的，主要介绍了本次要介绍的概念，即检索（Retrieval）和大语言模型（LLM）

2023-11-15 14:50:36

282

大语言模型简介：基于大语言模型模型全家桶Amazon Bedrock

本文基于亚马逊云科技推出的大语言模型与生成式AI的全家桶：Bedrock对大语言模型进行介绍。大语言模型指的是具有数十亿参数（B+）的预训练语言模型（例如：GPT-3, Bloom, LLaMA)。这种模型可以用于各种自然语言处理任务，如文本生成、机器翻译和自然语言理解等。

2023-12-04 15:51:46

356

开启智能时代：亚马逊云科技倾力打造大语言模型前沿应用

近年来，随着科技的飞速发展，大语言模型成为人工智能领域的一颗璀璨明珠。在这个信息爆炸的时代，大语言模型以其强大的自学习能力和广泛的应用领域引起了广泛关注。作为亚马逊云科技的前沿技术之一，本文将深入探讨大语言模型的革新之处以及在实际应用中的崭新可能性。

2023-12-06 13:57:13

447

大语言模型概述

在科技飞速发展的当今时代，人工智能技术成为社会进步的关键推动力之一。在广泛关注的人工智能领域中，大语言模型以其引人注目的特性备受瞩目。大语言模型的定义及发展历史大语言模型是一类基于深度学习技术

2023-12-21 17:53:59

555

大唐高鸿可信国产终端CTRUST CT230-T22E介绍

本次推出的大唐高鸿可信国产终端CTRUST CT230-T22E构建了人、设备及设备可信状态、应用行为、安全基线等的多维度可信身份，具备自主可控、安全可信、适用广泛的优势。

2023-12-22 16:31:56

504

大语言模型使用指南

，带你发现大语言模型的潜力，解锁无限可能。揭秘大语言模型的魔法在动手操作之前，我们先来揭秘一下大语言模型的魔法。这些模型通过大量的文本数据进行预训练，使其具备了超强的理解和生成自然语言的能力。搞懂它的构造和培训过程

2023-12-29 14:18:59

276

新能源充电枪测试机：揭秘未来充电技术的关键

2024-01-02 09:12:17

156

大语言模型推断中的批处理效应

随着开源预训练大型语言模型（Large Language Model, LLM ）变得更加强大和开放，越来越多的开发者将大语言模型纳入到他们的项目中。其中一个关键的适应步骤是将领域特定的文档集成到预训练模型中，这被称为微调。

2024-01-04 12:32:39

228

模型与人类的注意力视角下参数规模扩大与指令微调对模型语言理解的作用

近期的大语言模型（LLM）在自然语言理解和生成上展现出了接近人类的强大能力，远远优于先前的BERT等预训练模型（PLM）。

2024-01-04 14:06:39

139

只修改一个关键参数，就会毁了整个百亿参数大模型？

2022 年开始，我们发现 Multilingual BERT 是一个经过大规模跨语言训练验证的模型实例，其展示出了优异的跨语言迁移能力。具

2024-02-20 14:51:35

222

华为云盘古大模型通过金融大模型标杆验证，获最高评级

该验证标准主要关注金融大模型对语言，语音，视觉以及多模态任务等多元领域的适应能力，涵盖数据合规性，模型安全性和服务稳定性等关键要素。

2024-03-04 15:58:01

159

已全部加载完成

搜索历史

揭秘大语言模型可信能力的五个关键维度

评论