0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

标签 > 大模型

大模型

+关注2人关注

以大模型作为基础模型支撑AI产业应用逻辑已经被证明实用性,AI大模型为AI落地应用提供了一种通用化的解决方案;各自各样参数不一、面向不同行业、面向不同任务的“大模型”也陆续发布,大模型已经成为整个AI 界追逐的宠儿,AI大模型有效果好、泛化性强、研发流程标准化程度高等特点。

文章:2395 浏览:2647 帖子:12

大模型技术

一个给NLP领域带来革新的预训练语言大模型Bert

一个给NLP领域带来革新的预训练语言大模型Bert

之前的文章和大家详细的介绍了静态的词向量表示word2vec理论加实战,但是word2vec存在一个很大的问题,由于是静态词向量所以无法表示一词多义,对...

2023-02-28 标签:GPTELMOSTransformer 6.5万 0

通往AGI之路:揭秘英伟达A100、A800、H800、V100在高性能计算与大模型训练中的霸主地位

通往AGI之路:揭秘英伟达A100、A800、H800、V100在高性能计算与大模型训练中的霸主地位

英伟达前段时间发布GH 200包含 36 个 NVLink 开关,将 256 个 GH200 Grace Hopper 芯片和 144TB 的共享内存连...

2023-06-29 标签:AI英伟达Agi 2.9万 0

大模型训练为什么不能用4090显卡,GPU训练性能和成本对比

大模型训练为什么不能用4090显卡,GPU训练性能和成本对比

为什么?一般有 tensor parallelism、pipeline parallelism、data parallelism 几种并行方式,分别在模...

2023-09-15 标签:fpgagpu内存 2.5万 0

四种微调大模型的方法介绍

四种微调大模型的方法介绍

全微调(Full Fine-tuning):全微调是指对整个预训练模型进行微调,包括所有的模型参数。在这种方法中,预训练模型的所有层和参数都会被更新和优...

2024-01-03 标签:gpu深度学习ChatGPT 2.4万 0

十分钟读懂旋转编码(RoPE)

十分钟读懂旋转编码(RoPE)

对于位置编码,常规的做法是在计算 query,key 和 value 向量之前,会计算一个位置编码向量 加到词嵌入 上,位置编码向量 同样也是 维向量,...

2023-09-05 标签:向量旋转编码大模型 1.5万 0

InfiniBand和RoCEv2网络简介及解决方案

InfiniBand和RoCEv2网络简介及解决方案

超高带宽、超低延迟、超高可靠,这是大模型训练对于网络的要求。

2023-09-22 标签:数据中心AITCP 9380 0

图解大模型系列之:Megatron源码解读1,分布式环境初始化

图解大模型系列之:Megatron源码解读1,分布式环境初始化

使用Megatron来训练gpt类大模型的项目有很多。在这个系列里,我选择了由THUDM开发的CodeGeeX项目,它是gpt在代码生成方向上的应用,对...

2023-06-06 标签:gpu源码大模型 5927 0

开发者如何使用讯飞星火认知大模型API?

开发者如何使用讯飞星火认知大模型API?

之前我们使用网页文本输入的方式体验了讯飞星火认知大模型的功能(是什么让科大讯飞1个月股价翻倍?),本篇博文将从开发者角度来看看如何使用讯飞星火认知大模型API。

2023-08-15 标签:测试API科大讯飞 5452 0

什么是内存语义?CXL是如何划分语义的

什么是内存语义?CXL是如何划分语义的

从IB提供的具体操作来看,Send/Receive,RDMA_Read,RDMA_Write和ATOMIC操作实际上都是针对内存的操作,所不同的是,Se...

2024-04-08 标签:内存人工智能传输层 5409 0

主流大模型推理框架盘点解析

主流大模型推理框架盘点解析

vLLM是一个开源的大模型推理加速框架,通过PagedAttention高效地管理attention中缓存的张量,实现了比HuggingFace Tra...

2023-10-10 标签:神经网络gpu服务器 5269 0

介绍大模型高效训练所需要的主要技术

随着BERT、GPT等预训练模型取得成功,预训-微调范式已经被运用在自然语言处理、计算机视觉、多模态语言模型等多种场景,越来越多的预训练模型取得了优异的效果。

2022-11-08 标签:gpuGPTMLP 4839 0

什么是多模态?多模态的难题是什么?

什么是多模态?多模态的难题是什么?

单模态大模型,通常大于100M~1B参数。具有较强的通用性,比如对图片中任意物体进行分割,或者生成任意内容的图片或声音。极大降低了场景的定制成本。

2024-01-17 标签:AI大模型LLM 4597 0

图解大模型训练之:Megatron源码解读2,模型并行

图解大模型训练之:Megatron源码解读2,模型并行

前文说过,用Megatron做分布式训练的开源大模型有很多,我们选用的是THUDM开源的CodeGeeX(代码生成式大模型,类比于openAI Code...

2023-06-07 标签:gpu源码大模型 4441 0

大模型训练:为何A100更胜4090一筹?

首先看吞吐量,看起来没有什么违和的,在单卡能放下模型的情况下,确实是 H100 的吞吐量最高,达到 4090 的两倍。

2024-03-13 标签:FPGAgpu大模型 4237 0

大模型为什么要微调?大模型微调的原理

在人工智能(AI)领域,特别是自然语言处理(NLP)领域,大模型(如BERT、GPT系列等)的出现为许多复杂任务提供了强大的解决方案。然而,这些预训练的...

2024-07-10 标签:AI人工智能大模型 3921 0

人工智能与大模型的关系与区别

在科技日新月异的今天,人工智能(AI)已成为推动社会进步的重要力量。而在人工智能的众多分支中,大模型(Large Models)作为近年来兴起的概念,以...

2024-07-04 标签:计算机人工智能大模型 3673 0

什么是混合专家模型?混合专家模型 (MoEs)优劣势分析

什么是混合专家模型?混合专家模型 (MoEs)优劣势分析

门控网络或路由: 这个部分用于决定哪些令牌 (token) 被发送到哪个专家。例如,在下图中,“More”这个令牌可能被发送到第二个专家,而“Param...

2024-02-22 标签:神经网络AITransformer 3576 0

基于星火大模型的智能编程助手iFlyCode简介

基于星火大模型的智能编程助手iFlyCode简介

一款基于星火大模型的智能编程助手,旨在为开发者提供高效、准确和智能的编程支持。

2023-09-15 标签:编程C++编辑器 3528 0

基于AX650N/AX630C部署端侧大语言模型Qwen2

基于AX650N/AX630C部署端侧大语言模型Qwen2

本文将分享如何将最新的端侧大语言模型部署到超高性价比SoC上,向业界对端侧大模型部署的开发者提供一种新的思路。

2024-07-06 标签:爱芯元智大模型LLM 3519 0

深入了解RAG技术

深入了解RAG技术

这是任何RAG流程的最后一步——基于我们仔细检索的所有上下文和初始用户查询生成答案。最简单的方法可能是将所有获取到的上下文(超过某个相关性阈值的)连同查...

2024-01-17 标签:编码器大模型LLM 3190 0

相关标签

相关话题

换一批
  • 电子发烧友网
    电子发烧友网
    +关注
    电子发烧友网于2006年10月成立, 是一个以电子技术知识为核心,以工程师为主导的平台。致立于为中国电子工程师的电子产品设计等做出最大贡献,促进中国电子科技的稳步发展。
  • 无人驾驶
    无人驾驶
    +关注
    提供全球最前沿无人驾驶科技趋势,中国无人驾驶开发者社区
  • 1024
    1024
    +关注
  • 京瓷
    京瓷
    +关注
    京瓷株式会社成立于1959年4月1日。川村诚为现任代表取缔役社长。资本金为1,157亿332万日元。截至2006年3月31日为止的年度销售额达到1,181,489百万日元,集团公司包括关联公司在内共计183家,员工61,468名。
  • emmc
    emmc
    +关注
    eMMC (Embedded Multi Media Card)是MMC协会订立、主要针对手机或平板电脑等产品的内嵌式存储器标准规格。
  • 过压保护电路
    过压保护电路
    +关注
  • 6G
    6G
    +关注
    6G网络将是一个地面无线与卫星通信集成的全连接世界。6G,即第六代移动通信标准,也被称为第六代移动通信技术。主要促进的就是物联网的发展 。截至2019年11月,6G仍在开发阶段。6G的传输能力可能比5G提升100倍,网络延迟也可能从毫秒降到微秒级。
  • 华强pcb线路板打样
    华强pcb线路板打样
    +关注
  • 高频电容
    高频电容
    +关注
  • COB
    COB
    +关注
  • wifi6
    wifi6
    +关注
    WiFi6主要使用了OFDMA、MU-MIMO等技术,MU-MIMO(多用户多入多出)技术允许路由器同时与多个设备通信,而不是依次进行通信。MU-MIMO允许路由器一次与四个设备通信,WiFi6将允许与多达8个设备通信。WiFi6还利用其他技术,如OFDMA(正交频分多址)和发射波束成形,两者的作用分别提高效率和网络容量。WiFi6最高速率可达9.6Gbps。
  • dcdc转换器
    dcdc转换器
    +关注
    DC/DC转换器为转变输入电压后有效输出固定电压的电压转换器。DC/DC转换器分为三类:升压型DC/DC转换器、降压型DC/DC转换器以及升降压型DC/DC转换器。
  • 汽车
    汽车
    +关注
  • 检测电路图
    检测电路图
    +关注
  • Zynq-7000
    Zynq-7000
    +关注
      赛灵思公司(Xilinx)推出的行业第一个可扩展处理平台Zynq系列。旨在为视频监视、汽车驾驶员辅助以及工厂自动化等高端嵌入式应用提供所需的处理与计算性能水平。
  • CD4069
    CD4069
    +关注
  • 过流保护电路
    过流保护电路
    +关注
    电路过电流过电压保护是为防止主回路短路或直流牵引电动机发生环火造成主回路电流过大而损坏同步牵引发电机、主整流柜等电气设备,机车在牵引、电阻制动或自负载工况下,对主电路的过电流和过电压均进行保护。
  • 过零检测电路
    过零检测电路
    +关注
    过零检测指的是在交流系统中,当波形从正半周向负半周转换时,经过零位时,系统作出的检测。可作开关电路或者频率检测。漏电开关的漏电检测是检测零序电流。
  • 特斯拉线圈
    特斯拉线圈
    +关注
    特斯拉线圈又叫泰斯拉线圈,因为这是从“Tesla”这个英文名直接音译过来的。这是一种分布参数高频串联谐振变压器,可以获得上百万伏的高频电压。
  • VHF
    VHF
    +关注
  • VDD
    VDD
    +关注
     Vcc和Vdd是器件的电源端。Vcc是双极器件的正,Vdd多半是单极器件的正。下标可以理解为NPN晶体管的集电极C,和PMOS or NMOS场效应管的漏极D。同样你可在电路图中看见Vee和Vss,含义一样。因为主流芯片结构是硅NPN所以Vcc通常是正。如果用PNP结构Vcc就为负了。建议选用芯片时一定要看清电气参数
  • 逆变器电路图
    逆变器电路图
    +关注
  • 慕尼黑上海电子展
    慕尼黑上海电子展
    +关注
  • 测试电路
    测试电路
    +关注
  • AIoT
    AIoT
    +关注
    AIoT(人工智能物联网)=AI(人工智能)+IoT(物联网)。 AIoT融合AI技术和IoT技术,通过物联网产生、收集海量的数据存储于云端、边缘端,再通过大数据分析,以及更高形式的人工智能,实现万物数据化、万物智联化,物联网技术与人工智能追求的是一个智能化生态体系,除了技术上需要不断革新,技术的落地与应用更是现阶段物联网与人工智能领域亟待突破的核心问题。
  • HarmonyOS
    HarmonyOS
    +关注
    HarmonyOS最新信息分享,我们将为大家带来HarmonyOS是什么意思的深度解读,HarmonyOS官网地址、HarmonyOS开源相关技术解读与设计应用案例,HarmonyOS系统官网信息,华为harmonyOS最新资讯动态分析等。
  • 功放板
    功放板
    +关注
  • ELMOS
    ELMOS
    +关注
  • 功放制作
    功放制作
    +关注
    功率放大器(英文名称:power amplifier),简称“功放”,是指在给定失真率条件下,能产生最大功率输出以驱动某一负载(例如扬声器)的放大器。
  • 科创板
    科创板
    +关注
    拟订科创板股票上市审核规则、科创板上市公司并购重组审核规则、上市委员会及科技创新咨询委员会相关规则;负责科创板股票发行上市审核和科创板上市公司并购重组审核工作,拟订审核标准、审核程序等;对发行人、科创板上市公司及中介机构进行自律监管等。

关注此标签的用户(2人)

jf_76320117 meetyou_530

编辑推荐厂商产品技术软件/工具OS/语言教程专题

电机控制 DSP 氮化镓 功率放大器 ChatGPT 自动驾驶 TI 瑞萨电子
BLDC PLC 碳化硅 二极管 OpenAI 元宇宙 安森美 ADI
无刷电机 FOC IGBT 逆变器 文心一言 5G 英飞凌 罗姆
直流电机 PID MOSFET 传感器 人工智能 物联网 NXP 赛灵思
步进电机 SPWM 充电桩 IPM 机器视觉 无人机 三菱电机 ST
伺服电机 SVPWM 光伏发电 UPS AR 智能电网 国民技术 Microchip
瑞萨 沁恒股份 全志 国民技术 瑞芯微 兆易创新 芯海科技 Altium
德州仪器 Vishay Micron Skyworks AMS TAIYOYUDEN 纳芯微 HARTING
adi Cypress Littelfuse Avago FTDI Cirrus LogIC Intersil Qualcomm
st Murata Panasonic Altera Bourns 矽力杰 Samtec 扬兴科技
microchip TDK Rohm Silicon Labs 圣邦微电子 安费诺工业 ixys Isocom Compo
安森美 DIODES Nidec Intel EPSON 乐鑫 Realtek ERNI电子
TE Connectivity Toshiba OMRON Sensirion Broadcom Semtech 旺宏 英飞凌
Nexperia Lattice KEMET 顺络电子 霍尼韦尔 pulse ISSI NXP
Xilinx 广濑电机 金升阳 君耀电子 聚洵 Liteon 新洁能 Maxim
MPS 亿光 Exar 菲尼克斯 CUI WIZnet Molex Yageo
Samsung 风华高科 WINBOND 长晶科技 晶导微电子 上海贝岭 KOA Echelon
Coilcraft LRC trinamic
放大器 运算放大器 差动放大器 电流感应放大器 比较器 仪表放大器 可变增益放大器 隔离放大器
时钟 时钟振荡器 时钟发生器 时钟缓冲器 定时器 寄存器 实时时钟 PWM 调制器
视频放大器 功率放大器 频率转换器 扬声器放大器 音频转换器 音频开关 音频接口 音频编解码器
模数转换器 数模转换器 数字电位器 触摸屏控制器 AFE ADC DAC 电源管理
线性稳压器 LDO 开关稳压器 DC/DC 降压转换器 电源模块 MOSFET IGBT
振荡器 谐振器 滤波器 电容器 电感器 电阻器 二极管 晶体管
变送器 传感器 解析器 编码器 陀螺仪 加速计 温度传感器 压力传感器
电机驱动器 步进驱动器 TWS BLDC 无刷直流驱动器 湿度传感器 光学传感器 图像传感器
数字隔离器 ESD 保护 收发器 桥接器 多路复用器 氮化镓 PFC 数字电源
开关电源 步进电机 无线充电 LabVIEW EMC PLC OLED 单片机
5G m2m DSP MCU ASIC CPU ROM DRAM
NB-IoT LoRa Zigbee NFC 蓝牙 RFID Wi-Fi SIGFOX
Type-C USB 以太网 仿真器 RISC RAM 寄存器 GPU
语音识别 万用表 CPLD 耦合 电路仿真 电容滤波 保护电路 看门狗
CAN CSI DSI DVI Ethernet HDMI I2C RS-485
SDI nas DMA HomeKit 阈值电压 UART 机器学习 TensorFlow
Arduino BeagleBone 树莓派 STM32 MSP430 EFM32 ARM mbed EDA
示波器 LPC imx8 PSoC Altium Designer Allegro Mentor Pads
OrCAD Cadence AutoCAD 华秋DFM Keil MATLAB MPLAB Quartus
C++ Java Python JavaScript node.js RISC-V verilog Tensorflow
Android iOS linux RTOS FreeRTOS LiteOS RT-THread uCOS
DuerOS Brillo Windows11 HarmonyOS
林超文PCB设计:PADS教程,PADS视频教程 郑振宇老师:Altium Designer教程,Altium Designer视频教程
张飞实战电子视频教程 朱有鹏老师:海思HI3518e教程,HI3518e视频教程
李增老师:信号完整性教程,高速电路仿真教程 华为鸿蒙系统教程,HarmonyOS视频教程
赛盛:EMC设计教程,EMC视频教程 杜洋老师:STM32教程,STM32视频教程
唐佐林:c语言基础教程,c语言基础视频教程 张飞:BUCK电源教程,BUCK电源视频教程
正点原子:FPGA教程,FPGA视频教程 韦东山老师:嵌入式教程,嵌入式视频教程
张先凤老师:C语言基础视频教程 许孝刚老师:Modbus通讯视频教程
王振涛老师:NB-IoT开发视频教程 Mill老师:FPGA教程,Zynq视频教程
C语言视频教程 RK3566芯片资料合集
朱有鹏老师:U-Boot源码分析视频教程 开源硬件专题