0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

标签 > 大模型

大模型

+关注2人关注

以大模型作为基础模型支撑AI产业应用逻辑已经被证明实用性,AI大模型为AI落地应用提供了一种通用化的解决方案;各自各样参数不一、面向不同行业、面向不同任务的“大模型”也陆续发布,大模型已经成为整个AI 界追逐的宠儿,AI大模型有效果好、泛化性强、研发流程标准化程度高等特点。

文章:2395 浏览:2649 帖子:12

大模型技术

大模型未来的产业发展趋势和挑战是什么

大模型未来的产业发展趋势和挑战是什么

一般而言,大模型(Large Language Models)指的是包含超大规模参数的神经网络模型。大模型通常能够学习到更细微的模式和规律,具有更强的泛...

2023-09-13 标签:神经网络语音识别人工智能 907 0

开源大模型FLM-101B:训练成本最低的超100B参数大模型

开源大模型FLM-101B:训练成本最低的超100B参数大模型

近期,一支来自中国的研究团队正是针对这些问题提出了解决方案,他们推出了FLM-101B模型及其配套的训练策略。FLM-101B不仅大幅降低了训练成本,而...

2023-09-12 标签:开源语言模型大模型 1455 0

LLaMA微调显存需求减半,清华提出4比特优化器

LLaMA微调显存需求减半,清华提出4比特优化器

从 GPT-3,Gopher 到 LLaMA,大模型有更好的性能已成为业界的共识。但相比之下,单个 GPU 的显存大小却增长缓慢,这让显存成为了大模型训...

2023-09-11 标签:图像分类机器翻译大模型 493 0

揭秘英伟达A100、A800、H100、H800 GPU如何实现高性能大模型的百倍训练加速

揭秘英伟达A100、A800、H100、H800 GPU如何实现高性能大模型的百倍训练加速

摘要:本文主要介绍大模型的内部运行原理、我国算力发展现状。大模型指具有巨大参数量的深度学习模型,如GPT-4。其通过在大规模数据集上进行训练,能够产生更...

2023-09-09 标签:NVIDIAgpu英伟达 1884 0

大模型外挂知识库优化-大模型辅助向量召回

大模型外挂知识库优化-大模型辅助向量召回

用LLM根据用户query生成k个“假答案”。(大模型生成答案采用sample模式,保证生成的k个答案不一样,不懂LLM生成答案原理的同学可以看我这篇文...

2023-09-08 标签:向量数据集大模型 1958 0

大模型的优劣势有哪些

一般而言,越复杂的任务,越充裕的资源,应该是各自用更加专业的方案来做各自的上限才会比较高,大模型能提供的,是一个基础的、快速的、zero shot或者f...

2023-09-07 标签:nlp大模型 2149 0

大模型心高气傲,没有AI Agents生死难料

大模型心高气傲,没有AI Agents生死难料

AI Agents会消除人与AI系统的大量繁琐交互已经板上钉钉,正在发生

2023-09-06 标签:AI大模型 669 0

大模型的位置编码和外推性问题一样吗

大模型的位置编码和外推性问题一样吗

这种编码方式又叫做 Sinusoidal编码 。直觉上看,第个位置的表征向量维度是 ,这个向量的奇数位置元素使用余弦值,偶数位置元素使用正弦值。

2023-09-06 标签:人工智能GPT位置编码器 814 0

十分钟读懂旋转编码(RoPE)

十分钟读懂旋转编码(RoPE)

对于位置编码,常规的做法是在计算 query,key 和 value 向量之前,会计算一个位置编码向量 加到词嵌入 上,位置编码向量 同样也是 维向量,...

2023-09-05 标签:向量旋转编码大模型 1.5万 0

基于Tansformer架构的ChatGPT原理解析

基于Tansformer架构的ChatGPT原理解析

ChatGPT模型发布后,因其流畅的对话表达、极强的上下文存储、丰富的知识创作及其全面解决问题的能力而风靡全球,刷新了大众对人工智能的认知。提示学习(P...

2023-09-04 标签:ChatGPT文心一言AIGC 512 0

AI大模型终于走到了数据争夺战

数据标注行业亟待升级

2023-09-04 标签:AI数据库GPT 623 0

跑大模型AI的K8s与普通K8s的区别分析

Kubernetes是一个在大量节点上管理容器的系统,其主要功能总结起来,就是在想要启动容器的时候,负责“找一个「空闲」节点,启动容器”。但是它默认考虑...

2023-09-03 标签:gpuAI容器 912 0

开放加速规范AI服务器的设计方法

开放加速规范AI服务器的设计方法

当前语言大模型的参数量已达千亿以上,训练数据集的规模也达到了TB级别。业界典型的自然语言大模型有GPT、LLAMA、PaLM、文心、悟道、源等。如果用“...

2023-09-01 标签:服务器AI计算系统 2021 0

中科大&字节提出UniDoc:统一的面向文字场景的多模态大模型

中科大&字节提出UniDoc:统一的面向文字场景的多模态大模型

如上图所示,UniDoc基于预训练的视觉大模型及大语言模型,将文字的检测、识别、spotting(图中未画出)、多模态理解等四个任务,通过多模态指令微调...

2023-08-31 标签:语言模型数据集大模型 1545 0

OpenAI开放大模型微调功能!

OpenAI开放大模型微调功能!

除了提高性能之外,还能缩短提示时间,确保类似性能。另外,微调目前仅支持处理4000 tokens,这也是此前微调型号的两倍。16k tokens微调将于...

2023-08-24 标签:数据集OpenAI大模型 630 0

大模型分布式训练并行技术(一)-概述

大模型分布式训练并行技术(一)-概述

数据并行是最常见的并行形式,因为它很简单。在数据并行训练中,数据集被分割成几个碎片,每个碎片被分配到一个设备上。这相当于沿批次(Batch)维度对训练过...

2023-08-24 标签:模型数据集pytorch 1456 0

BaiChuan13B多轮对话微调范例

BaiChuan13B多轮对话微调范例

答案是不会。原因是LLM作为语言模型,它的注意力机制是一个单向注意力机制(通过引入 Masked Attention实现),模型在第一轮对话的输出跟输入...

2023-08-24 标签:语言模型大模型 1010 0

解析优化的调度逻辑和cuda实现

0x0. 前言 这篇文章来解析一下Megaton-LM涉及到的一个优化gradient_accumulation_fusion。这里fusion的意思是...

2023-08-24 标签:逻辑异步通信函数 1341 0

风口浪尖行稳致远 - 英伟达等企业如何顺应高性能计算大模型浪潮

风口浪尖行稳致远 - 英伟达等企业如何顺应高性能计算大模型浪潮

关键词:PLM;NLP;Transformer;ChatGPT;BERT;RNN;CNN;自注意力机制;多头注意力机制; Decoder Only ;E...

2023-08-23 标签:神经网络AI英伟达 2342 0

AGI离我们还有多远?大模型不是最终解,世界模型才是未来

大型语言模型(如 GPT-4)在解决特定任务和提取因果关系方面表现出色,但缺乏抽象的因果推理能力。它们倾向于从数据中提取已知的因果模式,而无法生成新的因果见解。

2023-08-23 标签:语言模型Agi大模型 398 0

相关标签

相关话题

换一批
  • 电子发烧友网
    电子发烧友网
    +关注
    电子发烧友网于2006年10月成立, 是一个以电子技术知识为核心,以工程师为主导的平台。致立于为中国电子工程师的电子产品设计等做出最大贡献,促进中国电子科技的稳步发展。
  • 无人驾驶
    无人驾驶
    +关注
    提供全球最前沿无人驾驶科技趋势,中国无人驾驶开发者社区
  • 1024
    1024
    +关注
  • 京瓷
    京瓷
    +关注
    京瓷株式会社成立于1959年4月1日。川村诚为现任代表取缔役社长。资本金为1,157亿332万日元。截至2006年3月31日为止的年度销售额达到1,181,489百万日元,集团公司包括关联公司在内共计183家,员工61,468名。
  • emmc
    emmc
    +关注
    eMMC (Embedded Multi Media Card)是MMC协会订立、主要针对手机或平板电脑等产品的内嵌式存储器标准规格。
  • 过压保护电路
    过压保护电路
    +关注
  • 6G
    6G
    +关注
    6G网络将是一个地面无线与卫星通信集成的全连接世界。6G,即第六代移动通信标准,也被称为第六代移动通信技术。主要促进的就是物联网的发展 。截至2019年11月,6G仍在开发阶段。6G的传输能力可能比5G提升100倍,网络延迟也可能从毫秒降到微秒级。
  • 华强pcb线路板打样
    华强pcb线路板打样
    +关注
  • 高频电容
    高频电容
    +关注
  • COB
    COB
    +关注
  • wifi6
    wifi6
    +关注
    WiFi6主要使用了OFDMA、MU-MIMO等技术,MU-MIMO(多用户多入多出)技术允许路由器同时与多个设备通信,而不是依次进行通信。MU-MIMO允许路由器一次与四个设备通信,WiFi6将允许与多达8个设备通信。WiFi6还利用其他技术,如OFDMA(正交频分多址)和发射波束成形,两者的作用分别提高效率和网络容量。WiFi6最高速率可达9.6Gbps。
  • dcdc转换器
    dcdc转换器
    +关注
    DC/DC转换器为转变输入电压后有效输出固定电压的电压转换器。DC/DC转换器分为三类:升压型DC/DC转换器、降压型DC/DC转换器以及升降压型DC/DC转换器。
  • 汽车
    汽车
    +关注
  • 检测电路图
    检测电路图
    +关注
  • Zynq-7000
    Zynq-7000
    +关注
      赛灵思公司(Xilinx)推出的行业第一个可扩展处理平台Zynq系列。旨在为视频监视、汽车驾驶员辅助以及工厂自动化等高端嵌入式应用提供所需的处理与计算性能水平。
  • CD4069
    CD4069
    +关注
  • 过流保护电路
    过流保护电路
    +关注
    电路过电流过电压保护是为防止主回路短路或直流牵引电动机发生环火造成主回路电流过大而损坏同步牵引发电机、主整流柜等电气设备,机车在牵引、电阻制动或自负载工况下,对主电路的过电流和过电压均进行保护。
  • 过零检测电路
    过零检测电路
    +关注
    过零检测指的是在交流系统中,当波形从正半周向负半周转换时,经过零位时,系统作出的检测。可作开关电路或者频率检测。漏电开关的漏电检测是检测零序电流。
  • 特斯拉线圈
    特斯拉线圈
    +关注
    特斯拉线圈又叫泰斯拉线圈,因为这是从“Tesla”这个英文名直接音译过来的。这是一种分布参数高频串联谐振变压器,可以获得上百万伏的高频电压。
  • VHF
    VHF
    +关注
  • VDD
    VDD
    +关注
     Vcc和Vdd是器件的电源端。Vcc是双极器件的正,Vdd多半是单极器件的正。下标可以理解为NPN晶体管的集电极C,和PMOS or NMOS场效应管的漏极D。同样你可在电路图中看见Vee和Vss,含义一样。因为主流芯片结构是硅NPN所以Vcc通常是正。如果用PNP结构Vcc就为负了。建议选用芯片时一定要看清电气参数
  • 逆变器电路图
    逆变器电路图
    +关注
  • 慕尼黑上海电子展
    慕尼黑上海电子展
    +关注
  • 测试电路
    测试电路
    +关注
  • AIoT
    AIoT
    +关注
    AIoT(人工智能物联网)=AI(人工智能)+IoT(物联网)。 AIoT融合AI技术和IoT技术,通过物联网产生、收集海量的数据存储于云端、边缘端,再通过大数据分析,以及更高形式的人工智能,实现万物数据化、万物智联化,物联网技术与人工智能追求的是一个智能化生态体系,除了技术上需要不断革新,技术的落地与应用更是现阶段物联网与人工智能领域亟待突破的核心问题。
  • HarmonyOS
    HarmonyOS
    +关注
    HarmonyOS最新信息分享,我们将为大家带来HarmonyOS是什么意思的深度解读,HarmonyOS官网地址、HarmonyOS开源相关技术解读与设计应用案例,HarmonyOS系统官网信息,华为harmonyOS最新资讯动态分析等。
  • 功放板
    功放板
    +关注
  • ELMOS
    ELMOS
    +关注
  • 功放制作
    功放制作
    +关注
    功率放大器(英文名称:power amplifier),简称“功放”,是指在给定失真率条件下,能产生最大功率输出以驱动某一负载(例如扬声器)的放大器。
  • 科创板
    科创板
    +关注
    拟订科创板股票上市审核规则、科创板上市公司并购重组审核规则、上市委员会及科技创新咨询委员会相关规则;负责科创板股票发行上市审核和科创板上市公司并购重组审核工作,拟订审核标准、审核程序等;对发行人、科创板上市公司及中介机构进行自律监管等。

关注此标签的用户(2人)

jf_76320117 meetyou_530

编辑推荐厂商产品技术软件/工具OS/语言教程专题

电机控制 DSP 氮化镓 功率放大器 ChatGPT 自动驾驶 TI 瑞萨电子
BLDC PLC 碳化硅 二极管 OpenAI 元宇宙 安森美 ADI
无刷电机 FOC IGBT 逆变器 文心一言 5G 英飞凌 罗姆
直流电机 PID MOSFET 传感器 人工智能 物联网 NXP 赛灵思
步进电机 SPWM 充电桩 IPM 机器视觉 无人机 三菱电机 ST
伺服电机 SVPWM 光伏发电 UPS AR 智能电网 国民技术 Microchip
瑞萨 沁恒股份 全志 国民技术 瑞芯微 兆易创新 芯海科技 Altium
德州仪器 Vishay Micron Skyworks AMS TAIYOYUDEN 纳芯微 HARTING
adi Cypress Littelfuse Avago FTDI Cirrus LogIC Intersil Qualcomm
st Murata Panasonic Altera Bourns 矽力杰 Samtec 扬兴科技
microchip TDK Rohm Silicon Labs 圣邦微电子 安费诺工业 ixys Isocom Compo
安森美 DIODES Nidec Intel EPSON 乐鑫 Realtek ERNI电子
TE Connectivity Toshiba OMRON Sensirion Broadcom Semtech 旺宏 英飞凌
Nexperia Lattice KEMET 顺络电子 霍尼韦尔 pulse ISSI NXP
Xilinx 广濑电机 金升阳 君耀电子 聚洵 Liteon 新洁能 Maxim
MPS 亿光 Exar 菲尼克斯 CUI WIZnet Molex Yageo
Samsung 风华高科 WINBOND 长晶科技 晶导微电子 上海贝岭 KOA Echelon
Coilcraft LRC trinamic
放大器 运算放大器 差动放大器 电流感应放大器 比较器 仪表放大器 可变增益放大器 隔离放大器
时钟 时钟振荡器 时钟发生器 时钟缓冲器 定时器 寄存器 实时时钟 PWM 调制器
视频放大器 功率放大器 频率转换器 扬声器放大器 音频转换器 音频开关 音频接口 音频编解码器
模数转换器 数模转换器 数字电位器 触摸屏控制器 AFE ADC DAC 电源管理
线性稳压器 LDO 开关稳压器 DC/DC 降压转换器 电源模块 MOSFET IGBT
振荡器 谐振器 滤波器 电容器 电感器 电阻器 二极管 晶体管
变送器 传感器 解析器 编码器 陀螺仪 加速计 温度传感器 压力传感器
电机驱动器 步进驱动器 TWS BLDC 无刷直流驱动器 湿度传感器 光学传感器 图像传感器
数字隔离器 ESD 保护 收发器 桥接器 多路复用器 氮化镓 PFC 数字电源
开关电源 步进电机 无线充电 LabVIEW EMC PLC OLED 单片机
5G m2m DSP MCU ASIC CPU ROM DRAM
NB-IoT LoRa Zigbee NFC 蓝牙 RFID Wi-Fi SIGFOX
Type-C USB 以太网 仿真器 RISC RAM 寄存器 GPU
语音识别 万用表 CPLD 耦合 电路仿真 电容滤波 保护电路 看门狗
CAN CSI DSI DVI Ethernet HDMI I2C RS-485
SDI nas DMA HomeKit 阈值电压 UART 机器学习 TensorFlow
Arduino BeagleBone 树莓派 STM32 MSP430 EFM32 ARM mbed EDA
示波器 LPC imx8 PSoC Altium Designer Allegro Mentor Pads
OrCAD Cadence AutoCAD 华秋DFM Keil MATLAB MPLAB Quartus
C++ Java Python JavaScript node.js RISC-V verilog Tensorflow
Android iOS linux RTOS FreeRTOS LiteOS RT-THread uCOS
DuerOS Brillo Windows11 HarmonyOS
林超文PCB设计:PADS教程,PADS视频教程 郑振宇老师:Altium Designer教程,Altium Designer视频教程
张飞实战电子视频教程 朱有鹏老师:海思HI3518e教程,HI3518e视频教程
李增老师:信号完整性教程,高速电路仿真教程 华为鸿蒙系统教程,HarmonyOS视频教程
赛盛:EMC设计教程,EMC视频教程 杜洋老师:STM32教程,STM32视频教程
唐佐林:c语言基础教程,c语言基础视频教程 张飞:BUCK电源教程,BUCK电源视频教程
正点原子:FPGA教程,FPGA视频教程 韦东山老师:嵌入式教程,嵌入式视频教程
张先凤老师:C语言基础视频教程 许孝刚老师:Modbus通讯视频教程
王振涛老师:NB-IoT开发视频教程 Mill老师:FPGA教程,Zynq视频教程
C语言视频教程 RK3566芯片资料合集
朱有鹏老师:U-Boot源码分析视频教程 开源硬件专题