0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

在英特尔酷睿Ultra7处理器上优化和部署Phi-3-min模型

英特尔物联网 来源:英特尔物联网 2024-08-30 16:58 次阅读

作者:王一凡

英特尔边缘计算创新大使

1Phi-3-mini模型简介

2024年4月23日,微软研究院公布Phi-3系列AI大模型,包含三个版本:mini(3.8B参数)、small(7B参数)以及medium(14B参数)。phi-3-mini是一个拥有3.8B参数规模的模型,其训练数据集基于Phi-2所使用数据集的扩大版本,由大量过滤后的网络数据和合成数据组成,经过3.3T tokens的训练,表现可以与Mixtral 8x7B和GPT-3.5等模型相媲美(例如,phi-3-mini在MMLU测试中达到了69%的准确率,在MT-bench上的得分为8.38)。

wKgZombRieSATC6qAAHyCwYRvAE098.jpg

请用下面的命令把Llama3-Chinese-8B-Instruct模型的预训练权重下载到本地待用。

git clone https://www.modelscope.cn/LLM-Research/Phi-3-mini-128k-instruct.git

2英特尔 酷睿 Ultra处理器简介

英特尔 酷睿 Ultra系列处理器是英特尔公司于2023年6月推出的一个高端处理器系列,其第一代产品代号为Meteor Lake。这款处理器标志着英特尔在处理器设计上的重大革新,它采用了先进的Intel 4制造工艺(先前称为7nm),并利用了EUV(极紫外光刻)技术,这带来了显著的性能提升和能效优化。

英特尔 酷睿Ultra系列处理器内置CPU、锐炫GPU和NPU,非常适合在端侧运行AI大模型。本文将在英特尔酷睿 Ultra 7 155H处理器上完成验证。

3搭建开发环境

首先,在https://www.anaconda.com/download下载并安装Anaconda,然后创建并激活名为phi3的虚拟环境:

conda create -n phi3 python=3.11 #创建虚拟环境
conda activate phi3        #激活虚拟环境
python -m pip install --upgrade pip      #升级pip到最新版

然后,安装Optimum Intel和其依赖项OpenVINO与NNCF:

python -m pip install "optimum-intel[openvino,nncf]"@git+https://github.com/huggingface/optimum-intel.git

最后,安装构建WebUI的工具包:

pip install gradio mdtex2html streamlit

4对Phi-3-mini-4k-instruct模型进行INT4量化

optimum-cli是Optimum Intel自带的跨平台命令行工具,可以不用编写量化代码,实现对Phi-3-mini-4k-instruct模型的量化。

执行命令将Phi-3-mini-4k-instruct模型量化为INT4 OpenVINO格式模型:

optimum-cli export openvino --model Phi-3-mini-4k-instruct --task text-generation-with-past --weight-format int4 --group-size 128 --ratio 0.8 --trust-remote-code phi3_ov

wKgaombRigSAfnfkAAN9KraL1fo798.jpg

5编写Phi-3-Mini的WebUI对话程序

Phi-3-Mini推理程序的关键代码,如下所示,主要实现载入Phi-3模型和对应的分词器,然后将提示词Token化后输入模型,最后解码模型生成的Token序列。

完整代码请参考:https://github.com/WangAria/OpenVINO/blob/main/phi3_webui.py

model_dir = "C:\Users\ASUS\phi3_ov" #Phi-3-mini-4k-instruct int4模型路径
DEVICE = "GPU" #可更换为"CPU", "AUTO"...
# 编译并载入Phi-3-mini-4k-instruct int4模型到指定DEVICE
ov_model = OVModelForCausalLM.from_pretrained(
  model_dir,
  device=DEVICE,
  ov_config=ov_config,
  config=AutoConfig.from_pretrained(model_dir, trust_remote_code=True),
  trust_remote_code=True,
)
# 实例化Phi-3-mini-4k-instruct int4模型的Tokenizer
tok = AutoTokenizer.from_pretrained(model_dir, trust_remote_code=True)

运行phi3_webui.py, 结果如下:

python phi3_webui.py

wKgaombRihqAKbGhAAHKNdPzHno071.png

6总结

Phi-3模型是微软公司新近推出的一系列小型语言模型(SLM),旨在以更小的规模实现与大型语言模型(LLM)相媲美的性能,特别是在语言处理、推理、编码和数学基准测试方面;英特尔 酷睿 Ultra系列处理器是英特尔公司新近推出高端处理器,相对前代有显著的AI性能提升和能效优化;二者相互结合,使得广大的端侧设备都能受益于日益先进的AI技术

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    18894

    浏览量

    227095
  • 英特尔
    +关注

    关注

    60

    文章

    9737

    浏览量

    170614
  • AI
    AI
    +关注

    关注

    87

    文章

    28791

    浏览量

    266107
  • 模型
    +关注

    关注

    1

    文章

    3028

    浏览量

    48332

原文标题:在英特尔® 酷睿™ Ultra7处理器上优化和部署Phi-3-min模型丨开发者实战

文章出处:【微信号:英特尔物联网,微信公众号:英特尔物联网】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    英特尔CES发布i7处理器和VR体验技术

    CES 2017英特尔将全方位展示塑造智能互联世界的创新技术,笔者之前看到的预报是i7
    发表于 01-05 09:15 1631次阅读
    <b class='flag-5'>英特尔</b><b class='flag-5'>在</b>CES发布<b class='flag-5'>酷</b><b class='flag-5'>睿</b>i<b class='flag-5'>7</b><b class='flag-5'>处理器</b>和VR体验技术

    英特尔i3处理器详解_i3处理器怎么样

    英特尔i3处理器是inter2010年年初推出的一款芯片,
    发表于 09-14 15:04 7.9w次阅读

    凌华科技发布两款基于最新的英特尔® 处理器的模块化电脑

    多任务以及卓越的每瓦性能摘要:●基于第13代英特尔® 处理器,具有先进的混合架构,提供性能核心和能效核心,并优化了功耗oExpress
    发表于 02-15 10:30

    支持嵌入式计算的基于英特尔I3 I3 I7处理器系列平台

    本内容介绍了支持嵌入式计算的基于英特尔I3 I3 I7
    发表于 12-07 14:11 36次下载
    支持嵌入式计算的基于<b class='flag-5'>英特尔</b><b class='flag-5'>酷</b><b class='flag-5'>睿</b>I<b class='flag-5'>3</b> I<b class='flag-5'>3</b> I<b class='flag-5'>7</b><b class='flag-5'>处理器</b>系列平台

    英特尔i9处理器助力打造极致的游戏和内容创建体验

    除了推出面向移动产品的全新英特尔 i9处理器以外,英特尔还发布了将第八代智能英特尔
    的头像 发表于 04-12 09:02 9532次阅读

    英特尔十代i7处理器也有TVB加速技术

    2018年,英特尔发布了8代H系列处理器,i9-8950HK支持了英特尔TVB加速技术(Thermal Velocity Boost),
    的头像 发表于 04-14 14:37 6709次阅读

    英特尔11代处理器将于3月16日登场

    大家对于英特尔11代处理器的兴趣并没有10代来得猛烈,毕竟相比较10代
    的头像 发表于 03-03 16:49 5030次阅读

    苹果M3芯片和英特尔i9处理器哪个强

    苹果M3芯片和英特尔i9处理器各有其优势,难以简单地说哪个更强。
    的头像 发表于 03-08 15:29 5821次阅读

    英特尔二季度对Ultra处理器供应受限

    英特尔首席执行官帕特·基辛格最新的财报电话会议透露,受晶圆级封装产能限制,二季度Ultra
    的头像 发表于 05-06 11:04 528次阅读

    英特尔Ultra处理器突破500个AI模型优化

    英特尔最新推出的英特尔® Ultra处理器
    的头像 发表于 05-09 11:18 609次阅读

    已有超过500款AI模型英特尔Ultra处理器上得以优化运行

    近日,英特尔宣布全新英特尔 Ultra处理器
    的头像 发表于 05-11 09:31 553次阅读

    英特尔Ultra处理器优化部署YOLOv8模型

    英特尔 Ultra处理器英特尔公司推出的一个高端处理
    的头像 发表于 05-30 17:16 1162次阅读
    <b class='flag-5'>在</b><b class='flag-5'>英特尔</b><b class='flag-5'>酷</b><b class='flag-5'>睿</b><b class='flag-5'>Ultra</b><b class='flag-5'>处理器</b><b class='flag-5'>上</b><b class='flag-5'>优化</b>和<b class='flag-5'>部署</b>YOLOv8<b class='flag-5'>模型</b>

    英特尔Ultra处理器出货量预计飙升

    英特尔中国区董事长王锐近日透露,英特尔Ultra处理器自问世以来,已经
    的头像 发表于 06-20 09:23 560次阅读

    如何将Llama3.1模型部署英特尔Ultra处理器

    本文从搭建环境开始,一步一步帮助读者实现只用五行代码便可将Llama3.1模型部署英特尔
    的头像 发表于 07-26 09:51 1526次阅读
    如何将Llama3.1<b class='flag-5'>模型</b><b class='flag-5'>部署</b><b class='flag-5'>在</b><b class='flag-5'>英特尔</b><b class='flag-5'>酷</b><b class='flag-5'>睿</b><b class='flag-5'>Ultra</b><b class='flag-5'>处理器</b>

    英特尔Ultra 200V系列处理器发布

    英特尔近日隆重推出了其革命性的Ultra 200V系列处理器,这一全新x86处理器家族以超高
    的头像 发表于 09-10 16:44 297次阅读