微软研究院近期公开发布了Phi-3系列AI模型,该系列包括mini版(38亿参数)、small版(70亿参数)以及medium版(140亿参数)。
微软称,带有38亿参数的phi-3-mini经过3.3万亿token的强化学习,其基础表现已经超过Mixtral 8x7B及GPT-3.5;此外,该模型可在手机等移动设备上运行,并在phi-2模型(27亿参数)的基础上,进一步融合了严格筛选的网络数据与合成数据。
尽管phi-3-mini在语言理解和推理方面已能匹敌大参数模型,但在TriviaQA等特定任务中仍受限于模型规模。
值得注意的是,phi-3-small和phi-3-medium两款模型在MMLU测试中的得分分别达到了75.3和78.2。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
微软
+关注
关注
4文章
6552浏览量
103878 -
移动设备
+关注
关注
0文章
487浏览量
54612 -
强化学习
+关注
关注
4文章
265浏览量
11195
发布评论请先 登录
相关推荐
在英特尔酷睿Ultra7处理器上优化和部署Phi-3-min模型
2024年4月23日,微软研究院公布Phi-3系列AI大模型,包含三个版本:mini(3.8B参数)、small(7B参数)以及medium(14B参数)。
OpenAI 推出 GPT-4o mini 取代GPT 3.5 性能超越GPT 4 而且更快 API KEY更便宜
GPT-4. GPT-4o mini的定价为每百万输入标记15美分和每百万输出标记60美分,比之前的前沿模型便宜了一个数量级,比GPT-3.5 Turbo便宜了60%以上。
Anthropic 发布Claude 3.5 Sonnet模型运行速度是Claude 3 Opus的两倍
Anthropic 发布Claude 3.5 Sonnet最新模型 新模型在推理、知识和编码能力评估方面超越了以前的版本和竞争对手
微软发布视觉型AI新模型:Phi-3-vision
据悉,Phi-3-vision 作为微软 Phi-3 家族的首款多模态模型,继承自 Phi-3-mini 的文本理解能力,兼具轻巧便携特性
英特尔优化AI产品组合,助力微软Phi-3家族模型
近日,英特尔宣布针对微软的Phi-3家族开放模型,成功验证并优化了其跨客户端、边缘及数据中心的AI产品组合。这一重要举措旨在提供更为灵活和高效的AI
英特尔与微软合作在其AI PC及边缘解决方案中支持多种Phi-3模型
近日,英特尔针对微软的多个Phi-3家族的开放模型,验证并优化了其跨客户端、边缘和数据中心的AI产品组合。
微软Build 2024:宣布开放AI GPT-40及Phi-3-visio
5 月 22 日,微软Build 2024大会在美正式开幕。萨提亚·纳德拉CEO、董事长宣布,OpenAI新款旗舰模型GPT-4o已经在Azure AI Studio上线,并开放API
NVIDIA加速微软最新的Phi-3 Mini开源语言模型
NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微软最新的 Phi-3 Mini 开源语言模型。TensorRT-LLM 是一个开源库,用于优化从 PC 到云端的 NVIDIA GPU 上运行的大语言
Meta推出新一代语言模型LLAMA 3,性能优于GPT-3.5
Meta决定将Llama 3的80亿参数版开源,以期让更多人能够接触到尖端的AI技术。全球范围内的开发者、研究员以及对AI充满好奇的人士均可参与其中,进行游戏开发、模型构建与实验探索。
苹果ReALM模型在实体识别测试中超越OpenAI GPT-4.0
“我们的模型在识别各种类型实体方面都有显著提升,即使是小尺寸模型,在屏幕实体识别准确性上也已超过原有的系统5%以上。在与GPT-3.5和GPT-4.0的比较中,小型
微软Copilot全面更新为OpenAI的GPT-4 Turbo模型
起初,Copilot作为Bing Chat AI助手推出,初期采用GPT-3.5模型,随后升级至GPT-4取得显著进步,如今再次更新至性能卓
全球最强大模型易主,GPT-4被超越
近日,AI领域的领军企业Anthropic宣布推出全新的Claude 3系列模型,其中包括最强版Claude 3 Opus。据该公司称,Claude
Anthropic推出Claude 3系列模型,全面超越GPT-4,树立AI新标杆
近日,AI领域的领军企业Anthropic震撼发布了全新的Claude 3系列模型,该系列模型在多模态和语言能力等关键领域展现出卓越
全球最强大模型易主:GPT-4被超越,Claude 3系列崭露头角
近日,人工智能领域迎来了一场革命性的突破。Anthropic公司发布了全新的Claude 3系列模型,该系列模型在多模态和语言能力等关键指标上展现出卓越
评论