0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

小米大模型MiLM-6B具有64亿参数,在同参数量级排名第1

jf_35673951 来源:jf_35673951 作者:jf_35673951 2023-08-14 10:25 次阅读

据了解,小米此前并未“官宣”直接加入AI大模型赛道中,但是目前小米的AI大模型 MiLM-6B已经悄然现身C-Eval、CMMLU 大模型评测榜单。并且小米大模型在 C-Eval总榜单排名第 10,同参数量级排名第1。

而从GitHub 项目给出的信息得知,MiLM-6B是由小米公司开发的一个大规模预训练语言模型,参数规模达64 亿。

MiLM-6B模型在具体各科目成绩上,在STEM(科学、技术、工程和数学教育)全部20个科目中,计量师、物理、化学、生物等多个项目获得了较高的准确率。

MiLM-6B 模型目前已经在大多数文科科目中表现出了相对良好的准确度,不过在“法学、数学、编程、概率论、离散数学”等涉及“抽象思维”的科目中,还有一定进步空间wprbsubsqkd。

并且在10个“社会科学”测试科目中,除“教育学和地理”外,该模型在其他8个科目中都获得了较为理想的准确率。

不仅如此,该模型在人文科学的11个科目中的“历史与法律”基础上有着不错的准确率表现。

以上源自互联网,版权归原作所有

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    31845

    浏览量

    270678
  • 小米
    +关注

    关注

    70

    文章

    14392

    浏览量

    145153
  • 大模型
    +关注

    关注

    2

    文章

    2652

    浏览量

    3270
收藏 人收藏

    评论

    相关推荐

    龙芯3a6000上部署DeepSeek 和 Gemma2大模型

    run deepseek-r1:1.5b 3.运行Gemma 2大模型 如果想体验 Google Gemma 2 可以到下面的网站选择不同参数的大
    发表于 02-07 19:35

    中国移动与中国石油发布700亿参数昆仑大模型

    近日,中国移动与中国石油北京联合举办了700亿参数昆仑大模型建设成果发布会,正式推出了这一行业重量级的大
    的头像 发表于 12-04 11:17 488次阅读

    干法刻蚀工艺的不同参数

          本文介绍了干法刻蚀工艺的不同参数。 干法刻蚀中可以调节的工艺参数有哪些?各有什么作用? 1,温度:晶圆表面温度,温度梯度 晶圆表面温度:控制刻蚀表面的化学反应速率和产物的挥发性 温度梯度
    的头像 发表于 12-02 09:56 806次阅读

    用aic3254单片机的响应下实现不同参数的带通滤波遇到的几个问题求解

    我在用TLV320AIC3254做一个项目。想用aic3254单片机的响应下实现不同参数的带通滤波。现在问题如下: 1.想要实现的滤波模式有3个。我用PPS的时候界面如下图(输入是单端输入
    发表于 10-24 07:45

    使用tina测量opa227的输入失调电压和失调电流,结果数量级和手册标准值差很多,为什么?

    使用tina测量opa227的输入失调电压和失调电流,发现结果数量级和手册标准值差很多,这两个参数的测量电路用得都是书上的参考电路,不知道什么地方出了问题,麻烦各位帮忙看看,谢过! 电路和测量数据附件中。
    发表于 09-14 07:59

    英伟达震撼发布:全新AI模型参数规模跃升至80亿量级

    8月23日,英伟达宣布,其全新AI模型面世,该模型参数规模高达80亿具有精度高、计算效益大等优势,适用于GPU加速的数据中心、云及工作站环
    的头像 发表于 08-23 16:08 834次阅读

    小米大语言模型MiLM正式通过备案

    近日,小米官方宣布,其自主研发的大语言模型MiLM已成功通过大模型备案,标志着小米人工智能领域
    的头像 发表于 05-20 09:31 679次阅读

    摩尔线程携手憨猴集团,共同探索国产AI算力的新应用场景与落地实践

    摩尔线程与憨猴科技集团有限公司(简称:憨猴集团)近日宣布,基于摩尔线程的夸娥(KUAE)千卡智算集群,憨猴集团已成功完成了7B、34B、70B同参数量级的大
    的头像 发表于 05-17 15:08 517次阅读

    小米大语言模型MiLM正式通过大模型备案

    近日,小米公司官方宣布,其研发的大型语言模型MiLM已成功通过大模型备案,标志着这一技术成果正式迈入了应用阶段。MiLM的推出,无疑将为
    的头像 发表于 05-17 09:31 509次阅读

    小米大语言模型获备案,有望应用于汽车、手机等产品

    早在去年8月,小米公司的MiLM模型便首次亮相C-Eval、CMMLU两大模型测评榜单,C-Eval总榜单中位列第十,
    的头像 发表于 05-16 14:32 414次阅读

    通义千问推出1100亿参数开源模型

    通义千问近日震撼发布1100亿参数的开源模型Qwen1.5-110B,这一举措标志着通义千问AI领域迈出了重大步伐。该
    的头像 发表于 05-06 10:49 648次阅读

    阿里云通义千问发布320亿参数模型,优化性能及效率

    与之前的模型相比,新版320亿参数模型性能、效率以及内存占用方面取得了明显改善。具体来说,32B
    的头像 发表于 04-08 14:44 915次阅读

    百度智能云推出全新轻量级模型

    近日举办的百度智能云千帆产品发布会上,三款全新的轻量级模型——ERNIE Speed、ERNIE Lite以及ERNIE Tiny,引起了业界的广泛关注。相较于传统的千亿级别参数
    的头像 发表于 03-22 10:28 751次阅读

    苹果发布300亿参数MM1多模态大模型

    近日,科技巨头苹果公司一篇由多位专家共同撰写的论文中,正式公布了其最新的多模态大模型研究成果——MM1。这款具有高达300亿
    的头像 发表于 03-19 11:19 971次阅读

    蚂蚁推出20亿参数多模态遥感模型SkySense

    据了解,负责开发的百灵团队利用自身拥有的19亿遥感影像数据集进行了预训练,从而生成了具有20.6亿参数的SkySense大模型。官方称其为全
    的头像 发表于 02-28 15:53 761次阅读