0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

中国电信开源千亿级参数大模型,助推AI产业优质发展

微云疏影 来源:综合整理 作者:综合整理 2024-04-17 10:02 次阅读

近日,中国电信宣布开源其星辰语义大模型TeleChat-12B的最新版本。此外,预计今年内,中国电信还将推出千亿级参数大模型。

据报道,与之前1月份发布的7B版相比,12B版本在多个维度上有显著改进,例如数据容量提升3倍,性能提高30%,在处理安全问题等技术领域更是超过了40%。这一新进步使其在在C-eval、MMLU、AGIEVAL等国际知名排行榜中位列国内同等参数水平开源模型之首。这无疑将有助于推动大模型开源生态的繁荣,并助力人工智能行业实现更高质量的发展。

TeleChat-12B在数据处理方面进行了深度优化,包括扩大训练数据至3T,改善数据清洗和标注策略,构建专项任务SFT(监督微调)数据,优化数据构建规范,从而大幅提升数据质量。此外,该模型还利用电信星辰大模型用户的真实反馈数据,对奖励模型和强化学习模型进行了优化,以提升模型的问答效果。

本次开源提供了基础模型及其对应的对话模型,不仅支持传统的全量参数更新,也支持LoRA等仅需更新部分参数的高效微调方式,以及Deepspeed微调、int8、int4量化和国产芯片训练推理等功能,推动了大模型的国产化进程。

值得注意的是,星辰大模型已经在各行各业得到广泛应用,为企业的数字化转型提供了强大动力。例如,客服大模型已在全国范围内的18个服务场景中投入使用,全面赋能智慧客服和数字人,进一步深化了智能化运营。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1791

    文章

    46947

    浏览量

    237800
  • LoRa
    +关注

    关注

    349

    文章

    1678

    浏览量

    231816
  • 大模型
    +关注

    关注

    2

    文章

    2353

    浏览量

    2537
收藏 人收藏

    评论

    相关推荐

    中软国际入选中国电信广东公司大模型生态伙伴库

    近日,中软国际成功入选中国电信广东公司大模型生态伙伴库,此举标志着中软国际在人工智能领域的技术实力和服务能力获得认可,双方将携手共建大模型生态,推动人工智能技术在各行业的应用落地。
    的头像 发表于 10-10 11:18 445次阅读

    中国电信人工智能研究院完成首个全国产化万卡万参大模型训练

    近日,中国电信人工智能研究院宣布了一项重大技术突破:成功完成国内首个基于全国产化万卡集群训练的万亿参数模型
    的头像 发表于 09-30 16:41 1652次阅读

    四维图新旗下六分科技加入中国电信低空经济产业联盟

    中国电信低空经济合作发展大会在南京举办。大会期间,中国电信低空经济产业联盟正式成立,并发布了“低空领航者”行动计划。该联盟由中国电信联合
    的头像 发表于 09-27 17:32 1131次阅读

    中国电信上海、北京两个万卡集群已经投产

    中国电信在智算领域的发展迎来重要里程碑。近日,中国电信宣布,其上海、北京两个万卡智算集群已正式投产运行,标志着中国电信在构建大规模智算能力方面取得了显著进展。
    的头像 发表于 08-09 17:47 696次阅读

    中国电信发布星辰大模型软件工厂

    在科技日新月异的今天,人工智能正以前所未有的速度渗透并改变着各行各业,其中,软件开发领域更是迎来了颠覆性的变革。2024年世界人工智能大会的璀璨舞台上,中国电信人工智能科技有限公司携手中国电信
    的头像 发表于 07-10 15:42 902次阅读

    中国电信发布全球首个单体稠密万亿参数语义模型

    近日,中国电信人工智能研究院(TeleAI)携手北京智源人工智能研究院,共同推出了全球首个单体稠密万亿参数语义模型——Tele-FLM-1T,这一里程碑式的成就标志着中国电信在人工智能
    的头像 发表于 06-20 10:50 637次阅读

    中软国际出席中国电信低空经济合作发展大会

    中国电信以“智领云端,逐梦低空”为主题,在江苏南京举办了“中国电信低空经济合作发展大会”。大会期间,中国电信低空经济产业联盟正式成立,并发布
    的头像 发表于 06-19 10:54 603次阅读

    中国电信发布首个支持30种方言混说语音大模型

    中国电信人工智能研究院(TeleAI)近日发布了一项引领业界的语音识别技术——星辰超多方言语音识别大模型。这一模型突破性地支持30种方言的自由混说识别,打破了传统单一模型只能识别特定方
    的头像 发表于 05-28 09:14 549次阅读

    中国电信携手依图科技联合发布“应急预警视觉大模型

    第七届数字中国建设峰会•智算云生态大会近日在福州盛大举办。在此次以"国云注智 聚力向新"为主题的2024智算云生态大会上,中国电信联合客户和生态合作伙伴们分享、展示了行业“AI+”技术创新的实践和成果,聚数生智,以智算新生态支撑
    的头像 发表于 05-27 10:54 739次阅读
    <b class='flag-5'>中国电信</b>携手依图科技联合发布“应急预警视觉大<b class='flag-5'>模型</b>”

    才茂5G工业网关通过中国电信5G Inside终端生态认证

    近日,在中国电信物联网开放实验室的指导下,才茂5G工业网关(产品型号:CM520-37FS)荣获中国电信颁发的5GInside终端生态认证证书。中国电信5GInside终端生态认证中国电信
    的头像 发表于 05-20 15:30 689次阅读
    才茂5G工业网关通过<b class='flag-5'>中国电信</b>5G Inside终端生态认证

    通义千问开源千亿参数模型

    通义千问近日开源了其首个千亿参数模型Qwen1.5-110B,这是其全系列中首个达到千亿级别的开源
    的头像 发表于 05-08 11:01 717次阅读

    通义千问推出1100亿参数开源模型

    通义千问近日震撼发布1100亿参数开源模型Qwen1.5-110B,这一举措标志着通义千问在AI领域迈出了重大步伐。该模型成为通义千问全系
    的头像 发表于 05-06 10:49 565次阅读

    中国电信规划在上海建设首个国产超大规模算力液冷集群

    中国电信规划建设首个国产超大规模算力液冷集群 人工智能技术的快速发展催生了巨大的算力需求;中国电信规划在上海规划建设可支持万亿参数模型训练
    的头像 发表于 02-22 18:48 1311次阅读

    中国电信中部智算中心在武汉正式投运

    近日,中国电信中部智算中心在武汉东湖新技术开发区(光谷)正式投入运营。这一重要项目的建成,标志着中国电信在推进算力网络建设和发展方面迈出了坚实的一步。
    的头像 发表于 01-30 11:40 894次阅读

    利尔达携手中国电信镇江分公司共绘5G物联网新蓝图

    近日,利尔达科技集团与中国电信镇江分公司正式签署战略合作协议。双方将在5G、物联网、云计算、工业互联网、大数据等领域等多个领域展开深度合作,共同推进镇江市乃至江苏省的数字化转型和产业升级。中国电信
    的头像 发表于 01-19 08:13 653次阅读
    利尔达携手<b class='flag-5'>中国电信</b>镇江分公司共绘5G物联网新蓝图