0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

多模态大模型“紫东·太初”教学挑战任务发布

7riU_gh_3a181fa 来源:华为计算 作者:华为计算 2022-03-26 08:42 次阅读

2020年9月,在教育部的领导下,华为技术有限公司与清华大学、北京大学等高校合作,布局建设首批72所“智能基座”产教融合协同育人基地,以昇腾、鲲鹏为核心,构建多样性计算的产业和人才生态,为我国AI产业高质量发展提供人才和智力支撑。清华大学计算机科学与技术系作为教育部-华为“智能基座”产教融合协同育人基地在清华大学的建设主体,共有20+老师参与。

2021年底,基于昇思MindSpore框架研发的业界首个三模态千亿参数多模态大模型“紫东·太初”实现基础模型开源,大模型开放。应清华大学计算机科学与技术系徐华老师邀请,华为昇思MindSpore首席架构师应江勇博士担任企业导师,于2022年3月7日在徐华老师的《数据挖掘·方法与应用》课程上完成关于AI大模型应用的研讨式教学,并在课堂上正式发布基于 “紫东·太初”的教学挑战任务。挑战任务发布当天,吸引了众多同学积极组队报名参加。

多模态大模型“紫东·太初”教学挑战任务发布现场

本次挑战任务是基于昇腾AI全栈软硬件平台技术,使用图像、语音、文本开源数据集及“紫东·太初”开源代码,完成基于万条小规模数据集的大模型预训练,以及对应下游任务的fine-tune和推理验证。共发布3个任务:

任务1

使用图像、语音、文本开源数据集,对大模型进行预训练,以支持下游任务的使用;

任务2

基于已训练好的多模态大模型,使用提供的数据集,进行图像到文本生成、跨模态检索两个下游任务的fine-tune和推理验证;

任务3

设计新的下游任务,并完成优化以达到较高准确率。

本轮挑战任务项目实施将贯穿整个春季课程,期间华为企业导师共同参与指导。根据计划,项目将在4月完成中期考核,6月完成结题考核,后续也将对本次试点工作进行经验总结和分享。

本次合作是智能基座项目的深化,未来,昇腾AI生态将继续探索更多的人工智能人才培养模式,共同构建以人工智能核心技术为基础的产业与人才生态,提高高等教育支撑解决关键核心技术问题的能力和水平。

原文标题:教学挑战任务发布:基于 “紫东 . 太初”预训练及下游任务开发

文章出处:【微信公众号:华为计算】欢迎添加关注!文章转载请注明出处。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    30516

    浏览量

    268743
  • 人工智能
    +关注

    关注

    1791

    文章

    47050

    浏览量

    238033
  • 模型
    +关注

    关注

    1

    文章

    3204

    浏览量

    48789

原文标题:教学挑战任务发布:基于 “紫东 . 太初”预训练及下游任务开发

文章出处:【微信号:gh_3a181fa836b6,微信公众号:华为计算】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    基于AX650N/AX630C部署模态模型InternVL2-1B

    InternVL2是由上海人工智能实验室OpenGVLab发布的一款模态模型,中文名称为“书生·万象”。该模型在多学科问答(MMMU)等
    的头像 发表于 11-18 17:32 632次阅读
    基于AX650N/AX630C部署<b class='flag-5'>多</b><b class='flag-5'>模态</b>大<b class='flag-5'>模型</b>InternVL2-1B

    利用OpenVINO部署Qwen2模态模型

    模态模型的核心思想是将不同媒体数据(如文本、图像、音频和视频等)进行融合,通过学习不同模态之间的关联,实现更加智能化的信息处理。简单来说,
    的头像 发表于 10-18 09:39 393次阅读

    依图模态模型伙伴CTO精研班圆满举办

    模型在不同行业领域的应用前景;7月19日, “依图科技模态模型伙伴CTO精研班”在杭州圆满举办,让更多的伙伴们深度体验了依图
    的头像 发表于 07-23 15:16 406次阅读

    商汤科技与海通证券携手发布金融行业首个模态全栈式大模型

    商汤科技与海通证券联合研发并发布了金融行业内首个面向业务场景的模态全栈式大模型。双方计划将这一先进技术应用于智能问答、合规风控、代码辅助
    的头像 发表于 05-06 10:16 443次阅读

    人大系初创公司智子引擎发布全新模态模型Awaker 1.0

    人大系初创公司智子引擎近日震撼发布了新一代模态模型Awaker 1.0,这一里程碑式的成果标志着公司在通用人工智能(AGI)领域取得了重要突破。与前代ChatImg序列
    的头像 发表于 05-06 09:59 588次阅读

    商汤科技联合海通证券发布业内首个面向金融行业的模态全栈式大模型

    4月23日,商汤科技正式推出“日日新SenseNova 5.0”大模型体系,并与海通证券联合发布业内首个面向金融行业的模态全栈式大模型
    的头像 发表于 04-26 09:48 447次阅读
    商汤科技联合海通证券<b class='flag-5'>发布</b>业内首个面向金融行业的<b class='flag-5'>多</b><b class='flag-5'>模态</b>全栈式大<b class='flag-5'>模型</b>

    商汤科技发布5.0模态模型,综合能力全面对标GPT-4 Turbo

    商汤科技发布5.0模态模型,综合能力全面对标GPT-4 Turbo 4月23日,商汤科技董事长兼CEO徐立在2024商汤技术交流日上发布
    的头像 发表于 04-24 16:49 1090次阅读

    李未可科技正式推出WAKE-AI模态AI大模型

    李未可科技模态 AI 大模型正式发布,积极推进 AI 在终端的场景应用   4月18日,2024中国生成式AI大会上李未可科技正式发布为眼
    发表于 04-18 17:01 574次阅读
    李未可科技正式推出WAKE-AI<b class='flag-5'>多</b><b class='flag-5'>模态</b>AI大<b class='flag-5'>模型</b>

    苹果发布300亿参数MM1模态模型

    近日,科技巨头苹果公司在一篇由多位专家共同撰写的论文中,正式公布了其最新的模态模型研究成果——MM1。这款具有高达300亿参数的模态
    的头像 发表于 03-19 11:19 876次阅读

    武汉人工智能研究院即将发布太初 3.0”,助力千行百业发展

    湖北日报透露,该项目的负责人王金桥院长表示:“为了进一步提升自身对各行业的支持力度,我们计划在今年上半年发布太初 3.0’版本”。此外,他也提到,该研究所在智能驾驶领域与东风汽车
    的头像 发表于 03-05 16:25 1146次阅读

    蚂蚁集团推出20亿参数模态遥感基础模型SkySense

    近日,蚂蚁集团联合武汉大学宣布成功研发出20亿参数模态遥感基础模型SkySense。这一创新模型由蚂蚁集团的AI创新研发部门NextEvo与武汉大学共同完成,是迄今为止国际上参数规模
    的头像 发表于 03-04 11:22 799次阅读

    蚂蚁推出20亿参数模态遥感模型SkySense

    据了解,负责开发的百灵团队利用自身拥有的19亿遥感影像数据集进行了预训练,从而生成了具有20.6亿参数的SkySense大模型。官方称其为全球范围内参数规模最大、任务覆盖最全且识别精度最高的
    的头像 发表于 02-28 15:53 644次阅读

    自动驾驶和模态大语言模型的发展历程

    模态大语言模型(MLLM) 最近引起了广泛的关注,其将 LLM 的推理能力与图像、视频和音频数据相结合,通过多模态对齐使它们能够更高效地执行各种
    发表于 12-28 11:45 508次阅读
    自动驾驶和<b class='flag-5'>多</b><b class='flag-5'>模态</b>大语言<b class='flag-5'>模型</b>的发展历程

    从Google模态模型看后续大模型应该具备哪些能力

    前段时间Google推出Gemini模态模型,展示了不凡的对话能力和模态能力,其表现究竟如何呢?
    的头像 发表于 12-28 11:19 1234次阅读
    从Google<b class='flag-5'>多</b><b class='flag-5'>模态</b>大<b class='flag-5'>模型</b>看后续大<b class='flag-5'>模型</b>应该具备哪些能力

    模型+模态的3种实现方法

    我们知道,预训练LLM已经取得了诸多惊人的成就, 然而其明显的劣势是不支持其他模态(包括图像、语音、视频模态)的输入和输出,那么如何在预训练LLM的基础上引入跨模态的信息,让其变得更强大、更通用呢?本节将介绍“大
    的头像 发表于 12-13 13:55 1656次阅读
    大<b class='flag-5'>模型</b>+<b class='flag-5'>多</b><b class='flag-5'>模态</b>的3种实现方法