0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

上海人工智能实验室发布多模态语料

微云疏影 来源:综合整理 作者:综合整理 2023-08-17 10:17 次阅读

近日,上海人工智能实验室发布联合语言资料数据联盟会员单位,共同发布“生万权”1.0多模式词典训练语言资料开源。

“书生·万卷”1.0将集中语言资料数据联盟会员们丰富的内容积累和上海人工智能实验室的数据处理能力等优势,为学术界及产业界提供高品质的大规模模型多模态事前训练语言资料。开放源代码提供2tb以上的数据,多种融合,精细处理,价值排序,使用方便高效。

此次开放源代码“书生·万卷”1.0包含文本、图片、文本和视频三部分数据集。其中,文本数据来自网页,百科全书,书籍,专利,教材,考试题等,数据总量超过5亿个,数据大小也超过1tb,涵盖科技,文学,媒体,教育,法律等多个领域。

图像和文字数据主要来自公开网页,经过处理形成图像和文字交叉的文件。总数字超过2200万个,数据大小超过140gb,涵盖新闻事件、人物、自然景观、社会生活等多个领域。

视频数据主要是中国中央电视台(cctv)和上海文广集团提供,新闻、电影、电视等多种类型的节目,包括视频,视频文件总数超过1000个,数据大小超过900gb,内容是军事、文艺、体育、自然、知识、影像艺术等领域覆盖着。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1791

    文章

    46872

    浏览量

    237606
  • 源代码
    +关注

    关注

    96

    文章

    2944

    浏览量

    66670
  • 模型
    +关注

    关注

    1

    文章

    3174

    浏览量

    48718
收藏 人收藏

    评论

    相关推荐

    基于AX650N/AX630C部署模态大模型InternVL2-1B

    InternVL2是由上海人工智能实验室OpenGVLab发布的一款模态大模型,中文名称为“书生·万象”。该模型在多学科问答(MMMU)等
    的头像 发表于 11-18 17:32 474次阅读
    基于AX650N/AX630C部署<b class='flag-5'>多</b><b class='flag-5'>模态</b>大模型InternVL2-1B

    内部创新驱动:SNP启动AI人工智能和云创新实验室

    SNP是SAP系统中数字化转型、自动化数据迁移和数据管理软件的知名提供商,该公司推出了一个人工智能和云创新实验室。未来,来自不同学科和SNP地点的专家,如新泽西州、布宜诺斯艾利斯和海德堡,以及子公司
    的头像 发表于 11-18 09:15 109次阅读

    Meta发布模态LLAMA 3.2人工智能模型

    Meta Platforms近日宣布了一项重要技术突破,成功推出了模态LLAMA 3.2人工智能模型。这一创新模型不仅能够深度解析文本信息,还实现了对图像内容的精准理解,标志着Meta在AI
    的头像 发表于 09-27 11:44 368次阅读

    中科曙光联合发布智能算力产业发展白皮书》

    近日,中科曙光联合国家信息中心大数据发展部、上海人工智能研究院、东方证券—上海人工智能研究院联合实验室发布了《智能算力产业发展白皮书》(下称
    的头像 发表于 08-06 14:30 543次阅读

    恩智浦首个云实验室正式上线运营

    恩智浦半导体近日宣布,其首个全线上实验室——人工智能创新实践平台云实验室已正式上线。这一创新举措旨在为全球用户提供前所未有的便捷体验。
    的头像 发表于 05-06 11:03 564次阅读

    恩智浦首个云实验室正式上线运营

    中国苏州——202 4 年 4 月 23 日—— 恩智浦半导体(NXP Semiconductors N.V.,纳斯达克代码:NXPI)今日宣布其首个全线上实验室——人工智能创新实践平台 云实验室
    的头像 发表于 04-24 11:36 876次阅读
    恩智浦首个云<b class='flag-5'>实验室</b>正式上线运营

    AI+教育 深圳市中小学联合实验室正式启用

    4月18日,深圳市中小学人工智能联合实验室在深圳高级中学(集团)南校区启用。 去年,深圳市教育局发布推进中小学人工智能教育工作方案,提出要建成具有深圳特色的
    发表于 04-22 10:07 226次阅读
    AI+教育 深圳市中小学联合<b class='flag-5'>实验室</b>正式启用

    云天励飞捐建深圳市中小学人工智能联合实验室正式启用

    4月18日,深圳市中小学人工智能联合实验室在深圳高级中学(集团)南校区启用。
    的头像 发表于 04-20 11:26 728次阅读

    上海人工智能实验室发布自动驾驶视频生成模型GenAD

    上海人工智能实验室近日取得重大技术突破,联合香港科技大学、德国图宾根大学及香港大学共同研发并发布了大规模自动驾驶视频生成模型——GenAD。这一创新模型通过精准预测和模拟真实世界场景,为自动驾驶技术的研究与应用提供了强有力的支撑
    的头像 发表于 03-26 10:40 492次阅读

    百川智能与北京大学将共建通用人工智能联合实验室

    近日,百川智能与北京大学携手合作,共同签署了“北大——百川通用人工智能联合实验室”的共建协议,标志着双方在人工智能领域迈出了坚实的合作步伐。
    的头像 发表于 03-21 11:45 860次阅读

    Cognizant成立高级人工智能实验室

    近日,全球领先的IT解决方案提供商Cognizant宣布在旧金山成立高级人工智能(AI)实验室。该实验室的成立标志着Cognizant在人工智能领域的进一步深耕,旨在通过前沿技术和创新
    的头像 发表于 03-11 10:36 554次阅读

    上海AI实验室发布新一代书生·视觉大模型

    近日,上海人工智能实验室上海AI实验室)联手多所知名高校及科技公司共同研发出新一代书生·视觉大模型(InternVL)。
    的头像 发表于 02-04 11:25 1054次阅读

    大众汽车成立人工智能实验室

    德国汽车制造商大众汽车公司近日宣布,已成立自己的人工智能实验室。这一重要举措凸显了汽车行业在前沿技术应用方面日益增长的雄心。
    的头像 发表于 02-03 16:44 945次阅读

    大众汽车自建人工智能实验室

    德国大众汽车集团(Volkswagen Group)近日宣布,已成立自己的人工智能实验室,旨在成为“全球联网的中心和孵化器”。该实验室的主要任务并非直接应用于量产汽车,而是致力于在全球范围内寻找与
    的头像 发表于 02-02 10:12 618次阅读

    人工智能领域模态的概念和应用场景

    随着人工智能技术的不断发展,模态成为了一个备受关注的研究方向。模态技术旨在将不同类型的数据和信息进行融合,以实现更加准确、高效的
    的头像 发表于 12-15 14:28 9225次阅读