0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

成都汇阳投资关于谷歌携 Gemini 王者归来,AI 算力和应用值得期待

话说科技 来源:话说科技 作者:话说科技 2023-12-11 14:40 次阅读

【Gemini 大模型主打多模态,性能对标GPT-4】

当地时间12月6日, 谷歌公司宣布推出其规模最大、功能最强的多模态大模型 Gemini, 其最强大的 TPU (张量处理单元)系统 “Cloud TPU v5p”, 以及来自谷歌云的人工智能超级计算机。

本次谷歌推出的多模态大模型Gemini 依然采用Transformer 架构,采用高效Attention 机制,支持32k 的上下文长度。Gemini 主打在多模态领域的突出能力,在输入端,Gemin 可以适应文本与音视频交叉的输入序列,比如自然图像、图表、截图、pdf 和视频等。在输出端, Gemini 兼具文本和图像两种输出形式。与市面上大模型不同的地方在于, Gemini 从设计之初开始就是多模态的,并不像 OpenAI 构建 DALL·E 和 Whisper 单独训练图像和语音模型。

wKgaomV2rvKAN4AuAAERwT7N7Bk575.png

Gemini 1.0 家族涵盖三类模型,各有定位:

1)Gemini Ultra: 用于高度复杂的任务,为规模最大、功能最强的类别,定位为 GPT-4的竞争对手;

2)Gemini Pro: 是一款中端型号,用于增强性能和大规模部署能力,根据谷歌技术报告, 其性能优于GPT-3.5;

3)Gemini Nano: 主要用于特定任务和移动设备。

wKgZomV2rvOAaRoaAAF58wRdqks928.png

模型能力方面, Gemini 系列在文本、多模态、模态组合等领域均实现了较大进展,在绝大多数基准测试中性能领先于GPT-4。

1、文本领域: Gemini Ultra 在多项基准测试中领先于GPT-4, 并成为现有 第一个在大规模多任务语言理解(MMLU) 方面超越人类专家的模型。在谷歌技术报告中,公司将Gemini 与 GPT-4以及此前谷歌最强的语言大模型 PaLM2 等等进行了比较,在大型语言模型 (LLM) 研发中使用的32个广泛使用的学术基准中,GeminiUltra 的性能有30个超过了当前最先进的结果(SOTA,State Of The Art),全面领先于GPT-4。

wKgaomV2rvOAI3tXAABjwYdX0Xc346.png

2、多模态领域, Gemini Ultra 在图像、视频、音频多项基准测试中同样实现超越GPT-4V。图像理解方面,无论是回答自然图像问题,进行扫描文档的文本识别,还是理解信息图表、图表和科学图解, Gemini Ultra 在多个任务上都取得了显著改进。视频理解方面,Gemini Ultra 彰显了强大的时态推理能力,在各种少镜头 (Few-shot)视频字幕任务和零镜头视频问答任务上取得了SOTA。 音频理解方面,Gemini Pro 模型在英语和多语言测试集的所有自动语音识别(ASR) 和自动语音翻译(AST) 任务中都明显优于 USM 和 Whisper 模型,Gemini Nano-1 模型在除 FLEURS 以外的所有数据集上也优于USM 和 Whisper。

wKgZomV2rvSAR1MYAADl_LpbaVc721.png

3、除此之外,模态组合领域, Gemini 彰显了处理多模态输入、跨模态推理 的强大能力。谷歌通过煎鸡蛋的烹饪场景示例,展示了Gemini 处理文本、视觉和音频交叉序列的能力以及跨模态推理能力。

wKgaomV2rvSAYQkFAADJzCjVmEg500.png

【算力优势稳固,发布新一代云端 AI 芯片 TPUv5p】

本次谷歌在发布 Gemini 的同时推出了全新的面向云端AI 加速的 TPU v5p,这也是谷歌迄今为止功能最强大、效率最高且可扩展性最强的 TPU 系统。

谷歌于2016年起开始推出第一代 TPU,TPU是为神经网络设计的专用芯片、 谷歌人工智能产品的核心,为谷歌搜索、YouTube 、Gmail、谷歌地图、Google Play和 Android 等数十亿用户提供服务。

谷歌表示, Gemini 1.0 采用TPU v4和 v5e 芯片上进行大规模训练,在 TPU 上Gemini 的运行速度明显快于早期规模更小、性能更弱的模型,未来TPU v5p也会应用于加速Gemini 开发。

wKgZomV2rvWAXoHsAAMyhgo_RL8502.png

TPU v5p 性能较 TPU v4 全面提升。谷歌 TPU v5p 在 bfloat16 精度下,可 以实现459 teraFLOPS; 在 Int8精度下,可以实现918 teraOPS。谷歌 TPU v5p 配备95GB 的 HBM3 内存,内存带宽为2.76TB/sec, 每个Pod 最多有8960 个加速核心,并自研搭载600GB/sec 芯片互联主控,可以更快、更准确地训练 AI模型。与 TPU v4相比, TPU v5p 的浮点运算性能大幅提升,在高带宽内存方面是 TPU v4的近3倍。

wKgaomV2rvWASYTQAAOMNvWngXU946.png

【背靠谷歌生态帝国,Gemini 商业化想象空间广阔】

从大模型应用端来看,相较OpenAI, 谷歌的商业版图更为广阔, Gemini 系列规模和功能强大,预计将快速融入谷歌生态,未来商业模式拥有极大的想象空间。

内部生态融合计划来看,谷歌表示,从发布日起,Gemini 可开始应用 Bard 和 Pixel8Pro 智能手机,并将很快与谷歌服务中的其他产品集成,包括Chrome、搜索和广告等。

应用于Bard 聊天机器人: 从发布会当天开始,谷歌聊天机器人Bard 将使用 Gemini Pro 的微调版本来实现高级推理、规划、理解和其他功能。明年初,谷 歌将推出 Bard Advanced, 其将使用 Gemini Ultra, 这代表 Bard 发布以来的最大更新。

应用于Pixel8Pro 手机: 从发布会当天开始,Pixel8 Pro 手机的两项功 能将由 Gemini Nano 提供支持:录音机应用(Recorder)中的Summarize 等功能、WhatsApp Gboard 中的 Smart Reply。由于模型在手机中运行,因此两者都可以离线工作,因此应该能拥有快速且原生的体验。谷歌表示,Nano 的目标是 创建一个尽可能强大的 Gemini 版本,但同时不会占用手机的存储空间或使处理器过热。

在接下来的几个月中,Gemini 将出现在谷歌更多的产品和服务中,例如搜 索、广告、Chrome 和DuetAI。

外部用户开放情况来看,谷歌计划通过谷歌云将 Gemini 授权给客户,供他们在自己的应用程序中使用。

12 月 13 日开始,开发者和企业客户可以通过谷歌 AIStudio 或谷歌Cloud VertexAI 中的GeminiAPI(应用程序编程接口)访GeminiPro,安卓开发 人员可以使用 GeminiNano 完成构建。

【全球巨头角逐激烈,AI 算力需求增长和应用场景或拓宽】

谷歌作为全球人工智能龙头之一,无论在算力、算法还是商业化各个方面都 积蓄了优势,Gemini 系列大模型的如期推出,打破此前市场关于延期发布的传 闻,同时 Gemini 系列在传统文本领域以及多模态领域能力均对标 GPT-4,总体超出市场预期。

随着人工智能巨头在大模型领域的竞争依然白热化,在此背景下继续看好 AI 算力需求的增长,同时当下对于多模态 AI 的激烈角逐也将持续拔升大模型的 整体能力水平,有助于不断拓展大模型的应用场景和边界,想象空间广阔。

当前,我国通用人工智能产业政策逐步完善,国产大模型能力持续升级。美国对华半导体出口管制升级,将倒逼我国国产 AI 芯片产业链加快成熟。随着国产大模型厂商和 AI 芯片厂商的持续发力,我国 AIGC 产业未来发展前景广阔。

算力方面:海光信息、中科曙光、紫光股份、浪潮信息、龙芯中科、神州数码寒武纪、景嘉微

算法方面:科大讯飞、海天瑞声、拓尔思、零点有数、汇纳科技、中科创达

应用场景方面:金山办公、万兴科技、拓尔思

网络安全方面:启明星辰、电科网安、锐捷网络

我们筛选出以下潜力标的

海光信息(688041) 海光 DCU 协处理器主要部署在服务器集群或数据中心,为应用程序提供高性能、高能效比的算力,支撑高复杂度和高吞吐量的数据处理任务,应用于大数据处理、人工智能、商业计算等计算密集类应用领域。

wKgaomV2rvaAeCQnAAE6_r-hwvI509.png

零点有数(301169) 公司应用人工智能技术,开发数据智能应用软件,在智能政 务、智能警务、智能税务和供应链智能化管理领域已有持续扩展的研发积累和客户合作。其中在人工智能技术的算法技术产业化方面,公司目前是积极的引领者之一。

wKgZomV2rvaAbqboAAGRSnwYgaQ783.png

万兴科技(300624) 公司致力于通过软件技术创新和产品能力提升助力新生代创作者高效、便捷创作。目前公司已布局虚拟数字人、虚拟场景、虚拟直播等创新 业务,并与近日在2022全球元宇宙大会论坛上宣布布局AIGC赛道,公司旗下首款AI绘画软件“万兴AI绘画”正式开启公测。

wKgaomV2rvaADzuFAAFXwvVXTX4186.png

参考资料 平安证券-计算机行业动态跟踪报告:多模态能力表现亮眼,谷歌携Gemini 王者归来-231208.pdf

免责声明:

本文由投资顾问:冯利勇(执业证书编码: A1280620060001)、 何军(执业证书编码: A1280621060001)、 罗力川(登记编号: A1280622110002) 等编 辑整理,仅代表团队观点,任何投资建议不作为您投资的依据,您须独立作出投 资决策,风险自担。请您确认自己具有相应的权利能力、行为能力、风险识别 能力及风险承受能力,能够独立承担法律责任。所涉及个股仅作投资参考和学习交流,不作为买卖依据。投资有风险,入市需谨慎!

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6141

    浏览量

    105080
  • AI
    AI
    +关注

    关注

    87

    文章

    30098

    浏览量

    268371
  • 算力
    +关注

    关注

    1

    文章

    925

    浏览量

    14733
收藏 人收藏

    评论

    相关推荐

    企业AI租赁是什么

    企业AI租赁是指企业通过互联网向专业的提供商租用所需的计算资源,以满足其AI应用的需求。
    的头像 发表于 11-14 09:30 156次阅读

    谷歌Gemini 1.5 Flash模型升级,AI聊天速度飙升50%

    谷歌近期对其Gemini AI系列进行了重大更新,推出了Gemini 1.5 Flash模型。此次升级的核心亮点在于显著提升了AI聊天的响应
    的头像 发表于 09-06 18:06 679次阅读

    谷歌任命原Character.AI首席执行官为Gemini联合技术负责人

    近日,谷歌宣布了一项重要人事任命,原Character.AI的联合创始人兼首席执行官诺姆·沙泽尔(Noam Shazeer)已重返谷歌,并将担任其人工智能新项目“Gemini”的联合技
    的头像 发表于 08-26 11:06 470次阅读

    大模型时代的需求

    现在AI已进入大模型时代,各企业都争相部署大模型,但如何保证大模型的,以及相关的稳定性和性能,是一个极为重要的问题,带着这个极为重要的问题,我需要在此书中找到答案。
    发表于 08-20 09:04

    成都投资关于华为新版芯片或挑战英伟达,国产值得关注?

    【华为将推出新款AI 芯片,瞄准英伟达中国市场份额】 近年来AI 产业蓬勃发展,资本市场也出现了狂欢,英伟达(NVDA.US)、AMD等科技企业因此收获了股价的暴涨。而 AI
    的头像 发表于 08-19 11:44 792次阅读

    谷歌推出Gemini Live,开启AI语音聊天新纪元

    在万众瞩目的Pixel 9系列手机发布会上,谷歌震撼宣布了一项创新服务——Gemini Live,该服务自今日起,率先向使用英语的Gemini Advanced订阅用户敞开大门。这一举措标志着
    的头像 发表于 08-15 17:29 680次阅读

    谷歌借助Gemini AI系统深化对机器人的训练

    7月12日,国际科技界传来新动态,谷歌正借助其先进的Gemini AI系统,深化对旗下机器人的训练,旨在显著提升它们的导航能力和任务执行能力。DeepMind机器人团队最新发布的研究论文,详细阐述
    的头像 发表于 07-12 16:29 599次阅读

    谷歌Gmail将支持Gemini总结电子邮件内容

    谷歌透露,Gemini 将协助 Workspace 和 Google One AI Premium 的用户理解和处理电子邮件内容。用户可通过移动应用和网页版 Gmail 使用 Gemini
    的头像 发表于 05-15 11:11 591次阅读

    谷歌Pixel 8将采用Gemini Nano模型,新增两项AI功能

    谷歌披露,Pixel 8 在配备 Gemini Nano 后,首先将增加两大创新 AI 功能:其中之一是 Recorder 应用内新增 Summarize 功能,无网络情况下可记录并归纳更多
    的头像 发表于 03-29 15:46 546次阅读

    谷歌发布AI新版本Gemini 1.5

    谷歌近日宣布推出其最新的人工智能(AI)版本——Gemini 1.5,这一新版本在文本处理能力上实现了重大突破。据了解,Gemini 1.5 Pro的上下文窗口长度已经扩展到惊人的10
    的头像 发表于 02-19 11:05 1074次阅读

    谷歌AI聊天机器人改名为Gemini

    谷歌(Google)近日宣布,旗下备受瞩目的AI聊天机器人Bard正式更名为Gemini,并推出了一款功能更加强大的付费版本——Gemini Advanced。这一战略调整旨在与微软、
    的头像 发表于 02-18 11:28 1044次阅读

    谷歌最新人工智能模型Gemini Pro已在欧洲上市

    近日,谷歌宣布其最新人工智能模型Gemini Pro已在欧洲市场上市,向欧洲用户开放。Gemini Pro是谷歌最大的人工智能(AI)模型之
    的头像 发表于 02-04 15:10 1143次阅读

    弘信电子与AI服务器合资,助力国产芯片落地

    此外,弘信电子近期在AI业务上取得了突破性进展,这并非源自本土化的积累,而是依赖于团队敏锐的战略眼光和强烈的创新动力。此次投资是弘信电子在AI
    的头像 发表于 12-25 09:30 835次阅读

    成都投资关于多模态驱动应用前景广阔,上游迎机会!

    Gemini 大模型主打多模态,性能对标 GPT-4】 当地时间12月6日, 谷歌公司宣布推出其规模最大、功能最强的多模态大模型 Gemini, 其最强大的 TPU (张量处理单元)系统
    的头像 发表于 12-18 13:08 457次阅读
    <b class='flag-5'>成都</b><b class='flag-5'>汇</b><b class='flag-5'>阳</b><b class='flag-5'>投资</b><b class='flag-5'>关于</b>多模态驱动应用前景广阔,上游<b class='flag-5'>算</b><b class='flag-5'>力</b>迎机会!

    谷歌揭秘Gemini,AMD对峙英伟达

    今天,我们看到谷歌揭开了多模态AI模型Gemini的神秘面纱,AMD挑战英伟达在AI芯片市场的霸主地位,微软在英国AI领域的巨额
    的头像 发表于 12-07 20:05 708次阅读