时至今日,随着算法、计算等的突破,生成式AI技术取得了令人惊叹的进展,大大提高人类的创造力和效率,为各种创作和应用提供了无限的可能。
生成式AI技术的发展为各行各业插上了想象的翅膀。微软(MSFT.US)、英伟达(NVDA .US)等科技大厂以及初创企业纷纷“跑步入场”生成式AI,已经覆盖芯片制造、云计算、数据服务、自然语言处理、文本数据分析、计算机视觉及智能安防、交通、金融、物联网等终端应用。
生成式 AI 在2023年发展迅猛,2024年这一势头还将持续。生成式AI工具已经被集成到文字处理器和软件开发人员的工具中,而在2024年,这些工具将变得更有效、更有用。
AI多模态时代来临
值得注意的是,虽然各类大模型层出不穷,但不断优化升级,推动行业进步仍是各大科技公司的主攻方向。业内专家分析,大模型由单模态向多模态升级已成为行业热点,多家公司在开发多模态的模型、计算机视觉技术,这些技术未来可以用来发现设计芯片等。
事实上,多模态是实现通用人工智能的必经之路。多模态数据输入可帮助模型能力和用户体验提高,允许多模态数据输出也更符合真实世界需要,在数据、算法及算力上的要求都要高于单模态,这一波自然语言大模型发展为其他模态提供了技术参考,行业有望加速发展。
正如谷歌(GOOG.US)Gemini横空出世,让大家的目光重新聚焦在了多模态大模型上。Gemini1.0号称具有原生多模态能力,能够处理视频、音频、图像、文本和代码等多种形式的内容,且性能优于现有的“拼接型”多模态大模型。
从谷歌官方公布的技术文档中的示例来看,Gemini不仅能够进行双模态之间的转换,亦能处理需要进行多模态转换的复杂任务。从这个角度来看,Gemini上线是AI产业发展的里程碑事件,其代表的原生多模态大模型有望拓展大模型的应用场景和边界。
如今AI浪潮进入多模态时代,市场潜力巨大。开源证券表示,科技巨头之间多模态大模型的竞争日益激烈,同时驱动着底层多模态大模型的能力不断突破,叠加GPT等AI应用形式的出现,新一轮人工智能应用热潮正在掀起。
微美全息步入下半场,向多模态时代进发
在如今的AI时代,全新的技术范式正在重新定义企业 AI 应用的落地方式,加速企业全面智能化升级,企业更要勇于探索,产业更要直面竞争。据了解,作为领先的AI视觉服务商微美全息(WIMI.US)随着以大模型技术为核心的 AIGC 技术的快速发展,带来诸多AI创新应用开发和运维的新变化,积极赋能生成式AI 运用迈向多模态时代。
截止目前,微美全息已经在生成式Al+数字广告、生成式Al+数字教育、生成式AI+数字文化传媒、生成式Al+数字健康、生成式AI+出行等领域,让生成式AI赋能到百行百业的方方面面。而在面向多模态时代,微美全息多模态大模型融合AI视觉、语音和数据处理技术,极大丰富了生成式认知和决策层面,有望使大模型在复杂人机交互、自然语言理解等领域取得重大进步。
另一方面,考虑到众多大模型及多模态时代应用催生出更多算力需求,因此布署端侧算力是生成式AI规模化扩展多模态时代至关重要的一步。微美全息对于端侧算力研发十分重视,成立微美全息研发中心自研AI算力,边缘算法、5G/6G网络算力等,有望激化算力市场良性竞争,进而降低算力使用成本。显而易见,未来,微美全息在多模态军备竞赛下算力基建产业链将持续受益。
结语
精彩纷呈的2023年被普遍视为生成式AI的元年,科技产业的图景已经被深刻改变。毫无疑问,2024年,AI行业必将迎来巨大的变革。在这新的一年里,以ChatGPT为首的生成式AI技术在全球点燃研发浪潮,同时多模态会是推动本轮AI热点继续前进的下一个增长点。预计下一代多模态将会快速拓展目前大语言模型有限的应用场景,显著提高语言模型的泛化能力,并吸引各大科技公司竞相入局,加快让这样的想象来到现实世界中。
审核编辑 黄宇
-
AI
+关注
关注
87文章
30084浏览量
268347 -
算力
+关注
关注
1文章
925浏览量
14732 -
大模型
+关注
关注
2文章
2318浏览量
2458
发布评论请先 登录
相关推荐
评论