0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI行业七大趋势:合成数据、多模态AI崛起

恬静简朴1 来源:恬静简朴1 作者:恬静简朴1 2022-09-02 12:24 次阅读

2021 年,虚拟世界和网络游戏成为热门话题,Facebook 将公司改名为“Meta”,使得元宇宙一度破圈,互联网企业纷纷入局。为了保护隐私,医疗行业、电信以及金融业开始利用 synthetic data(合成数据),为数据共享提供更多的机会。

人工智能赋能产业,正成为引领经济、科技发展的重要驱动力。

在较为低迷的投融资大环境下,全球投资者对于 AI 的关注度有增不减。2021 年,全球 AI 初创企业融资破纪录达到 668 亿美元,是 2020 年融资总额的两倍之多。2022 年 Q1 相较于 2021 年 Q4 融资额下降了12%,但仍低于同期全球风险投资整体下降幅度。

新的一年,人工智能会朝着什么方向发展?CB Insights 提出了 2022 年值得关注的七大 AI 趋势。

合成数据,保护隐私

目前,由于 AI 技术呈指数级发展,变得更加先进,但其局限性仍然存在。例如,某些行业缺乏足够的真实数据来训练 AI 模型,又或者合规隐私成为一些行业技术发展的痛点。

企业纷纷开始部署 Synthetic data (合成数据),即由计算机人工生成的数据,可用于替代自现实世界中采集的真实数据集。

虽然有人质疑合成数据模拟真实数据的准确性,但仍有一些大公司将赌注押在了这项技术上。

illumina 正在使用由创业公司 Gretel 开发的合成基因数据进行医学研究。在一项联合研究中,两家公司均强调了,取得患者的知情同意权等举措限制了部分医学研究的速度和规模。Gretel 便使用真实的基因型和表型数据进行 AI 算法训练,生成人工基因组合成数据。

在金融领域,J.P. Morgan 正在利用合成数据训练金融 AI 模型。而在电信行业,由于无法获得客户同意,预计高达 85% 的真实客户数据无法获取,这给行为分析和预测造成了极大障碍。西班牙电信公司 Telefónica 与 Most AI 合作,模拟真实客户数据的统计模式,创建 GDPR 合规的客户合成数据档案。

现阶段,基于 GANs 的图像合成技术和视频合成技术发展迅猛,但高效且可行的表格数据合成技术仍处于初级阶段。整体来看,数据匿名化、隐私合规和纠正算法偏见等优势使得合成数据技术成为吸引各行业公司的关键要素。

芯片追逐战

随着 AI 技术不断进步,加速在各行业落地应用。无论是云数据中心还是像照相机这样的智能边缘设备,适用于计算密集型的专业硬件需求激增。

Nvidia(英伟达)的图形处理器曾一度主导着价值 670 亿美元的 AI 芯片市场,如今多家公司相继入局。

谷歌最新推出的 Pixel 手机搭载了自研的 Tensor 处理器,强化了软件应用,而Amazon(亚马逊)也在 2021 年 Q4 推出了自研芯片 Graviton3。

除了这几家大公司外,一些初创企业也纷纷杀入。曾声称造出世界最大芯片的明星创企 Cerebras Systems 在 2021 年 Q4 融资 2.5 亿美元,估值达到 40 亿美元。

pYYBAGMRhYKAYxDrAACe9n5hUL4262.png

图 | 截至 2022 年 5 月 13 日,融资前十的全球 AI 芯片供应商(来源:CB Insights)

由于空间和能源的限制,大型芯片并不适用于许多日常的 AI 应用场景。考虑到这一点,越来越多的公司开始研发可以用于汽车传感器、照相机、自动化工厂机器人等低功耗设备的 AI 芯片。

On-device AI processing(端侧 AI)能够实现低延迟以及数据隐私的保护。Mythic、Syntiant 和 Kneron 等初创公司分别筹集了超过 1 亿美元研发该项技术。

像 Untether AI 和 HOUMO.AI(后摩智能)这样的初创公司正致力于研发“in-memory computing”(存内计算)技术。与传统方法相比,存内计算把计算和存储合二为一实现高度集成,能够大幅度提升性能。Samsung 公司报告称,采用存内计算技术后,语音识别神经网络的速度提高了一倍以上,资源消耗削减了一半。

AI 芯片独角兽公司 Graphcore 采用3D 封装技术极大提高了性能。3D封装技术,简单来说,就是指在不改变封装体尺寸的前提下,在同一个封装体内,在垂直方向上叠放两个或者更多芯片的技术。

其他公司则抛弃了传统 AI 芯片,转而使用光子芯片,即利用光而不是电信号来传输数据。光子学最大的优势是速度,与依靠电缆传输的电子相比,光可以以更快的速度、更大的带宽和更少的能量传输信息。随着人们对 AI 工具的需求呈指数级增长,光子学有望成为破除 AI 硬件局限性的方法。

多年来,研究人员一直在研发通用性光子芯片。像 Lightmatter 和 Luminous Computing 等初创公司都希望构建更快、更节能的芯片,支持机器学习以及能够处理繁琐算法的“AI 超级计算机”。

新的技术层出不穷,新一代芯片在提高性能的同时降低功耗。展望未来,像量子机器学习这样的前沿科技将不断改变 AI 发展的面貌。

AI 赋能内容审核

在美国,玩电子游戏的人数达到了史上前所未有的最高水平。76% 的 18 岁以下的青少年沉迷于电子游戏,这让家长们担心孩子们极有可能接触到不合时宜或者充满仇恨的信息。

处理网络仇恨言论是一个老生常谈的问题。据悉,在 2016 年至 2021 年间,Meta 花费了 130 亿美元用于内容审查,而 TikTok 声称在 2020 年有近万人从事内容审查工作。TikTok 和 Meta 都曾被内容管理员起诉,因为他们在图文审查工作中遭受了心理创伤。

随着元宇宙的火热以及网络游戏生态系统的迅速发展,有害信息已经从社交媒体蔓延到新的阵地,即网络游戏和虚拟世界。

网络游戏环境恶劣,充斥着各种仇恨言论、网络霸凌以及故意退出。反诽谤联盟的一项研究发现,在比较受欢迎的多人游戏中,高达 80% 的玩家都曾受到骚扰。

一些初创公司正着眼于利用 AI 技术进行内容审核。Spectrum Labs 称,其 NLP 平台可以将音频和文本的内容审核工作减少 50% ,有害信息检测能力提高 10 倍。

美国初创公司 GGWP 通过 AI 监控聊天记录和游戏数据来打击游戏中的有害行为。此前,这家初创公司已经筹集了 1200 万美元的种子资金,投资者包括 BITKRAFT Esport Ventures、Sony Innovation Fund(索尼创新基金)和 Riot Games。

2021 年 4 月,美国 Hive 公司募集了 5000万美元的 D 轮融资,估值达到 20 亿美元。Hive 公司成立于 2013 年,是一个专注于 AI 培训数据的智能众包平台,提供自动内容审核服务,帮助像 HighRise 和 Naver Z 这样的元宇宙公司解决玩家发表的仇恨言论、网络欺凌等问题。

为了提高审核能力,大型科技公司收购了一些 AI 初创公司。例如,2021 年 10 月,微软收购了 AI 内容审核服务公司 Two Hat,该公司的客户包括 Roblox、 Epic Games 和微软旗下的 Minecraft。

利用 AI 技术实现完美的内容审核是不可能的。在线用户能够不断适应审查规则,逃避平台的审查。但是,在 NLP 和基于深度学习的图像分类等关键领域取得的突破,以及以内容审查为业务方向的 AI 初创企业获得多轮融资,在一定程度上表明了 AI 审核将成为未来的方向之一。

Deepfakes检测

Deepfakes(深度伪造)不仅能创造出极其逼真的图像,还能生成“假”声音和视频。

利用 AI 学习算法,Deepfakes 的技术愈发精进,效果十分逼真。网络上公开发布的视频和录音数量之多,容易获取,这使得训练 AI 算法和 Deepfakes 容易许多。研究人员表示,对于人们来说,区分 AI 伪造的人像、物体和视频与真实情况十分困难。

2022 年,Deepfakes 在媒体上大量涌现,尤其是在政治领域。2022 年 3 月,《华尔街日报》报道了韩国总统大选候选人 Yoon Suk-yeol 利用 Deepfakes 技术改善自己在年轻选民中的公众形象的新闻。这个名为“AI Yoon”的数字人看起来十分风趣幽默。

Deepfakes 衍生出的假新闻和假消息是一个大问题。对于消费者来说。Deepfakes 还有可能成为网络钓鱼和勒索诈骗的工具。

微软认为,AI 防御体系无法完全打击 Deepfakes 生成的假冒产品,于是推出了 Project Origin(起源项目),允许出版商使用防篡改元数据对媒体进行认证的服务。

美国加州的一家创业公司 Truepic 使用加密和区块链技术打造图像视频真实验证平台。Truepic 一直在与高通公司合作,为高通公司应用芯片组的智能手机拍摄的照片加上水印。去年 Truepic 获得 Adobe、微软 M12、Sony Innovation Fund(索尼创新基金)等 2700 万美元的融资。

为了应对日益增长的网络安全威胁,一些科技公司开始尝试各种解决方案,包括设备端认证软件和 API、区块链等。去年,Meta 的研究人员声称他们不仅可以确定图像是否是伪造的,还可以剖析用于深度伪造的 AI 模型。但是 Deepfakes 技术还将持续演进、无处不在,人们需要寻找新的方法将其摧毁。

低代码/零代码开发

算法能将自然语言命令翻译成计算机代码,特别是对公民开发者来说,这意味着软件开发新一股的浪潮。

2021 年 6 月,GitHub(2018 年该公司被微软收购)和 OpenAI(微软持有其10 亿美元的少数股权)联合推出了 Copilot。Copilot 最大的一个功能就是可以将英语注释转换为代码。

微软并不是唯一一家涉猎该领域的科技巨头。2022 年 2 月,谷歌 DeepMind 发布了新的编程系统 AlphaCode,作为让其 AI 世界的代表竞逐编程比赛。在通过 Codeforces 平台上的编程竞赛后,DeepMind 表示其 AI 的表现已到达中等水平。

初创公司则更关注软件测试:自动化质量检查和代码单元测试。其中包括,得到 CRV 和 Google Ventures 融资的 Mabl、获 Salesforce Ventures 融资的 Autify、2022 年 Q1 获 1000 万 B 轮融资以及牛津大学的衍生公司 Diffblue。

自动编程仍处于初级阶段。但该领域技术进步促使一些初创公司不断拓展零代码/低代码解决方案,让非技术用户能够参与数据科学项目,缩小技能差距,并加快生产周期。

多模态 AI 崛起

多模态 AI 正在打破单一感官的藩篱,使用一个通用 AI 模型科技将多种类型的数据所蕴含的语义信息概念化并作出预测。

在 2021 年初,OpenAI 发布了可以根据文本信息生成图像的 AI 模型 DALL-E。

图 | AI 根据文本提示生成牛油果形状的扶手椅(来源:Open AI)

2022 年 1 月,OpenAI 发布了升级版 DALLE-2,生成图像的画质提升了 4 倍。

2022 年 5 月,谷歌推出了图像生成器 Imagen。据称,Imagen 在生成图像的质量以及输入文本和生成的图像的一致性方面要优于 OpenAI 模型。

今年早些时候,Meta 发表了一篇名为 “不同视觉模态都能通吃的杂食者”的论文,其中详细介绍了如果对一种 AI 模型进行识别 2D 图像的预训练,不经过额外的模态训练,该模型也能可以识别视频或三维图像中的南瓜。

多模态 AI 正在从实验室走到实际应用。例如,谷歌正在使用多模态 AI 来改进搜索体验。未来,如果用户上传了一张登山靴的照片,并附上“我能穿着这双靴子去富士山徒步旅行吗?”的文字,搜索引擎将识别上传的图像,从文本、图像和视频数据中挖掘网络上关于富士山的信息,并将这些琐碎的信息连接起来,提供一个贴切的答案。

多模态 AI 正在走出实验室,为搜索服务和内容生成等应用提供驱动力。

AI for AI

随着 AI 技术应用延展,企业正在寻求彻底改变现有的数据管理模式的解决方案,转向“AI 优先”策略。

说起来容易做起来难。从采集数据、运行数据质量检查到开发模型和监测后期生产表现,一个项目从原始数据转变为生产准备是一个多步骤的过程。

市场上涌现出数以百计的公司研发各阶段的解决方案。

端到端的机器学习公司将 AI 生命周期管理过程中的多步骤融合成一个 SaaS 产品,这将为那些希望快速高效构建 AI 系统的企业提供绝佳选择。

2021 年 5 月,谷歌发布了端到端开发平台 Vertex AI,该公司称 Vertex AI 能为没有机器学习经验的数据科学团队提供一站式服务。

DataRobot 是一家市值 63 亿美元的公司,多年来通过并购积极扩大产品规模。去年,DataRobot 进行了 3 笔收购,扩大市场份额。

无代码和低代码趋势也扩展至机器学习平台,以弥合 AI 技能差距,plug-and-play(即插即用)的功能激励非专家人员参与到 AI 项目中。为此,2021 年,全球第二高估值 AI 独角兽公司 Databricks 收购了低程序代码工具供应商 8080 Labs。

随着大多数老牌厂商开始布局 Auto ML(自动机器学习)功能,“AI for AI”也成为增长的领域。企业开始使用 AI 技术将 AI 开发过程的各环节自动化,如数据质量检查或部分模型开发环节。

持续分化,未来已来,“AI for AI”将迎来更广阔的发展空间。

审核编辑 黄昊宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 微软
    +关注

    关注

    4

    文章

    6549

    浏览量

    103878
  • AI
    AI
    +关注

    关注

    87

    文章

    29635

    浏览量

    267968
  • 人工智能
    +关注

    关注

    1789

    文章

    46562

    浏览量

    236878
  • Meta
    +关注

    关注

    0

    文章

    256

    浏览量

    11325
收藏 人收藏

    评论

    相关推荐

    AI大模型的最新研究进展

    。例如,在医疗领域,生成式AI可以帮助医生生成诊断报告、治疗方案等;在教育领域,AI大模型可以生成个性化的学习资源和建议。 模态融合与交互 : A
    的头像 发表于 10-23 15:19 234次阅读

    未来AI大模型的发展趋势

    上得到了显著提升。未来,算法和架构的进一步优化将推动AI大模型在性能上实现新的突破。 多头自注意力机制、前馈神经网络等关键技术的改进,将增强模型的表达能力和泛化能力。 模态融合 : AI
    的头像 发表于 10-23 15:06 355次阅读

    苹果发布300亿参数模态AI大模型MM1.5

    苹果近日推出了全新的模态AI大模型MM1.5,该模型拥有高达300亿的参数规模,是在前代MM1架构的基础上进一步发展而来的。
    的头像 发表于 10-14 15:50 219次阅读

    聆思CSK6视觉语音大模型AI开发板入门资源合集(硬件资料、大模型语音/模态交互/英语评测SDK合集)

    丰富外设配件 配套模态应用示例,支持快速上手体验大模型语音交互、智能视觉等 AI 应用 板载 DAPLINK 调试器,外接一条USB 线即可实现烧录、调试、串口日志查看 板载网络模组,支持开发联网类
    发表于 06-18 17:33

    智谱AI发布全新模态开源模型GLM-4-9B

    近日,智谱AI在人工智能领域取得重大突破,成功推出全新开源模型GLM-4-9B。这款模型以其卓越的模态能力,再次刷新了业界对于大型语言模型的认识。
    的头像 发表于 06-07 09:17 635次阅读

    Build 2024发布多项Azure AI Speech全新模态功能

    客户们持续使用 Azure OpenAI 和 Azure AI Speech 进行创新,为企业引入新的效率,并构建新的模态体验。
    的头像 发表于 05-28 09:08 509次阅读
    Build 2024发布多项Azure <b class='flag-5'>AI</b> Speech全新<b class='flag-5'>多</b><b class='flag-5'>模态</b>功能

    谷歌发布模态AI新品,加剧AI巨头竞争

    在全球AI竞技场上,谷歌与OpenAI一直稳居领先地位。近日,谷歌在I/O开发者大会上掀起了一股新的技术浪潮,发布了多款全新升级的模态AI产品。
    的头像 发表于 05-16 09:28 405次阅读

    李未可科技正式推出WAKE-AI模态AI大模型

    李未可科技模态 AI 大模型正式发布,积极推进 AI 在终端的场景应用   4月18日,2024中国生成式AI大会上李未可科技正式发布为眼
    发表于 04-18 17:01 547次阅读
    李未可科技正式推出WAKE-<b class='flag-5'>AI</b><b class='flag-5'>多</b><b class='flag-5'>模态</b><b class='flag-5'>AI</b>大模型

    AI快讯:华为助力金融行业加速拥抱AI 马斯克xAI 展示首个模态模型

    AI快讯:华为助力金融行业加速拥抱AI 马斯克xAI 展示首个模态模型 小编给大家汇总一下近期的AI
    发表于 04-15 12:32 384次阅读

    谷歌推出模态VLOGGER AI

    谷歌最新推出的VLOGGER AI技术引起了广泛关注,这项创新的模态模型能够让静态肖像图“活”起来并“说话”。用户只需提供一张人物肖像照片和一段音频内容,VLOGGER AI就能让图
    的头像 发表于 03-22 10:45 749次阅读

    MWC2024:高通推出全新AI Hub及前沿模态大模型

    2024年世界移动通信大会(MWC)上,高通再次展现其技术领导力,通过发布全新的高通AI Hub和展示前沿的模态大模型技术,推动了5G和AI技术的融合创新。
    的头像 发表于 02-26 16:59 1159次阅读

    阿里巴巴推出自主模态AI代理MobileAgent

    阿里巴巴最近推出了一款名为MobileAgent的自主模态AI代理,这款产品模拟人类操作手机,并采用纯视觉解决方案,无需任何系统代码。
    的头像 发表于 02-04 10:34 928次阅读

    洲明科技发布AI+显示终端技术,推动LED行业数字化、智能化升级

    AI技术快速崛起,引领着数字产业新的场景、应用及生态,同时也为LED行业带来巨大商业机遇。为此,洲明科技提出“LED+AI”战略,在技术层面,推出数字虚拟人UniAvatar、垂直
    的头像 发表于 02-03 14:43 921次阅读

    CES2024中国企业引领AI交互潮流

    AIGC技术的发展,AI应用将呈现爆发式增长,IDC预测,到 2024 年全球将涌现出超过 5 亿个新应用,这相当于过去 40 年间出现的应用数总和。 2024年AIGC应用的十大趋势关键词涵盖应用层创新、AI Agent、专属
    发表于 01-12 15:18 296次阅读
      CES2024中国企业引领<b class='flag-5'>AI</b>交互潮流

    语音数据集:AI语音技术的灵魂

    提升语音识别和生成能力:语音数据集为AI模型提供了丰富的语音样本,通过训练和学习这些数据AI可以更好地理解和模拟人类的语音特征,从而提高语音识别的准确性和语音生成的自然度。 促进
    的头像 发表于 12-14 14:33 928次阅读