0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

阿里发布手机操作智能体框架Mobile-Agent

CHANBAEK 来源:网络整理 2024-02-05 10:41 次阅读

阿里巴巴与北京交通大学的联合团队近日在学术界引起了广泛关注,因为他们共同推出了一款全新的手机操作智能体框架——Mobile-Agent。这款框架旨在为手机用户提供更高效、便捷的操作体验,引领手机操作方式的全新革命。

Mobile-Agent框架的核心优势在于其纯视觉解决方案。传统的手机操作方式往往需要依赖XML等标记语言以及系统元数据,而Mobile-Agent则完全摒弃了这些需求。这意味着用户无需进行复杂的设置或修改,只需通过直观的视觉指示即可完成操作。

Mobile-Agent的操作范围不受任何限制,可以在任何应用上进行操作。这得益于其强大的多应用操作能力,使得用户可以在不同应用之间轻松切换,无需重复相同的操作步骤。

为了实现精确的操作定位,Mobile-Agent配备了多种视觉感知工具。这些工具能够识别屏幕上的各种元素,如按钮、图标等,并对其进行精准的定位和识别。这一功能为用户提供了更加个性化的操作体验,满足各种不同用户的需求。

最令人惊喜的是,Mobile-Agent无需进行任何训练即可即插即用。这意味着用户无需花费大量时间进行学习和适应,即可轻松上手。这种便捷性使得Mobile-Agent具有广泛的应用前景,为各类用户提供更加高效、智能的手机操作体验。

目前,Mobile-Agent已经学会了如何操作阿里巴巴、谷歌地图、TikTok等10个知名应用。这意味着用户可以通过简单的视觉指示,在这些应用上进行各种操作,完成跨应用任务。这一功能为用户提供了前所未有的便利性,使得手机操作变得更加轻松愉快。

总体来说,阿里发布的手机操作智能体框架Mobile-Agent具有巨大的潜力,有望引领手机操作方式的全新变革。通过纯视觉解决方案、不受限制的操作范围、精准的操作定位以及无需训练的便捷性,Mobile-Agent为用户提供了更加高效、智能的手机操作体验。未来,我们期待看到更多关于Mobile-Agent的研究和应用,为手机操作领域带来更多的创新和突破。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 手机
    +关注

    关注

    35

    文章

    6849

    浏览量

    157391
  • 阿里巴巴
    +关注

    关注

    7

    文章

    1608

    浏览量

    47101
收藏 人收藏

    评论

    相关推荐

    弘信电子抢跑AI手机产业未来

    Galaxy S24系列智能手机凭借集成的生成式AI工具,仅发售28天便在韩国销量突破百万,刷新了S系列手机的销售纪录。中国手机厂商亦不甘落后,华为鸿蒙操作系统与大模型深度融合,小米在
    的头像 发表于 11-11 14:06 332次阅读

    微软Copilot Studio新功能:支持定制Agent 赋能用户构建自主智能

    微软宣布重大更新,用户可通过Microsoft Copilot Studio构建自主智能。麦肯锡、汤森路透等全球知名企业己利用智能,实现了效率飞跃与业务升级。
    的头像 发表于 11-10 09:59 466次阅读
    微软Copilot Studio新功能:支持定制<b class='flag-5'>Agent</b> 赋能用户构建自主<b class='flag-5'>智能</b><b class='flag-5'>体</b>

    荣耀发布个人化全场景AI操作系统MagicOS 9.0

    近期,手机市场迎来了一波密集的新品发布,其中AI技术成为了各大厂商竞相追逐的焦点。   10月23日,荣耀公司发布了行业首个搭载智能
    的头像 发表于 10-29 16:48 596次阅读

    基于Qwen-Agent与OpenVINO构建本地AI智能

    Qwen2 是阿里巴巴集团 Qwen 团队研发的大语言模型和大型多模态模型系列。Qwen2 具备自然语言理解、文本生成、视觉理解、音频理解、工具使用、角色扮演、作为 AI Agent 进行互动等多种能力。
    的头像 发表于 07-26 09:54 720次阅读
    基于Qwen-<b class='flag-5'>Agent</b>与OpenVINO构建本地AI<b class='flag-5'>智能</b><b class='flag-5'>体</b>

    西部数据发布AI数据周期框架,推动人工智能革新

    在人工智能领域持续革新的今天,西部数据公司凭借其深厚的技术积累,正式发布了全新的人工智能数据周期(AI Data Cycle)框架。这一框架
    的头像 发表于 06-14 17:55 977次阅读

    蚂蚁集团发布首个开源金融场景多智能框架

    在第七届数字中国建设峰会上,蚂蚁集团宣布了一项引人注目的举措:正式开源其多智能框架agentUniverse。这一框架不仅是金融领域的首个开源多
    的头像 发表于 05-28 09:25 674次阅读

    阿里达摩院提出“知识链”框架,降低大模型幻觉

    近日,阿里巴巴达摩院(湖畔实验室)携手新加坡南洋理工大学等研究机构,共同推出了大模型知识链(CoK)框架。该框架不仅可实时检索异构知识源,还能逐步纠正推理错误,有效提高了大模型在回答知识型问题时的准确率,并显著降低了所谓的“幻觉
    的头像 发表于 05-10 11:46 656次阅读

    阿里发布通义千问2.5

    阿里云近日正式发布了通义千问2.5,标志着其人工智能技术在中文语境下取得了重要突破。据阿里智能集团首席技术官周靖人介绍,通义千问2.5在文
    的头像 发表于 05-10 09:57 485次阅读

    创作者变身知识智能,AI时代的“超级个体”

    Agent不创作:为什么知识智能是创作者的人生杠杆?
    的头像 发表于 04-23 09:26 1292次阅读
    创作者变身知识<b class='flag-5'>智能</b><b class='flag-5'>体</b>,AI时代的“超级个体”

    谷歌DeepMind推出SIMI通用AI智能

    近日,谷歌的DeepMind团队发布了其最新研究成果——SIMI(Scalable Instructable Multiworld Agent),这是一个通用人工智能智能
    的头像 发表于 03-18 11:39 884次阅读

    OPPO发布1+N 智能生态战略,联发科携手OPPO打造AI手机生态

    最近,OPPO举办AI战略发布会,发布由 OPPO AI 超级智能和 AI Pro 智能开发
    的头像 发表于 02-21 17:03 991次阅读
    OPPO<b class='flag-5'>发布</b>1+N <b class='flag-5'>智能</b><b class='flag-5'>体</b>生态战略,联发科携手OPPO打造AI<b class='flag-5'>手机</b>生态

    OPPO发布1+N智能生态战略

    OPPO近日在全球科技界掀起了波澜,正式发布了其独特的1+N智能生态战略,标志着这家科技巨头在人工智能领域的全新布局。该战略的核心在于两大组件:AI超级
    的头像 发表于 02-21 10:36 681次阅读

    微软推出首个专为Windows定制的Agent

    随着人工智能技术的飞速发展,全球科技巨头纷纷在这一领域布局。OpenAI以其强大的技术实力在视频领域掀起了一场革命,而微软则悄然对传统用户界面发起了挑战。近日,微软最新发布了一款名为UFO(UI-Focused Agent)的
    的头像 发表于 02-19 11:41 796次阅读

    微软发布Agent框架UFO,引领UI交互新纪元

    微软近日宣布推出全新的Agent框架——UFO(UI-Focused Agent),旨在构建更智能、更直观的用户界面交互体验。该框架基于Op
    的头像 发表于 02-19 11:15 1121次阅读

    AI Agent爆发在即!深剖AI Agent技术原理及发展趋势

    电子发烧友网报道(文/李弯弯)AI Agent指人工智能代理,是一种能够感知环境、进行决策和执行动作的智能实体。AI Agent通常基于机器学习和人工
    的头像 发表于 01-12 01:01 3824次阅读