0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

微软新AI项目为文档和电子邮件的图像添加字幕

姚小熊27 来源:人工智能实验室 作者:人工智能实验室 2020-11-18 10:54 次阅读

微软的一项新AI项目旨在自动为文档和电子邮件中的图像添加字幕,以便视觉障碍软件读取图像。

微软的研究人员在有关预印本存储库arXiv的论文中解释了他们的机器学习模型的原理。

该模型使用可视语音词汇预训练(VIVO),它利用大量成对的图像标签数据来学习视觉词汇。然后,使用带有适当字幕的图像的第二个数据以帮助教AI如何最好地描述图片。

“理想情况下,每个人都应在文档,网络,社交媒体中为所有图像添加替代文本,因为这可以使盲人访问内容并参与对话。但是,可惜,人们却没有。”微软AI平台小组的软件工程经理Saqib Shaikh说。

总体而言,研究人员希望AI能够提供Microsoft现有字幕系统两倍的性能。

为了对新AI的性能进行基准测试,研究人员将其纳入了“无上限”挑战。在撰写本文时,Microsoft的AI现在在其排行榜上排名第一。

“无上限的挑战实际上是如何描述您在训练数据中没有看到的那些新颖的物体?”微软研究实验室的首席研究经理王丽娟评论道。

希望使用Microsoft自动字幕AI来构建应用程序的开发人员已经可以这样做,因为Azure Cognitive Services的Computer Vision软件包中提供了该功能。

微软令人印象深刻的SeeingAI应用程序将使用新的AI进行更新,该应用程序使用计算机视觉描述视力障碍者的周围环境。

“图像字幕是可以实现广泛服务的核心计算机视觉功能之一,”Azure AI认知服务的CTO黄表示。

黄继续说:“我们AI的这一突破以Azure为平台,以服务于更多客户。” “这不仅是研究上的突破;在Azure上将突破转化为生产所需的时间也是突破。”

改进的自动字幕功能也有望在今年晚些时候在Outlook,Word和PowerPoint中使用。
责任编辑:YYX

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 微软
    +关注

    关注

    4

    文章

    6636

    浏览量

    104582
  • AI
    AI
    +关注

    关注

    87

    文章

    31845

    浏览量

    270674
收藏 人收藏

    评论

    相关推荐

    The Bat! Voyager便携式电子邮件客户端软件介绍

        The Bat! Voyager是一款便携式电子邮件客户端软件,可以在任何运行 Microsoft Windows 的电脑上通过 USB 或便携式媒体启动。The Bat! Voyager
    的头像 发表于 02-13 11:01 61次阅读

    微软Office引入AI助手Copilot并涨价

    OneNote等常用软件中,体验到由Copilot带来的智能化辅助。 据悉,Copilot作为一款功能强大的AI助手,旨在帮助用户更加高效地完成各种文档编辑、数据分析、演示文稿制作以及邮件处理等任务。其智能化的特性和对用户需求的
    的头像 发表于 01-18 11:29 563次阅读

    ONLYOFFICE工作区:Web捆绑包助力高效团队管理和协作

    式的媒体播放器 可填写的在线表单 用于端到端加密文档协作的私密房间 邮件 让您的邮箱井井有条。在您的域名上创建企业邮箱或使用默认的邮箱。连接多个电子邮件账户,管理和标记邮件。创建签名并
    的头像 发表于 01-06 17:08 264次阅读
    ONLYOFFICE工作区:Web捆绑包助力高效团队管理和协作

    万里红电子邮件内容保密检查系统的优势

    电子邮件,作为一种更正式、专业的沟通渠道,是党政机关单位处理业务工作中必不可少的通信方式之一。电子邮件传输迅速、使用便捷、长期保存,很多机关单位建设了专有的电子邮件系统,进行公文传递、修改和审批
    的头像 发表于 12-13 10:11 253次阅读

    微软新型专利实现电子邮件与聊天工具的无缝切换

     5 月 30 日消息,美国商标和专利局近日于 5 月 21 日公布授予微软一项专利,该专利涉及一种全新的系统可实现从电子邮件至聊天工具的无缝切换。
    的头像 发表于 05-30 15:31 498次阅读

    微软AI新成果:将不可编辑PDF转化为可编辑文档

    市面现有相关软件虽能将PDF转为可编辑版,但易丧失原始布局。微软研究论文名为《从不可编辑文档生成可编辑文档的方法和系统》,其独特之处在于运用AI技术保持了字体、色彩、布局及
    的头像 发表于 05-30 10:11 868次阅读

    微软Office Outlook Lite服务升级,支持短信功能

    据报道,微软于今日宣布更新 Outlook Lite 服务,使其支持 SMS 短信功能。微软称,通过此项升级,用户现可整合管理电子邮件及 SMS 短信,有效提升沟通效率。
    的头像 发表于 05-28 11:41 659次阅读

    微软网页版PPT新增语音识别及字幕生成功能

    据报道,微软计划于今年六月份推出网页版PowerPoint全新语音识别功能。此项功能将能够监控PowerPoint视频中的声音,进而自动生成字幕
    的头像 发表于 05-16 14:36 519次阅读

    微软中国AI团队或将整体搬迁至美国或澳大利亚

    5月15日,钛媒体爆料称,微软公司已经通过电子邮件形式,通知旗下中国区域负责人旗下AI研发团队,包括C+AI团队以及Azure ML团队等,将全员迁移至美国或者澳大利亚。据悉,此次搬迁
    的头像 发表于 05-15 16:29 986次阅读

    谷歌Gmail将支持Gemini总结电子邮件内容

    谷歌透露,Gemini 将协助 Workspace 和 Google One AI Premium 的用户理解和处理电子邮件内容。用户可通过移动应用和网页版 Gmail 使用 Gemini
    的头像 发表于 05-15 11:11 1044次阅读

    微软新版Outlook邮件应用提高垃圾邮件防御能力

    微软称,垃圾邮件即指收件箱中无意接收的、未经许可的邮件信息,包括那些意图推广产品或服务的商家以及名为网络钓鱼的虚假邮件,这些邮件往往假扮成官
    的头像 发表于 05-14 09:50 439次阅读

    2024年第一季度电子邮件威胁报告:美国垃圾邮件数量居首,制造业受害较多

    具体而言,在各类被攻击对象之中,制造业、政府部门以及IT行业成为了黑客的主要目标。该报告显示,在2024年第一季度,制造业收到了43%的电子邮件,政府部门15%,IT行业11%的攻击。
    的头像 发表于 05-14 09:31 800次阅读

    微软Windows 11 AI探索者功能揭秘

    早前于 4 月 27 日,Xeno 曾详细解释过 Windows 11 AI Explorer 的主要功能,其中一大亮点在于能够追踪用户在电脑上的全部操作活动,涵盖了各类应用程序、电子邮件文档、会议以及观看电影等。
    的头像 发表于 05-07 10:22 525次阅读

    微软发布金融聊天机器人,定价尚无确切消息

    在此之前,微软已推出两款相对应的产品——适用于Office应用及Outlook邮箱的Office 365 Copilot,以及专为销售人员设计的Copilot for Sales,用以协助撰写电子邮件和收集客户信息等。
    的头像 发表于 03-01 09:08 587次阅读

    微软新闻编辑行业推出AI工具

    近日,微软宣布与全球多家知名新闻机构展开紧密合作,共同探索并推动生成式AI在新闻编辑室中的创新应用。微软表示,将全力支持新闻机构优化AI技术在新闻采编和日常业务实践中的运用,并致力于培
    的头像 发表于 02-18 11:08 779次阅读