0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

微软开发了一种新的AI图像字幕算法

姚小熊27 来源:cnBeta.COM 作者:cnBeta.COM 2020-10-15 14:09 次阅读

微软开发了一种新的图像字幕算法,在某些有限的测试中,其准确率超过了人类。该人工智能系统已被用于更新该公司为视障人士提供的助理应用程序 “Seeing AI”,并将很快被纳入Word、Outlook和PowerPoint等其他微软产品中。在那里,它将被用于为图像创建alt文本等任务,这一功能对于提高无障碍性尤为重要。

这些应用包括微软自己的Seeing AI,该公司于2017年首次发布。Seeing AI利用计算机视觉为视障人士描述通过智能手机摄像头看到的世界。它可以识别家庭物品,阅读和扫描文本,描述场景,甚至识别朋友。它还可以用来描述其他应用中的图像,包括电子邮件客户端、社交媒体应用和WhatsApp等消息应用。

微软没有披露Seeing AI的用户数量,但Azure AI的企业副总裁Eric Boyd告诉The Verge,该软件是 “为盲人或低视力人士提供的领先应用之一”。Seeing AI已经连续三年被盲人和低视力iOS用户社区AppleVis评选为最佳应用或最佳辅助应用。

微软新的图像字幕算法将显著提高Seeing AI的性能,因为它不仅能识别物体,还能更精确地描述它们之间的关系。因此,该算法可以在看一张图片时,不仅能说出图片中包含哪些物品和物体(如 “一个人、一把椅子、一个手风琴”),还能说出它们之间的互动关系(如 “一个人坐在椅子上,正在拉手风琴”)。微软表示,该算法是其之前自2015年开始使用的图像字幕系统的两倍。

该算法在9月份发表的一篇预印论文中进行了描述,在一个被称为 “nocaps ”的图像字幕基准测试上取得了有史以来最高的分数。这是一个业界领先的图像字幕评分板,不过它有自己的限制条件。nocaps基准测试由超过166,000个人类生成的字幕组成,描述了从Open Images Dataset中提取的约15,100张图片。这些图片涵盖了一系列场景,从运动到假日抓拍,再到美食摄影等等。
责任编辑:YYX

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 微软
    +关注

    关注

    4

    文章

    6573

    浏览量

    103967
  • AI
    AI
    +关注

    关注

    87

    文章

    30259

    浏览量

    268492
收藏 人收藏

    评论

    相关推荐

    AI图像识别摄像机

    AI图像识别摄像机是一种集成了先进算法和深度学习模型的智能监控设备。这些摄像机不仅能够捕捉视频画面,还能实时分析和处理所拍摄的内容,从而实现对特定对象、场景或行
    的头像 发表于 11-08 10:38 173次阅读
    <b class='flag-5'>AI</b><b class='flag-5'>图像</b>识别摄像机

    爱普生开发了一种烤箱控制的晶体振荡器,其功耗比传统OCXOs1低56%

    爱普生开发了一种烤箱控制的晶体振荡器,其功耗比传统OCXOs1低56%-该振荡器小巧且节能,是下代通信基础设施中参考信号源应用的理想选择-精工爱普生公司(TSE:6724,“爱普生”)开发了
    的头像 发表于 10-29 11:28 143次阅读
    爱普生<b class='flag-5'>开发了</b><b class='flag-5'>一种</b>烤箱控制的晶体振荡器,其功耗比传统OCXOs1低56%

    BitEnergy AI公司开发一种AI处理方法

    BitEnergy AI公司,家专注于人工智能(AI)推理技术的企业,其工程师团队创新性地开发了一种名为线性复杂度乘法(L-Mul)的
    的头像 发表于 10-22 15:15 348次阅读

    图像识别算法的提升有哪些

    方法。 数据增强 数据增强是提高图像识别算法性能的一种有效方法。通过对训练数据进行变换和扩展,可以增加数据的多样性,提高模型的泛化能力。常见的数据增强方法包括: 2.1 旋转、缩放、平移和翻转 通过对
    的头像 发表于 07-16 11:12 599次阅读

    图像识别算法的优缺点有哪些

    图像识别算法一种利用计算机视觉技术对图像进行分析和理解的方法,它在许多领域都有广泛的应用,如自动驾驶、医疗诊断、安全监控等。然而,图像识别
    的头像 发表于 07-16 11:09 1375次阅读

    Whatsapp正在开发一种新的生成人工智能功能

    据悉,Whatsapp正在开发一种新的生成人工智能功能,该功能应允许用户制作自己的个性化头像,用于任何想象中的场景。WABetaInfo在新的Android版WhatsApp测试版2.24.14.7
    的头像 发表于 07-14 17:50 956次阅读

    日本九州大学开发了名为QDyeFinder的人工智能(AI)工具

    在探索大脑这宇宙中最复杂结构的征途中,科学家们不断突破技术的边界,以更精细、更高效的方式揭示其奥秘。近期,日本九州大学的研究团队在《自然·通讯》杂志上发表了项革命性的研究成果,他们开发了
    的头像 发表于 07-03 14:43 439次阅读

    基于一种AI辅助可穿戴微流控比色传感器系统

    存在的挑战限制了这项技术的实际应用。 据麦姆斯咨询报道,为了克服这些挑战,来自中国石油大学(华东)的研究人员开发了一种人工智能(AI)辅助的可穿戴微流控比色传感器系统(AI-WMCS)
    的头像 发表于 06-29 10:57 1w次阅读
    基于<b class='flag-5'>一种</b><b class='flag-5'>AI</b>辅助可穿戴微流控比色传感器系统

    微软网页版PPT新增语音识别及字幕生成功能

    据报道,微软计划于今年六月份推出网页版PowerPoint全新语音识别功能。此项功能将能够监控PowerPoint视频中的声音,进而自动生成字幕
    的头像 发表于 05-16 14:36 373次阅读

    微软在天气预报领域突破,新AI模型精准预测未来30天

    微软在天气预报领域取得显著成果。其Start团队成功研发了一种全新AI模型,能够更精准地预测未来30天的天气状况。
    的头像 发表于 05-10 11:23 785次阅读

    微软开发AI语言模型MAI-1,挑战行业巨头

    据最新消息,微软正积极开发款新型AI语言模型MAI-1,以提升在快速发展的AI市场中的竞争力。
    的头像 发表于 05-08 10:27 435次阅读

    利用AI实现自动图像标注不是梦

    次次的将图像添加标签进行分类,如此机械式的操作是否令你心烦?为不多不少的图像分类标注工作不得不增加个岗位?你是否因图像标注需求和数据安全
    的头像 发表于 01-04 08:29 1261次阅读
    利用<b class='flag-5'>AI</b>实现自动<b class='flag-5'>图像</b>标注不是梦

    FPGA图像处理-CLAHE算法介绍()

    在介绍CLAHE算法之前必须要先提下直方图均衡化,直方图均衡化算法一种常见的图像增强算法,可
    的头像 发表于 01-02 13:32 1693次阅读
    FPGA<b class='flag-5'>图像</b>处理-CLAHE<b class='flag-5'>算法</b>介绍(<b class='flag-5'>一</b>)

    韩国研究团队开发了一种在石墨烯层上生长柔性GaN LED阵列的方法

    外媒消息,韩国首尔国立大学与成均馆大学的研究团队联合开发了一种在石墨烯层上生长柔性GaN LED阵列的方法,通过该技术研究团队生长出了LED微型阵列,并称作微盘阵列(Microdisks arrays)。
    的头像 发表于 12-18 10:07 902次阅读

    韩国开发了一种在石墨烯层上生长柔性GaN LED阵列的方法

    12月11日,外媒消息,韩国首尔国立大学与成均馆大学的研究团队联合开发了一种在石墨烯层上生长柔性GaN LED阵列的方法,通过该技术研究团队生长出了LED微型阵列
    的头像 发表于 12-13 16:06 742次阅读
    韩国<b class='flag-5'>开发了</b><b class='flag-5'>一种</b>在石墨烯层上生长柔性GaN LED阵列的方法