据报道,微软计划于今年六月份推出网页版PowerPoint全新语音识别功能。此项功能将能够监控PowerPoint视频中的声音,进而自动生成字幕。
早在2023年12月,微软已对网页版PowerPoint进行了升级,允许用户在视频中添加字幕,但目前仅支持WebVTT格式。
微软表示,新功能上线后,用户只需在演示文稿中插入视频,即可通过字幕选项,从支持的63种语言中选择最合适的语言,然后点击生成字幕。
此外,微软还透露,该功能可在PowerPoint应用程序中快速扫描长达两个小时的视频,并在数分钟内生成字幕。完成后,用户可点击“编辑字幕”按钮,对自动生成的字幕进行修正。当用户发现需编辑的字幕部分时,视频将会自动播放。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
微软
+关注
关注
4文章
6589浏览量
104017 -
语音识别
+关注
关注
38文章
1735浏览量
112628 -
应用程序
+关注
关注
37文章
3260浏览量
57674
发布评论请先 登录
相关推荐
ChatGPT新增实时搜索与高级语音功能
在OpenAI的第八天技术分享直播中,ChatGPT的搜索功能迎来了重大更新。此次更新不仅丰富了ChatGPT的功能体系,更提升了其实用性和竞争力。 新增的实时搜索功能,是此次更新的亮
微软预览版Copilot Vision AI功能上线
微软公司近日宣布,将面向美国地区的Copilot Pro用户推出预览版的Copilot Vision AI功能。这一创新功能旨在通过人工智能技术,进一步提升用户的网页浏览体验。 Cop
语音识别与自然语言处理的关系
在人工智能的快速发展中,语音识别和自然语言处理(NLP)成为了两个重要的技术支柱。语音识别技术使得机器能够理解人类的语音,而自然语言处理则让
ASR与传统语音识别的区别
识别技术。 构建更深更复杂的神经网络模型,利用大量数据进行训练。 提高了语音识别的准确率和稳定性。 传统语音识别 : 通常依赖于声学-语言模
ASR语音识别技术应用
ASR(Automatic Speech Recognition)语音识别技术,是计算机科学与人工智能领域的重要突破,能将人类语音转换为文本,广泛应用于智能家居、医疗、交通等多个领域。以下是对ASR
什么是离线语音识别芯片?与在线语音识别的区别
离线语音识别芯片适用于智能家电等,特点为小词汇量、低成本、安全性高、响应快,无需联网。在线语音识别功能更广泛、
Transformer模型在语音识别和语音生成中的应用优势
随着人工智能技术的飞速发展,语音识别和语音生成作为人机交互的重要组成部分,正逐渐渗透到我们生活的各个方面。而Transformer模型,自其诞生以来,凭借其独特的自注意力机制和并行计算
谷歌将优化安卓系统的实时字幕功能,用户可更改字幕行数
Live Captions作为安卓系统的辅助工具,能自动识别并实时将音频转化为字幕。此功能对听力受损或环境嘈杂时难以理解内容的人群十分有用。
微软OneNote引入“便笺”功能并更改图标为紫色,新增搜索框
如今,微软官方宣布这一功能已进入稳定运行阶段,所有Windows用户均可尝试最新版本的OneNote应用,体验其新增的“便笺”功能。
微软onedrive网页版新增离线模式
此项新功能开放后,客户可利用网页版OneDrive的离线模式实现诸如主页、个人文档、共享、收藏夹、人员管理和会议视图等基本功能。同时,用户还能查阅文件夹、文件名称,获取所有者、大小、活动和上次访问时间等详细信息。
微软网页版Excel新增复制粘贴功能,助力提升用户工作效率
今日,微软公司宣布推出Microsoft 365Insider项目,面向会员开放网页版Excel的试用机会,旨在通过提升复制粘贴功能来提高用户生产效率。
谷歌Chrome浏览器实时字幕功能拓展至11种语言,覆盖简繁中文
这款名为“提供音频和视频自动字幕生成”的功能,不仅能够实现设备间数据零泄漏,而且在IT之家当前所试用的最新稳定版Chrome浏览器环境下,其主要界面将显示为英文,但同时也兼容其他如法语、德语及意大利语的
微软相册更新生成式擦除编辑功能,消除照片干扰
微软公开宣布,已经成功地将最近研发出的所有人工智能编辑功能(包括模糊背景、删除及替换背景以及生成式擦除)移植到适配Arm64设备和Windows 10的照片应用中,现在已面向全平台的W
评论