0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

涂鸦On-App AI视频主体突出方案全新上线!自动追踪+智能放大,一键革新视频剪辑体验

涂鸦开发者 2025-04-10 19:04 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

随着智能 IPC 设备(如安防摄像头、宠物陪伴机器人、婴儿监视器等)日益普及,越来越多的生活场景被实时记录。然而在实际使用中,由于设备安装位置不当、广角镜头视野过大等原因,经常会出现拍摄主体占比过小的问题,导致"全景清晰而主体模糊",严重影响用户的观看体验。


一、涂鸦AI 推理模型自动突出主体

因此,涂鸦重磅推出 On-App AI 视频主体突出解决方案利用涂鸦赋能 App 的AI 能力对画面进行实时目标检测,自动定位、识别主体后,再利用图像算法对其进行智能自适应放大,使主体更突出、画面更聚焦。最后,对处理完成的视频进行编码与封装,即可输出经过优化的视频内容。


该方案适合拓展应用至生活各个场景中,如:

在室内监护中,可用于婴儿看护、宠物监测、宠物机器人等设备;

在医疗影像或科研中,可结合内镜或其他医疗设备突出术野关键区域;

在户外记录时,可用于智能喂鸟器、狩猎摄像机、自然景观摄像机等设备;

在安防与工业检测中,可用于巡检、维修等需要检查局部细节的设备。


a.例如针对家庭场景里的小猫,摄像头会自动识别主体并进行画面放大:

948192fe-15fb-11f0-9434-92fbcf53809c.png

(没有主体突出功能的视频画面)

94c12036-15fb-11f0-9434-92fbcf53809c.png

(有主体突出功能的视频画面)

b.在户外复杂场景下,涂鸦 On-App AI 视频主体方案依然能够精准识别目标对象,并进行动作追踪和画面放大。戳视频,直观体验生成效果:


二、详解涂鸦AI 视频主体突出技术

1、整体技术架构介绍

在涂鸦所有的 AI 产品/硬件解决方案中, 我们打通了端到端的 AI 能力:即设备端、云端、App 端三端协同。通过将先进的 AI 推理模型部署到涂鸦赋能 App 上,能够助力品牌商与开发者将先进的AI技术无缝集成到移动设备中,打造更灵活的 AI 架构、更优的用户体验、更安全的计算能力。


在移动端模型的部署中,涂鸦采用了轻量化技术架构TensorFlow Lite 等),这种技术架构的优势就在于具备高效推理、低延迟、低功耗等特点,并且支持本地模型实现离线运行、系统更新、部署等按需加载的机制,助力提高运行效率,打造更灵活的 AI 架构。

图像处理技术涂鸦采用了 OpenGL ES,可实现更高效的渲染与优化,充分利用 GPU 对图像处理过程进行加速;

视频编解码技术采用涂鸦平台提供的硬件解码,能够提升视频处理性能、降低 CPU 负载,确保视频流畅播放与低功耗运行。

951ad4b4-15fb-11f0-9434-92fbcf53809c.png

(涂鸦AI 视频主体突出技术架构图)


2、技术亮点

2.1 拥有更灵活的 AI 架构:轻量化和动态化

95352ac6-15fb-11f0-9434-92fbcf53809c.png

(轻量化与动态化运行流程示意图)

2.1.1 轻量级检测模型

涂鸦采用专门优化移动端的轻量级对象检测模型 EfficientDet-D0,该模型参数少、计算量小、推理速度快,可以精准检测视频中指定主体(如宠物、人物)的位置与类别。同时,基于智能分析能力可快速筛除无主体片段,有效降低计算负担,提升处理效率。



2.1.2 模型动态化

采用按需加载的动态模型管理机制,支持模型在线下载、更新与部署,确保视频应用始终使用最优模型版本,同时减少初始安装包体积,提高运行效率。



2.2 更优的用户体验:实时性和高效率

9549ef1a-15fb-11f0-9434-92fbcf53809c.png(AI实时数据处理流程示意图)

2.2.1实时交互处理

该方案支持实时响应用户的交互需求。依托本地计算的高效运行,可确保流畅无延迟的用户体验,无需依赖网络,即可实现快速响应与实时处理。



2.2.2 新增防抖图像算法

在检测视频主体位置的过程中,检测框可能会发生抖动偏移,从而导致主体放大的画面也会产生抖动;针对这一问题,涂鸦增加抖动阈值,确保视频处理画面时的平滑流畅。



2.2.3 微调模型以提高准确度

涂鸦积累了海量不同场景下的主体图片,覆盖不同光照条件下白天黑夜等多个场景,数据脱敏之后,涂鸦对这些模型进行精心的训练微调,确保模型推理过程中的泛化能力。



2.3 更安全的计算能力:低成本和隐私保护

955a108e-15fb-11f0-9434-92fbcf53809c.png(涂鸦 AI 端侧算力结构图)

2.3.1降低处理成本

涂鸦支持开发者动态调整视频帧的推理策略。在没有检测到视频主体的时候,系统会间隔多帧识别一帧;当检测到主体时,就会自动调整为间隔 3 帧检测一帧。这样就能充分利用移动端的硬件加速,显著提升视频编解码速度,降低 CPU 负载,提高整体性能。

而且,本地化处理相比云端处理的成本更低、更能节约云端负荷,算力消耗每万次减少 25 TFLOPs,节省成本约 10% 左右。



2.3.2 保护隐私安全

该方案的所有数据处理均在本地完成,显著降低时延、提高响应速度,同时避免数据外传,增强用户隐私保护,为应用提供更安全高效的计算环境。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    41963

    浏览量

    303029
  • IPC
    IPC
    +关注

    关注

    3

    文章

    384

    浏览量

    55127
  • 涂鸦智能
    +关注

    关注

    7

    文章

    327

    浏览量

    20784
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    涂鸦On-App AI视频通话隐私保护方案:最快3ms极速响应,双端守护隐私安全

    泄露的风险。而On-AppAI的机会就在这里:让App不只是“接通视频”,而是在通话瞬间自动保护用户隐私——模糊背景、突出人像,让每次通话
    的头像 发表于 05-07 18:20 141次阅读
    <b class='flag-5'>涂鸦</b><b class='flag-5'>On-App</b> <b class='flag-5'>AI</b><b class='flag-5'>视频</b>通话隐私保护<b class='flag-5'>方案</b>:最快3ms极速响应,双端守护隐私安全

    涂鸦智能举办2026开发者大会,三大AI应用生态首公开!

    深圳——4月23日,2026 TUYA全球开发者大会正式开幕,来自全球的数千名开发者、企业代表、技术专家们齐聚堂,携手打造AI应用生态。大会现场,全球AI云平台服务提供商涂鸦
    的头像 发表于 04-24 09:17 465次阅读
    <b class='flag-5'>涂鸦</b><b class='flag-5'>智能</b>举办2026开发者大会,三大<b class='flag-5'>AI</b>应用生态首公开!

    一键影像测量仪和全自动影像测量仪有什么区别?

    一键影像测量仪与全自动影像测量仪在操作、效率、适用工件以及功能上存在显著差异。作为国内领先的PCB测量仪器、智能检测设备专业解决方案供应商——班通科技自研有全
    的头像 发表于 03-31 09:25 1056次阅读
    <b class='flag-5'>一键</b>影像测量仪和全<b class='flag-5'>自动</b>影像测量仪有什么区别?

    涂鸦全新AI宠物门禁方案AI面部识别+低功耗设计,破解多宠进出与家庭防护双重难题

    智能推出全新低功耗AI宠物门禁方案,以“AI宠物面部识别”取代传统物理介质,通过设备端算法比对实现秒级精准开门,彻底解决宠物安全与家庭防护难
    的头像 发表于 03-26 18:18 355次阅读
    <b class='flag-5'>涂鸦</b><b class='flag-5'>全新</b><b class='flag-5'>AI</b>宠物门禁<b class='flag-5'>方案</b>:<b class='flag-5'>AI</b>面部识别+低功耗设计,破解多宠进出与家庭防护双重难题

    MAX9513:智能睡眠与双向视频支持的CVBS视频滤波器放大

    MAX9513:智能睡眠与双向视频支持的CVBS视频滤波器放大器 在当今的电子设备中,尤其是便携式设备,对于视频处理和电源管理有着极高的要求
    的头像 发表于 01-20 10:15 457次阅读

    瑞芯微SOC智能视觉AI处理器

    能力。核心升级: 增加了高规格的视频编码能力,支持H.264/H.265格式的4K@60fps编码。目标: 解决了RK1126只能“分析”不能“录制”的短板,成为个集视频采集、AI
    发表于 12-19 13:44

    基于DP1323EL的电动车解锁方案:超高速读写,提升电动车一键解锁体验

    靠近车辆时,APP自动检测信号强度,实现“无感解锁”。例如,用户步行接近电动车5米左右范围内,车辆仪表盘会自动亮起,解锁车锁;上车后,踩下刹车即可一键启动。这种
    发表于 11-10 17:45

    重磅!腾视科技新官网正式上线AI算力与智能解决方案一键直达

    AI算力模组到全栈智能解决方案,从技术研发到场景落地,腾视科技始终以 “前沿技术落地者” 为定位,助力产业智能化升级。新官网的上线,是我们与世界对话的新起点,未来,我们期待与更多伙伴
    的头像 发表于 10-11 10:57 1084次阅读
    重磅!腾视科技新官网正式<b class='flag-5'>上线</b>,<b class='flag-5'>AI</b>算力与<b class='flag-5'>智能解决方案</b><b class='flag-5'>一键</b>直达

    照片视频太普通?涂鸦On-App AI黑科技,让宠物/人像1秒C位出片!

    一键识别人/宠物并实现智能居中,点下就能让照片/视频秒变质感大片呢?01涂鸦助你一键生成氛围感
    的头像 发表于 08-14 18:55 1548次阅读
    照片<b class='flag-5'>视频</b>太普通?<b class='flag-5'>涂鸦</b><b class='flag-5'>On-App</b> <b class='flag-5'>AI</b>黑科技,让宠物/人像1秒C位出片!

    告别多设备!揭秘QM系列闪测仪如何一键搞定多元检测

    QM 系列一键闪测仪作为方案核心,搭载双视野双远心镜头与 2000 万像素 CMOS 传感器,测量精度可达 ±1μm。其内置的 AI 深度学习系统经过海量工业样本训练,能一键识别 50
    的头像 发表于 08-11 13:43 1258次阅读
    告别多设备!揭秘QM系列闪测仪如何<b class='flag-5'>一键</b>搞定多元检测

    AI视频分析系统

    方案背景人工智能大时代背景下,视频应用领域相关的行业应用方式已经发生了深刻的变化,各论安防监控还是各类垂直行业视频应用,都需要AI视觉分析与
    的头像 发表于 08-06 14:39 1111次阅读
    <b class='flag-5'>AI</b><b class='flag-5'>视频</b>分析系统

    SIP 广播对讲与华为视频会议融合解决方案

    ,实现通过视频会议终端发起广播任务,或在对讲终端触发紧急呼叫时,自动关联视频会议中的指定终端,如会议室终端或领导终端,发送告警信号。 功能联动 :在视频会议中可实时调用广播对讲功能,如
    发表于 07-12 10:57

    NVIDIA RTX Blackwell GPU为专业级视频剪辑提供加速

    42 摄像机正在消费级市场日益普及,它能够捕捉到比大多数标准摄像机高倍的颜色信息。与此同时,生成式 AI 视频模型的功能与质量均在迅速提升,使全新工具和工作流成为可能。
    的头像 发表于 07-04 15:00 1415次阅读

    HarmonyOS应用一键置灰指南

    一键置灰通常应用于如下场景 1. 重大悼念活动: 在国家发生重大灾难、事故或举行悼念日等特殊时期,为了表达对逝者的尊重和哀悼,许多 APP 会将界面置灰。例如,在些地震、空难等灾难事件发生后,以及
    的头像 发表于 06-27 00:08 771次阅读

    4K、多模态、长视频AI视频生成的下个战场,谁在领跑?

    电子发烧友网报道(文/李弯弯) 6月11日,豆包App上线视频生成模型豆包Seedance 1.0 pro。这是字节跳动最新视频模型,支持文字与图片输入,可生成多镜头无缝切换的1080
    的头像 发表于 06-16 00:13 7631次阅读