0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

音视频技术开发之浅析

LiveVideoStack 来源:电子发烧友网 作者:工程师谭军 2018-07-09 14:15 次阅读

Hulu 视频QoS优化策略

QoS直接关系到用户体验,如何提升QoS就成为视频平台技术实力的体现。本文来自Hulu全球高级研发经理、视频编解码与传输领域资深专家傅徳良在LiveVideoStackCon 2017上的分享。尽管Hulu提供服务的网络环境与国内大相径庭,但其相关QoS保障策略依然值得借鉴。

微博短视频服务优化实践

本文来自新浪微博视频转码平台技术负责人李成亚在LiveVideoStackCon 2017上的分享,由LiveVideoStack整理成文。李成亚分享了微博短视频如何提升用户体验、降低成本的思路与实践,包括提升短视频发布速度,降低长视频转码时间,通过新的Codec减少带宽成本等。

熊猫TV直播H5播放器架构探索

本文来自熊猫TV音视频技术专家姜雨晴在LiveVideoStackCon 2017上的分享,并有LiveVideoStack整理成文。当下,打造一款播放器已经有比较好的开源实现,但熊猫TV为什么还要自研一款H5播放器呢?为了保证业务持续扩展能力,需要对播放器做解耦。同时,在播放器上线初期还遇到了音画不同步、故障定位、客户端性能不足等问题。

Dubbo源码分析 -- 远程通信 Netty

Dubbo 做为 RPC 框架,需要进行跨 JVM 通信,要保证高性、稳定的进行远程通信。Dubbo 底层通信选择了 Netty 这个 NIO 框架做为默认的网络通信框架并且通过自定义协议进行通信。

中国电信发布全球首份5G技术白皮书

2018年6月26日,中国电信在2018上海世界移动大会(MWCS)上发布了《中国电信5G技术白皮书》,这也是全球MNO运营商首次发布全面阐述5G技术观点和总体策略的白皮书。

音频开源代码中重采样算法的评估与选择

在音频软件实现中经常会遇到两个模块采样率不一致的情况,比如语音通话时采集到的PCM信号是16k Hz的,但编码时codec是AMR-NB(AMR-NB是8k Hz采样),这时就需要把16k Hz采样的PCM值转换成8k Hz采样的PCM值(这叫降采样或者下采样),然后再去做AMR-NB编码。本文介绍如何评估开源代码里的重采样实现以及选择最适合的实现。

音频/视频技术

Google 实时流拥塞控制算法GCCx1wan

GCC是google实时流拥塞控制算法的简称,已经在WebRTC中实现,应用于Chrome,后面将应用到Hangouts(视频聊天产品)中,主要用于视频流的拥塞控制。

FFmpeg中的scale和crop参数FlyingPenguin

FFmpeg中的libavfilter提供了一整套的基于filter的机制。filter本身是一个插件的形式,可以快速的组装需要的效果。本文简单介绍了通过filter实现视频的水平镜像效果。

iOS中获取音频流并提取pcmCNon

本文简要介绍了两种不同的原始音频流获取方式 AVCaptureSession、AudioUnit,以及如何从AudioUnit获取的原始数据中提取pcm。

用getDisplayMedia实现在Chrome中共享屏幕

Chrome网上商店已决定停止允许Chrome扩展程序的内联安装。这对WebRTC应用程序有相当大的影响,因为Chrome中的屏幕共享目前还需要扩展程序。getDisplayMedia能来解决这个问题吗?本文来自appear.in的WebRTC工程师Philipp Hancke,LiveVideoStack对文章进行了摘译。

编解码

基于镜头的编码

基于镜头的编码比基于主题的编码带来更高的编码效率,由于对内容感知的粒度更加细,这种改变的结果显而易见。然而,更细粒度的编码也会带来更高的负责度,比如在AWS环境中,在基础设施服务失效的情况下,如何最大限度的保留已编码的成果,从而减少重复编码工作。本文来自Netflix的科技博客,LiveVideoStack对原文进行了摘译。

视频编码步入更压缩高性能时代

目前,针对海量多媒体数据的压缩和处理,特别是VR和HDR视频数据,开发并提出新的高性能codec及处理方案是多媒体通信应用行业共同面临的难题。MPEG已经开始着手更新一代视频编解码标准VVC的制定,视频压缩性能有望进一步大幅提高。在此背景下,本文简要梳理一下当前针对大规模多媒体数据的高效压缩技术。

JavaScript 编写 MPEG1 解码器柒缘生活吧

本文主要介绍了用JavaScript编写MPEG1解码器的开发过程中的一系列问题:JSMpeg中实现音频流传输的逻辑组件构成及流程,MPEG内部的YUV格式转换等。

UIImage图片解码的性能优化吴家十三少

用 UIImage 或 CGImageSource 的那几个方法创建图片时,图片数据并不会立刻解码。图片设置到 UIImageView 或者 CALayer.contents 中去,并且 CALayer 被提交到 GPU 前,CGImage 中的数据才会得到解码。本文主要介绍了图片解码时产生的性能问题及优化。

Android音视频系列:H264视频编码介绍

本文从配置编码参数、输入要编码的图像帧、编码数据生成等方面介绍了使用X264开源库编码的H264视频编码技术。

AI智能

简单初始化,训练10000层CNN

如何快速简单地训练神经网络?谷歌大脑研究人员研究了CNN的可训练性,提出了一种简单的初始化策略,不需要使用残差连接或批标准化,就能训练10000层的原始CNN。作者表示,他们的这项工作清除了在训练任意深度的原始卷积网络时存在的所有主要的障碍。

步态识别的深度学习:综述

步态是人在行走过程中姿态的变化.不同于人脸、指纹、虹膜等, 步态是唯一可在远距离非受控状态下获得的生物特征.步态识别指利用步态信息对人的身份进行识别的技术,当前关于步态识别方面的研究综述主要围绕在相关手工特征建模和传统机器学习(非深度学习)的识别算法上.

卷积神经网络的压缩和加速

本文介绍了比较常见的4种卷积神经网络压缩和加速方法,其中网络裁枝与低秩估计的方法从矩阵乘法角度,着眼于减少标量乘法和加法个数来实现模型压缩和加速的;而模型量化则是着眼于参数本身,直接减少每个参数的存储空间,提升每次标量乘法和加法的速度,从而实现模型的压缩和加速;模型蒸馏方法却是从宏观结构入手,直接构造了结构简单,参数少的小网络,将难点转移成对小网络的训练上。

场景文本检测—CTPN算法介绍

对于复杂环境中的字符的识别,主要包括文字检测和文字识别两个步骤,这里介绍的CTPN(Detecting Text in Natural Image with Connectionist Text Proposal Network)方法就是在场景中提取文字的一个效果较好的算法,能将自然环境中的文本信息位置加以检测。

图像

腾讯优图CVPR 2018论文:图片去模糊及快速肖像处理等多项技术解读

在慢速曝光或快速运动拍摄照片时,图像模糊常常困扰着照片拍摄者。腾讯优图实验室的新算法,可以处理非特定场景中的图片模糊。算法基于一种被称为「动态模糊」的模糊模型假设。

使用 MATLAB 图像处理算法,视频实时加持蓝天背景

本文将以色度键控效果为例,介绍在嵌入式硬件上部署 MATLAB 图像处理算法的简单工作流。我们将使用 MATLAB Coder™ 通过算法生成C代码,然后使用在硬件上运行的实用程序在 Raspberry Pi 板卡上进行算法原型验证。最后,我们将算法移植至 NVIDIA Jetson Tx1 平台以保证实时性能。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Google
    +关注

    关注

    5

    文章

    1762

    浏览量

    57479
  • AI
    AI
    +关注

    关注

    87

    文章

    30541

    浏览量

    268759
  • 视频编码
    +关注

    关注

    2

    文章

    113

    浏览量

    21018
  • javascript
    +关注

    关注

    0

    文章

    516

    浏览量

    53834
  • 5G
    5G
    +关注

    关注

    1354

    文章

    48403

    浏览量

    563806

原文标题:音视频技术开发周刊 56期

文章出处:【微信号:livevideostack,微信公众号:LiveVideoStack】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    AMS-HE200:HDMI音视频网络延长器,开启传输新时代

    在数字化时代,高清音视频传输已经成为各行各业不可或缺的重要技术。无论是安防监控、视频会议,还是户外广告、家庭影院,高清音视频信号的无缝传输都扮演着至关重要的角色。深圳市程达科技有限公司
    的头像 发表于 11-27 10:04 111次阅读
    AMS-HE200:HDMI<b class='flag-5'>音视频</b>网络延长器,开启传输新时代

    dm368录制音视频后用vlc播放不同步是怎么回事?

    目前我们用其他的开发板 能够录制音视频,但是用vlc播放的时候发现每次都是视频播放完成了音频还要播放一会,随着录制时间加上,延后的这个时间也会变长 请问有知道怎么回事的吗?
    发表于 10-15 06:56

    盘点那些常见音视频接口

    我们熟知的一些常见音视频接口,发展至今在日常使用中已经渐渐少了。但是在工业领域的音视频连接,依然能看到其身影。这些看似消失的接口,它们现在发展成什么样子了?本期我们将做一个大盘点。
    的头像 发表于 09-09 14:34 497次阅读

    常见音视频接口的静电浪涌防护和滤波方案

    音视频接口在现代多媒体设备中扮演着至关重要的角色,它们确保了音视频信号在不同设备间的顺畅传输,各种类型的音视频接口满足了多样化的应用场景需求。 在音视频接口的设计领域,静电浪涌防护与滤
    的头像 发表于 06-25 11:28 631次阅读

    音视频IP化浪潮全面来袭,分布式系统开创音视频行业新时代!

    在传统音视频频系统中,厂商们各自采用不同的通讯方式和控制协议,这使得不同的产品之间就像一座座的信息孤岛,要连接起来就需要复杂的转换设备和系统再开发。随着音视频项目的规模不断扩大,各类音频设备产品
    的头像 发表于 05-30 16:55 665次阅读

    音视频产品EMC整改案例解析

    音视频产品EMCRE整改案例解析
    的头像 发表于 05-20 16:49 396次阅读
    <b class='flag-5'>音视频</b>产品EMC整改案例解析

    【RTC程序设计:实时音视频权威指南】音视频的编解码压缩技术

    音视频所载有的信息在通过传输的时候就需要压缩编码。 其中,文本压缩是指通过使用各种算法和技术,将文本数据表示为更紧凑的形式,以减少存储空间。 霍夫曼编码是一种无损压缩算法,它可以根据字符出现
    发表于 04-28 21:04

    音视频SoC与AI技术融合,带来更智能的音视频处理解决方案

    ,如WiFi路由器和物联网设备。在安防、智能音频等领域,对SoC芯片的算力要求相比智能手机、服务器等略低。   人工智能技术音视频SoC 的融合                                          随着人工智能
    的头像 发表于 04-26 01:20 4282次阅读

    【RTC程序设计:实时音视频权威指南】音频采集与预处理

    闲暇之余,继续学习【RTC程序设计:实时音视频权威指南】这本书。 书中对于音频采集的介绍非常详细和全面,包括原理、方法、技术细节以及实践应用等方面的内容。 音频采集是实时音视频通信中的关键步骤之一
    发表于 04-25 10:41

    【RTC程序设计:实时音视频权威指南】新书一瞥

    本人从事音视频领域的开发,经常接触实时音视频处理相关的技术,看到这本书非常有兴趣阅读,这本书全面介绍实时音视频(RTC)
    发表于 04-22 09:09

    【RTC程序设计:实时音视频权威指南】本书概览

    ,这都是按照音视频流的开发的一般流程介绍的。然后介绍了编解码以上所技术,信令与媒体协商(个人觉得协商这里用协议更合适,因为里面讲解的是各种音视频传输的协议)。然后是控制传输优化,可扩展
    发表于 04-21 17:09

    音视频解码生成:打造极致观影体验的关键技术

    在现代多媒体时代,音视频解码生成技术已成为提供极致观影体验的核心要素。它不仅能够确保音视频数据的高效传输,还能保证播放的流畅性和画质清晰度,为用户带来身临其境的观影享受。 1. 解码生成的重要性
    的头像 发表于 02-25 14:43 458次阅读

    音视频解码器优化技巧:提升播放体验的关键步骤

    随着数字多媒体内容的爆炸式增长,音视频解码器在现代技术生活中扮演着至关重要的角色。从流畅的在线视频流播放到高质量的本地文件解码,解码器的性能直接影响了我们的观看体验。那么,如何优化音视频
    的头像 发表于 02-21 14:45 784次阅读

    音视频解码生成在多媒体制作中的应用

    音视频解码生成是多媒体制作中不可或缺的一部分,它扮演着将编码的音视频数据转化为可播放、可编辑的内容的关键角色。在多媒体制作的全过程中,音视频解码生成技术都有广泛的应用。 1.
    的头像 发表于 02-21 14:39 366次阅读

    音视频解码生成与流媒体传输的结合

    音视频解码生成与流媒体传输是现代数字媒体技术中两个不可或缺的部分,它们的结合为用户提供了高质量、实时性的多媒体体验。 1. 解码生成与流媒体传输的关系 解码生成是流媒体传输的前提。在流媒体服务中
    的头像 发表于 02-21 14:36 384次阅读