0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

音視頻技術(shù)開發(fā)之淺析

LiveVideoStack ? 來源:電子發(fā)燒友網(wǎng) ? 作者:工程師譚軍 ? 2018-07-09 14:15 ? 次閱讀

Hulu 視頻QoS優(yōu)化策略

QoS直接關(guān)系到用戶體驗,如何提升QoS就成為視頻平臺技術(shù)實力的體現(xiàn)。本文來自Hulu全球高級研發(fā)經(jīng)理、視頻編解碼與傳輸領(lǐng)域資深專家傅徳良在LiveVideoStackCon 2017上的分享。盡管Hulu提供服務(wù)的網(wǎng)絡(luò)環(huán)境與國內(nèi)大相徑庭,但其相關(guān)QoS保障策略依然值得借鑒。

微博短視頻服務(wù)優(yōu)化實踐

本文來自新浪微博視頻轉(zhuǎn)碼平臺技術(shù)負責人李成亞在LiveVideoStackCon 2017上的分享,由LiveVideoStack整理成文。李成亞分享了微博短視頻如何提升用戶體驗、降低成本的思路與實踐,包括提升短視頻發(fā)布速度,降低長視頻轉(zhuǎn)碼時間,通過新的Codec減少帶寬成本等。

熊貓TV直播H5播放器架構(gòu)探索

本文來自熊貓TV音視頻技術(shù)專家姜雨晴在LiveVideoStackCon 2017上的分享,并有LiveVideoStack整理成文。當下,打造一款播放器已經(jīng)有比較好的開源實現(xiàn),但熊貓TV為什么還要自研一款H5播放器呢?為了保證業(yè)務(wù)持續(xù)擴展能力,需要對播放器做解耦。同時,在播放器上線初期還遇到了音畫不同步、故障定位、客戶端性能不足等問題。

Dubbo源碼分析 -- 遠程通信 Netty

Dubbo 做為 RPC 框架,需要進行跨 JVM 通信,要保證高性、穩(wěn)定的進行遠程通信。Dubbo 底層通信選擇了 Netty 這個 NIO 框架做為默認的網(wǎng)絡(luò)通信框架并且通過自定義協(xié)議進行通信。

中國電信發(fā)布全球首份5G技術(shù)白皮書

2018年6月26日,中國電信在2018上海世界移動大會(MWCS)上發(fā)布了《中國電信5G技術(shù)白皮書》,這也是全球MNO運營商首次發(fā)布全面闡述5G技術(shù)觀點和總體策略的白皮書。

音頻開源代碼中重采樣算法的評估與選擇

在音頻軟件實現(xiàn)中經(jīng)常會遇到兩個模塊采樣率不一致的情況,比如語音通話時采集到的PCM信號是16k Hz的,但編碼時codec是AMR-NB(AMR-NB是8k Hz采樣),這時就需要把16k Hz采樣的PCM值轉(zhuǎn)換成8k Hz采樣的PCM值(這叫降采樣或者下采樣),然后再去做AMR-NB編碼。本文介紹如何評估開源代碼里的重采樣實現(xiàn)以及選擇最適合的實現(xiàn)。

音頻/視頻技術(shù)

Google 實時流擁塞控制算法GCCx1wan

GCC是google實時流擁塞控制算法的簡稱,已經(jīng)在WebRTC中實現(xiàn),應(yīng)用于Chrome,后面將應(yīng)用到Hangouts(視頻聊天產(chǎn)品)中,主要用于視頻流的擁塞控制。

FFmpeg中的scale和crop參數(shù)FlyingPenguin

FFmpeg中的libavfilter提供了一整套的基于filter的機制。filter本身是一個插件的形式,可以快速的組裝需要的效果。本文簡單介紹了通過filter實現(xiàn)視頻的水平鏡像效果。

iOS中獲取音頻流并提取pcmCNon

本文簡要介紹了兩種不同的原始音頻流獲取方式 AVCaptureSession、AudioUnit,以及如何從AudioUnit獲取的原始數(shù)據(jù)中提取pcm。

用getDisplayMedia實現(xiàn)在Chrome中共享屏幕

Chrome網(wǎng)上商店已決定停止允許Chrome擴展程序的內(nèi)聯(lián)安裝。這對WebRTC應(yīng)用程序有相當大的影響,因為Chrome中的屏幕共享目前還需要擴展程序。getDisplayMedia能來解決這個問題嗎?本文來自appear.in的WebRTC工程師Philipp Hancke,LiveVideoStack對文章進行了摘譯。

編解碼

基于鏡頭的編碼

基于鏡頭的編碼比基于主題的編碼帶來更高的編碼效率,由于對內(nèi)容感知的粒度更加細,這種改變的結(jié)果顯而易見。然而,更細粒度的編碼也會帶來更高的負責度,比如在AWS環(huán)境中,在基礎(chǔ)設(shè)施服務(wù)失效的情況下,如何最大限度的保留已編碼的成果,從而減少重復編碼工作。本文來自Netflix的科技博客,LiveVideoStack對原文進行了摘譯。

視頻編碼步入更壓縮高性能時代

目前,針對海量多媒體數(shù)據(jù)的壓縮和處理,特別是VR和HDR視頻數(shù)據(jù),開發(fā)并提出新的高性能codec及處理方案是多媒體通信應(yīng)用行業(yè)共同面臨的難題。MPEG已經(jīng)開始著手更新一代視頻編解碼標準VVC的制定,視頻壓縮性能有望進一步大幅提高。在此背景下,本文簡要梳理一下當前針對大規(guī)模多媒體數(shù)據(jù)的高效壓縮技術(shù)。

JavaScript 編寫 MPEG1 解碼器柒緣生活吧

本文主要介紹了用JavaScript編寫MPEG1解碼器的開發(fā)過程中的一系列問題:JSMpeg中實現(xiàn)音頻流傳輸?shù)倪壿嫿M件構(gòu)成及流程,MPEG內(nèi)部的YUV格式轉(zhuǎn)換等。

UIImage圖片解碼的性能優(yōu)化吳家十三少

用 UIImage 或 CGImageSource 的那幾個方法創(chuàng)建圖片時,圖片數(shù)據(jù)并不會立刻解碼。圖片設(shè)置到 UIImageView 或者 CALayer.contents 中去,并且 CALayer 被提交到 GPU 前,CGImage 中的數(shù)據(jù)才會得到解碼。本文主要介紹了圖片解碼時產(chǎn)生的性能問題及優(yōu)化。

Android音視頻系列:H264視頻編碼介紹

本文從配置編碼參數(shù)、輸入要編碼的圖像幀、編碼數(shù)據(jù)生成等方面介紹了使用X264開源庫編碼的H264視頻編碼技術(shù)。

AI智能

簡單初始化,訓練10000層CNN

如何快速簡單地訓練神經(jīng)網(wǎng)絡(luò)?谷歌大腦研究人員研究了CNN的可訓練性,提出了一種簡單的初始化策略,不需要使用殘差連接或批標準化,就能訓練10000層的原始CNN。作者表示,他們的這項工作清除了在訓練任意深度的原始卷積網(wǎng)絡(luò)時存在的所有主要的障礙。

步態(tài)識別的深度學習:綜述

步態(tài)是人在行走過程中姿態(tài)的變化.不同于人臉、指紋、虹膜等, 步態(tài)是唯一可在遠距離非受控狀態(tài)下獲得的生物特征.步態(tài)識別指利用步態(tài)信息對人的身份進行識別的技術(shù),當前關(guān)于步態(tài)識別方面的研究綜述主要圍繞在相關(guān)手工特征建模和傳統(tǒng)機器學習(非深度學習)的識別算法上.

卷積神經(jīng)網(wǎng)絡(luò)的壓縮和加速

本文介紹了比較常見的4種卷積神經(jīng)網(wǎng)絡(luò)壓縮和加速方法,其中網(wǎng)絡(luò)裁枝與低秩估計的方法從矩陣乘法角度,著眼于減少標量乘法和加法個數(shù)來實現(xiàn)模型壓縮和加速的;而模型量化則是著眼于參數(shù)本身,直接減少每個參數(shù)的存儲空間,提升每次標量乘法和加法的速度,從而實現(xiàn)模型的壓縮和加速;模型蒸餾方法卻是從宏觀結(jié)構(gòu)入手,直接構(gòu)造了結(jié)構(gòu)簡單,參數(shù)少的小網(wǎng)絡(luò),將難點轉(zhuǎn)移成對小網(wǎng)絡(luò)的訓練上。

場景文本檢測—CTPN算法介紹

對于復雜環(huán)境中的字符的識別,主要包括文字檢測和文字識別兩個步驟,這里介紹的CTPN(Detecting Text in Natural Image with Connectionist Text Proposal Network)方法就是在場景中提取文字的一個效果較好的算法,能將自然環(huán)境中的文本信息位置加以檢測。

圖像

騰訊優(yōu)圖CVPR 2018論文:圖片去模糊及快速肖像處理等多項技術(shù)解讀

在慢速曝光或快速運動拍攝照片時,圖像模糊常常困擾著照片拍攝者。騰訊優(yōu)圖實驗室的新算法,可以處理非特定場景中的圖片模糊。算法基于一種被稱為「動態(tài)模糊」的模糊模型假設(shè)。

使用 MATLAB 圖像處理算法,視頻實時加持藍天背景

本文將以色度鍵控效果為例,介紹在嵌入式硬件上部署 MATLAB 圖像處理算法的簡單工作流。我們將使用 MATLAB Coder? 通過算法生成C代碼,然后使用在硬件上運行的實用程序在 Raspberry Pi 板卡上進行算法原型驗證。最后,我們將算法移植至 NVIDIA Jetson Tx1 平臺以保證實時性能。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • Google
    +關(guān)注

    關(guān)注

    5

    文章

    1752

    瀏覽量

    57334
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29438

    瀏覽量

    267768
  • 視頻編碼
    +關(guān)注

    關(guān)注

    2

    文章

    112

    瀏覽量

    20995
  • javascript
    +關(guān)注

    關(guān)注

    0

    文章

    515

    瀏覽量

    53728
  • 5G
    5G
    +關(guān)注

    關(guān)注

    1352

    文章

    48266

    瀏覽量

    562605

原文標題:音視頻技術(shù)開發(fā)周刊 56期

文章出處:【微信號:livevideostack,微信公眾號:LiveVideoStack】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    盤點那些常見音視頻接口

    我們熟知的一些常見音視頻接口,發(fā)展至今在日常使用中已經(jīng)漸漸少了。但是在工業(yè)領(lǐng)域的音視頻連接,依然能看到其身影。這些看似消失的接口,它們現(xiàn)在發(fā)展成什么樣子了?本期我們將做一個大盤點。
    的頭像 發(fā)表于 09-09 14:34 ?333次閱讀

    常見音視頻接口的靜電浪涌防護和濾波方案

    音視頻接口在現(xiàn)代多媒體設(shè)備中扮演著至關(guān)重要的角色,它們確保了音視頻信號在不同設(shè)備間的順暢傳輸,各種類型的音視頻接口滿足了多樣化的應(yīng)用場景需求。 在音視頻接口的設(shè)計領(lǐng)域,靜電浪涌防護與濾
    的頭像 發(fā)表于 06-25 11:28 ?533次閱讀

    音視頻IP化浪潮全面來襲,分布式系統(tǒng)開創(chuàng)音視頻行業(yè)新時代!

    在傳統(tǒng)音視頻頻系統(tǒng)中,廠商們各自采用不同的通訊方式和控制協(xié)議,這使得不同的產(chǎn)品之間就像一座座的信息孤島,要連接起來就需要復雜的轉(zhuǎn)換設(shè)備和系統(tǒng)再開發(fā)。隨著音視頻項目的規(guī)模不斷擴大,各類音頻設(shè)備產(chǎn)品
    的頭像 發(fā)表于 05-30 16:55 ?574次閱讀

    音視頻產(chǎn)品EMC整改案例解析

    音視頻產(chǎn)品EMCRE整改案例解析
    的頭像 發(fā)表于 05-20 16:49 ?327次閱讀
    <b class='flag-5'>音視頻</b>產(chǎn)品EMC整改案例解析

    【RTC程序設(shè)計:實時音視頻權(quán)威指南】音視頻的編解碼壓縮技術(shù)

    音視頻所載有的信息在通過傳輸?shù)臅r候就需要壓縮編碼。 其中,文本壓縮是指通過使用各種算法和技術(shù),將文本數(shù)據(jù)表示為更緊湊的形式,以減少存儲空間。 霍夫曼編碼是一種無損壓縮算法,它可以根據(jù)字符出現(xiàn)
    發(fā)表于 04-28 21:04

    音視頻SoC與AI技術(shù)融合,帶來更智能的音視頻處理解決方案

    ,如WiFi路由器和物聯(lián)網(wǎng)設(shè)備。在安防、智能音頻等領(lǐng)域,對SoC芯片的算力要求相比智能手機、服務(wù)器等略低。 ? 人工智能技術(shù)音視頻SoC 的融合??????????????????????????????????????? ? 隨著人工智能
    的頭像 發(fā)表于 04-26 01:20 ?3989次閱讀

    【RTC程序設(shè)計:實時音視頻權(quán)威指南】音頻采集與預處理

    閑暇之余,繼續(xù)學習【RTC程序設(shè)計:實時音視頻權(quán)威指南】這本書。 書中對于音頻采集的介紹非常詳細和全面,包括原理、方法、技術(shù)細節(jié)以及實踐應(yīng)用等方面的內(nèi)容。 音頻采集是實時音視頻通信中的關(guān)鍵步驟之一
    發(fā)表于 04-25 10:41

    【RTC程序設(shè)計:實時音視頻權(quán)威指南】新書一瞥

    本人從事音視頻領(lǐng)域的開發(fā),經(jīng)常接觸實時音視頻處理相關(guān)的技術(shù),看到這本書非常有興趣閱讀,這本書全面介紹實時音視頻(RTC)
    發(fā)表于 04-22 09:09

    【RTC程序設(shè)計:實時音視頻權(quán)威指南】本書概覽

    ,這都是按照音視頻流的開發(fā)的一般流程介紹的。然后介紹了編解碼以上所技術(shù),信令與媒體協(xié)商(個人覺得協(xié)商這里用協(xié)議更合適,因為里面講解的是各種音視頻傳輸?shù)膮f(xié)議)。然后是控制傳輸優(yōu)化,可擴展
    發(fā)表于 04-21 17:09

    音視頻解碼生成:打造極致觀影體驗的關(guān)鍵技術(shù)

    在現(xiàn)代多媒體時代,音視頻解碼生成技術(shù)已成為提供極致觀影體驗的核心要素。它不僅能夠確保音視頻數(shù)據(jù)的高效傳輸,還能保證播放的流暢性和畫質(zhì)清晰度,為用戶帶來身臨其境的觀影享受。 1. 解碼生成的重要性
    的頭像 發(fā)表于 02-25 14:43 ?389次閱讀

    音視頻解碼生成在多媒體制作中的應(yīng)用

    音視頻解碼生成是多媒體制作中不可或缺的一部分,它扮演著將編碼的音視頻數(shù)據(jù)轉(zhuǎn)化為可播放、可編輯的內(nèi)容的關(guān)鍵角色。在多媒體制作的全過程中,音視頻解碼生成技術(shù)都有廣泛的應(yīng)用。 1.
    的頭像 發(fā)表于 02-21 14:39 ?326次閱讀

    音視頻解碼生成與流媒體傳輸?shù)慕Y(jié)合

    音視頻解碼生成與流媒體傳輸是現(xiàn)代數(shù)字媒體技術(shù)中兩個不可或缺的部分,它們的結(jié)合為用戶提供了高質(zhì)量、實時性的多媒體體驗。 1. 解碼生成與流媒體傳輸?shù)年P(guān)系 解碼生成是流媒體傳輸?shù)那疤?。在流媒體服務(wù)中
    的頭像 發(fā)表于 02-21 14:36 ?330次閱讀

    音視頻

    音視頻技術(shù)都喜歡深究內(nèi)部最核心的原理和機制,尤其是ffmpeg這個編解碼庫,可以說是音視頻領(lǐng)域事實上的標準。語音智能算法,語言語義分析和理解,流媒體服務(wù)器等高端技術(shù)也都基于它而構(gòu)建。
    發(fā)表于 11-23 08:51

    關(guān)于手機端音視頻技術(shù)的思考與經(jīng)驗

    提起手機音視頻,大家的第一印象可能是上面列舉的抖音、快手、愛奇藝和小米視頻等在線視頻平臺,其中我們的小米視頻是一個聚合平臺,用戶可以通過它觀看各大流媒體平臺的
    發(fā)表于 11-17 09:43 ?749次閱讀
    關(guān)于手機端<b class='flag-5'>音視頻</b><b class='flag-5'>技術(shù)</b>的思考與經(jīng)驗

    ESP RTC音視頻傳輸延遲測試

    音視頻
    Kevincoooool
    發(fā)布于 :2023年11月11日 10:54:02