0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AVA新技術(shù)讓劇照清晰又好看

LiveVideoStack ? 來源:未知 ? 作者:楊鑫 ? 2018-03-06 15:04 ? 次閱讀

電影、劇集等視頻的創(chuàng)作、生產(chǎn)、分銷等環(huán)節(jié)已經(jīng)可以通過算法優(yōu)化提升效率。Netflix的AVA平臺可以自動的甄選最有代表性的劇照,從而針對不同人群推送最能打動觀眾的劇照。

在Netflix公司,無論是內(nèi)容平臺工程師團(tuán)隊(duì),還是全球產(chǎn)品創(chuàng)意團(tuán)隊(duì)都知道,觀眾在尋找新的節(jié)目和電影觀看時,封面插圖扮演著非常重要的角色。我們可以透過封面插圖,揭示故事的獨(dú)特元素,而這些元素將我們的觀眾與不同的角色和故事線索聯(lián)系起來。我們?yōu)榇烁械胶茏院?。隨著我們的原創(chuàng)內(nèi)容不斷增多,我們的技術(shù)專家的任務(wù)是尋找新的方式來處理不多擴(kuò)展的資源,并使我們的創(chuàng)意可以擺脫不斷增長的令人厭煩的數(shù)字宣傳需求。其中的一個方法是直接從我們的源視頻中采集靜態(tài)圖像幀,以提供更加靈活的原始插圖來源。

商業(yè)案例

宣傳劇照是直接從源視頻內(nèi)容中獲取的靜態(tài)視頻幀,用于擴(kuò)大Netflix服務(wù)的標(biāo)題范圍。在一個一小時的新劇集中,有近86,000個靜態(tài)視頻幀。

通常來說,這些宣傳劇照是由影片的策劃人或編輯人工選擇的,他們需要對打算呈現(xiàn)的源內(nèi)容有深入的了解。通過A / B測試我們了解到,通過盡可能多地變換各種不同的標(biāo)題,我們可以有效地推動預(yù)期和意外受眾群體進(jìn)行更多地觀看。說到標(biāo)題藝術(shù),我們喜歡測試一個標(biāo)題的許多藝術(shù)表現(xiàn)形式,以便為正確的觀眾找到“正確的”作品插圖。雖然這為創(chuàng)新和測試提供了一個令人興奮的機(jī)會,但它同時也提出了一個非常嚴(yán)峻的挑戰(zhàn),即在我們不斷增長的全球內(nèi)容目錄中的每個標(biāo)題上實(shí)踐這種體驗(yàn)。

AVA

AVA是一個工具和算法的集合,旨在從我們服務(wù)的視頻中提取高質(zhì)量的圖像。平均一個電視節(jié)目(約10集)包含近900萬個總幀數(shù)。要求創(chuàng)意編輯們從許多視頻幀中有效篩選出來一個能夠吸引觀眾注意力的視頻幀是乏味并且缺乏效率的。我們著手構(gòu)建了一個工具,能夠快速有效地識別Netflix服務(wù)上哪些幀能夠最佳地表達(dá)主題和標(biāo)題。

為了實(shí)現(xiàn)這個目標(biāo),我們首先提出了客觀信號,它可以促使我們使用幀注解來衡量視頻的每一幀。因此,我們可以收集視頻的每個幀的有效表示。隨后,我們創(chuàng)建了排序算法,使我們能夠?qū)Ψ蠈徝?、?chuàng)意和多樣性目標(biāo)的視頻幀子集進(jìn)行排序,以準(zhǔn)確地為我們產(chǎn)品的各種畫面呈現(xiàn)內(nèi)容。

由AVA提供的備選圖像

從源視頻到編輯備選圖像的高級階段

幀注解

作為我們自動化流水線的一部分,我們在視頻的每個幀中都處理和注釋不同的變量,以便最好地得出幀的內(nèi)容,并理解該幀對于故事是否重要。為了進(jìn)行橫向擴(kuò)展,并為不斷增長的內(nèi)容目錄提供可預(yù)測的SLA,我們利用Archer框架更有效地處理視頻。Archer允許我們把視頻分成更小的可以并行處理的視頻塊。這使我們能夠通過提高視頻處理流水線的效率來擴(kuò)展規(guī)模,并允許我們將越來越多的內(nèi)容智能算法集成到我們的工具集中。

通過一系列計(jì)算機(jī)視覺算法處理一段內(nèi)容中的每一幀視頻,以收集客觀幀元數(shù)據(jù)、幀的潛在表示,以及這些幀所包含的一些上下文元數(shù)據(jù)。我們處理和應(yīng)用到視頻幀的注解屬性大致可以分為三大類:

視覺元數(shù)據(jù)

通常這些屬性是客觀的、可測量的,并且主要包含在像素級。視覺屬性包括亮度、顏色、對比度和運(yùn)動模糊等等。

我們在幀級捕獲到的一些視覺屬性的例子。

上下文元數(shù)據(jù)

上下文元數(shù)據(jù)由多個元素的組合組成,這些元素被聚合以從幀的角色、對象和攝影機(jī)的動作或移動中獲得含義。下面是一些例子:

人臉識別。使用面部特征跟蹤、姿態(tài)估計(jì)和情感分析技術(shù) —— 這使我們能夠估計(jì)該幀中主體的姿勢和情緒。

運(yùn)動估計(jì)—— 這使我們能夠估計(jì)特定鏡頭中包含的運(yùn)動量(包括攝影機(jī)運(yùn)動和主體運(yùn)動)。這使我們能夠控制諸如運(yùn)動模糊之類的元素,以及識別產(chǎn)生高質(zhì)量靜止圖像的攝影機(jī)移動。

攝影機(jī)拍攝識別—— (例如,近距離拍攝與移動攝影車拍攝)這提供了對電影攝影師意圖的洞察,使我們能夠快速識別并顯現(xiàn)出攝影師選擇的體裁風(fēng)格,以提供對主題表達(dá)的情緒、基調(diào)和流派的更深入洞察。

對象檢測—— 道具和動畫對象的分割檢測使我們能夠找到該幀中重要的非人類主體。

面部特征和姿勢估計(jì)的例子; 我們用一些因子來檢測幀特征,發(fā)現(xiàn)有令人信服的面部表情出現(xiàn)。

用于預(yù)測攝影機(jī)運(yùn)動的光流分析示例,以估計(jì)Black Mirror的拍攝手法(縮小和平移鏡頭)。

構(gòu)圖元數(shù)據(jù)

構(gòu)圖元數(shù)據(jù)是指我們根據(jù)攝影、電影拍攝和視覺美學(xué)設(shè)計(jì)中的一些核心原理確定和定義的一組特殊的啟發(fā)式特征。有一些構(gòu)圖的基本原則:三分法原則、景深原則和對稱原則。

對象檢測和語義分割的例子,以識別三分法美學(xué)的前景對象。

圖像排名

在給定視頻中的每一幀都經(jīng)過處理和注解后,下一步就是通過一個自動藝術(shù)品流水線從這些幀中選出最佳的候選圖像。這樣,當(dāng)我們的創(chuàng)意團(tuán)隊(duì)準(zhǔn)備好開始一段內(nèi)容的工作時,他們會自動提供一個高質(zhì)量的圖像集供您選擇。下面,我們概述一些我們用來為給定標(biāo)題提供最佳圖像的關(guān)鍵考慮元素。

演員

演員在藝術(shù)品中起著非常重要的作用。我們確定給定情節(jié)的關(guān)鍵角色的一種方法是利用臉部聚類和角色識別的組合來對主要角色,而不是次要角色或額外角色進(jìn)行優(yōu)先順序。為了達(dá)到這個目的,我們訓(xùn)練了一個深度學(xué)習(xí)模型,從所有符合幀注解的候選幀中追蹤面部相似性,以找到并排序該標(biāo)題的主要演員,而不知道該劇演員的任何情況。

除了演員重要性之外,我們還會考慮演員的姿勢,面部標(biāo)志以及角色的整體位置。

Wynona Ryder出演Joyce Byers時的幀排名和最佳選擇范例。

由于次優(yōu)的面部表情、姿勢和動作模糊而排名較低的圖像的示例

幀分類

創(chuàng)意和視覺分類是一個非常主觀的學(xué)科,因?yàn)橛泻芏嗖煌姆绞絹砀兄投x圖像的多樣性。在該解決方案中,圖像分類更具體地指的是算法捕捉在單個電影或情節(jié)中自然發(fā)生的具有啟發(fā)式變化的能力。在此過程中,我們希望為設(shè)計(jì)師和創(chuàng)意人員提供一個可擴(kuò)展的機(jī)制,以便快速了解哪些視覺元素最能代表主題,以及哪些元素?zé)o法準(zhǔn)確代表主題。我們在AVA中引入的一些視覺啟發(fā)式變量為一個標(biāo)題提供了不同的圖像集,包括攝影機(jī)鏡頭類型(遠(yuǎn)景vs中景)、視覺相似性(三分法則,亮度,對比度)、顏色(最突出的顏色)和顯著圖(識別負(fù)面空間和復(fù)雜度)。通過結(jié)合這些啟發(fā)式變量,我們可以基于定制矢量對圖像幀進(jìn)行有效聚類后再分類。此外,通過合并多個向量,我們能夠構(gòu)建一個多樣性指數(shù),針對某個特定情節(jié)或電影的所有候選圖像進(jìn)行評分。

AVA的鏡頭檢測分集的例子; (左)中景,(中心)特寫,(右)極端特寫。

成人圖像過濾器

考慮到內(nèi)容敏感度和受眾成熟度等原因,我們還需要確保排除了包含有害或令人反感元素的幀。編輯排除的標(biāo)準(zhǔn)示例,比如: 性/裸露、文字、標(biāo)志/未經(jīng)授權(quán)的品牌,以及暴力/血腥。為了降低含有這些元素的幀的優(yōu)先級,我們將這些變量中的每一個的概率作為向量,使我們能夠量化并最終為這些幀賦予較低的分?jǐn)?shù)。

我們還添加了標(biāo)題流派,內(nèi)容格式,成人度評分等元素作為次要元素或次要特征,并作為反饋,提供給排名預(yù)測模型。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4576

    瀏覽量

    92344
  • 甄別
    +關(guān)注

    關(guān)注

    0

    文章

    2

    瀏覽量

    5364

原文標(biāo)題:AVA:Netflix的劇照個性化甄選平臺

文章出處:【微信號:livevideostack,微信公眾號:LiveVideoStack】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    示波器測量的是U13的輸出,輸出的波形不清晰是什么原因?qū)е碌模?/a>

    示波器測量的是U13的輸出(其實(shí)測量U9U10輸出的波形都是一樣的不清晰) 輸入頻率40K-50K交流電流經(jīng)過采樣電阻,接著是一個200KHZ的有源低通,我想40K-50K之間的波形無衰減才把
    發(fā)表于 08-26 07:19

    揭秘能耗管理系統(tǒng):如何你的建筑綠色省錢?

    揭秘能耗管理系統(tǒng):如何你的建筑綠色省錢? 在當(dāng)今這個環(huán)保意識日益增強(qiáng)的時代,建筑行業(yè)的綠色轉(zhuǎn)型已成為不可逆轉(zhuǎn)的趨勢。而在這場轉(zhuǎn)型中,能耗管理系統(tǒng)(Energy Management System
    的頭像 發(fā)表于 08-14 10:38 ?194次閱讀

    采用ava+BS架構(gòu)開發(fā)的工業(yè)級UWB室內(nèi)定系統(tǒng)源碼UWB Ultra-Wideband定位系統(tǒng)技術(shù)接口及技術(shù)特點(diǎn)

    采用ava+B/S架構(gòu)開發(fā)的工業(yè)級UWB室內(nèi)定系統(tǒng)源碼UWB(Ultra-Wideband)定位系統(tǒng)技術(shù)接口及技術(shù)特點(diǎn) UWB(Ultra-Wideband)定位技術(shù)本身并不直接連接藍(lán)
    的頭像 發(fā)表于 06-28 09:36 ?265次閱讀
    采用<b class='flag-5'>ava</b>+BS架構(gòu)開發(fā)的工業(yè)級UWB室內(nèi)定系統(tǒng)源碼UWB Ultra-Wideband定位系統(tǒng)<b class='flag-5'>技術(shù)</b>接口及<b class='flag-5'>技術(shù)</b>特點(diǎn)

    凌度被評為高新技術(shù)企業(yè),正式躋身國家高新技術(shù)企業(yè)隊(duì)伍!

    凌度喜報接踵而至!繼斬獲“專精特新”企業(yè)稱號后,東莞市凌度電子科技有限公司被評為高新技術(shù)企業(yè),正式躋身國家高新技術(shù)企業(yè)隊(duì)伍!
    的頭像 發(fā)表于 05-09 09:49 ?320次閱讀
    凌度被評為高<b class='flag-5'>新技術(shù)</b>企業(yè),正式躋身國家高<b class='flag-5'>新技術(shù)</b>企業(yè)隊(duì)伍!

    北極芯微榮獲“國家高新技術(shù)企業(yè)”稱號

    武漢北極芯微電子有限公司(以下簡稱:北極芯微)順利通過2023年度國家高新技術(shù)企業(yè)認(rèn)定,榮獲由全國高新技術(shù)企業(yè)認(rèn)定機(jī)構(gòu)頒布的“國家高新技術(shù)企業(yè)”稱號。
    的頭像 發(fā)表于 04-25 09:50 ?429次閱讀
    北極芯微榮獲“國家高<b class='flag-5'>新技術(shù)</b>企業(yè)”稱號

    Type-C PD無線麥克風(fēng)OTG聲音更清晰?。?!LDR6028方案!

    在日常工作和生活中,我們經(jīng)常需要使用麥克風(fēng)進(jìn)行直播或者視頻通話。而Type-C PD麥克風(fēng)的出現(xiàn),為我們提供了更便捷、更高效的錄音體驗(yàn)。它不僅具備高保真音質(zhì),還支持快速充電,您的聲音更加清晰
    的頭像 發(fā)表于 04-21 23:04 ?449次閱讀
    Type-C PD無線麥克風(fēng)OTG<b class='flag-5'>讓</b>聲音更<b class='flag-5'>清晰</b>?。?!LDR6028方案!

    中移芯昇獲高新技術(shù)企業(yè)證書

    近日,中國移動旗下專業(yè)芯片公司芯昇科技有限公司(以下簡稱“中移芯昇”)順利通過“高新技術(shù)企業(yè)”認(rèn)定,獲高新技術(shù)企業(yè)證書。創(chuàng)新是企業(yè)發(fā)展的內(nèi)在動力。高新技術(shù)企業(yè)是指在《國家重點(diǎn)支持的高新技術(shù)
    的頭像 發(fā)表于 03-06 08:17 ?359次閱讀
    中移芯昇獲高<b class='flag-5'>新技術(shù)</b>企業(yè)證書

    紫光展銳探索“夜空中最亮的星”清晰可見的Local Dimming技術(shù)

    所謂Local Dmming,是指電視直下式背光的分區(qū)控光技術(shù)背光面板的每個區(qū)域可以進(jìn)行獨(dú)立的開關(guān)或亮度調(diào)節(jié),能夠更精細(xì)地控制背光區(qū)域的明滅,使畫面明暗層次更加分明,用戶視覺感受更為優(yōu)質(zhì)。
    的頭像 發(fā)表于 01-17 16:52 ?1126次閱讀

    智芯傳感連續(xù)榮獲國家“高新技術(shù)企業(yè)”稱號

    今日,北京市2023年度高新技術(shù)企業(yè)資格認(rèn)定通過的第三批高新技術(shù)企業(yè)證書正式頒發(fā),北京智芯傳感科技有限公司憑借領(lǐng)先的技術(shù)實(shí)力、持續(xù)的創(chuàng)新能力和專業(yè)的人才團(tuán)隊(duì),順利通過各項(xiàng)評審,再次榮獲國家“高
    的頭像 發(fā)表于 01-09 09:59 ?505次閱讀
    智芯傳感連續(xù)榮獲國家“高<b class='flag-5'>新技術(shù)</b>企業(yè)”稱號

    矽朋微無錫子公司榮獲“國家高新技術(shù)企業(yè)”認(rèn)定!

    2023年12月13日,全國高新技術(shù)企業(yè)認(rèn)定管理工作領(lǐng)導(dǎo)小組辦公室發(fā)布《對江蘇省認(rèn)定機(jī)構(gòu)2023年認(rèn)定報備的第二批高新技術(shù)企業(yè)備案名單》,正式認(rèn)定“矽朋微電子(無錫)有限公司”為“國家高新技術(shù)企業(yè)
    的頭像 發(fā)表于 01-06 08:24 ?323次閱讀
    矽朋微無錫子公司榮獲“國家高<b class='flag-5'>新技術(shù)</b>企業(yè)”認(rèn)定!

    新技術(shù)在生物樣本冷凍中的應(yīng)用案例分析

      一、冷凍樣本的新技術(shù)應(yīng)用   1. 低溫離心   低溫離心是一種比較先進(jìn)的生物樣本冷凍處理技術(shù),它可以在較低溫度下將樣本進(jìn)行離心,從而有效地分離和保存其中的細(xì)胞和分子。相比傳統(tǒng)的液氮冷凍方法
    發(fā)表于 12-26 13:30

    影響LED透明屏清晰度的因素有哪些?怎樣提高LED透明屏的清晰度?

    關(guān)鍵的方法和技術(shù)可以使用。 首先,增加像素密度是提高LED透明屏清晰度的有效方法之一。像素密度是指每平方英寸中的像素數(shù)量,較高的像素密度可以提供更多的細(xì)節(jié)和更精確的圖像。通過增加像素密度,LED屏幕能夠呈現(xiàn)更清晰的圖像和更細(xì)膩的
    的頭像 發(fā)表于 12-11 14:25 ?730次閱讀

    好看的PCB也是產(chǎn)品的優(yōu)勢

    的設(shè)計(jì)杰作。探討好看的PCB設(shè)計(jì),不僅涉及到創(chuàng)意設(shè)計(jì)、工藝技術(shù)、技術(shù)創(chuàng)新,還關(guān)乎品牌形象的打造,從而描繪出電子時代中PCB設(shè)計(jì)的全貌。好看的PCB設(shè)計(jì)的起源與電子產(chǎn)品與
    的頭像 發(fā)表于 12-11 08:00 ?412次閱讀
    <b class='flag-5'>好看</b>的PCB也是產(chǎn)品的優(yōu)勢

    藍(lán)牙4.1新技術(shù)全面解析(附藍(lán)牙掃盲知識)

    電子發(fā)燒友網(wǎng)站提供《藍(lán)牙4.1新技術(shù)全面解析(附藍(lán)牙掃盲知識).doc》資料免費(fèi)下載
    發(fā)表于 11-10 16:26 ?1次下載
    藍(lán)牙4.1<b class='flag-5'>新技術(shù)</b>全面解析(附藍(lán)牙掃盲知識)

    那些應(yīng)對APT攻擊的最新技術(shù)

    電子發(fā)燒友網(wǎng)站提供《那些應(yīng)對APT攻擊的最新技術(shù).pdf》資料免費(fèi)下載
    發(fā)表于 11-10 10:42 ?0次下載
    那些應(yīng)對APT攻擊的最<b class='flag-5'>新技術(shù)</b>