百度智能云視頻AI技術(shù)助力媒體行業(yè)產(chǎn)業(yè)升級
發(fā)布時間:2021-06-10 23:23
<正>隨著技術(shù)的不斷進步,人工智能正加速改變各行各業(yè)。從電子游戲到電視電影、綜藝節(jié)目等,人工智能與流媒體領(lǐng)域的融合越來越深入,在提高效率和促進行業(yè)升級發(fā)展方面發(fā)揮著至關(guān)重要的作用。本文將以百度智能云視頻AI技術(shù)為例,闡述人工智能技術(shù)是如何助力媒體行業(yè)產(chǎn)業(yè)升級的。
【文章來源】:人工智能. 2020,(02)
【文章頁數(shù)】:10 頁
【部分圖文】:
媒體內(nèi)容分析MCA的操作臺演示界面
首先是偏預(yù)處理任務(wù)的基礎(chǔ)特征層,用于進行圖像、音頻等多模特征的處理,并且在前期對視頻的冗余數(shù)據(jù),以及編碼和物體運動造成的模糊和運動偽影進行去除。從底層提取高質(zhì)量的圖片數(shù)據(jù),從而提升上層圖像標簽的準確率。中層的結(jié)構(gòu)化算子層,適用于通用任務(wù),算子組件化功能獨立,可單獨服務(wù)化部署也可組合支持業(yè)務(wù)的擴展。憑借百度在語音識別、OCR、人臉、NLP、知識圖譜等方向的算法和數(shù)據(jù)積累,以及在視頻場景下的需求理解,為視頻提供通用的高質(zhì)量算法能力以及定制化的視頻AI技術(shù),給通用視頻提供多層次多維度的結(jié)構(gòu)化分析結(jié)果。
相似圖檢索主要的操作是比較兩幅圖像之間的相似度(例如pHash之間的漢明距離等),相似度低于某個閾值則認為兩張圖是相似的。為了提升檢索性能,通常初始化階段將數(shù)據(jù)集分成多個bucket,每一個bucket會存儲距離處于一定范圍的樣本,且任意兩個bucket之間是不相交的。根據(jù)bucket之間的相關(guān)性,整個數(shù)據(jù)庫可以組成一個樹狀結(jié)構(gòu),通過樹節(jié)點的路徑選擇加快檢索效率,類似于KD-Tree等方法。構(gòu)建bucket的過程有多種方法,常使用的是聚類算法,如K-Means、DBSCAN、Hierarchical Clustering等,這里需要根據(jù)算法特點和實際任務(wù)進行選擇。圖像去重也可以使用相同的辦法。使用大規(guī)模數(shù)據(jù)例如ImageNet預(yù)訓(xùn)練的模型具有很強的語義表達性以及特征區(qū)分性,提取圖像的特征后使用無監(jiān)督聚類算法將特征進行聚類,結(jié)合清晰度、美觀度等模型輔助得到圖像質(zhì)量的分數(shù),結(jié)合聚類簇中心輸出最優(yōu)圖像。對于大規(guī)模視頻數(shù)據(jù)集來說,可以先使用無監(jiān)督的方式進行粗切,確定粗切的組數(shù),在每組中進行更加精細的去重操作,如圖4所示。
本文編號:3223311
【文章來源】:人工智能. 2020,(02)
【文章頁數(shù)】:10 頁
【部分圖文】:
媒體內(nèi)容分析MCA的操作臺演示界面
首先是偏預(yù)處理任務(wù)的基礎(chǔ)特征層,用于進行圖像、音頻等多模特征的處理,并且在前期對視頻的冗余數(shù)據(jù),以及編碼和物體運動造成的模糊和運動偽影進行去除。從底層提取高質(zhì)量的圖片數(shù)據(jù),從而提升上層圖像標簽的準確率。中層的結(jié)構(gòu)化算子層,適用于通用任務(wù),算子組件化功能獨立,可單獨服務(wù)化部署也可組合支持業(yè)務(wù)的擴展。憑借百度在語音識別、OCR、人臉、NLP、知識圖譜等方向的算法和數(shù)據(jù)積累,以及在視頻場景下的需求理解,為視頻提供通用的高質(zhì)量算法能力以及定制化的視頻AI技術(shù),給通用視頻提供多層次多維度的結(jié)構(gòu)化分析結(jié)果。
相似圖檢索主要的操作是比較兩幅圖像之間的相似度(例如pHash之間的漢明距離等),相似度低于某個閾值則認為兩張圖是相似的。為了提升檢索性能,通常初始化階段將數(shù)據(jù)集分成多個bucket,每一個bucket會存儲距離處于一定范圍的樣本,且任意兩個bucket之間是不相交的。根據(jù)bucket之間的相關(guān)性,整個數(shù)據(jù)庫可以組成一個樹狀結(jié)構(gòu),通過樹節(jié)點的路徑選擇加快檢索效率,類似于KD-Tree等方法。構(gòu)建bucket的過程有多種方法,常使用的是聚類算法,如K-Means、DBSCAN、Hierarchical Clustering等,這里需要根據(jù)算法特點和實際任務(wù)進行選擇。圖像去重也可以使用相同的辦法。使用大規(guī)模數(shù)據(jù)例如ImageNet預(yù)訓(xùn)練的模型具有很強的語義表達性以及特征區(qū)分性,提取圖像的特征后使用無監(jiān)督聚類算法將特征進行聚類,結(jié)合清晰度、美觀度等模型輔助得到圖像質(zhì)量的分數(shù),結(jié)合聚類簇中心輸出最優(yōu)圖像。對于大規(guī)模視頻數(shù)據(jù)集來說,可以先使用無監(jiān)督的方式進行粗切,確定粗切的組數(shù),在每組中進行更加精細的去重操作,如圖4所示。
本文編號:3223311
本文鏈接:http://sikaile.net/jingjilunwen/whjj/3223311.html
最近更新
教材專著