BBC电视广告检测音频视觉特征数据集1963-2021
数据来源:互联网公开数据
标签:电视广告,音频特征,视觉特征,二分类,机器学习,广告检测,分类算法
数据概述:
本数据集包含了从电视节目片段中提取的大量音频-视觉特征,用于电视广告和非广告内容的分类检测。数据集每行代表一个电视节目的特征记录,包含232个不同的特征列,其中包括帧长度、运动分布、帧差分布、短时能量、过零率、频谱质心、频谱滚降、频谱通量、基频、运动分布(40个箱)、帧差分布(32个箱)、文本区域分布(15个均值和15个方差箱)、音频词袋(4000个箱)以及边缘变化率等详细特征。
数据用途概述:
该数据集适用于电视广告检测系统的开发和优化,以及相关特征提取和分类算法的研究。研究人员可以利用此数据集训练和评估各种分类模型,提高广告检测的准确性和效率。此外,数据集也适用于电视内容分析、广告效果评估等应用场景。
举例:
数据集中的一个记录可能包含如下特征:帧长度为1.2秒,运动分布的均值为0.3和方差为0.05,短时能量的均值为0.4和方差为0.02,频谱质心的均值为0.5和方差为0.03,运动分布的第10个箱值为0.2,帧差分布的第5个箱值为0.1,文本区域分布的第3个均值箱值为0.4和第10个方差箱值为0.02,音频词袋的第1000个箱值为0.3,边缘变化率的均值为0.05和方差为0.005,目标类别为1(表示广告)。