电影对话语料库第一部分-1963至2021年-ilabyu

电影对话语料库第一部分-1963至2021年-ilabyu 数据来源:互联网公开数据 标签:电影,对话,语料库,自然语言处理,语音识别,数据标注,深度学习 数据概述: 本数据集包含149,689个对话片段,这些对话片段来自1,722部电影。通过使用基于深度神经网络的语音活动检测技术结合过滤规则,这些对话被自动分割。数据集由两部分组成:电影文件和标注文件。标注文件包含每个对话片段的开始时间、结束时间和标签(对话为“1”,非对话为“0”)。电影文件需要单独从托管网站下载。我们的网站上还提供了示例抓取脚本。 数据用途概述: 该数据集适用于自然语言处理、语音识别、对话分析、电影研究等多种场景。研究者可以利用此数据集进行对话模式研究、情感分析、语音识别技术评估等;教育机构可以将其用于教学和实验;电影研究者可以分析电影中的对话结构和内容;开发者可以利用标注数据进行算法训练和优化。此外,该数据集也是进行数据清洗和预处理方法研究的宝贵资源。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 1.06 MiB
最后更新 2025年4月21日
创建于 2025年4月21日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。