数据集

电影对话语料库第一部分-1963至2021年-ilabyu

电影对话语料库第一部分-1963至2021年-ilabyu 数据来源：互联网公开数据标签：电影,对话,语料库,自然语言处理,语音识别,数据标注,深度学习数据概述：本数据集包含149,689个对话片段，这些对话片段来自1,722部电影。通过使用基于深度神经网络的语音活动检测技术结合过滤规则，这些对话被自动分割。数据集由两部分组成：电影文件和标注文件。标注文件包含每个对话片段的开始时间、结束时间和标签（对话为“1”，非对话为“0”）。电影文件需要单独从托管网站下载。我们的网站上还提供了示例抓取脚本。数据用途概述：该数据集适用于自然语言处理、语音识别、对话分析、电影研究等多种场景。研究者可以利用此数据集进行对话模式研究、情感分析、语音识别技术评估等；教育机构可以将其用于教学和实验；电影研究者可以分析电影中的对话结构和内容；开发者可以利用标注数据进行算法训练和优化。此外，该数据集也是进行数据清洗和预处理方法研究的宝贵资源。

数据与资源

versions_20250411104633.zipZIP
1.06 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	1.06 MiB
最后更新	2025年4月21日
创建于	2025年4月21日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

电影对话语料库第一部分-1963至2021年-ilabyu

数据与资源

附加信息

注册成功！