TED演讲文本数据集-演讲内容与结构分析-2024年9月12日

TED演讲文本数据集-演讲内容与结构分析-2024年9月12日

数据来源:互联网公开数据

标签:TED演讲,文本,转录,演讲稿,自然语言处理,文本分析,主题分割,内容分析

数据概述: 本数据集包含了从ted.com网站抓取的TED演讲文本的转录稿,其中每个演讲稿被分割成段落。演讲视频列表来源于“TED演讲(2020年5月1日)”数据集,同时补充了从ted.com网站抓取的最新演讲视频。

数据用途概述: 该数据集主要用于训练文本分割(主题分割)模型,服务于takotesai.com网站。此外,该数据集也适用于自然语言处理、文本分析、内容分析等研究,例如演讲稿的结构分析、主题识别、情感分析等。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 21.44 MiB
最后更新 2025年4月16日
创建于 2025年4月16日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。