TED演讲文本主题分析与文本分割数据集-2020年5月1日

TED演讲文本主题分析与文本分割数据集-2020年5月1日 数据来源:互联网公开数据 标签:TED演讲,文本,演讲,文本分割,自然语言处理,机器学习,主题分析,演讲稿,NLP 数据概述: 本数据集包含了从TED.com网站抓取的TED演讲稿文本,每个演讲稿被分割成段落。演讲视频列表来源于“TED Talks Transcripts for NLP”数据集。

数据用途概述: 该数据集主要用于训练文本分割模型,例如在takotesai.com网站上进行主题分割。此外,也可用于自然语言处理、文本分析、主题建模等研究,例如分析TED演讲稿的内容结构、识别演讲主题、进行情感分析等。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 15.32 MiB
最后更新 2025年4月18日
创建于 2025年4月18日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。