找到5,810个数据集

标签: 文本分析

过滤结果
  • 情绪情感分析补充数据集AdditionalDatasetforEmotions-dimonyara

    2025年4月24日   

    情绪情感分析补充数据集AdditionalDatasetforEmotions-dimonyara 数据来源:互联网公开数据 标签:情感分析,数据集,情绪识别,自然语言处理,机器学习,心理学,文本分析,数据挖掘 数据概述: 该数据集包含来自多个来源的情感和情绪相关数据,记录了文本或语音中的情感表达和情绪状态。主要特征如下:...
    packageimg
  • 样本索引数据集SampleIndexDataset-edmundng200

    2025年4月24日   

    样本索引数据集SampleIndexDataset-edmundng200 数据来源:互联网公开数据 标签:索引,数据集,文本分析,自然语言处理,信息检索,机器学习,数据挖掘,样本 数据概述: 该数据集包含样本索引数据,记录了文本样本与索引之间的对应关系。主要特征如下: 时间跨度:数据记录的时间范围不限,取决于样本数据的更新频率。...
    packageimg
  • 阿拉伯语文章数据集ArabicArticleDataset-surayhan

    2025年4月24日   

    阿拉伯语文章数据集ArabicArticleDataset-surayhan 数据来源:互联网公开数据 标签:阿拉伯语,文章,数据集,自然语言处理,文本分析,机器学习,语言研究,数据挖掘 数据概述: 该数据集包含来自互联网的阿拉伯语文本,记录了各类阿拉伯语文章的内容。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。...
    packageimg
  • 美国专利商标局专利词汇数据集USPTOWordsDataset-durrivedfunktor

    2025年4月24日   

    美国专利商标局专利词汇数据集USPTOWordsDataset-durrivedfunktor 数据来源:互联网公开数据 标签:专利,词汇,数据集,文本分析,自然语言处理,知识产权,机器学习,信息检索 数据概述: 该数据集包含来自美国专利商标局(USPTO)的专利文本数据,记录了专利文件中的关键词汇和术语。主要特征如下:...
    packageimg
  • 自然语言推理数据集MNLI数据集-nlgluong

    2025年4月24日   

    自然语言推理数据集MNLI数据集-nlgluong 数据来源:互联网公开数据 标签:自然语言处理,数据集,机器学习,文本分析,推理,语言模型,学术研究,深度学习 数据概述: 该数据集包含来自多领域来源的语料库,主要用于自然语言推理任务的研究。主要特征如下: 时间跨度:数据记录的时间范围从2017年到2018年。...
    packageimg
  • 产品类型分类数据集-satishkumarmishra

    2025年4月24日   

    产品类型分类数据集-satishkumarmishra 数据来源:互联网公开数据 标签:产品分类,数据集,机器学习,文本分析,自然语言处理,电商,类别预测,数据挖掘 数据概述: 该数据集包含来自电商平台的产品信息,旨在用于产品类型的自动分类。主要特征如下: 时间跨度:数据记录的时间跨度不固定,取决于数据来源的更新频率。...
    packageimg
  • 在线性别歧视层次分类数据集HierarchicalClassificationofOnlineSexismDataset-bbiswabasuroy

    2025年4月24日   

    在线性别歧视层次分类数据集HierarchicalClassificationofOnlineSexismDataset-bbiswabasuroy 数据来源:互联网公开数据 标签:性别歧视,数据集,层次分类,社会研究,机器学习,文本分析,社会问题,自然语言处理 数据概述:...
    packageimg
  • 网络欺凌检测数据集CyberbullyingDetectionDataset-sanzidasiddike

    2025年4月24日   

    网络欺凌检测数据集CyberbullyingDetectionDataset-sanzidasiddike 数据来源:互联网公开数据 标签:网络欺凌,文本分析,自然语言处理,机器学习,情感分析,社交媒体,风险评估,数据挖掘 数据概述: 该数据集包含来自社交媒体平台的文本数据,旨在用于网络欺凌检测任务。主要特征如下: 时间跨度:...
    packageimg
  • 时尚情感分析数据集SentimentalAnalysisonFashionDataset-wifoder1234

    2025年4月24日   

    时尚情感分析数据集SentimentalAnalysisonFashionDataset-wifoder1234 数据来源:互联网公开数据 标签:时尚,情感分析,数据集,文本分析,机器学习,社交媒体,消费者行为,电子商务 数据概述: 该数据集包含来自时尚相关社交媒体平台的用户评论数据,记录了用户对时尚产品,品牌和购物体验的评价。主要特征如下:...
    packageimg
  • 欧洲语言共同参考框架CEFR英语学习数据集-natsumii

    2025年4月24日   

    欧洲语言共同参考框架CEFR英语学习数据集-natsumii 数据来源:互联网公开数据 标签:英语学习,CEFR,数据集,语言评估,文本分析,自然语言处理,语言学习,英语 数据概述: 该数据集包含来自欧洲语言共同参考框架(CEFR)的英语学习数据,主要用于评估和分析英语学习者的语言水平。主要特征如下:...
    packageimg
  • 谷歌翻译SQuAD2-0数据集至印地语和泰米尔语GoogleTranslatedSQuAD2-0toHindiandTamilDataset-tkm2261

    2025年4月24日   

    谷歌翻译SQuAD2-0数据集至印地语和泰米尔语GoogleTranslatedSQuAD2-0toHindiandTamilDataset-tkm2261 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,问答系统,数据集,印地语,泰米尔语,深度学习,文本分析 数据概述: 该数据集包含从SQuAD...
    packageimg
  • 垃圾邮件分类数据集SpamEmailClassificationDataset-josiagiven

    2025年4月24日   

    垃圾邮件分类数据集SpamEmailClassificationDataset-josiagiven 数据来源:互联网公开数据 标签:垃圾邮件,邮件分类,数据集,文本分析,机器学习,自然语言处理,信息过滤,数据挖掘 数据概述: 该数据集包含来自互联网公开来源的电子邮件数据,记录了邮件的文本内容和分类标签(垃圾邮件或正常邮件)。主要特征如下:...
    packageimg
  • 在线新闻流行度数据集OnlineNewsPopularityDataset-ayushmudunuru

    2025年4月24日   

    在线新闻流行度数据集OnlineNewsPopularityDataset-ayushmudunuru 数据来源:互联网公开数据 标签:在线新闻,流行度分析,数据集,机器学习,文本分析,社交媒体,新闻传播,社交网络 数据概述:该数据集来自葡萄牙新闻聚合网站“Portal...
    packageimg
  • 标签化辩论比赛嵌入数据集LabeledTabbieEmbeddingsDataset-orcldsapp129833

    2025年4月24日   

    标签化辩论比赛嵌入数据集LabeledTabbieEmbeddingsDataset-orcldsapp129833 数据来源:互联网公开数据 标签:辩论比赛,数据集,文本嵌入,自然语言处理,机器学习,文本分析,教育,人工智能 数据概述:...
    packageimg
  • 证据处理流程数据集DataProcessforEvidenceDataset-davidnguyens12

    2025年4月24日   

    证据处理流程数据集DataProcessforEvidenceDataset-davidnguyens12 数据来源:互联网公开数据 标签:证据处理,数据集,文本分析,自然语言处理,信息检索,司法,机器学习,数据清洗 数据概述: 该数据集包含了用于证据处理流程的数据,记录了从原始证据到分析结果的各个环节。主要特征如下:...
    packageimg
  • 词汇数据集Lexicon-CleanDataset-jvmchik

    2025年4月24日   

    词汇数据集Lexicon-CleanDataset-jvmchik 数据来源:互联网公开数据 标签:语言学,词汇学,数据集,自然语言处理,文本分析,教育研究,数据清洗,语言资源 数据概述: 该数据集包含经过清洗和标准化的词汇数据,记录了多种语言的词汇信息。主要特征如下: 时间跨度:数据记录的时间范围不明确,主要为静态词汇数据。...
    packageimg
  • 维基百科电影剧情数据集WikiMoviePlotsDataset-devictor1

    2025年4月24日   

    维基百科电影剧情数据集WikiMoviePlotsDataset-devictor1 数据来源:互联网公开数据 标签:电影,剧情,数据集,自然语言处理,文本分析,电影研究,剧情摘要,机器学习 数据概述: 该数据集包含了来自维基百科的电影剧情摘要信息,记录了大量不同电影的剧情内容。主要特征如下: 时间跨度:数据涵盖了电影制作的各个历史时期。...
    packageimg
  • 问题与答案链接数据集QuestionandAnswerURLsDataset-aniken

    2025年4月24日   

    问题与答案链接数据集QuestionandAnswerURLsDataset-aniken 数据来源:互联网公开数据 标签:问答数据,数据集,网络爬取,文本分析,信息检索,机器学习,自然语言处理,知识图谱 数据概述: 该数据集包含来自互联网的问答数据,记录了各种问题及其对应的答案链接。主要特征如下: 时间跨度:数据记录的时间范围从近年到当前。...
    packageimg
  • 傲慢与偏见文本数据集PrideandPrejudiceCleanDataset-theeranartmeesathien

    2025年4月24日   

    傲慢与偏见文本数据集PrideandPrejudiceCleanDataset-theeranartmeesathien 数据来源:互联网公开数据 标签:文本分析,文学作品,数据集,自然语言处理,情感分析,机器学习,英语文学,机器学习 数据概述: 该数据集包含来自《傲慢与偏见》这本经典文学作品的文本数据,记录了小说的完整内容。主要特征如下:...
    packageimg
  • 泰国身份证号码识别数据集-pharisitalee

    2025年4月24日   

    泰国身份证号码识别数据集-pharisitalee 数据来源:互联网公开数据 标签:泰国,身份证号码,身份识别,数据集,自然语言处理,机器学习,文本分析,信息安全 数据概述: 该数据集包含泰国的身份证号码及其相关信息,用于身份识别和验证。主要特征如下: 时间跨度:数据记录的时间范围为不特定,主要为现有身份证信息。 地理范围:数据覆盖泰国全境。...
    packageimg