-
情绪情感分析补充数据集AdditionalDatasetforEmotions-dimonyara
情绪情感分析补充数据集AdditionalDatasetforEmotions-dimonyara 数据来源:互联网公开数据 标签:情感分析,数据集,情绪识别,自然语言处理,机器学习,心理学,文本分析,数据挖掘 数据概述: 该数据集包含来自多个来源的情感和情绪相关数据,记录了文本或语音中的情感表达和情绪状态。主要特征如下:... -
样本索引数据集SampleIndexDataset-edmundng200
样本索引数据集SampleIndexDataset-edmundng200 数据来源:互联网公开数据 标签:索引,数据集,文本分析,自然语言处理,信息检索,机器学习,数据挖掘,样本 数据概述: 该数据集包含样本索引数据,记录了文本样本与索引之间的对应关系。主要特征如下: 时间跨度:数据记录的时间范围不限,取决于样本数据的更新频率。... -
阿拉伯语文章数据集ArabicArticleDataset-surayhan
阿拉伯语文章数据集ArabicArticleDataset-surayhan 数据来源:互联网公开数据 标签:阿拉伯语,文章,数据集,自然语言处理,文本分析,机器学习,语言研究,数据挖掘 数据概述: 该数据集包含来自互联网的阿拉伯语文本,记录了各类阿拉伯语文章的内容。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。... -
美国专利商标局专利词汇数据集USPTOWordsDataset-durrivedfunktor
美国专利商标局专利词汇数据集USPTOWordsDataset-durrivedfunktor 数据来源:互联网公开数据 标签:专利,词汇,数据集,文本分析,自然语言处理,知识产权,机器学习,信息检索 数据概述: 该数据集包含来自美国专利商标局(USPTO)的专利文本数据,记录了专利文件中的关键词汇和术语。主要特征如下:... -
自然语言推理数据集MNLI数据集-nlgluong
自然语言推理数据集MNLI数据集-nlgluong 数据来源:互联网公开数据 标签:自然语言处理,数据集,机器学习,文本分析,推理,语言模型,学术研究,深度学习 数据概述: 该数据集包含来自多领域来源的语料库,主要用于自然语言推理任务的研究。主要特征如下: 时间跨度:数据记录的时间范围从2017年到2018年。... -
产品类型分类数据集-satishkumarmishra
产品类型分类数据集-satishkumarmishra 数据来源:互联网公开数据 标签:产品分类,数据集,机器学习,文本分析,自然语言处理,电商,类别预测,数据挖掘 数据概述: 该数据集包含来自电商平台的产品信息,旨在用于产品类型的自动分类。主要特征如下: 时间跨度:数据记录的时间跨度不固定,取决于数据来源的更新频率。... -
在线性别歧视层次分类数据集HierarchicalClassificationofOnlineSexismDataset-bbiswabasuroy
在线性别歧视层次分类数据集HierarchicalClassificationofOnlineSexismDataset-bbiswabasuroy 数据来源:互联网公开数据 标签:性别歧视,数据集,层次分类,社会研究,机器学习,文本分析,社会问题,自然语言处理 数据概述:... -
网络欺凌检测数据集CyberbullyingDetectionDataset-sanzidasiddike
网络欺凌检测数据集CyberbullyingDetectionDataset-sanzidasiddike 数据来源:互联网公开数据 标签:网络欺凌,文本分析,自然语言处理,机器学习,情感分析,社交媒体,风险评估,数据挖掘 数据概述: 该数据集包含来自社交媒体平台的文本数据,旨在用于网络欺凌检测任务。主要特征如下: 时间跨度:... -
时尚情感分析数据集SentimentalAnalysisonFashionDataset-wifoder1234
时尚情感分析数据集SentimentalAnalysisonFashionDataset-wifoder1234 数据来源:互联网公开数据 标签:时尚,情感分析,数据集,文本分析,机器学习,社交媒体,消费者行为,电子商务 数据概述: 该数据集包含来自时尚相关社交媒体平台的用户评论数据,记录了用户对时尚产品,品牌和购物体验的评价。主要特征如下:... -
欧洲语言共同参考框架CEFR英语学习数据集-natsumii
欧洲语言共同参考框架CEFR英语学习数据集-natsumii 数据来源:互联网公开数据 标签:英语学习,CEFR,数据集,语言评估,文本分析,自然语言处理,语言学习,英语 数据概述: 该数据集包含来自欧洲语言共同参考框架(CEFR)的英语学习数据,主要用于评估和分析英语学习者的语言水平。主要特征如下:... -
谷歌翻译SQuAD2-0数据集至印地语和泰米尔语GoogleTranslatedSQuAD2-0toHindiandTamilDataset-tkm2261
谷歌翻译SQuAD2-0数据集至印地语和泰米尔语GoogleTranslatedSQuAD2-0toHindiandTamilDataset-tkm2261 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,问答系统,数据集,印地语,泰米尔语,深度学习,文本分析 数据概述: 该数据集包含从SQuAD... -
垃圾邮件分类数据集SpamEmailClassificationDataset-josiagiven
垃圾邮件分类数据集SpamEmailClassificationDataset-josiagiven 数据来源:互联网公开数据 标签:垃圾邮件,邮件分类,数据集,文本分析,机器学习,自然语言处理,信息过滤,数据挖掘 数据概述: 该数据集包含来自互联网公开来源的电子邮件数据,记录了邮件的文本内容和分类标签(垃圾邮件或正常邮件)。主要特征如下:... -
在线新闻流行度数据集OnlineNewsPopularityDataset-ayushmudunuru
在线新闻流行度数据集OnlineNewsPopularityDataset-ayushmudunuru 数据来源:互联网公开数据 标签:在线新闻,流行度分析,数据集,机器学习,文本分析,社交媒体,新闻传播,社交网络 数据概述:该数据集来自葡萄牙新闻聚合网站“Portal... -
标签化辩论比赛嵌入数据集LabeledTabbieEmbeddingsDataset-orcldsapp129833
标签化辩论比赛嵌入数据集LabeledTabbieEmbeddingsDataset-orcldsapp129833 数据来源:互联网公开数据 标签:辩论比赛,数据集,文本嵌入,自然语言处理,机器学习,文本分析,教育,人工智能 数据概述:... -
证据处理流程数据集DataProcessforEvidenceDataset-davidnguyens12
证据处理流程数据集DataProcessforEvidenceDataset-davidnguyens12 数据来源:互联网公开数据 标签:证据处理,数据集,文本分析,自然语言处理,信息检索,司法,机器学习,数据清洗 数据概述: 该数据集包含了用于证据处理流程的数据,记录了从原始证据到分析结果的各个环节。主要特征如下:... -
词汇数据集Lexicon-CleanDataset-jvmchik
词汇数据集Lexicon-CleanDataset-jvmchik 数据来源:互联网公开数据 标签:语言学,词汇学,数据集,自然语言处理,文本分析,教育研究,数据清洗,语言资源 数据概述: 该数据集包含经过清洗和标准化的词汇数据,记录了多种语言的词汇信息。主要特征如下: 时间跨度:数据记录的时间范围不明确,主要为静态词汇数据。... -
维基百科电影剧情数据集WikiMoviePlotsDataset-devictor1
维基百科电影剧情数据集WikiMoviePlotsDataset-devictor1 数据来源:互联网公开数据 标签:电影,剧情,数据集,自然语言处理,文本分析,电影研究,剧情摘要,机器学习 数据概述: 该数据集包含了来自维基百科的电影剧情摘要信息,记录了大量不同电影的剧情内容。主要特征如下: 时间跨度:数据涵盖了电影制作的各个历史时期。... -
问题与答案链接数据集QuestionandAnswerURLsDataset-aniken
问题与答案链接数据集QuestionandAnswerURLsDataset-aniken 数据来源:互联网公开数据 标签:问答数据,数据集,网络爬取,文本分析,信息检索,机器学习,自然语言处理,知识图谱 数据概述: 该数据集包含来自互联网的问答数据,记录了各种问题及其对应的答案链接。主要特征如下: 时间跨度:数据记录的时间范围从近年到当前。... -
傲慢与偏见文本数据集PrideandPrejudiceCleanDataset-theeranartmeesathien
傲慢与偏见文本数据集PrideandPrejudiceCleanDataset-theeranartmeesathien 数据来源:互联网公开数据 标签:文本分析,文学作品,数据集,自然语言处理,情感分析,机器学习,英语文学,机器学习 数据概述: 该数据集包含来自《傲慢与偏见》这本经典文学作品的文本数据,记录了小说的完整内容。主要特征如下:... -
泰国身份证号码识别数据集-pharisitalee
泰国身份证号码识别数据集-pharisitalee 数据来源:互联网公开数据 标签:泰国,身份证号码,身份识别,数据集,自然语言处理,机器学习,文本分析,信息安全 数据概述: 该数据集包含泰国的身份证号码及其相关信息,用于身份识别和验证。主要特征如下: 时间跨度:数据记录的时间范围为不特定,主要为现有身份证信息。 地理范围:数据覆盖泰国全境。...