-
乌尔都语文本词频统计数据集-乌尔都语文本语料库
乌尔都语文本词频统计数据集-乌尔都语文本语料库 数据来源:互联网公开数据 标签:乌尔都语,文本分析,自然语言处理,词频统计,语料库,语言学,N-gram 数据概述: 本数据集基于在线报纸和书籍的抓取构建的乌尔都语语料库,包含了不同长度的N-gram及其对应的出现频率。数据文件包括:... -
食品评论情感分析数据集SentimentAnalysisFoodReviewsDataset-cngkhutnguyn
食品评论情感分析数据集SentimentAnalysisFoodReviewsDataset-cngkhutnguyn 数据来源:互联网公开数据 标签:情感分析,食品评论,数据集,自然语言处理,机器学习,消费者行为,文本分析,市场研究 数据概述: 该数据集包含来自食品评论网站或平台的用户评论数据,记录了消费者对食品产品的评价和情感倾向。主要特征如下:... -
GPT-2模型训练数据集EP2-LR8e5-blackitten13
GPT-2模型训练数据集EP2-LR8e5-blackitten13 数据来源:互联网公开数据 标签:自然语言处理,文本生成,数据集,GPT-2,机器学习,模型训练,语言模型,文本分析 数据概述: 该数据集用于训练 GPT-2 模型,由 EP2 (Epoch 2) 和 LR8e5 (Learning Rate 8e-5)... -
CommonLit阅读理解文章可读性数据集-chiraggodaw
CommonLit阅读理解文章可读性数据集-chiraggodaw 数据来源:互联网公开数据 标签:阅读理解,可读性,数据集,自然语言处理,文本分析,教育,机器学习,语言评估 数据概述: 该数据集包含了来自CommonLit平台的中小学阅读理解文章,以及它们的可读性评分。主要特征如下: 时间跨度: 数据记录的时间范围涵盖了多个学年。 地理范围:... -
论文评分数据集EssayScoringDataset-caokhoihuynh
论文评分数据集EssayScoringDataset-caokhoihuynh 数据来源:互联网公开数据 标签:论文,写作,评分,数据集,自然语言处理,文本分析,教育,机器学习 数据概述: 该数据集包含学生的论文及其对应的评分信息,旨在用于论文评分模型的训练和评估。主要特征如下: 时间跨度:数据记录的时间跨度不明确,但涵盖了学生写作的多个年份。... -
人工智能生成文本检测训练数据集LLMDetectAIGeneratedTextTrainEssaysDataset-joshualudolf
人工智能生成文本检测训练数据集LLMDetectAIGeneratedTextTrainEssaysDataset-joshualudolf 数据来源:互联网公开数据 标签:自然语言处理,机器学习,文本分类,人工智能检测,深度学习,数据集,文本分析,文本生成 数据概述:... -
星际迷航剧本数据集StarTrekScriptsDataset-tamarafingerlin
星际迷航剧本数据集StarTrekScriptsDataset-tamarafingerlin 数据来源:互联网公开数据 标签:科幻,剧本,数据集,文本分析,自然语言处理,影视剧,文化研究,语言学 数据概述: 该数据集包含了《星际迷航》系列电视剧和电影的剧本,记录了各个剧集和电影的对话,场景描述等内容。主要特征如下:... -
虚假新闻检测模型数据集FakeNewsModelDataset-hoanhminh24
虚假新闻检测模型数据集FakeNewsModelDataset-hoanhminh24 数据来源:互联网公开数据 标签:新闻检测,数据集,机器学习,文本分析,自然语言处理,信息安全,新闻媒体,深度学习 数据概述: 该数据集包含用于虚假新闻检测的文本数据,记录了新闻文章的标题,正文,发布时间,来源等信息。主要特征如下:... -
CommonLit阅读理解单词增强数据集-shaz13
CommonLit阅读理解单词增强数据集-shaz13 数据来源:互联网公开数据 标签:阅读理解,自然语言处理,数据集,词汇增强,文本分析,教育,机器学习,文本挖掘 数据概述:该数据集包含 CommonLit 竞赛的阅读理解文本,并对文本中的单词进行了增强处理。主要特征如下: 时间跨度:数据来源于 CommonLit 竞赛,时间跨度涵盖竞赛期间。... -
PDF文件知识提取数据集PDFFilesKnowledgeProcessingandMiningDataset-kailassrt
PDF文件知识提取数据集PDFFilesKnowledgeProcessingandMiningDataset-kailassrt 数据来源:互联网公开数据 标签:PDF文件,知识提取,数据集,自然语言处理,机器学习,文本分析,信息检索,学术资源 数据概述:... -
越南情感分析处理数据集VietnameseSentimentProcessedDataset-longtrg
越南情感分析处理数据集VietnameseSentimentProcessedDataset-longtrg 数据来源:互联网公开数据 标签:情感分析,数据集,自然语言处理,机器学习,文本分析,越南语,社交媒体,舆情分析 数据概述:该数据集包含经过处理的越南语文本数据,主要用于情感分析任务。主要特征如下:... -
假评论检测自然语言处理数据集FakeReviewDetectionwithNLPDataset-uselessguy
假评论检测自然语言处理数据集FakeReviewDetectionwithNLPDataset-uselessguy 数据来源:互联网公开数据 标签:假评论,自然语言处理,数据集,文本分析,机器学习,文本分类,在线评论,电子商务 数据概述:该数据集包含来自电子商务平台的用户评论数据,主要用于假评论检测和自然语言处理任务。主要特征如下:... -
航班信息命名实体识别数据集Ner-flightDataset-hharshsharma2098
航班信息命名实体识别数据集Ner-flightDataset-hharshsharma2098 数据来源:互联网公开数据 标签:航班信息,命名实体识别,数据集,自然语言处理,机器学习,文本分析,交通行业,航空数据 数据概述: 该数据集包含航班信息相关的数据,适用于命名实体识别任务,帮助识别和提取航班相关的实体信息。主要特征如下: 时间跨度:... -
BBC新闻分类数据集BBCNewsClassificationDataset-chalikamihiran
BBC新闻分类数据集BBCNewsClassificationDataset-chalikamihiran 数据来源:互联网公开数据 标签:新闻分类,数据集,文本分析,自然语言处理,机器学习,数据挖掘,信息检索,人工智能 数据概述:该数据集包含来自BBC(英国广播公司)的新闻文章,主要用于新闻类别的自动分类。主要特征如下:... -
自然语言处理项目数据集DatasetforNLPProject-namang04
自然语言处理项目数据集DatasetforNLPProject-namang04 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,深度学习,语言模型,情感分析,文本分类 数据概述: 该数据集为自然语言处理项目设计,记录了多种文本数据,适用于文本分类,情感分析,语言模型训练等任务。主要特征如下:... -
点击诱饵标题数据集ClickbaitTitleDataset-hansel11
点击诱饵标题数据集ClickbaitTitleDataset-hansel11 数据来源:互联网公开数据 标签:点击诱饵,数据集,文本分析,自然语言处理,机器学习,内容推荐,新闻传播,社交媒体 数据概述: 该数据集包含来自互联网的标题数据,记录了各类网络内容中的点击诱饵标题及其相关特征。主要特征如下:... -
新闻事件实体解析数据集EntityResolutionforNewsEventsDataset-hiten26
新闻事件实体解析数据集EntityResolutionforNewsEventsDataset-hiten26 数据来源:互联网公开数据 标签:新闻事件,实体解析,数据集,自然语言处理,信息抽取,文本分析,机器学习,数据整合 数据概述:该数据集包含来自新闻报道的数据,主要用于实体解析和新闻事件的识别。主要特征如下:... -
女性电子商务服装评论数据集Women-sE-commerceClothingReviewsDataset-meghnachavda
女性电子商务服装评论数据集Women-sE-commerceClothingReviewsDataset-meghnachavda 数据来源:互联网公开数据 标签:电子商务,服装零售,消费者评论,数据集,文本分析,情感分析,机器学习,用户行为 数据概述:该数据集包含来自电子商务平台的女性服装评论数据,记录了消费者对服装产品的评价和反馈。主要特征如下:... -
哈利波特主题聊天机器人数据集HarryPotterChatbotData-fionayufionayu
哈利波特主题聊天机器人数据集HarryPotterChatbotData-fionayufionayu 数据来源:互联网公开数据 标签:聊天机器人,自然语言处理,数据集,哈利波特,对话系统,人工智能,文本分析,教育应用 数据概述: 该数据集包含哈利波特主题的聊天机器人对话数据,记录了用户与聊天机器人之间的互动内容。主要特征如下:... -
穆瓦塔-马利克圣训数据集MuwattaMalikHadithCSVDataset-huzaifatahir7524
穆瓦塔-马利克圣训数据集MuwattaMalikHadithCSVDataset-huzaifatahir7524 数据来源:互联网公开数据 标签:伊斯兰研究,圣训,数据集,宗教文献,文本分析,历史研究,文化研究,机器学习 数据概述: 该数据集包含来自穆瓦塔·马利克(Muwatta...