-
食谱评价与用户反馈数据集-shivanshpandeys
食谱评价与用户反馈数据集-shivanshpandeys 数据来源:互联网公开数据 标签:食谱,评价,用户反馈,文本分析,情感分析,自然语言处理,机器学习,美食 数据概述: 该数据集包含来自各种来源的食谱评价和用户反馈数据,记录了用户对不同食谱的评价和反馈。主要特征如下: 时间跨度: 数据记录的时间范围不明确,取决于数据来源。 地理范围:... -
DAIGT混合段落数据集v1-2024-serjhenrique
DAIGT混合段落数据集v1-2024-serjhenrique 数据来源:互联网公开数据 标签:DAIGT,混合数据集,段落,机器学习,人类生成,文本分析,概率分布 数据概述: 本数据集是DAIGT... -
词云生成与分析数据集WordCloudGenerationandAnalysisDataset-omkarm0542
词云生成与分析数据集WordCloudGenerationandAnalysisDataset-omkarm0542 数据来源:互联网公开数据 标签:词云,文本分析,数据集,数据可视化,自然语言处理,关键词提取,频率分析,信息检索 数据概述: 该数据集包含用于词云生成和分析的文本数据,记录了不同来源的文本内容和对应的词频信息。主要特征如下: 时间跨度:... -
推特灾难事件数据集TweetDisasterDataset-rjmanoj
推特灾难事件数据集TweetDisasterDataset-rjmanoj 数据来源:互联网公开数据 标签:推特,灾难事件,自然语言处理,文本分析,机器学习,情感分析,社交媒体,危机管理 数据概述: 该数据集包含来自推特(Twitter)的公开数据,记录了与灾难事件相关的推文信息。主要特征如下:... -
表情符号转阿拉伯文本数据集EmojitoArabicTextDataset-hatemamine
表情符号转阿拉伯文本数据集EmojitoArabicTextDataset-hatemamine 数据来源:互联网公开数据 标签:表情符号,文本转换,数据集,自然语言处理,机器学习,翻译,阿拉伯语,文本分析 数据概述:该数据集包含来自多个来源的表情符号与阿拉伯文本的对应关系数据,记录了表情符号及其对应的阿拉伯文本描述。主要特征如下:... -
冰与火之歌文学作品数据集ASongofIceandFireLiteraryDataset-stormbreaker1726
冰与火之歌文学作品数据集ASongofIceandFireLiteraryDataset-stormbreaker1726 数据来源:互联网公开数据 标签:文学作品,数据集,文本分析,数据分析,机器学习,自然语言处理,故事分析,小说研究 数据概述: 该数据集包含来自《冰与火之歌》系列文学作品的数据,记录了该系列小说的文本内容及相关元数据。主要特征如下:... -
CommonLit文本阅读理解训练数据集CommonLitReadabilityPrizeDataset-mcpenguin
CommonLit文本阅读理解训练数据集CommonLitReadabilityPrizeDataset-mcpenguin 数据来源:互联网公开数据 标签:文本分析,阅读理解,自然语言处理,教育,数据集,机器学习,文本难度,语言学 数据概述: 该数据集包含CommonLit公司提供的文本阅读理解训练数据,旨在评估文本的可读性和难度。主要特征如下:... -
棒球比赛自动化洞察数据集AutomatedInsightsBaseballGameRoundupDataset-jialin97
棒球比赛自动化洞察数据集AutomatedInsightsBaseballGameRoundupDataset-jialin97 数据来源:互联网公开数据 标签:棒球,体育,数据集,比赛分析,自然语言处理,数据挖掘,机器学习,文本分析 数据概述: 该数据集包含来自自动化洞察(Automated... -
僧伽罗语新闻文章数据集SinhalaNewsArticlesDataset-timnirmal
僧伽罗语新闻文章数据集SinhalaNewsArticlesDataset-timnirmal 数据来源:互联网公开数据 标签:新闻文章,僧伽罗语,自然语言处理,文本分析,数据集,情感分析,语言模型,文本挖掘 数据概述: 该数据集包含来自互联网的僧伽罗语新闻文章,旨在为自然语言处理(NLP)研究和应用提供资源。主要特征如下:... -
新闻处理数据集NewsProcessedDataset-mario123475
新闻处理数据集NewsProcessedDataset-mario123475 数据来源:互联网公开数据 标签:新闻,数据处理,文本分析,自然语言处理,机器学习,数据挖掘,信息提取,情感分析 数据概述:该数据集包含来自互联网的新闻数据,经过预处理和清洗,适用于文本分析和自然语言处理任务。主要特征如下:... -
自然语言处理特征工程数据集FeatureEngineeringforNLPDataAcquisition-ebaruti
自然语言处理特征工程数据集FeatureEngineeringforNLPDataAcquisition-ebaruti 数据来源:互联网公开数据 标签:自然语言处理,特征工程,数据集,文本分析,机器学习,语言学,数据科学,人工智能... -
TED演讲数据集2006-2023TEDTalkDataset-tasnimtahasin
TED演讲数据集2006-2023TEDTalkDataset-tasnimtahasin 数据来源:互联网公开数据 标签:TED演讲,数据集,文本分析,视频内容,演讲者,主题分类,自然语言处理,教育与培训 数据概述:该数据集包含来自TED官方网站的演讲内容,记录了自2006年以来的TED演讲的详细信息和文本内容。主要特征如下:... -
越南语停用词数据集VLSPStopwordsVietnameseDataset-phttrnnguyngia
越南语停用词数据集VLSPStopwordsVietnameseDataset-phttrnnguyngia 数据来源:互联网公开数据 标签:自然语言处理,文本分析,停用词,越南语,数据集,语言学,文本挖掘,信息检索 数据概述: 该数据集包含了越南语的停用词列表,旨在帮助文本处理和自然语言处理任务。主要特征如下:... -
光学字符识别OCR与Gemini模型融合结果数据集OCR-GeminiResultDataset-risckynhut
光学字符识别OCR与Gemini模型融合结果数据集OCR-GeminiResultDataset-risckynhut 数据来源:互联网公开数据 标签:光学字符识别,自然语言处理,数据集,图像处理,文本分析,机器学习,人工智能,计算机视觉 数据概述: 该数据集包含通过光学字符识别(OCR)技术与 Gemini... -
正则表达式与文本挖掘清理后的NLP数据集-janiscorona
正则表达式与文本挖掘清理后的NLP数据集-janiscorona 数据来源:互联网公开数据 标签:自然语言处理,文本挖掘,正则表达式,数据清洗,NLP,数据集,文本分析,数据预处理 数据概述: 该数据集包含了经过清洗和预处理的文本数据,主要用于自然语言处理(NLP)和文本挖掘任务。主要特征如下:... -
GoJek用户应用评价数据集UASReviewGojekDataset-dwialviany
GoJek用户应用评价数据集UASReviewGojekDataset-dwialviany 数据来源:互联网公开数据 标签:用户评价,出行服务,数据集,文本分析,情感分析,自然语言处理,服务质量,移动应用 数据概述:该数据集包含来自GoJek用户的应用评价数据,记录了用户对GoJek出行服务的反馈和体验。主要特征如下:... -
聊天机器人对话数据集ChatbotCSVDataset-hageribrahim55
聊天机器人对话数据集ChatbotCSVDataset-hageribrahim55 数据来源:互联网公开数据 标签:自然语言处理,对话系统,数据集,机器学习,聊天机器人,人工智能,文本分析,数据挖掘 数据概述: 该数据集包含来自聊天机器人对话系统的数据,记录了用户与聊天机器人之间的互动对话内容。主要特征如下:... -
越南语与德语平行语料数据集Vietnamese-GermanParallelCorpusDataset-flightstar
越南语与德语平行语料数据集Vietnamese-GermanParallelCorpusDataset-flightstar 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,数据集,语料库,双语数据,文本分析,人工智能,语言技术 数据概述: 该数据集包含越南语与德语的平行语料数据,记录了两种语言之间的对齐文本。主要特征如下:... -
命名实体识别数据集NER-animeshnareda
命名实体识别数据集NER-animeshnareda 数据来源:互联网公开数据 标签:自然语言处理,命名实体识别,数据集,文本分析,机器学习,信息抽取,人工智能,NLP 数据概述:该数据集包含来自多个领域的文本数据,用于训练和评估命名实体识别模型。主要特征如下: 时间跨度:数据记录的时间范围不固定,涵盖了不同时期的新闻,文章和报告等。... -
班加罗尔推特数据集BangaloreTweetsDataset-mlcovidresearch
班加罗尔推特数据集BangaloreTweetsDataset-mlcovidresearch 数据来源:互联网公开数据 标签:社交媒体,文本分析,情感分析,数据挖掘,机器学习,城市研究,舆情分析,公众意见 数据概述: 该数据集包含来自班加罗尔地区的推特数据,记录了该城市用户在社交媒体上的公开言论和互动信息。主要特征如下:...