-
比喻性名词短语数据集BNFigurativeNPDataset-ghazalismydaughter
比喻性名词短语数据集BNFigurativeNPDataset-ghazalismydaughter 数据来源:互联网公开数据 标签:语言学,自然语言处理,数据集,比喻性语言,名词短语,语义分析,文本挖掘,机器学习 数据概述: 该数据集包含来自语言学研究和自然语言处理领域的比喻性名词短语数据,记录了各类比喻性表达和其语义特征。主要特征如下:... -
微博社交网络数据集WeiboSocialNetworksDataset-jm3402
微博社交网络数据集WeiboSocialNetworksDataset-jm3402 数据来源:互联网公开数据 标签:社交媒体,社交网络,数据集,用户行为,社会关系,网络分析,自然语言处理,机器学习 数据概述: 该数据集包含来自微博的社交网络数据,记录了用户之间的社交关系和部分用户行为信息。主要特征如下:... -
新闻文章文本数据集-nikkummishra
新闻文章文本数据集-nikkummishra 数据来源:互联网公开数据 标签:新闻,文本分析,自然语言处理,数据集,情感分析,信息检索,机器学习,舆情分析 数据概述: 该数据集包含来自多个来源的新闻文章文本数据,记录了各类新闻的详细信息。主要特征如下: 时间跨度:数据记录的时间范围为从特定年份至今。... -
日语平假名与越南语数据集Hiragana-Japanese-VietnameseDataset-flightstar
日语平假名与越南语数据集Hiragana-Japanese-VietnameseDataset-flightstar 数据来源:互联网公开数据 标签:语言学习,数据集,平假名,越南语,字符识别,自然语言处理,机器学习,多语言 数据概述: 该数据集包含日语平假名与越南语的相关数据,记录了两种语言之间的对应关系和语言特征。主要特征如下:... -
自然语言处理Kaggle竞赛1NLPKaggleCompetition1数据集-hakim11
自然语言处理Kaggle竞赛1NLPKaggleCompetition1数据集-hakim11 数据来源:互联网公开数据 标签:自然语言处理,数据集,机器学习,文本分类,文本挖掘,深度学习,文本分析,竞赛数据 数据概述: 该数据集来源于Kaggle平台举办的自然语言处理竞赛,主要记录了用于文本分类任务的文本数据。主要特征如下:... -
声波网络模型数据集WaveNetModelDataset-ashmitashuklaiit
声波网络模型数据集WaveNetModelDataset-ashmitashuklaiit 数据来源:互联网公开数据 标签:声学,语音识别,数据集,神经网络,深度学习,音频处理,人工智能,自然语言处理 数据概述: 该数据集包含用于训练和评估声波网络(WaveNet)模型的音频数据,记录了多种语音和音频信号的特征。主要特征如下:... -
酒店评论数据集HotelReviewDataset-katakuri
酒店评论数据集HotelReviewDataset-katakuri 数据来源:互联网公开数据 标签:酒店业,评论分析,数据集,文本分析,情感分析,自然语言处理,用户体验,酒店管理 数据概述: 该数据集包含来自多家酒店的用户评论数据,记录了顾客对酒店服务的评价和反馈。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2023年。... -
官方测试标签数据集OfficialTestLabelDataset-nguyenvuthanhtung
官方测试标签数据集OfficialTestLabelDataset-nguyenvuthanhtung 数据来源:互联网公开数据 标签:标签数据,数据集,自然语言处理,文本分类,机器学习,人工智能,数据标注,文本分析 数据概述: 该数据集包含来自官方测试的数据标签,记录了各类文本的标注信息,适用于自然语言处理和文本分类任务。主要特征如下:... -
电商商品信息识别与提取数据集CleanedShopeeDatawithOCRDataset-mohneesh7
电商商品信息识别与提取数据集CleanedShopeeDatawithOCRDataset-mohneesh7 数据来源:互联网公开数据 标签:电商数据,OCR识别,数据集,商品信息,图像处理,自然语言处理,机器学习,数据清洗... -
Reddit社区评论情感分析数据集RedditCommentsSentimentAnalysisDataset-diyashreedevadiga
Reddit社区评论情感分析数据集RedditCommentsSentimentAnalysisDataset-diyashreedevadiga 数据来源:互联网公开数据 标签:社交媒体,情感分析,自然语言处理,文本数据,机器学习,评论数据,舆情分析,文本挖掘 数据概述:... -
命名实体识别数据集NERDatasets-a7med7m0stvfa
命名实体识别数据集NERDatasets-a7med7m0stvfa 数据来源:互联网公开数据 标签:命名实体识别,自然语言处理,文本分析,机器学习,数据集,人工智能,信息提取,语言技术 数据概述: 该数据集包含多种文本数据,记录了文本中的命名实体信息。主要特征如下: 时间跨度:数据记录的时间范围不固定,涵盖多个时间段的文本数据。... -
孟加拉国新闻标题数据集BangladeshNewsHeadlinesDataset-ishtyaquemikrani
孟加拉国新闻标题数据集BangladeshNewsHeadlinesDataset-ishtyaquemikrani 数据来源:互联网公开数据 标签:新闻分析,数据集,文本挖掘,自然语言处理,机器学习,媒体研究,新闻分类,语言模型 数据概述: 该数据集包含来自孟加拉国新闻媒体的新闻标题数据,记录了新闻标题的文本内容。主要特征如下:... -
食谱生成器烹饪数据集RecipeGeneratorCookingDataset-siva1206
食谱生成器烹饪数据集RecipeGeneratorCookingDataset-siva1206 数据来源:互联网公开数据 标签:食谱,烹饪,数据集,菜谱,食材,自然语言处理,机器学习,文本生成 数据概述: 该数据集包含来自互联网的食谱数据,记录了各种菜肴的详细信息,旨在用于食谱生成和烹饪相关的研究。主要特征如下:... -
生态旅行文档分类数据集EcotrekDocumentClassificationDataset-hachemsfar
生态旅行文档分类数据集EcotrekDocumentClassificationDataset-hachemsfar 数据来源:互联网公开数据 标签:文档分类,自然语言处理,机器学习,数据集,环境研究,文本分析,生态旅游,信息检索 数据概述: 该数据集包含来自生态旅行领域的文档数据,记录了与生态旅游相关的各类文档的分类信息。主要特征如下:... -
-
自然语言处理训练脚本数据集NLPTrainScriptDataset-hertz192
自然语言处理训练脚本数据集NLPTrainScriptDataset-hertz192 数据来源:互联网公开数据 标签:自然语言处理,训练脚本,数据集,机器学习,文本分析,语言模型,人工智能,深度学习 数据概述: 该数据集包含用于自然语言处理(NLP)任务的训练脚本和数据,主要服务于语言模型的训练和优化。主要特征如下:... -
Flickr30K邦加拉语数据集Flicker30KBanglaDataset-arifmahmoodsarker
Flickr30K邦加拉语数据集Flicker30KBanglaDataset-arifmahmoodsarker 数据来源:互联网公开数据 标签:Flickr, 邦加拉语, 图像标注, 数据集, 机器学习, 自然语言处理, 图像识别, 多语言支持 数据概述: 该数据集包含来自 Flickr 30K 数据集的图像和其对应的邦加拉语描述。主要特征如下:... -
Steam游戏评测测试数据集Steam游戏评测测试数据集-jainkanishk95
Steam游戏评测测试数据集Steam游戏评测测试数据集-jainkanishk95 数据来源:互联网公开数据 标签:Steam, 游戏评测, 数据集, 用户反馈, 自然语言处理, 游戏产业, 机器学习, 情感分析 数据概述:该数据集包含来自Steam平台的游戏评测数据,记录了用户对游戏的评价和反馈。主要特征如下:... -
YouTube垃圾评论数据集2015-2020-rsiindicator
YouTube垃圾评论数据集2015-2020-rsiindicator 数据来源:互联网公开数据 标签:YouTube, 垃圾评论, 数据集, 自然语言处理, 机器学习, 情感分析, 社交媒体, 数据清洗 数据概述:该数据集包含来自YouTube平台的评论数据,记录了大量视频下的用户评论,特别关注其中的垃圾评论。主要特征如下:... -
注释者数据集72022年Annnotators72022Dataset-jakir57
注释者数据集72022年Annnotators72022Dataset-jakir57 数据来源:互联网公开数据 标签:注释者,数据集,自然语言处理,文本标注,机器学习,人工智能,文本分析,数据科学 数据概述: 该数据集包含2022年来自7名注释者的标注数据,记录了他们在文本标注任务中的详细信息。主要特征如下:...