-
语言模型系统大规模数据集LMSys72KDataset-qinhaoyang
语言模型系统大规模数据集LMSys72KDataset-qinhaoyang 数据来源:互联网公开数据 标签:语言模型,自然语言处理,数据集,机器学习,文本分析,人工智能,大数据,文本生成 数据概述: 该数据集由LMSys项目提供,包含大规模的文本数据,适用于语言模型训练、自然语言处理及文本生成等任务。主要特征如下:... -
文本分析与自然语言处理数据集TextAnalysisandNLPDataset-jayjinnie
文本分析与自然语言处理数据集TextAnalysisandNLPDataset-jayjinnie 数据来源:互联网公开数据 标签:文本分析,自然语言处理,数据集,机器学习,情感分析,文本分类,语言模型,信息提取 数据概述: 该数据集包含来自多个来源的文本数据,记录了各类文本内容及其相关属性。主要特征如下:... -
求职平台职位描述数据集IndeedJobDescriptionsDataset-sophiatu2
求职平台职位描述数据集IndeedJobDescriptionsDataset-sophiatu2 数据来源:互联网公开数据 标签:人力资源,职位描述,数据集,文本分析,机器学习,职业发展,数据挖掘,自然语言处理 数据概述: 该数据集包含来自求职平台Indeed的职位描述数据,记录了不同行业和地区的招聘信息。主要特征如下:... -
越南股市新闻数据集VietnameseStockNewsDataset-frozenrainbow
越南股市新闻数据集VietnameseStockNewsDataset-frozenrainbow 数据来源:互联网公开数据 标签:股市新闻,数据集,金融市场,自然语言处理,投资分析,经济研究,文本分析,机器学习 数据概述:该数据集包含来自越南多个新闻媒体的股市相关新闻报道,记录了关于越南股市的最新动态、公司财报、市场分析等信息。主要特征如下:... -
Mercari商品价格预测数据集-illgorhek
Mercari商品价格预测数据集-illgorhek 数据来源:互联网公开数据 标签:电商,价格预测,数据集,机器学习,商品销售,自然语言处理,文本分析,推荐系统 数据概述: 该数据集包含来自Mercari电商平台上的商品信息,用于商品价格预测。主要特征如下: 时间跨度:数据记录的时间跨度未知,具体取决于数据集的发布时间。... -
机器翻译Transformer模型数据集TransformerMTDataset-doltinukuid
机器翻译Transformer模型数据集TransformerMTDataset-doltinukuid 数据来源:互联网公开数据 标签:机器翻译,Transformer,数据集,自然语言处理,深度学习,语言学,人工智能,文本分析... -
俄罗斯新闻文本数据集Lenta-FontankaDataset-hosstell
俄罗斯新闻文本数据集Lenta-FontankaDataset-hosstell 数据来源:互联网公开数据 标签:新闻文本,自然语言处理,文本分析,情感分析,俄语,数据集,文本分类,信息检索 数据概述: 该数据集包含了来自Lenta.ru和Fontanka.ru两个俄罗斯新闻网站的文本数据,记录了新闻文章的详细信息。主要特征如下:... -
文本毒性分类数据集-chenxidong
文本毒性分类数据集-chenxidong 数据来源:互联网公开数据 标签:文本分类,毒性检测,自然语言处理,机器学习,情感分析,文本分析,数据安全,社交媒体 数据概述: 该数据集包含了大量的文本数据,并标注了文本的毒性程度,旨在用于训练和评估文本毒性分类模型。主要特征如下: 时间跨度:... -
网页抓取数据集CrawlData-fdfyaytkt
网页抓取数据集CrawlData-fdfyaytkt 数据来源:互联网公开数据 标签:网页抓取,数据集,文本分析,自然语言处理,网络数据,信息检索,数据挖掘,网络爬虫 数据概述: 该数据集包含了从互联网上抓取到的网页内容数据,涵盖了各种主题和来源。主要特征如下: 时间跨度: 数据记录的时间范围不定,取决于网页抓取的具体时间。 地理范围:... -
有价值沟通数据集ValuableCommunicationDataset-yarome
有价值沟通数据集ValuableCommunicationDataset-yarome 数据来源:互联网公开数据 标签:沟通研究,数据集,社交媒体,文本分析,情感分析,自然语言处理,心理学,数据挖掘 数据概述:该数据集包含来自社交媒体平台的有价值沟通数据,记录了用户之间的交流信息。主要特征如下: 时间跨度:数据记录的时间范围从2016年到2021年。... -
商品销售价格预测数据集ProductSalesPricePrediction-drewsy1991
商品销售价格预测数据集ProductSalesPricePrediction-drewsy1991 数据来源:互联网公开数据 标签:商品销售, 价格预测, 机器学习, 文本分析, 商品描述, 电商, 零售, 数据挖掘 数据概述:... -
新冠疫情常见问题解答数据集COVID-19FAQsDataset-mohankrishnan02
新冠疫情常见问题解答数据集COVID-19FAQsDataset-mohankrishnan02 数据来源:互联网公开数据 标签:新冠疫情,FAQ,问答,数据集,自然语言处理,文本分析,健康,公共卫生 数据概述: 该数据集包含了关于新冠疫情的常见问题与解答,旨在提供关于COVID-19的全面信息。主要特征如下:... -
甲状腺手术相关医学文献数据集ThyroidSurgeryMedicalLiteratureDataset-emirhancelik
甲状腺手术相关医学文献数据集ThyroidSurgeryMedicalLiteratureDataset-emirhancelik 数据来源:互联网公开数据 标签:医学文献, 甲状腺手术, 儿童, 手术结果, 临床研究, 文本分析, 医疗健康, 数据挖掘 数据概述: 该数据集包含来自医学文献的数据,记录了儿童甲状腺手术的相关信息。主要特征如下:... -
图像描述词频统计数据集ImageDescriptionWordFrequencyStatistics-ritchie46
图像描述词频统计数据集ImageDescriptionWordFrequencyStatistics-ritchie46 数据来源:互联网公开数据 标签:图像描述, 词频统计, 文本分析, 自然语言处理, 计算机视觉, 语料库, 数据挖掘, 图像检索 数据概述:... -
时尚行业社交媒体文本数据分析数据集FashionIndustrySocialMediaTextDataAnalysis-rahulshelke98
时尚行业社交媒体文本数据分析数据集FashionIndustrySocialMediaTextDataAnalysis-rahulshelke98 数据来源:互联网公开数据 标签:时尚, 社交媒体, 文本分析, 情感分析, 话题识别, 流行趋势, 数据挖掘, 机器学习 数据概述:... -
电影评论用户画像数据集MovieReviewsUserProfileDataset-gabriellealves
电影评论用户画像数据集MovieReviewsUserProfileDataset-gabriellealves 数据来源:互联网公开数据 标签:电影评论, 用户画像, 文本分析, 数据挖掘, 用户行为, 情感分析, 数据集, 机器学习 数据概述: 该数据集包含来自互联网的电影评论数据,记录了用户对电影的评论文本以及用户的基本信息。主要特征如下:... -
金融新闻情感分析数据集FinancialNewsSentimentAnalysisDataset-tderonde
金融新闻情感分析数据集FinancialNewsSentimentAnalysisDataset-tderonde 数据来源:互联网公开数据 标签:金融新闻,情感分析,自然语言处理,数据集,文本分析,机器学习,金融科技,情感分类 数据概述: 该数据集包含了经过 FinBERT 模型处理的金融新闻数据,用于情感分析研究。主要特征如下: 时间跨度:... -
消息内容分析数据集MessagesV1Dataset-pcvchowdary
消息内容分析数据集MessagesV1Dataset-pcvchowdary 数据来源:互联网公开数据 标签:消息,文本分析,自然语言处理,情感分析,数据集,社交媒体,机器学习,数据挖掘 数据概述: 该数据集包含来自各种社交媒体平台的消息内容,记录了用户之间的文本交流信息。主要特征如下: 时间跨度:数据记录的时间范围从2020年初到2023年末。... -
亚马逊评论词汇处理数据集AmazonReviewsLexicalProcessingDataset-abidinawres
亚马逊评论词汇处理数据集AmazonReviewsLexicalProcessingDataset-abidinawres 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,词汇处理,情感分析,机器学习,电子商务,消费者研究 数据概述: 该数据集包含来自亚马逊平台的用户评论数据,记录了商品评论的文本内容及其相关信息。主要特征如下:... -
电影及其剧本数据集MoviesandMovieScriptsDataset-torloweidadata
电影及其剧本数据集MoviesandMovieScriptsDataset-torloweidadata 数据来源:互联网公开数据 标签:电影,剧本,数据集,文本分析,自然语言处理,文学研究,文化研究,娱乐产业 数据概述: 该数据集包含来自多个来源的电影及其剧本数据,记录了电影的基本信息和对应的剧本内容。主要特征如下:...