-
越南快讯新闻文章数据集VnExpressNewsArticleDataset-trnnhtminh
越南快讯新闻文章数据集VnExpressNewsArticleDataset-trnnhtminh 数据来源:互联网公开数据 标签:新闻文章,越南,自然语言处理,文本分析,数据集,情感分析,主题分类,信息检索 数据概述: 该数据集包含了来自越南新闻网站VnExpress的文章数据,记录了该网站上发布的新闻文章的详细信息。主要特征如下:... -
文本摘要生成数据集SESummarizationDataset-rahulshelke98
文本摘要生成数据集SESummarizationDataset-rahulshelke98 数据来源:互联网公开数据 标签:文本摘要,数据集,自然语言处理,机器学习,信息检索,文本挖掘,语言学,数据科学 数据概述:该数据集包含来自Stack... -
BBC新闻分类数据集NewsCategoryofBBCDataset-remyakarthika
BBC新闻分类数据集NewsCategoryofBBCDataset-remyakarthika 数据来源:互联网公开数据 标签:新闻分类,数据集,自然语言处理,机器学习,文本分析,信息检索,媒体研究,文本挖掘 数据概述: 该数据集包含来自BBC的新闻文章数据,记录了不同类别的新闻文章内容。主要特征如下:... -
邮件分析数据集EmailAnalysisDataset-sanjayyym
邮件分析数据集EmailAnalysisDataset-sanjayyym 数据来源:互联网公开数据 标签:邮件分析,文本挖掘,数据集,自然语言处理,情感分析,垃圾邮件检测,信息检索,机器学习 数据概述: 该数据集包含来自互联网的邮件数据,主要用于邮件内容分析,情感分析,垃圾邮件检测等任务。主要特征如下:... -
维基百科与MSMARCO问答数据集WikiandMSMARCOQ-ADataset-rangoiv
维基百科与MSMARCO问答数据集WikiandMSMARCOQ-ADataset-rangoiv 数据来源:互联网公开数据 标签:自然语言处理,问答系统,数据集,信息检索,机器学习,文本分析,知识图谱,深度学习 数据概述: 该数据集结合了维基百科和MS MARCO的数据,记录了大量的问答对和相关信息检索结果。主要特征如下:... -
语义文本相关性数据集SemanticTextualRelatednessData-udvasbasak
语义文本相关性数据集SemanticTextualRelatednessData-udvasbasak 数据来源:互联网公开数据 标签:文本分析,语义理解,自然语言处理,机器学习,信息检索,人工智能,语言模型,数据挖掘 数据概述: 该数据集包含来自公开资源的数据,记录了用于衡量文本间语义相关性的文本对。主要特征如下:... -
研究信息检索与科学数据集RissDataset-ResearchInformationRetrievalandScienceDataset-chahine...
研究信息检索与科学数据集RissDataset-ResearchInformationRetrievalandScienceDataset-chahinebendjeddou 数据来源:互联网公开数据 标签:信息检索,科学研究,数据集,学术论文,机器学习,数据分析,学术资源,知识图谱 数据概述:... -
项目DOI记录数据集ProjectDOIRecordDataset-matheualves
项目DOI记录数据集ProjectDOIRecordDataset-matheualves 数据来源:互联网公开数据 标签:DOI,项目管理,数据集,学术研究,数字标识符,科研管理,信息检索,学术出版 数据概述: 该数据集包含来自多个学术项目和研究成果的DOI(数字对象标识符)记录,记录了各类学术项目的唯一标识信息。主要特征如下:... -
灾害应急处理自然语言处理数据集NLPwithDisasterDataset-tarun2k3
灾害应急处理自然语言处理数据集NLPwithDisasterDataset-tarun2k3 数据来源:互联网公开数据 标签:自然语言处理,灾害应急,文本分类,数据集,机器学习,信息检索,危机管理,社会媒体分析 数据概述:该数据集包含来自Twitter的推文数据,记录了与灾害事件相关的文本信息。主要特征如下:... -
垃圾邮件检测与情感分析数据集EmailSpamDetectionandSentimentAnalysisDataset-adarshkumarjha
垃圾邮件检测与情感分析数据集EmailSpamDetectionandSentimentAnalysisDataset-adarshkumarjha 数据来源:互联网公开数据 标签:垃圾邮件,情感分析,数据集,文本分类,自然语言处理,机器学习,文本挖掘,信息检索 数据概述: 该数据集包含了电子邮件数据,用于垃圾邮件检测和情感分析任务。主要特征如下:... -
项目文件数据集-justingrima
项目文件数据集-justingrima 数据来源:互联网公开数据 标签:项目管理,文件分析,数据集,文档处理,数据挖掘,文本分析,信息检索,版本控制 数据概述: 该数据集包含了一系列项目文件的相关数据,记录了项目中各种类型文件的详细信息。主要特征如下: 时间跨度:数据记录的时间范围涵盖了项目文件的创建,修改和版本控制时间。... -
用户知识图谱数据集Yu-KTDataset-ayu2anqi
用户知识图谱数据集Yu-KTDataset-ayu2anqi 数据来源:互联网公开数据 标签:知识图谱,用户行为,数据集,机器学习,数据挖掘,信息检索,人工智能,社交网络 数据概述: 该数据集包含来自社交网络平台或用户行为记录的知识图谱数据,记录了用户在平台上的交互行为,信息偏好及社交关系。主要特征如下:... -
网页链接与描述数据集-fan1dy
网页链接与描述数据集-fan1dy 数据来源:互联网公开数据 标签:网页链接,文本分析,数据挖掘,自然语言处理,信息检索,文本分类,网络数据,数据集 数据概述: 该数据集包含来自互联网的网页链接,网页标题和网页描述信息。主要特征如下: 时间跨度:数据记录的时间范围不明确,取决于抓取时间,但涵盖了大量的网页数据。 地理范围:数据覆盖全球范围内的网页。... -
PromptEnhanceArchive数据集PromptEnhanceArchiveDataset-overtimecraftsclips
PromptEnhanceArchive数据集PromptEnhanceArchiveDataset-overtimecraftsclips 数据来源:互联网公开数据 标签:自然语言处理,文本增强,数据集,机器学习,深度学习,文本挖掘,语言模型,信息检索 数据概述:... -
BBC新闻导航数据集BBCNewsNavigatorDataset-remyakarthika
BBC新闻导航数据集BBCNewsNavigatorDataset-remyakarthika 数据来源:互联网公开数据 标签:新闻媒体,数据集,文本分析,自然语言处理,信息检索,机器学习,新闻分类,数据分析 数据概述:该数据集包含来自BBC新闻导航系统的数据,记录了新闻文章的详细信息。主要特征如下:... -
阿拉伯语文本摘要基准数据集ArabicSummarizationBenchmarkDataset-bavlygeorge
阿拉伯语文本摘要基准数据集ArabicSummarizationBenchmarkDataset-bavlygeorge 数据来源:互联网公开数据 标签:阿拉伯语,文本摘要,数据集,自然语言处理,机器学习,语言学,信息检索,翻译 数据概述: 该数据集包含来自多个来源的阿拉伯语文本数据,旨在用于文本摘要任务的评估和研究。主要特征如下:... -
文档关键词提取数据集Keywords-in-DocumentsDataset-hachemsfarecotrek
文档关键词提取数据集Keywords-in-DocumentsDataset-hachemsfarecotrek 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,关键词提取,机器学习,信息检索,文本挖掘,数据科学 数据概述: 该数据集包含来自多个来源的文档数据,记录了文档及其对应的关键词信息。主要特征如下:... -
电子邮件意图识别数据集-nikhilhestabit
电子邮件意图识别数据集-nikhilhestabit 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,电子邮件,意图识别,机器学习,情感分析,信息检索 数据概述: 该数据集包含来自电子邮件的数据,旨在用于电子邮件意图识别任务。主要特征如下: 时间跨度:数据记录的时间范围不明确,但涵盖了多种不同时间段的电子邮件。... -
微软大规模机器阅读理解文档检索评分数据集MSMARCOQueryDocScoreDataset-tnhan1806
微软大规模机器阅读理解文档检索评分数据集MSMARCOQueryDocScoreDataset-tnhan1806 数据来源:互联网公开数据 标签:机器阅读理解,文档检索,数据集,自然语言处理,信息检索,深度学习,文本匹配,问答系统 数据概述: 该数据集由微软发布,旨在促进机器阅读理解和文档检索领域的研究。数据集的核心是查询-... -
主题建模数据集TopicModelingDataset-quangvinhtrnh
主题建模数据集TopicModelingDataset-quangvinhtrnh 数据来源:互联网公开数据 标签:主题建模,数据集,自然语言处理,文本分析,机器学习,数据挖掘,信息检索,文本挖掘 数据概述: 该数据集专注于主题建模任务,包含来自多个来源的文本数据,用于分析文本内容中的潜在主题。主要特征如下:...