-
关键词提取与文本摘要数据集Keys-TextrankDataset-yojn710
关键词提取与文本摘要数据集Keys-TextrankDataset-yojn710 数据来源:互联网公开数据 标签:自然语言处理,文本分析,关键词提取,数据集,机器学习,文本摘要,信息检索,人工智能 数据概述: 该数据集专注于自然语言处理领域,主要记录了文本中的关键词提取和文本摘要任务所需的数据。主要特征如下:... -
WikiSQLSpider数据集WikiSQLSpiderDataset-charanhu
WikiSQLSpider数据集WikiSQLSpiderDataset-charanhu 数据来源:互联网公开数据 标签:SQL查询,数据集,数据库,自然语言处理,信息检索,机器学习,模式匹配,数据分析 数据概述: 该数据集由 WikiSQLSpider 项目提供,主要记录了从自然语言问题到 SQL 查询的转换数据,适用于 SQL... -
知识库构建与应用数据集KnowledgeBaseDataset-mariamelseedawy
知识库构建与应用数据集KnowledgeBaseDataset-mariamelseedawy 数据来源:互联网公开数据 标签:知识库,数据集,信息检索,自然语言处理,人工智能,机器学习,语义网,知识图谱 数据概述: 该数据集包含用于知识库构建与应用的多领域结构化数据,记录了各类实体,属性及关系信息。主要特征如下: 时间跨度:... -
邮件垃圾信息检测数据集EmailSpamDetectionDataset-tridovan
邮件垃圾信息检测数据集EmailSpamDetectionDataset-tridovan 数据来源:互联网公开数据 标签:垃圾邮件,邮件分类,数据集,自然语言处理,文本分析,机器学习,信息检索,安全 数据概述: 该数据集包含了电子邮件信息,用于垃圾邮件的检测与分类。主要特征如下: 时间跨度:数据记录的时间不明确,但涵盖了收集电子邮件的时间段。... -
问答数据集QuestionAnsweringDataset-namphmquang
问答数据集QuestionAnsweringDataset-namphmquang 数据来源:互联网公开数据 标签:问答系统,自然语言处理,数据集,机器学习,语言模型,知识库,信息检索,人工智能 数据概述:该数据集包含来自多个来源的问答对数据,记录了用户提出的问题及其对应的答案。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。... -
股票情绪分析新闻标题数据集StockSentimentAnalysisUsingNewsHeadlinesDataset-shivammishra3
股票情绪分析新闻标题数据集StockSentimentAnalysisUsingNewsHeadlinesDataset-shivammishra3 数据来源:互联网公开数据 标签:股票情绪分析,新闻标题,数据集,金融分析,自然语言处理,机器学习,投资决策,信息检索 数据概述: 该数据集包含新闻标题,用于分析新闻报道对股票市场情绪的影响。主要特征如下:... -
影视元数据数据集MovieMetadataCSVDataset-vikramgunaganti
影视元数据数据集MovieMetadataCSVDataset-vikramgunaganti 数据来源:互联网公开数据 标签:影视分析,元数据,数据集,数据挖掘,机器学习,信息检索,文化产业,统计分析 数据概述: 该数据集包含来自电影数据库的元数据,记录了电影作品的关键信息。主要特征如下:... -
维基百科句子数据集WikiSentencesV2-ranjitp20
维基百科句子数据集WikiSentencesV2-ranjitp20 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,语言模型,文本语料库,信息检索,机器学习,文本摘要 数据概述: 该数据集包含了来自维基百科的句子,旨在为自然语言处理任务提供大规模文本语料库。主要特征如下:... -
商业新闻文章数据集BusinessNewsArticlesDataset-talalhassan141
商业新闻文章数据集BusinessNewsArticlesDataset-talalhassan141 数据来源:互联网公开数据 标签:新闻,商业,财经,文本分析,自然语言处理,情感分析,信息检索,数据挖掘 数据概述: 该数据集包含来自各类商业新闻网站和媒体的文章,记录了全球范围内的商业和财经新闻。主要特征如下:... -
自助文章问题解决与建议数据集-greatcodes
自助文章问题解决与建议数据集-greatcodes 数据来源:互联网公开数据 标签:自助,健康,移民,个人护理,问题解决,建议,文本分类,信息检索,内容分析,文本摘要 数据概述:... -
谷歌趋势搜索数据集GoogleTrendsSearchDataDataset-angelcc
谷歌趋势搜索数据集GoogleTrendsSearchDataDataset-angelcc 数据来源:互联网公开数据 标签:互联网搜索,数据集,趋势分析,用户行为,数据分析,市场研究,信息检索,社会热点 数据概述: 该数据集包含来自谷歌趋势(Google... -
越南快讯新闻文章数据集VnExpressNewsArticleDataset-trnnhtminh
越南快讯新闻文章数据集VnExpressNewsArticleDataset-trnnhtminh 数据来源:互联网公开数据 标签:新闻文章,越南,自然语言处理,文本分析,数据集,情感分析,主题分类,信息检索 数据概述: 该数据集包含了来自越南新闻网站VnExpress的文章数据,记录了该网站上发布的新闻文章的详细信息。主要特征如下:... -
文本摘要生成数据集SESummarizationDataset-rahulshelke98
文本摘要生成数据集SESummarizationDataset-rahulshelke98 数据来源:互联网公开数据 标签:文本摘要,数据集,自然语言处理,机器学习,信息检索,文本挖掘,语言学,数据科学 数据概述:该数据集包含来自Stack... -
BBC新闻分类数据集NewsCategoryofBBCDataset-remyakarthika
BBC新闻分类数据集NewsCategoryofBBCDataset-remyakarthika 数据来源:互联网公开数据 标签:新闻分类,数据集,自然语言处理,机器学习,文本分析,信息检索,媒体研究,文本挖掘 数据概述: 该数据集包含来自BBC的新闻文章数据,记录了不同类别的新闻文章内容。主要特征如下:... -
邮件分析数据集EmailAnalysisDataset-sanjayyym
邮件分析数据集EmailAnalysisDataset-sanjayyym 数据来源:互联网公开数据 标签:邮件分析,文本挖掘,数据集,自然语言处理,情感分析,垃圾邮件检测,信息检索,机器学习 数据概述: 该数据集包含来自互联网的邮件数据,主要用于邮件内容分析,情感分析,垃圾邮件检测等任务。主要特征如下:... -
维基百科与MSMARCO问答数据集WikiandMSMARCOQ-ADataset-rangoiv
维基百科与MSMARCO问答数据集WikiandMSMARCOQ-ADataset-rangoiv 数据来源:互联网公开数据 标签:自然语言处理,问答系统,数据集,信息检索,机器学习,文本分析,知识图谱,深度学习 数据概述: 该数据集结合了维基百科和MS MARCO的数据,记录了大量的问答对和相关信息检索结果。主要特征如下:... -
语义文本相关性数据集SemanticTextualRelatednessData-udvasbasak
语义文本相关性数据集SemanticTextualRelatednessData-udvasbasak 数据来源:互联网公开数据 标签:文本分析,语义理解,自然语言处理,机器学习,信息检索,人工智能,语言模型,数据挖掘 数据概述: 该数据集包含来自公开资源的数据,记录了用于衡量文本间语义相关性的文本对。主要特征如下:... -
研究信息检索与科学数据集RissDataset-ResearchInformationRetrievalandScienceDataset-chahine...
研究信息检索与科学数据集RissDataset-ResearchInformationRetrievalandScienceDataset-chahinebendjeddou 数据来源:互联网公开数据 标签:信息检索,科学研究,数据集,学术论文,机器学习,数据分析,学术资源,知识图谱 数据概述:... -
项目DOI记录数据集ProjectDOIRecordDataset-matheualves
项目DOI记录数据集ProjectDOIRecordDataset-matheualves 数据来源:互联网公开数据 标签:DOI,项目管理,数据集,学术研究,数字标识符,科研管理,信息检索,学术出版 数据概述: 该数据集包含来自多个学术项目和研究成果的DOI(数字对象标识符)记录,记录了各类学术项目的唯一标识信息。主要特征如下:... -
灾害应急处理自然语言处理数据集NLPwithDisasterDataset-tarun2k3
灾害应急处理自然语言处理数据集NLPwithDisasterDataset-tarun2k3 数据来源:互联网公开数据 标签:自然语言处理,灾害应急,文本分类,数据集,机器学习,信息检索,危机管理,社会媒体分析 数据概述:该数据集包含来自Twitter的推文数据,记录了与灾害事件相关的文本信息。主要特征如下:...