-
Web搜索与数据挖掘竞赛WSDMCup数据集WebSearchandDataMiningCompetitionDataset-vicks18
Web搜索与数据挖掘竞赛WSDMCup数据集WebSearchandDataMiningCompetitionDataset-vicks18 数据来源:互联网公开数据 标签:数据挖掘,搜索引擎,机器学习,文本分析,信息检索,推荐系统,数据集,算法竞赛 数据概述:该数据集来自Web搜索与数据挖掘竞赛(WSDM... -
数据2019年4月至9月搜索Feed新闻聚合数据集RSSFeedApril-September2019fromSearchFeedIME-davidesantangelo
2019年4月至9月搜索Feed新闻聚合数据集RSSFeedApril-September2019fromSearchFeedIME-davidesantangelo 数据来源:互联网公开数据 标签:新闻聚合,数据集,RSS,文本分析,信息检索,机器学习,媒体研究,网络数据 数据概述:... -
新闻订阅源数据RSSNewsFeedData-kopaldixit
新闻订阅源数据RSSNewsFeedData-kopaldixit 数据来源:互联网公开数据 标签:新闻,RSS,数据集,自然语言处理,文本分析,信息检索,机器学习,新闻聚合 数据概述: 该数据集包含来自RSS新闻订阅源的数据,记录了新闻文章的标题、摘要、正文、发布时间、来源网站等信息。主要特征如下:... -
维基文本清洗数据集第二部分WikitextCleanDataPart2Dataset-yingpengchen
维基文本清洗数据集第二部分WikitextCleanDataPart2Dataset-yingpengchen 数据来源:互联网公开数据 标签:自然语言处理,文本数据,数据集,文本清洗,机器学习,语言模型,信息检索,文本分析 数据概述: 该数据集是维基文本清洗数据集的第二部分,包含了从维基百科中提取和清洗过的文本数据。主要特征如下:... -
Sber银行问答数据集SberQADataset-theerror
Sber银行问答数据集SberQADataset-theerror 数据来源:互联网公开数据 标签:问答系统,自然语言处理,数据集,机器学习,人工智能,银行服务,客户支持,信息检索 数据概述:该数据集由Sber银行提供,包含了一系列用户与银行客服之间的问答对话,适用于自然语言处理和问答系统的研究。主要特征如下:... -
计算机科学领域论文数据集DBLP-curiousaniruddha
计算机科学领域论文数据集DBLP-curiousaniruddha 数据来源:互联网公开数据 标签:论文,数据集,计算机科学,学术,出版物,信息检索,数据挖掘,自然语言处理 数据概述:该数据集包含来自DBLP(数字图书馆与出版物)的数据,记录了计算机科学领域的学术论文出版信息。主要特征如下:... -
电商商品问答生成数据集E-commerceQuestionAnsweringGenerationDataset-cosmicrayer
电商商品问答生成数据集E-commerceQuestionAnsweringGenerationDataset-cosmicrayer 数据来源:互联网公开数据 标签:电商,问答生成,自然语言处理,数据集,文本生成,机器学习,信息检索,商品信息 数据概述: 该数据集包含电商平台上的商品信息和对应的问答对,用于训练和评估问答生成模型。主要特征如下:... -
多语言新闻文章数据集Multi-NewsDataset-terrychanorg
多语言新闻文章数据集Multi-NewsDataset-terrychanorg 数据来源:互联网公开数据 标签:新闻,多语言,数据集,自然语言处理,文本摘要,机器翻译,信息检索,文本分析 数据概述: 该数据集包含来自不同语言的新闻文章,用于文本摘要和多语言处理任务。主要特征如下: 时间跨度:数据记录的时间范围为不确定,取决于新闻来源的更新频率。... -
电影详情与评分推荐系统数据集MovieDetailsandRatingsforRecommenderSystemsDataset-reetamborgohain
电影详情与评分推荐系统数据集MovieDetailsandRatingsforRecommenderSystemsDataset-reetamborgohain 数据来源:互联网公开数据 标签:电影评分,推荐系统,数据集,用户行为,数据分析,机器学习,信息检索,娱乐产业 数据概述:... -
维基百科内容数据集WikiDataset-selcukcan
维基百科内容数据集WikiDataset-selcukcan 数据来源:互联网公开数据 标签:维基百科,数据集,文本分析,自然语言处理,机器学习,信息检索,知识图谱,语义分析 数据概述: 该数据集包含来自维基百科的文本内容,记录了维基百科上的文章、条目及相关信息。主要特征如下: 时间跨度:数据记录的时间范围从维基百科创建至今(动态更新)。... -
天文学与地质学维基百科文章数据集AstronomyandGeologyWikipediaArticles-abdelrahmanghunemiii
天文学与地质学维基百科文章数据集AstronomyandGeologyWikipediaArticles-abdelrahmanghunemiii 数据来源:互联网公开数据 标签:维基百科, 天文学, 地质学, 文本分析, 网页抓取, 知识图谱, 信息检索, 自然语言处理 数据概述:... -
印地语和泰米尔语问答数据集HindiandTamilQuestionAnsweringDataset-urstrulysai
印地语和泰米尔语问答数据集HindiandTamilQuestionAnsweringDataset-urstrulysai 数据来源:互联网公开数据 标签:问答系统, 文本理解, 机器阅读, 印度语言, 印地语, 泰米尔语, 自然语言处理, 信息检索 数据概述:... -
维基百科文章文本数据集WikipediaArticleTextData-tolgaerdogmus
维基百科文章文本数据集WikipediaArticleTextData-tolgaerdogmus 数据来源:互联网公开数据 标签:维基百科, 文本数据, 自然语言处理, 文本分析, 信息检索, 语料库, 文本挖掘, 数据集 数据概述: 该数据集包含来自维基百科的文章文本数据,记录了维基百科上收录的各种主题的文章内容。主要特征如下:... -
学术论文文本分析数据集AcademicPaperTextAnalysisDataset-rishiii20
学术论文文本分析数据集AcademicPaperTextAnalysisDataset-rishiii20 数据来源:互联网公开数据 标签:学术论文, 文本分析, 自然语言处理, 学术研究, 论文摘要, 文本挖掘, 信息检索, 机器学习 数据概述:... -
文本分类新闻数据集TextClassificationNewsDataset-balatmak
文本分类新闻数据集TextClassificationNewsDataset-balatmak 数据来源:互联网公开数据 标签:文本分类, 新闻, 自然语言处理, 语料库, 多分类, 机器学习, 文本挖掘, 信息检索 数据概述: 该数据集包含来自不同新闻来源的文本数据,记录了新闻文章的内容及其所属类别,适用于文本分类、信息检索等任务。主要特征如下:... -
阿拉伯语问答数据集-真伪判断与文本分析ArabicQuestionAnsweringDataset-TrueorFalseJudgmentandTextA...
阿拉伯语问答数据集-真伪判断与文本分析ArabicQuestionAnsweringDataset-TrueorFalseJudgmentandTextAnalysis-ibrahim2002 数据来源:互联网公开数据 标签:阿拉伯语, 问答系统, 文本分析, 信息检索, 事实判断, 自然语言处理, 机器阅读理解, 数据集 数据概述:... -
美国国家档案馆政府文件清理数据集GADatasetClean-zhihaozhao777
美国国家档案馆政府文件清理数据集GADatasetClean-zhihaozhao777 数据来源:互联网公开数据 标签:政府文件,数据集,数据清洗,文本分析,自然语言处理,档案管理,信息检索,历史研究 数据概述: 该数据集包含来自美国国家档案馆(GA)的政府文件数据,记录了已清理的政府文件文本内容。主要特征如下:... -
问题映射与分类数据集QuestionMappingandClassificationDataset-ammarmasselhy
问题映射与分类数据集QuestionMappingandClassificationDataset-ammarmasselhy 数据来源:互联网公开数据 标签:问题分类,数据集,自然语言处理,文本分析,机器学习,信息检索,人工智能,语义理解 数据概述: 该数据集包含来自多个领域的公开问题数据,记录了各类问题的文本内容及其对应的分类标签。主要特征如下:... -
安然公司电子邮件数据集EnronEmailDataset-napisarchuk
安然公司电子邮件数据集EnronEmailDataset-napisarchuk 数据来源:互联网公开数据 标签:电子邮件,数据集,文本分析,自然语言处理,金融,腐败,社交网络,信息检索 数据概述: 该数据集包含来自美国安然公司(Enron Corporation)员工的电子邮件,记录了该公司在破产前的大量内部通信。主要特征如下:... -
数据2021年最新新闻数据集LatestNewsDataset2021-newsdataio
2021年最新新闻数据集LatestNewsDataset2021-newsdataio 数据来源:互联网公开数据 标签:新闻,数据集,文本分析,自然语言处理,机器学习,情感分析,信息检索,数据挖掘 数据概述:该数据集包含来自2021年全球各地的新闻数据,记录了各类新闻事件和报道内容。主要特征如下:...