-
地区报纸可视化元数据数据集-nikhilwani
地区报纸可视化元数据数据集-nikhilwani 数据来源:互联网公开数据 标签:新闻,可视化,数据集,文本分析,自然语言处理,信息检索,媒体研究,出版物 数据概述: 该数据集包含来自地区报纸的可视化元数据,记录了报纸文章中可视元素的详细信息。主要特征如下: 时间跨度:数据记录的时间范围为未知,具体时间跨度取决于数据集的原始来源。... -
科学BERT数据集SciBERTDataset-cse006kongkanbora
科学BERT数据集SciBERTDataset-cse006kongkanbora 数据来源:互联网公开数据 标签:科学文献,自然语言处理,数据集,机器学习,深度学习,文本分类,学术研究,信息检索 数据概述:该数据集包含来自多个科学文献的数据,记录了大量科学论文的摘要,文本和相关元数据。主要特征如下:... -
文本分类数据集TextClassificationDataset-albellna
文本分类数据集TextClassificationDataset-albellna 数据来源:互联网公开数据 标签:文本分类,自然语言处理,数据集,机器学习,文本分析,信息检索,人工智能,语言模型 数据概述: 该数据集包含来自多个来源的文本数据,记录了不同类别文本的样本,适用于文本分类,情感分析等应用。主要特征如下:... -
学术会议论文数据集AcademicConferencesPapersDataset-igalbronshtein
学术会议论文数据集AcademicConferencesPapersDataset-igalbronshtein 数据来源:互联网公开数据 标签:学术会议,论文,数据集,自然语言处理,文本分析,信息检索,学术研究,机器学习 数据概述: 该数据集包含来自多个学术会议的论文数据,记录了会议论文的标题,摘要,关键词,作者信息等。主要特征如下:... -
自然语言处理与信息检索INLP作业3数据集INLPAssignment3Dataset-shubhamkathiriya
自然语言处理与信息检索INLP作业3数据集INLPAssignment3Dataset-shubhamkathiriya 数据来源:互联网公开数据 标签:自然语言处理,信息检索,数据集,文本分类,机器学习,深度学习,文本分析,数据挖掘 数据概述:... -
BM25基础训练集数据集-danielphalen
BM25基础训练集数据集-danielphalen 数据来源:互联网公开数据 标签:信息检索,文本处理,数据集,自然语言处理,BM25,搜索算法,文本相似度,机器学习 数据概述:该数据集包含用于训练和评估BM25(Best Match 25)模型的文本数据,主要用于信息检索任务。主要特征如下: 时间跨度:数据涵盖了从特定时间段内收集的文本数据。... -
健康问答数据集ViHealthQADataset-quangnguynvnnn
健康问答数据集ViHealthQADataset-quangnguynvnnn 数据来源:互联网公开数据 标签:健康问答,数据集,医疗健康,自然语言处理,机器学习,医学研究,信息检索,人工智能 数据概述:该数据集包含来自互联网的健康问答数据,记录了用户提出健康相关问题及专家的回答。主要特征如下: 时间跨度:数据记录的时间范围从2018年到2022年。... -
越南新闻摘要数据集VietnameseSummaryDataset-trinhnguyenthmai
越南新闻摘要数据集VietnameseSummaryDataset-trinhnguyenthmai 数据来源:互联网公开数据 标签:越南语,文本摘要,数据集,自然语言处理,NLP,机器翻译,信息检索,文本分析 数据概述: 该数据集包含来自越南新闻网站的文章及其对应的摘要。主要特征如下:... -
新闻头条数据集NewsHeadlineDataset-satyamneelmani
新闻头条数据集NewsHeadlineDataset-satyamneelmani 数据来源:互联网公开数据 标签:新闻,头条,数据集,文本分析,自然语言处理,机器学习,信息检索,舆情分析 数据概述:该数据集包含来自各大新闻媒体的头条新闻数据,记录了新闻的标题,发布时间,来源媒体,新闻类别等信息。主要特征如下:... -
Quora问答平台问题数据集QuoraQuestionsDataset-ayushshandilya15
Quora问答平台问题数据集QuoraQuestionsDataset-ayushshandilya15 数据来源:互联网公开数据 标签:问答平台,自然语言处理,数据集,文本分析,机器学习,语义分析,社交媒体,信息检索 数据概述: 该数据集包含来自Quora问答平台的问题数据,记录了用户提出的各种问题及其相关信息。主要特征如下:... -
学术论文摘要数据集ResearchAbstractsDataset-danielmendozac
学术论文摘要数据集ResearchAbstractsDataset-danielmendozac 数据来源:互联网公开数据 标签:学术研究,论文摘要,自然语言处理,文本分析,信息检索,机器学习,学术文献,文本挖掘 数据概述: 该数据集包含来自不同学术领域的论文摘要,记录了论文的研究主题,方法,结果和结论。主要特征如下:... -
路透社新闻文本分类数据集Reuters-21578Dataset-shashwatnaidu
路透社新闻文本分类数据集Reuters-21578Dataset-shashwatnaidu 数据来源:互联网公开数据 标签:文本分类,新闻,自然语言处理,机器学习,数据集,信息检索,语料库,文本分析 数据概述: 该数据集包含来自路透社的新闻报道,主要用于文本分类任务。主要特征如下: 时间跨度:数据记录的时间范围主要集中在1987年。... -
关键词与句子关系分析数据集Keyword-SentencesDataset-maheshwarbhosale
关键词与句子关系分析数据集Keyword-SentencesDataset-maheshwarbhosale 数据来源:互联网公开数据 标签:自然语言处理,关键词提取,句子分析,数据集,文本挖掘,机器学习,语义分析,信息检索 数据概述: 该数据集包含关键词与句子之间的关系数据,记录了关键词在句子中的出现位置,语义关联等信息。主要特征如下:... -
道琼斯工业平均指数新闻数据集2010-2024-ahmadkhadra321
道琼斯工业平均指数新闻数据集2010-2024-ahmadkhadra321 数据来源:互联网公开数据 标签:道琼斯工业平均指数,新闻数据集,金融新闻,经济分析,数据挖掘,市场预测,机器学习,信息检索 数据概述:... -
学术研究论文数据集ResearchPaperDataset-harunshimanto
学术研究论文数据集ResearchPaperDataset-harunshimanto 数据来源:互联网公开数据 标签:学术研究,论文数据,数据集,文本分析,自然语言处理,机器学习,信息检索,教育研究 数据概述: 该数据集包含来自学术研究领域的论文数据,记录了学术期刊,会议和相关出版物上发表的研究论文的详细信息。主要特征如下:... -
COVID-19疫情论文搜索结果数据集COVID-19PandemicPaperSearchResultsDataset-jiteshpabla
COVID-19疫情论文搜索结果数据集COVID-19PandemicPaperSearchResultsDataset-jiteshpabla 数据来源:互联网公开数据 标签:COVID-19,疫情,论文,文献,搜索,自然语言处理,信息检索,生物医学 数据概述: 该数据集包含了从COVID-19 Open Research Dataset... -
金融行业问答系统高质量文本片段数据集FinancialRAGBestChunksDataset-squarenabla
金融行业问答系统高质量文本片段数据集FinancialRAGBestChunksDataset-squarenabla 数据来源:互联网公开数据 标签:金融,问答系统,RAG,自然语言处理,数据集,文本分析,机器学习,信息检索 数据概述: 该数据集包含从金融领域文档中提取的,用于构建问答系统(RAG,Retrieval-Augmented... -
新闻组文本分类数据集20NewsgroupTextClassificationDataset-kurianbenoy
新闻组文本分类数据集20NewsgroupTextClassificationDataset-kurianbenoy 数据来源:互联网公开数据 标签:文本分类,数据集,自然语言处理,机器学习,文本挖掘,信息检索,新闻组,数据科学 数据概述: 该数据集包含来自20个不同新闻组的文本数据,记录了从1993年到1994年的新闻文章。主要特征如下:... -
谷歌问答数据集GoogleQuestionDataset-tankmitesh
谷歌问答数据集GoogleQuestionDataset-tankmitesh 数据来源:互联网公开数据 标签:问答系统,自然语言处理,数据集,机器学习,信息检索,人工智能,搜索引擎,用户查询 数据概述: 该数据集包含来自谷歌搜索引擎的用户查询数据,记录了用户向谷歌搜索提问的具体内容和相关特征。主要特征如下:... -
问答历史数据集QNAHistoryDataset-donutkashvi
问答历史数据集QNAHistoryDataset-donutkashvi 数据来源:互联网公开数据 标签:问答系统,数据集,自然语言处理,机器学习,文本分析,信息检索,人工智能,教育技术 数据概述: 该数据集包含来自问答平台的问答历史记录,记录了用户提问和系统回答的内容。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。...