-
文本信息处理与索引数据集TextProcessingandIndexingDataset-aryanp2702
文本信息处理与索引数据集TextProcessingandIndexingDataset-aryanp2702 数据来源:互联网公开数据 标签:文本处理, 索引, 信息检索, 语料库, 关键词提取, 机器学习, 自然语言处理, 数据清洗 数据概述: 该数据集包含来自不同来源的文本数据,记录了经过处理的文本内容及其对应的索引信息。主要特征如下:... -
信息检索领域论文数据集-lamtruong1594
信息检索领域论文数据集-lamtruong1594 数据来源:互联网公开数据 标签:信息检索,论文,数据集,文本分析,自然语言处理,学术研究,文本挖掘,机器学习 数据概述: 该数据集包含来自多个信息检索领域论文的数据,记录了论文的元数据和文本内容。主要特征如下: 时间跨度:数据记录的时间范围从2000年到2020年。... -
Quora问题分类数据集QuoraQuestionClassificationDataset-ludwigvinberg
Quora问题分类数据集QuoraQuestionClassificationDataset-ludwigvinberg 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,机器学习,问答系统,信息检索,数据挖掘,语言模型 数据概述: 该数据集来自Quora平台,记录了用户提交的各类问题及其分类标签。主要特征如下:... -
检索增强生成技术评估数据集DSC-RAGDataset-nhttinon
检索增强生成技术评估数据集DSC-RAGDataset-nhttinon 数据来源:互联网公开数据 标签:自然语言处理,数据集,检索增强,生成模型,文本分析,机器学习,人工智能,信息检索 数据概述: 该数据集专注于检索增强生成(Retrieval-Augmented Generation,... -
法律文本问答数据集LegalTextQuestionAnsweringDataset-mohamedelidrissi1
法律文本问答数据集LegalTextQuestionAnsweringDataset-mohamedelidrissi1 数据来源:互联网公开数据 标签:法律文本, 问答系统, 自然语言处理, 文本匹配, 信息检索, 机器阅读理解, 法学研究, 数据集构建 数据概述: 该数据集包含来自法律文本的问答对,旨在促进对法律文档的理解和分析。主要特征如下:... -
地标信息文本匹配数据集LandmarkInformationTextMatching-lunapandachan
地标信息文本匹配数据集LandmarkInformationTextMatching-lunapandachan 数据来源:互联网公开数据 标签:文本匹配, 地标识别, 实体链接, 地理位置, 自然语言处理, 机器学习, 数据挖掘, 信息检索 数据概述:... -
跨编码器分段数据集Cross-EncoderDatasetSegmented-epsilon1234
跨编码器分段数据集Cross-EncoderDatasetSegmented-epsilon1234 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,机器学习,深度学习,语义分析,信息检索,文本挖掘 数据概述: 该数据集包含用于跨编码器模型的分段文本数据,记录了经过处理的文本片段及其对应的分类标签或语义关系。主要特征如下:... -
问题与回答数据集QIDS-may12312
问题与回答数据集QIDS-may12312 数据来源:互联网公开数据 标签:问答系统,数据集,自然语言处理,信息检索,知识图谱,文本分析,机器学习,语义理解 数据概述: 该数据集包含了来自不同领域的问答对,旨在用于构建和评估问答系统。主要特征如下: 时间跨度:数据记录的时间跨度不明确,涵盖了不同时间段的问题和答案。... -
大规模问答负样本数据集20kQuerieswithTop10Negatives-ictworld
大规模问答负样本数据集20kQuerieswithTop10Negatives-ictworld 数据来源:互联网公开数据 标签:问答系统,自然语言处理,数据集,负样本,信息检索,语义匹配,深度学习,检索增强 数据概述:... -
维基百科元数据数据集WikipediaMetadataDataset-chankhavu
维基百科元数据数据集WikipediaMetadataDataset-chankhavu 数据来源:互联网公开数据 标签:元数据,维基百科,数据集,文本挖掘,自然语言处理,机器学习,信息检索,数据科学 数据概述: 该数据集包含来自维基百科的元数据,记录了维基百科条目的详细信息。主要特征如下: 时间跨度:数据记录的时间范围为2023年6月1日。... -
新闻标题翻译与来源识别数据集NewsTitleTranslationandSourceIdentificationDataset-zmddzf
新闻标题翻译与来源识别数据集NewsTitleTranslationandSourceIdentificationDataset-zmddzf 数据来源:互联网公开数据 标签:机器翻译, 文本摘要, 命名实体识别, 新闻分析, 语言模型, 数据清洗, 文本挖掘, 信息检索 数据概述:... -
文本相似度分析新闻摘要数据集TextSimilarityAnalysisNewsSummaryDataset-imharshkashyap
文本相似度分析新闻摘要数据集TextSimilarityAnalysisNewsSummaryDataset-imharshkashyap 数据来源:互联网公开数据 标签:文本分析, 相似度计算, 自然语言处理, 新闻摘要, 文本匹配, 信息检索, 语料库, 机器学习 数据概述:... -
维基百科文章摘要数据集WikipediaArticlesSummary-sayedmahmoud
维基百科文章摘要数据集WikipediaArticlesSummary-sayedmahmoud 数据来源:互联网公开数据 标签:维基百科, 文本摘要, 自然语言处理, 文本分析, 信息检索, 知识图谱, 数据挖掘, 语料库 数据概述: 该数据集包含来自维基百科的文章摘要信息,记录了文章标题、正文内容及对应的URL链接。主要特征如下:... -
电子邮件内容分析数据集EmailContentAnalysisDataset-yasinmillers
电子邮件内容分析数据集EmailContentAnalysisDataset-yasinmillers 数据来源:互联网公开数据 标签:电子邮件, 文本分析, Enron数据集, 自然语言处理, 词频统计, 信息检索, 语料库, 情感分析 数据概述:... -
越南问答数据集VietnameseQuestionAnsweringDataset-dinhnhattruong
越南问答数据集VietnameseQuestionAnsweringDataset-dinhnhattruong 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 文本理解, 越南语, 机器阅读理解, 数据集, 文本匹配, 信息检索 数据概述: 该数据集包含来自互联网的越南语问答对,记录了问题、上下文文本、问题ID和上下文ID。主要特征如下:... -
大学院系问答数据集CollegeDepartmentQuestion-AnswerDataset-hagorgog
大学院系问答数据集CollegeDepartmentQuestion-AnswerDataset-hagorgog 数据来源:互联网公开数据 标签:问答系统, 教育, 信息检索, 自然语言处理, 知识库, 文本生成, 数据集, 学术 数据概述: 该数据集包含来自大学院系相关信息的问答对,记录了用户提出的问题及其对应的回答。主要特征如下:... -
越南法律问答数据集VietnamLegalQuestionAnsweringDataset-qucthinanhh
越南法律问答数据集VietnamLegalQuestionAnsweringDataset-qucthinanhh 数据来源:互联网公开数据 标签:法律问答, 自然语言处理, 问答系统, 信息检索, 文本匹配, 知识库, 越南语, 数据集 数据概述: 该数据集包含来自越南法律领域的问答数据,旨在支持越南语法律问答系统的开发与研究。主要特征如下:... -
搜索结果相关性评估数据集SearchResultRelevanceEvaluationDataset-niallmcguire
搜索结果相关性评估数据集SearchResultRelevanceEvaluationDataset-niallmcguire 数据来源:互联网公开数据 标签:搜索相关性, 文本匹配, 信息检索, 机器学习, 自然语言处理, 数据标注, 评估指标, 推荐系统 数据概述:... -
新闻摘要与原文对照分析数据集NewsSummaryandArticleAnalysis-saiganeshsriram
新闻摘要与原文对照分析数据集NewsSummaryandArticleAnalysis-saiganeshsriram 数据来源:互联网公开数据 标签:新闻摘要, 文本摘要, 自然语言处理, 文本分析, 信息检索, 机器翻译, 深度学习, 对比分析 数据概述:... -
学术论文摘要文本分析数据集AcademicPaperAbstractTextAnalysis-avanishgadhikar
学术论文摘要文本分析数据集AcademicPaperAbstractTextAnalysis-avanishgadhikar 数据来源:互联网公开数据 标签:学术论文, 文本摘要, 自然语言处理, 文本分析, 机器学习, 论文标题, 信息检索, 内容理解 数据概述:...