-
问答信息生成与意图识别数据集QuestionGenerationandIntentRecognitionDataset-kharchoufi
问答信息生成与意图识别数据集QuestionGenerationandIntentRecognitionDataset-kharchoufi 数据来源:互联网公开数据 标签:问答生成, 意图识别, 自然语言处理, 文本挖掘, 数据标注, 语义理解, 信息检索, 机器学习 数据概述:... -
学术论文摘要分析数据集AcademicPaperAbstractAnalysis-aeyazadil123
学术论文摘要分析数据集AcademicPaperAbstractAnalysis-aeyazadil123 数据来源:互联网公开数据 标签:学术论文, 摘要分析, 文本挖掘, 自然语言处理, 信息检索, 机器学习, 文本分类, 语料库 数据概述: 该数据集包含来自学术论文的摘要信息,记录了论文的标题和摘要内容。主要特征如下:... -
电子邮件内容主题分析数据集EmailContentTopicAnalysis-aseemshehzad
电子邮件内容主题分析数据集EmailContentTopicAnalysis-aseemshehzad 数据来源:互联网公开数据 标签:电子邮件, 文本分析, 主题建模, 自然语言处理, 情感分析, 语料库, 文本挖掘, 信息检索 数据概述: 该数据集包含来自电子邮件内容的数据,记录了邮件正文内容。主要特征如下:... -
IIITBQuora重复问题检测训练数据集IIITBQuoraStackingTrainSet-shourabhpayal
IIITBQuora重复问题检测训练数据集IIITBQuoraStackingTrainSet-shourabhpayal 数据来源:互联网公开数据 标签:Quora, 数据集, 自然语言处理, 重复问题检测, 机器学习, 文本分析, 数据挖掘, 信息检索... -
健康医疗问答匹配数据集HealthcareQuestionAnsweringMatchingDataset-takiwyr
健康医疗问答匹配数据集HealthcareQuestionAnsweringMatchingDataset-takiwyr 数据来源:互联网公开数据 标签:问答匹配, 自然语言处理, 医疗健康, 文本相似度, 信息检索, 越南语, 数据标注, 机器阅读理解 数据概述:... -
能源行业电子邮件语料库数据集EnergyIndustryEmailCorpus-rodrigomller
能源行业电子邮件语料库数据集EnergyIndustryEmailCorpus-rodrigomller 数据来源:互联网公开数据 标签:电子邮件, 文本分析, 能源行业, Enron, 语料库, 自然语言处理, 词频统计, 信息检索 数据概述: 该数据集包含来自 Enron... -
移动通信客户服务问答数据集MobileCommunicationCustomerServiceQ-ADataset-dinethm
移动通信客户服务问答数据集MobileCommunicationCustomerServiceQ-ADataset-dinethm 数据来源:互联网公开数据 标签:客户服务, 问答系统, 自然语言处理, 文本匹配, 信息检索, 知识库构建, 通信行业, 数据集 数据概述:... -
学生咨询问答语料库StudentInquiryQ-ACorpus-phyngyn
学生咨询问答语料库StudentInquiryQ-ACorpus-phyngyn 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 学生服务, 文本分类, 情感分析, 信息检索, 语料库, 教育 数据概述: 该数据集包含来自越南某大学学生咨询服务平台的数据,记录了学生提出的问题及其对应的官方解答。主要特征如下:... -
文本信息处理与索引数据集TextProcessingandIndexingDataset-aryanp2702
文本信息处理与索引数据集TextProcessingandIndexingDataset-aryanp2702 数据来源:互联网公开数据 标签:文本处理, 索引, 信息检索, 语料库, 关键词提取, 机器学习, 自然语言处理, 数据清洗 数据概述: 该数据集包含来自不同来源的文本数据,记录了经过处理的文本内容及其对应的索引信息。主要特征如下:... -
信息检索领域论文数据集-lamtruong1594
信息检索领域论文数据集-lamtruong1594 数据来源:互联网公开数据 标签:信息检索,论文,数据集,文本分析,自然语言处理,学术研究,文本挖掘,机器学习 数据概述: 该数据集包含来自多个信息检索领域论文的数据,记录了论文的元数据和文本内容。主要特征如下: 时间跨度:数据记录的时间范围从2000年到2020年。... -
Quora问题分类数据集QuoraQuestionClassificationDataset-ludwigvinberg
Quora问题分类数据集QuoraQuestionClassificationDataset-ludwigvinberg 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,机器学习,问答系统,信息检索,数据挖掘,语言模型 数据概述: 该数据集来自Quora平台,记录了用户提交的各类问题及其分类标签。主要特征如下:... -
检索增强生成技术评估数据集DSC-RAGDataset-nhttinon
检索增强生成技术评估数据集DSC-RAGDataset-nhttinon 数据来源:互联网公开数据 标签:自然语言处理,数据集,检索增强,生成模型,文本分析,机器学习,人工智能,信息检索 数据概述: 该数据集专注于检索增强生成(Retrieval-Augmented Generation,... -
法律文本问答数据集LegalTextQuestionAnsweringDataset-mohamedelidrissi1
法律文本问答数据集LegalTextQuestionAnsweringDataset-mohamedelidrissi1 数据来源:互联网公开数据 标签:法律文本, 问答系统, 自然语言处理, 文本匹配, 信息检索, 机器阅读理解, 法学研究, 数据集构建 数据概述: 该数据集包含来自法律文本的问答对,旨在促进对法律文档的理解和分析。主要特征如下:... -
地标信息文本匹配数据集LandmarkInformationTextMatching-lunapandachan
地标信息文本匹配数据集LandmarkInformationTextMatching-lunapandachan 数据来源:互联网公开数据 标签:文本匹配, 地标识别, 实体链接, 地理位置, 自然语言处理, 机器学习, 数据挖掘, 信息检索 数据概述:... -
跨编码器分段数据集Cross-EncoderDatasetSegmented-epsilon1234
跨编码器分段数据集Cross-EncoderDatasetSegmented-epsilon1234 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,机器学习,深度学习,语义分析,信息检索,文本挖掘 数据概述: 该数据集包含用于跨编码器模型的分段文本数据,记录了经过处理的文本片段及其对应的分类标签或语义关系。主要特征如下:... -
问题与回答数据集QIDS-may12312
问题与回答数据集QIDS-may12312 数据来源:互联网公开数据 标签:问答系统,数据集,自然语言处理,信息检索,知识图谱,文本分析,机器学习,语义理解 数据概述: 该数据集包含了来自不同领域的问答对,旨在用于构建和评估问答系统。主要特征如下: 时间跨度:数据记录的时间跨度不明确,涵盖了不同时间段的问题和答案。... -
大规模问答负样本数据集20kQuerieswithTop10Negatives-ictworld
大规模问答负样本数据集20kQuerieswithTop10Negatives-ictworld 数据来源:互联网公开数据 标签:问答系统,自然语言处理,数据集,负样本,信息检索,语义匹配,深度学习,检索增强 数据概述:... -
维基百科元数据数据集WikipediaMetadataDataset-chankhavu
维基百科元数据数据集WikipediaMetadataDataset-chankhavu 数据来源:互联网公开数据 标签:元数据,维基百科,数据集,文本挖掘,自然语言处理,机器学习,信息检索,数据科学 数据概述: 该数据集包含来自维基百科的元数据,记录了维基百科条目的详细信息。主要特征如下: 时间跨度:数据记录的时间范围为2023年6月1日。... -
新闻标题翻译与来源识别数据集NewsTitleTranslationandSourceIdentificationDataset-zmddzf
新闻标题翻译与来源识别数据集NewsTitleTranslationandSourceIdentificationDataset-zmddzf 数据来源:互联网公开数据 标签:机器翻译, 文本摘要, 命名实体识别, 新闻分析, 语言模型, 数据清洗, 文本挖掘, 信息检索 数据概述:... -
文本相似度分析新闻摘要数据集TextSimilarityAnalysisNewsSummaryDataset-imharshkashyap
文本相似度分析新闻摘要数据集TextSimilarityAnalysisNewsSummaryDataset-imharshkashyap 数据来源:互联网公开数据 标签:文本分析, 相似度计算, 自然语言处理, 新闻摘要, 文本匹配, 信息检索, 语料库, 机器学习 数据概述:...