-
跨编码器训练数据2万条-2023年12月数据集-ictworld
跨编码器训练数据2万条-2023年12月数据集-ictworld 数据来源:互联网公开数据 标签:自然语言处理,数据集,跨编码器,文本匹配,语义相似度,信息检索,机器学习,文本分析 数据概述: 该数据集包含2万条用于训练跨编码器的文本数据,旨在提升模型在语义相似度计算、文本匹配和信息检索等任务上的表现。主要特征如下:... -
虚假新闻检测数据集FakeandRealNewsDetectionDataset-sabriarbishal
虚假新闻检测数据集FakeandRealNewsDetectionDataset-sabriarbishal 数据来源:互联网公开数据 标签:新闻,虚假新闻,机器学习,文本分类,自然语言处理,数据集,舆情分析,信息检索 数据概述: 该数据集包含来自不同来源的新闻文章,用于虚假新闻的检测和分析。主要特征如下:... -
越南问答语料库数据集VietnameseQuestionAnsweringCorpus-nguyenminh2006
越南问答语料库数据集VietnameseQuestionAnsweringCorpus-nguyenminh2006 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 文本匹配, 信息检索, 语料库, 越南语, 文本分析, 机器阅读理解 数据概述: 该数据集包含来自公开渠道的越南语问答语料,旨在支持越南语问答系统的开发与研究。主要特征如下:... -
BKAI法律文档检索数据集BKAILegalDocumentRetrievalDataset-littlekai25
BKAI法律文档检索数据集BKAILegalDocumentRetrievalDataset-littlekai25 数据来源:互联网公开数据 标签:法律,文档检索,数据集,自然语言处理,文本分类,机器学习,信息检索,人工智能 数据概述: 该数据集由BKAI(BKAV人工智能研究院)提供,专注于法律文档的检索任务。主要特征如下:... -
印尼语问答数据集IndonesianQuestion-AnsweringDataset-wirantiiimaripadang
印尼语问答数据集IndonesianQuestion-AnsweringDataset-wirantiiimaripadang 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 文本相似度, 印尼语, 文本理解, 机器学习, 数据标注, 信息检索 数据概述:... -
文本处理语料库数据集ProcessedCorpusDataset-colinsmyth001
文本处理语料库数据集ProcessedCorpusDataset-colinsmyth001 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器学习,文本分类,语言模型,数据挖掘,信息检索 数据概述: 该数据集包含经过预处理的文本语料库,记录了多种来源的文本数据,经过清洗和标准化处理。主要特征如下:... -
问答系统知识库构建测试数据集QuestionAnsweringKnowledgeBaseConstructionTestDataset-andreajaunarena
问答系统知识库构建测试数据集QuestionAnsweringKnowledgeBaseConstructionTestDataset-andreajaunarena 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 知识库, 文本匹配, 信息检索, 机器阅读理解, 文本生成, 数据集 数据概述:... -
学术论文摘要分析数据集AcademicPaperAbstractAnalysis-mostafaahmed245
学术论文摘要分析数据集AcademicPaperAbstractAnalysis-mostafaahmed245 数据来源:互联网公开数据 标签:学术论文, 摘要分析, 文本挖掘, 自然语言处理, 知识发现, 语义分析, 信息检索, 机器学习 数据概述:... -
新闻文章地域与来源分析数据集NewsArticleRegionandSourceAnalysisDataset-reviewerh
新闻文章地域与来源分析数据集NewsArticleRegionandSourceAnalysisDataset-reviewerh 数据来源:互联网公开数据 标签:新闻数据, 数据挖掘, 地域分析, 新闻来源, 数据集, 文本分析, 媒体研究, 信息检索 数据概述:... -
嵌入与TF-IDF文本特征提取数据集EmbeddedandTF-IDFTextFeatureExtractionDataset-malav312
嵌入与TF-IDF文本特征提取数据集EmbeddedandTF-IDFTextFeatureExtractionDataset-malav312 数据来源:互联网公开数据 标签:自然语言处理,文本特征提取,机器学习,数据集,TF-IDF,词嵌入,文本分析,信息检索 数据概述:该数据集包含用于文本特征提取的嵌入和TF-... -
福布斯亿万富豪问答数据集ForbesBillionairesQuestionAnsweringDataset-hongsonuit
福布斯亿万富豪问答数据集ForbesBillionairesQuestionAnsweringDataset-hongsonuit 数据来源:互联网公开数据 标签:亿万富豪, 福布斯, 问答系统, 自然语言处理, 数据集, 金融, 富豪排名, 信息检索 数据概述:... -
越南法律问答数据集VietnamLegalQuestionAnsweringDataset-cuong1702
越南法律问答数据集VietnamLegalQuestionAnsweringDataset-cuong1702 数据来源:互联网公开数据 标签:法律问答, 自然语言处理, 问答系统, 文本处理, 越南语, 信息检索, 机器学习, 法律法规 数据概述: 该数据集包含来自越南法律领域的问题和答案,旨在用于构建和评估法律问答系统。主要特征如下:... -
维基HowTo教程数据集WikiHowAllDataset-margueritemalertk
维基HowTo教程数据集WikiHowAllDataset-margueritemalertk 数据来源:互联网公开数据 标签:WikiHow,教程,数据集,文本分析,自然语言处理,内容生成,知识图谱,信息检索,教育 数据概述: 该数据集包含了维基HowTo网站上所有教程的内容,涵盖了各种主题的详细操作指南。主要特征如下:... -
安然公司电子邮件语料库EnronEmailCorpus数据集-ashutoshkun
安然公司电子邮件语料库EnronEmailCorpus数据集-ashutoshkun 数据来源:互联网公开数据 标签:电子邮件, 文本分析, 自然语言处理, 语料库, Enron, 文本挖掘, 信息检索, 情感分析 数据概述: 该数据集包含来自安然公司(Enron)的电子邮件,记录了公司员工在特定时期内的电子邮件通信内容。主要特征如下:... -
数据2020年推特问答特征数据集TF20QAFeaturesDataset-opanichev
2020年推特问答特征数据集TF20QAFeaturesDataset-opanichev 数据来源:互联网公开数据 标签:推特,问答,数据集,自然语言处理,文本分析,机器学习,社交媒体,信息检索 数据概述: 该数据集包含来自2020年推特(Twitter)平台上的问答(QA)数据,用于支持自然语言处理和信息检索任务。主要特征如下:... -
文本内容语义分析知识抽取数据集TextContentSemanticAnalysisandKnowledgeExtractionDataset-anasbenbrahim
文本内容语义分析知识抽取数据集TextContentSemanticAnalysisandKnowledgeExtractionDataset-anasbenbrahim 数据来源:互联网公开数据 标签:语义分析, 知识抽取, 文本挖掘, 自然语言处理, 关系抽取, 信息检索, 文本摘要, 数据清洗 数据概述:... -
芬兰新闻文章摘要数据集FinnishNewsArticlesSummary-alayagill
芬兰新闻文章摘要数据集FinnishNewsArticlesSummary-alayagill 数据来源:互联网公开数据 标签:新闻摘要, 文本摘要, 自然语言处理, 芬兰语, 文本分析, 语料库, 机器翻译, 信息检索 数据概述:... -
能源行业邮件语料库数据集EnergyIndustryEmailCorpus-gungunshukla15
能源行业邮件语料库数据集EnergyIndustryEmailCorpus-gungunshukla15 数据来源:互联网公开数据 标签:邮件语料库, 能源行业, 文本分析, Enron, 词频统计, 自然语言处理, 信息检索, 电子邮件 数据概述: 该数据集包含来自Enron公司内部的电子邮件数据,记录了能源行业从业者之间的沟通内容。主要特征如下:... -
社交媒体内容与标签分析数据集SocialMediaContentandHashtagAnalysis-rubikkblue
社交媒体内容与标签分析数据集SocialMediaContentandHashtagAnalysis-rubikkblue 数据来源:互联网公开数据 标签:社交媒体, 文本分析, 标签提取, 内容分类, 自然语言处理, 数据挖掘, 机器学习, 信息检索 数据概述:... -
学生咨询问答数据集StudentInquiryQ-A-phyngyn
学生咨询问答数据集StudentInquiryQ-A-phyngyn 数据来源:互联网公开数据 标签:学生咨询, 问答系统, 文本处理, 自然语言处理, 教育, 信息检索, 知识库, 语义分析 数据概述: 该数据集包含来自学生咨询服务平台或类似渠道的问答数据,记录了学生提出的问题及其对应的解答。主要特征如下:...