-
教育内容文本相似度分析训练数据集EducationalContentTextSimilarityAnalysisTrainingData-dmitriygerasimov
教育内容文本相似度分析训练数据集EducationalContentTextSimilarityAnalysisTrainingData-dmitriygerasimov 数据来源:互联网公开数据 标签:文本相似度, 教育, 课程, 文本分类, 自然语言处理, 机器学习, BERT模型, 语义理解 数据概述:... -
文本自动纠错数据集CleanedAutoCorrectDataset-oyounis
文本自动纠错数据集CleanedAutoCorrectDataset-oyounis 数据来源:互联网公开数据 标签:文本纠错,数据集,自然语言处理,机器学习,文本分析,文本处理,语言技术,人工智能 数据概述:该数据集包含经过清洗和自动纠错处理的文本数据,适用于文本纠错和自然语言处理任务。主要特征如下:... -
照片翻译数据集PHOMTTranslationDataset-baotanguyen
照片翻译数据集PHOMTTranslationDataset-baotanguyen 数据来源:互联网公开数据 标签:机器翻译,图像识别,数据集,多语言,计算机视觉,自然语言处理,人工智能,图像翻译 数据概述: 该数据集专注于照片翻译任务,包含大量带有文本信息的图像及其对应的翻译文本。主要特征如下:... -
大型语言模型系统预处理数据集LMSYSPreprocessedDataset-a5hvin
大型语言模型系统预处理数据集LMSYSPreprocessedDataset-a5hvin 数据来源:互联网公开数据 标签:自然语言处理,数据集,机器学习,深度学习,语言模型,数据预处理,文本分析,人工智能 数据概述:... -
化学分子结构与编码数据集ChemicalMoleculeStructureandEncodingDataset-buildxz
化学分子结构与编码数据集ChemicalMoleculeStructureandEncodingDataset-buildxz 数据来源:互联网公开数据 标签:化学, 分子结构, SMILES, 编码, 机器学习, 数据集, 化学信息学, 自然语言处理 数据概述:... -
新冠疫苗相关推文情感分析数据集COVID-19VaccineRelatedTweetsSentimentAnalysis-yashjasani
新冠疫苗相关推文情感分析数据集COVID-19VaccineRelatedTweetsSentimentAnalysis-yashjasani 数据来源:互联网公开数据 标签:社交媒体, 情感分析, 新冠疫苗, 推文数据, 自然语言处理, 文本挖掘, 舆情分析, 机器学习 数据概述:... -
文本相似度判断数据集TextSimilarityJudgmentDataset-shaffaka
文本相似度判断数据集TextSimilarityJudgmentDataset-shaffaka 数据来源:互联网公开数据 标签:文本相似度, 自然语言处理, 文本匹配, 二分类, 语义分析, 数据集, 机器学习, 语料库 数据概述: 该数据集包含从多个来源收集的文本对,记录了用于判断文本对之间相似度的结构化示例。主要特征如下:... -
数据2021年最新新闻数据集LatestNewsDataset2021-newsdataio
2021年最新新闻数据集LatestNewsDataset2021-newsdataio 数据来源:互联网公开数据 标签:新闻,数据集,文本分析,自然语言处理,机器学习,情感分析,信息检索,数据挖掘 数据概述:该数据集包含来自2021年全球各地的新闻数据,记录了各类新闻事件和报道内容。主要特征如下:... -
翻译质量评估数据集QuACE数据集-emam2002
翻译质量评估数据集QuACE数据集-emam2002 数据来源:互联网公开数据 标签:机器翻译,数据集,翻译质量评估,自然语言处理,文本分析,语言学,深度学习,文本相似度 数据概述: 该数据集包含来自 QuACE(Quality Assessment of Computer-Enhanced... -
土耳其大国民议会命名实体识别数据集TBMMNERDataset-esrapolat
土耳其大国民议会命名实体识别数据集TBMMNERDataset-esrapolat 数据来源:互联网公开数据 标签:自然语言处理,命名实体识别,土耳其语,数据集,文本分析,政治,机器学习,NLP 数据概述: 该数据集包含来自土耳其大国民议会(TBMM)的文本数据,用于命名实体识别(NER)任务。主要特征如下:... -
健康与生命科学相关Reddit讨论数据集HealthandLifeScienceRelatedRedditDiscussionsDataset-amalinow
健康与生命科学相关Reddit讨论数据集HealthandLifeScienceRelatedRedditDiscussionsDataset-amalinow 数据来源:互联网公开数据 标签:健康科学,生命科学,社交网络,数据分析,机器学习,自然语言处理,医学研究,公众健康 数据概述:... -
数据2011-2019年主题话题数据集2011-2019年主题话题数据集-marcosneco
2011-2019年主题话题数据集2011-2019年主题话题数据集-marcosneco 数据来源:互联网公开数据 标签:主题分析,社交媒体,数据集,文本分析,自然语言处理,社会研究,情感分析,市场趋势 数据概述:该数据集包含来自社交媒体平台的2011年至2019年期间的主题话题数据,记录了不同时间段内热门话题和讨论内容。主要特征如下:... -
数据512维度的嵌入向量数据集Embedding-512-2Dataset-bankit1234
512维度的嵌入向量数据集Embedding-512-2Dataset-bankit1234 数据来源:互联网公开数据 标签:文本嵌入,语义分析,自然语言处理,机器学习,向量表示,深度学习,数据集,特征提取 数据概述: 该数据集包含512维度的文本嵌入向量,用于表示文本的语义信息。主要特征如下:... -
计算重用-词句银行数据集RecomputeUsingWord-SentBankDataset-minhhieu002
计算重用-词句银行数据集RecomputeUsingWord-SentBankDataset-minhhieu002 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,语言模型,计算重用,语义理解,人工智能 数据概述: 该数据集包含来自词句银行(Word-Sent... -
越南问答数据集VietnameseQuestionAnsweringDataset-khinguynphan
越南问答数据集VietnameseQuestionAnsweringDataset-khinguynphan 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 文本检索, 信息抽取, 越南语, 语料库, 机器阅读理解, 数据集 数据概述: 该数据集包含来自越南语语料库的问答对,旨在支持越南语问答系统的开发与研究。主要特征如下:... -
COVID-19挑战论文分词数据集TokenizedWordsCOVID-19ChallengeDataset-omarkhalil27
COVID-19挑战论文分词数据集TokenizedWordsCOVID-19ChallengeDataset-omarkhalil27 数据来源:互联网公开数据 标签:COVID-19, 数据集, 文本处理, 自然语言处理, 机器学习, 医学研究, 学术资源, 文献分析 数据概述:... -
聊天机器人性能对比数据集LMSYSChatbotArenaData-morufubello
聊天机器人性能对比数据集LMSYSChatbotArenaData-morufubello 数据来源:互联网公开数据 标签:人工智能,聊天机器人,数据集,机器学习,自然语言处理,性能评估,对话系统,算法比较 数据概述: 该数据集来源于LMSYS(大型机器系统)平台的聊天机器人竞技场,记录了多种聊天机器人在不同场景下的性能表现。主要特征如下:... -
新闻文章内容分析数据集NewsArticleContentAnalysisDataset-haianhjobs
新闻文章内容分析数据集NewsArticleContentAnalysisDataset-haianhjobs 数据来源:互联网公开数据 标签:新闻文章, 内容分析, 文本挖掘, 自然语言处理, 文本分类, 信息提取, 舆情分析, 数据集 数据概述:... -
DAGI扩展非论文数据集DAGIExtendedNon-EssayDataset-bulivington
DAGI扩展非论文数据集DAGIExtendedNon-EssayDataset-bulivington 数据来源:互联网公开数据 标签:数据集,文本分析,机器学习,自然语言处理,数据挖掘,文本分类,非结构化数据,学术资源 数据概述: 该数据集包含来自DAGI项目的扩展数据,记录了非论文类文本的详细信息。主要特征如下:... -
语音合成训练数据集TTSTrainingDataset-ayushs9020
语音合成训练数据集TTSTrainingDataset-ayushs9020 数据来源:互联网公开数据 标签:语音合成,数据集,机器学习,自然语言处理,人工智能,语言学,语音识别,文本转语音 数据概述:该数据集包含来自多个来源的语音合成训练数据,记录了文本与相应语音的对应关系,用于训练语音合成模型。主要特征如下:...