-
CommonLit2023开放式文本阅读理解数据集-lftuwujie
CommonLit2023开放式文本阅读理解数据集-lftuwujie 数据来源:互联网公开数据 标签:阅读理解,文本分析,自然语言处理,教育,数据集,机器学习,文本挖掘,语言学 数据概述: 该数据集由CommonLit平台提供,包含了来自不同年级学生的开放式文本阅读理解数据,旨在促进对阅读理解和文本分析的研究。主要特征如下:... -
推文处理流水线数据集TweetsPipelineDataset-omaressam02
推文处理流水线数据集TweetsPipelineDataset-omaressam02 数据来源:互联网公开数据 标签:社交媒体,推文分析,数据集,文本挖掘,情感分析,机器学习,自然语言处理,网络舆情 数据概述: 该数据集包含来自社交媒体平台Twitter的推文数据,记录了用户发布的推文内容及相关信息。主要特征如下:... -
语义相似度模型训练评估结果数据集SemanticSimilarityModelTrainingEvaluationResults-niuxiaoying
语义相似度模型训练评估结果数据集SemanticSimilarityModelTrainingEvaluationResults-niuxiaoying 数据来源:互联网公开数据 标签:语义相似度, 文本相似度, 模型评估, 机器学习, 自然语言处理, Pearson相关系数, Spearman相关系数, 训练结果 数据概述:... -
文本情感分类与主题识别数据集TextSentimentClassificationandTopicRecognitionDataset-thne1111
文本情感分类与主题识别数据集TextSentimentClassificationandTopicRecognitionDataset-thne1111 数据来源:互联网公开数据 标签:文本情感分析, 主题分类, 多分类模型, 情感识别, 文本挖掘, 自然语言处理, 机器学习, 语料库 数据概述:... -
多语言翻译语料库MultilingualTranslationCorpus-pushpaksaraf
多语言翻译语料库MultilingualTranslationCorpus-pushpaksaraf 数据来源:互联网公开数据 标签:机器翻译, 语言学, 语料库, 自然语言处理, 文本翻译, 文本分析, 印度语, 语言对 数据概述:... -
代码API序列生成与注释数据集CodeAPISequenceGenerationandAnnotationDataset-abdaman
代码API序列生成与注释数据集CodeAPISequenceGenerationandAnnotationDataset-abdaman 数据来源:互联网公开数据 标签:代码生成, API序列, 软件工程, 机器学习, 自然语言处理, 代码注释, 源代码分析, 文本生成 数据概述:... -
法律文档检索与分类数据集ZaloAILegalRetrievalDataset-phandat12082002
法律文档检索与分类数据集ZaloAILegalRetrievalDataset-phandat12082002 数据来源:互联网公开数据 标签:法律文档,数据集,信息检索,自然语言处理,文本分类,法律研究,机器学习,人工智能 数据概述:... -
学术论文自然语言处理文章数据集NLPArticlesfromarXiv-org1994-2020Dataset-sagyndykbn
学术论文自然语言处理文章数据集NLPArticlesfromarXiv-org1994-2020Dataset-sagyndykbn 数据来源:互联网公开数据 标签:自然语言处理,学术论文,数据集,文本分析,机器学习,学术研究,计算机科学,文本挖掘 数据概述:... -
教育项目申请审批数据集EducationProjectApplicationApprovalDataset-karthicktj
教育项目申请审批数据集EducationProjectApplicationApprovalDataset-karthicktj 数据来源:互联网公开数据 标签:教育, 项目申请, 审批, 机器学习, 自然语言处理, 文本分析, 教师, 资金申请 数据概述:... -
文本安全风险评估数据集TextSafetyRiskAssessmentDataset-utiric
文本安全风险评估数据集TextSafetyRiskAssessmentDataset-utiric 数据来源:互联网公开数据 标签:文本分析, 风险评估, 情感分析, 恶意文本, 内容审核, 自然语言处理, 机器学习, 数据标注 数据概述: 该数据集包含来自开放平台的文本内容,记录了文本的安全性评估结果。主要特征如下:... -
文本相似度判断数据集TextSimilarityJudgmentDataset-srinu513
文本相似度判断数据集TextSimilarityJudgmentDataset-srinu513 数据来源:互联网公开数据 标签:文本相似度, 自然语言处理, 句子对, 语义分析, 机器学习, 数据标注, 文本匹配, 深度学习 数据概述: 该数据集包含用于评估文本相似度的句子对,记录了两个句子之间的语义相似程度。主要特征如下:... -
全球新闻数据集GlobalNewsDataset-kaitohabib
全球新闻数据集GlobalNewsDataset-kaitohabib 数据来源:互联网公开数据 标签:新闻,数据集,全球事务,媒体分析,文本挖掘,自然语言处理,人工智能,信息传播 数据概述: 该数据集包含来自全球各大新闻媒体的内容,记录了不同国家、地区和主题的新闻报道。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。... -
PSPV5C嵌入向量数据集PSPV5CEmbeddingsDataset-shinomoriaoshi
PSPV5C嵌入向量数据集PSPV5CEmbeddingsDataset-shinomoriaoshi 数据来源:互联网公开数据 标签:嵌入向量,数据集,自然语言处理,机器学习,文本分析,深度学习,语言模型,语义理解 数据概述:该数据集包含来自PSPV5C模型的嵌入向量数据,记录了大量文本数据的语义表示。主要特征如下:... -
分层抽样情感分析数据集StratifiedSamplewithSentimentDataset-fotinipap
分层抽样情感分析数据集StratifiedSamplewithSentimentDataset-fotinipap 数据来源:互联网公开数据 标签:情感分析,数据集,分层抽样,自然语言处理,机器学习,文本分析,数据挖掘,人工智能 数据概述: 该数据集包含通过分层抽样方法收集的文本数据,记录了不同类别文本的情感倾向。主要特征如下:... -
社交媒体谣言检测数据集SocialMediaRumorDetectionDataset-mohamedhismail
社交媒体谣言检测数据集SocialMediaRumorDetectionDataset-mohamedhismail 数据来源:互联网公开数据 标签:谣言检测, 社交媒体, 文本分析, 舆情分析, 机器学习, 自然语言处理, 情感分析, Twitter 数据概述:... -
法律文书问答数据集LegalDocumentQuestionAnsweringDataset-lthnhtinostic
法律文书问答数据集LegalDocumentQuestionAnsweringDataset-lthnhtinostic 数据来源:互联网公开数据 标签:问答系统, 法律文本, 信息检索, 自然语言处理, 文本理解, 知识库, 司法, 越南语 数据概述: 该数据集包含来自越南法律文书的问答对,记录了用户提出的问题及其对应的法律条文上下文。主要特征如下:... -
社交媒体情感分析新冠疫情推文数据集SocialMediaSentimentAnalysisCOVID-19Tweets-mlcovidresearch
社交媒体情感分析新冠疫情推文数据集SocialMediaSentimentAnalysisCOVID-19Tweets-mlcovidresearch 数据来源:互联网公开数据 标签:情感分析, 社交媒体, 文本挖掘, 新冠疫情, 自然语言处理, 情绪识别, 机器学习, 语料库 数据概述:... -
在线评论毒性分类数据集OnlineCommentToxicityClassificationDataset-haiiiith
在线评论毒性分类数据集OnlineCommentToxicityClassificationDataset-haiiiith 数据来源:互联网公开数据 标签:文本分类, 毒性检测, 情感分析, 自然语言处理, 机器学习, 负面评论, 评论过滤, 数据标注 数据概述:... -
新闻真伪性判断数据集NewsReliabilityAssessment-pathumveyron24
新闻真伪性判断数据集NewsReliabilityAssessment-pathumveyron24 数据来源:互联网公开数据 标签:新闻真伪, 虚假新闻, 文本分类, 机器学习, 自然语言处理, 舆情分析, 数据标注, 媒体分析 数据概述: 该数据集包含来自新闻网站和社交媒体的数据,记录了新闻标题及其对应的真实性标签。主要特征如下:... -
社交媒体情感分析推文数据集SocialMediaSentimentAnalysisTweets-durgancegaur
社交媒体情感分析推文数据集SocialMediaSentimentAnalysisTweets-durgancegaur 数据来源:互联网公开数据 标签:情感分析, 文本分类, 社交媒体, 情绪识别, 自然语言处理, 机器学习, 推文数据, 数据标注 数据概述:...