-
文本向量化嵌入数据集TextVectorizationEmbeddingDataset-louvalita
文本向量化嵌入数据集TextVectorizationEmbeddingDataset-louvalita 数据来源:互联网公开数据 标签:文本向量化, 词嵌入, 语义分析, 自然语言处理, 机器学习, 文本挖掘, 向量空间模型, 语料库 数据概述:... -
中文古文阅读理解测试数据集ChineseClassicalTextReadingComprehensionTestDataset-biebeixing
中文古文阅读理解测试数据集ChineseClassicalTextReadingComprehensionTestDataset-biebeixing 数据来源:互联网公开数据 标签:古文阅读, 文本理解, 语言模型, 中文NLP, 考试测评, 语义分析, 机器阅读理解, 知识问答 数据概述:... -
文本嵌入数据集TextEmbeddingDataset-krishnanpalanisami
文本嵌入数据集TextEmbeddingDataset-krishnanpalanisami 数据来源:互联网公开数据 标签:文本数据,嵌入,自然语言处理,机器学习,语义分析,向量化,文本挖掘,深度学习 数据概述: 该数据集包含文本及其对应的嵌入向量,旨在为自然语言处理任务提供基础数据。主要特征如下:... -
语言工具-6数据集LanguageTool-6Dataset-tsobolev
语言工具-6数据集LanguageTool-6Dataset-tsobolev 数据来源:互联网公开数据 标签:语言处理,文本分析,数据集,自然语言处理,语法检查,机器学习,语义分析,文本纠错 数据概述: 该数据集由语言工具-6项目提供,主要包含用于语言处理的文本数据,适用于文本分析、语法检查等任务。主要特征如下:... -
维基百科中文版处理数据集ProcessedWikihowChineseDataset-akumar99
维基百科中文版处理数据集ProcessedWikihowChineseDataset-akumar99 数据来源:互联网公开数据 标签:自然语言处理,文本数据,数据集,机器学习,文本分类,语义分析,中文处理,信息提取 数据概述: 该数据集包含来自维基百科中文版的数据,经过处理和清洗,记录了维基百科中的大量中文文本内容。主要特征如下: 时间跨度:... -
问答社区问题文本真伪识别数据集QuestionTextSincere-InsincereClassification-gayatrisrinivasan
问答社区问题文本真伪识别数据集QuestionTextSincere-InsincereClassification-gayatrisrinivasan 数据来源:互联网公开数据 标签:文本分类, 自然语言处理, 问答社区, 情感分析, 垃圾信息检测, 机器学习, 数据标注, 语义分析 数据概述:... -
写作质量评估文本嵌入数据集WritingQualityAssessmentTextEmbeddings-shubhamchauhan22222
写作质量评估文本嵌入数据集WritingQualityAssessmentTextEmbeddings-shubhamchauhan22222 数据来源:互联网公开数据 标签:文本嵌入, 写作评估, 语义分析, 深度学习, 语言模型, 自然语言处理, 文本相似度, 情感分析 数据概述:... -
文本语料库嵌入向量数据集TextCorpusEmbeddingVectors-mohanadahmed25
文本语料库嵌入向量数据集TextCorpusEmbeddingVectors-mohanadahmed25 数据来源:互联网公开数据 标签:文本嵌入, 语义分析, 自然语言处理, 深度学习, 向量空间, 语料库, 数据预处理, 机器翻译 数据概述: 该数据集包含经过处理的文本语料库数据及其对应的嵌入向量表示。主要特征如下:... -
文本相似度判断训练数据集TextSimilarityJudgementTrainingDataset-gloriara2
文本相似度判断训练数据集TextSimilarityJudgementTrainingDataset-gloriara2 数据来源:互联网公开数据 标签:文本相似度, 自然语言处理, 文本匹配, 语义分析, 机器学习, 数据集, 文本对, 二分类 数据概述: 该数据集包含从互联网收集的文本对,用于训练和评估文本相似度判断模型。主要特征如下:... -
跨编码器分段数据集Cross-EncoderDatasetSegmented-epsilon1234
跨编码器分段数据集Cross-EncoderDatasetSegmented-epsilon1234 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,机器学习,深度学习,语义分析,信息检索,文本挖掘 数据概述: 该数据集包含用于跨编码器模型的分段文本数据,记录了经过处理的文本片段及其对应的分类标签或语义关系。主要特征如下:... -
问答主题文本转换数据集QuestionAnsweringTopicTextConversion-hobertj
问答主题文本转换数据集QuestionAnsweringTopicTextConversion-hobertj 数据来源:互联网公开数据 标签:文本转换, 问答系统, 文本摘要, 语义分析, 文本生成, 自然语言处理, 数据清洗, 机器翻译 数据概述:... -
专利文本相似度分析数据集PatentTextSimilarityAnalysis-aleron751
专利文本相似度分析数据集PatentTextSimilarityAnalysis-aleron751 数据来源:互联网公开数据 标签:专利, 文本相似度, 自然语言处理, 语义分析, 机器学习, 文本匹配, 专利检索, 数据集 数据概述: 该数据集包含来自专利文献的文本数据,用于评估专利文本之间的相似度。主要特征如下:... -
写作评估与生成文本分析数据集WritingAssessment-GeneratedTextAnalysisDataset-aryansingh0301
写作评估与生成文本分析数据集WritingAssessment-GeneratedTextAnalysisDataset-aryansingh0301 数据来源:互联网公开数据 标签:写作评估, 文本生成, 自然语言处理, 机器写作, 写作质量, 语义分析, 教育, 文本对比 数据概述:... -
问题相似度判断预处理数据集QuestionSimilarityPreprocessedDataset-longhainguyen
问题相似度判断预处理数据集QuestionSimilarityPreprocessedDataset-longhainguyen 数据来源:互联网公开数据 标签:问题相似度, 文本预处理, 自然语言处理, 问答系统, 文本分类, 语义分析, 数据清洗, 机器学习 数据概述:... -
越南语问答题数据集VietnameseQuestionAnsweringDataset-dinhnhattruong
越南语问答题数据集VietnameseQuestionAnsweringDataset-dinhnhattruong 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 文本理解, 越南语, 信息检索, 语义分析, 机器阅读理解, 语料库 数据概述:... -
文本向量嵌入模型构建数据集TextVectorEmbeddingModelBuilding-priyamj27
文本向量嵌入模型构建数据集TextVectorEmbeddingModelBuilding-priyamj27 数据来源:互联网公开数据 标签:文本嵌入, 词向量, 语义分析, 自然语言处理, 机器学习, 向量空间, 文本相似度, 数据集 数据概述: 该数据集包含用于构建文本向量嵌入模型的数据,记录了文本数据及其对应的嵌入向量表示。主要特征如下:... -
金融文本情感分析词典数据集FinancialTextSentimentAnalysisLexicon-payne18
金融文本情感分析词典数据集FinancialTextSentimentAnalysisLexicon-payne18 数据来源:互联网公开数据 标签:金融, 文本分析, 情感分析, 词典, 语义分析, 自然语言处理, 财务报告, 数据挖掘 数据概述: 该数据集包含来自Loughran-... -
越南问答语料库数据集VietnameseQuestionAnsweringCorpus-thowoo
越南问答语料库数据集VietnameseQuestionAnsweringCorpus-thowoo 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 文本理解, 语料库, 信息检索, 文本匹配, 越南语, 语义分析 数据概述: 该数据集包含从互联网收集的越南语问答语料,主要用于训练和评估越南语问答系统。主要特征如下:... -
体育新闻文章分类数据集SportsNewsArticleClassification-shaimaa1234
体育新闻文章分类数据集SportsNewsArticleClassification-shaimaa1234 数据来源:互联网公开数据 标签:新闻文本, 体育新闻, 文本分类, 自然语言处理, 机器学习, 阿拉伯语, 新闻分析, 语义分析 数据概述: 该数据集包含来自埃及媒体网站的文章,记录了体育新闻相关的文章内容。主要特征如下:... -
学生写作评估文本质量数据集StudentEssayAssessmentTextQuality-kenbwire
学生写作评估文本质量数据集StudentEssayAssessmentTextQuality-kenbwire 数据来源:互联网公开数据 标签:写作评估, 文本分析, 机器学习, 教育, 文本质量, 语义分析, 自然语言处理, 评分预测 数据概述:...