-
数学公式图像与MathML数据集MathematicalFormulaImageandMathMLDataset-teslanicola
数学公式图像与MathML数据集MathematicalFormulaImageandMathMLDataset-teslanicola 数据来源:互联网公开数据 标签:数学公式, 图像识别, MathML, 数据集, 计算机视觉, 文本分析, 公式检测, 机器学习 数据概述: 该数据集包含数学公式的图像及其对应的MathML表示。主要特征如下:... -
新闻真伪识别文本数据集NewsCredibilityIdentificationTextDataset-ritchiepulikottil
新闻真伪识别文本数据集NewsCredibilityIdentificationTextDataset-ritchiepulikottil 数据来源:互联网公开数据 标签:新闻, 文本分类, 虚假新闻, 自然语言处理, 机器学习, 标题, 作者, 文本分析, 二元分类 数据概述:... -
法国司法判决文本分析数据集FrenchJudicialRulingTextAnalysis-tournevis
法国司法判决文本分析数据集FrenchJudicialRulingTextAnalysis-tournevis 数据来源:互联网公开数据 标签:司法判决, 法律文本, 法国, 文本分析, 历史数据, 自然语言处理, 案例研究, 法律研究 数据概述: 该数据集包含来自法国司法系统的判决文本,记录了关于案件裁决的详细信息。主要特征如下:... -
尼泊尔新闻数据集NepaliNewsDataset-niranjanshrestha
尼泊尔新闻数据集NepaliNewsDataset-niranjanshrestha 数据来源:互联网公开数据 标签:新闻,尼泊尔,数据集,文本分析,自然语言处理,机器学习,信息提取,新闻分类 数据概述: 该数据集包含来自尼泊尔的新闻数据,记录了尼泊尔国内外的新闻报道和新闻文章。主要特征如下: 时间跨度:数据记录的时间范围从2014年到2020年。... -
文本质量评估预测数据集TextQualityAssessmentPrediction-dingyan
文本质量评估预测数据集TextQualityAssessmentPrediction-dingyan 数据来源:互联网公开数据 标签:文本分析, 语言评估, 机器学习, 自然语言处理, 文本质量, 评分预测, 文本特征, 模型训练 数据概述:... -
心理健康文章摘要分析数据集MentalHealthArticleSummaryAnalysis-terrychanorg
心理健康文章摘要分析数据集MentalHealthArticleSummaryAnalysis-terrychanorg 数据来源:互联网公开数据 标签:心理健康, 摘要, 文本分析, 自然语言处理, 摘要生成, 情感分析, 文本长度, 语料库 数据概述: 该数据集包含来自互联网的文章,记录了文章标题、摘要、正文内容及其对应的URL。主要特征如下:... -
英语作文评分预测模型数据集EnglishEssayScoringPredictionModelDataset-thajime
英语作文评分预测模型数据集EnglishEssayScoringPredictionModelDataset-thajime 数据来源:互联网公开数据 标签: 英语作文, 评分预测, 机器学习, 自然语言处理, 文本分析, 模型训练, 语言评估, 交叉验证 数据概述:... -
加密货币领域情感分析推文数据集CryptocurrencyDomainSentimentAnalysisTweetsDataset-fabioturazzi
加密货币领域情感分析推文数据集CryptocurrencyDomainSentimentAnalysisTweetsDataset-fabioturazzi 数据来源:互联网公开数据 标签:加密货币,情感分析,社交媒体,数据集,自然语言处理,机器学习,文本分析,金融科技 数据概述:... -
Quora问答平台问题对数据集QuoraQuestionPairsDataset-bhattacharjeeajay12
Quora问答平台问题对数据集QuoraQuestionPairsDataset-bhattacharjeeajay12 数据来源:互联网公开数据 标签:自然语言处理,问答系统,数据集,文本分析,机器学习,语义相似度,文本匹配,信息检索 数据概述: 该数据集包含来自Quora问答平台的问题对数据,记录了用户提交的成对问题及其相似性标签。主要特征如下:... -
语言模型与人类文本对比数据集LLMvsHumanTextComparisonDataset-mohamedlotfy50
语言模型与人类文本对比数据集LLMvsHumanTextComparisonDataset-mohamedlotfy50 数据来源:互联网公开数据 标签:自然语言处理,文本对比,数据集,机器学习,语言模型,人类文本,人工智能,文本分析 数据概述:... -
新闻文章内容挖掘预处理数据集NewsArticleDataContentMiningPreprocessedDataset-tousifmdaminfaisal
新闻文章内容挖掘预处理数据集NewsArticleDataContentMiningPreprocessedDataset-tousifmdaminfaisal 数据来源:互联网公开数据 标签:新闻分析,内容挖掘,数据集,文本分析,自然语言处理,机器学习,数据预处理,信息提取 数据概述:... -
人工智能与人类文本对比数据集AIandHumanTextComparisonDataset-naveenfream
人工智能与人类文本对比数据集AIandHumanTextComparisonDataset-naveenfream 数据来源:互联网公开数据 标签:自然语言处理,文本分类,ai生成,人类写作,机器学习,文本分析,语言模型,数据挖掘 数据概述:... -
俄罗斯媒体真伪新闻数据集RussianMediaFakeandRealNewsDataset-danielsbuls
俄罗斯媒体真伪新闻数据集RussianMediaFakeandRealNewsDataset-danielsbuls 数据来源:互联网公开数据 标签:新闻媒体,数据集,真伪识别,文本分析,机器学习,信息传播,数据分析,新闻研究 数据概述: 该数据集包含来自俄罗斯媒体的新闻文章数据,记录了新闻内容的真伪标签及相关特征。主要特征如下:... -
文本嵌入转换数据集-jainhemang
文本嵌入转换数据集-jainhemang 数据来源:互联网公开数据 标签:文本分析,自然语言处理,数据集,嵌入,语义相似度,机器学习,深度学习,向量空间 数据概述: 该数据集包含了经过转换的文本嵌入数据,用于分析文本的语义信息和相似度。主要特征如下: 时间跨度: 数据未明确时间范围,但通常涵盖了近年来常用的文本语料。 地理范围:... -
编程问答社区问题文本数据集ProgrammingQ-ACommunityQuestionTextData-nandhinirjs
编程问答社区问题文本数据集ProgrammingQ-ACommunityQuestionTextData-nandhinirjs 数据来源:互联网公开数据 标签:编程问答, 文本分析, 自然语言处理, 问答系统, 文本挖掘, 社区数据, 机器学习, 语料库 数据概述:... -
产品清洗训练数据集CleanedProductsTrainingDataDataset-koteswaruduakula
产品清洗训练数据集CleanedProductsTrainingDataDataset-koteswaruduakula 数据来源:互联网公开数据 标签:产品数据,数据清洗,机器学习,文本分析,自然语言处理,数据集,数据预处理,信息提取 数据概述: 该数据集包含经过清洗和标准化的产品数据,主要用于训练和评估产品数据清洗模型。主要特征如下:... -
信息检索研究数据集-khamalking
信息检索研究数据集-khamalking 数据来源:互联网公开数据 标签:信息检索,数据集,文本分析,自然语言处理,机器学习,搜索,语义理解,文本挖掘 数据概述: 该数据集包含用于信息检索领域的研究和评估的文本数据。主要特征如下: 时间跨度:数据记录的时间跨度不定,取决于具体的数据来源,但通常涵盖了近年来公开的文本和文档。... -
DistilBERT预处理数据集DistilBERTPreprocessedDataset-kirillklyukvin
DistilBERT预处理数据集DistilBERTPreprocessedDataset-kirillklyukvin 数据来源:互联网公开数据 标签:自然语言处理,预训练模型,数据集,文本分类,机器学习,深度学习,文本分析,人工智能 数据概述:... -
歌曲歌词翻译数据集LyricTranslationDataset-xiehayan
歌曲歌词翻译数据集LyricTranslationDataset-xiehayan 数据来源:互联网公开数据 标签:歌词,翻译,数据集,自然语言处理,机器翻译,文本分析,多语言,语言学 数据概述: 该数据集包含来自多个来源的歌曲歌词及其对应的翻译文本,旨在用于机器翻译、文本分析和多语言研究。主要特征如下:... -
COVID-19相关医学文献分析数据集COVID-19RelatedMedicalLiteratureAnalysis-saumya94
COVID-19相关医学文献分析数据集COVID-19RelatedMedicalLiteratureAnalysis-saumya94 数据来源:互联网公开数据 标签:COVID-19, 医学文献, 文本分析, 传染病, 呼吸系统疾病, 自然语言处理, 疫情研究, 生物医学 数据概述: 该数据集包含来自PMC(Pubmed...