-
两步Wave-Net语音合成数据集-garganany
两步Wave-Net语音合成数据集-garganany 数据来源:互联网公开数据 标签:语音合成,深度学习,数据集,音频处理,人工智能,自然语言处理,WaveNet,语音生成 数据概述: 该数据集包含用于训练两步 WaveNet 模型的数据,主要用于语音合成任务。主要特征如下: 时间跨度:数据记录了音频的录制时间,具体时间跨度取决于原始数据。... -
隐含仇恨言论排名数据集ImplicitHateSpeechwithRankingDataset-devayani14
隐含仇恨言论排名数据集ImplicitHateSpeechwithRankingDataset-devayani14 数据来源:互联网公开数据 标签:仇恨言论,数据集,文本分析,情感分析,机器学习,自然语言处理,社会研究,内容审核 数据概述:该数据集包含来自多个在线平台的文本数据,记录了带有隐含仇恨言论的言论内容及其对应的排名。主要特征如下:... -
电影相似度分析数据集MoviesSimilarityDataset-devendra45
电影相似度分析数据集MoviesSimilarityDataset-devendra45 数据来源:互联网公开数据 标签:电影分析,相似度计算,数据集,推荐系统,机器学习,数据挖掘,娱乐产业,自然语言处理 数据概述: 该数据集包含来自多个电影数据库的电影信息,记录了电影之间的相似度关系及相关特征。主要特征如下:... -
LaTeX文档分析数据集LaTeXDocumentAnalysisDataset-sai1881
LaTeX文档分析数据集LaTeXDocumentAnalysisDataset-sai1881 数据来源:互联网公开数据 标签:LaTeX, 文档分析, 数据集, 语法结构, 文学研究, 自然语言处理, 计算机科学, 学术资源 数据概述:... -
用户评论情感分析数据集CommentsScoreDataset-esgintn
用户评论情感分析数据集CommentsScoreDataset-esgintn 数据来源:互联网公开数据 标签:评论分析,情感分析,数据集,自然语言处理,机器学习,文本挖掘,用户行为,社交媒体 数据概述:该数据集包含来自各种来源的用户评论数据,记录了用户对特定主题或产品的评论及其对应的情感评分。主要特征如下:... -
RedditWSB论坛帖子数据集RedditWSBPostsDataset-dataranch
RedditWSB论坛帖子数据集RedditWSBPostsDataset-dataranch 数据来源:互联网公开数据 标签:社交媒体,金融,股票,投资,文本分析,自然语言处理,舆情分析,机器学习 数据概述: 该数据集包含来自 Reddit 网站 WallStreetBets(WSB)子版块的帖子数据,记录了用户在 WSB... -
俄英虚假新闻翻译数据集RUS-ENFakeNewsTranslationDataset-nimbus32
俄英虚假新闻翻译数据集RUS-ENFakeNewsTranslationDataset-nimbus32 数据来源:互联网公开数据 标签:虚假新闻,翻译,数据集,俄语,英语,自然语言处理,机器翻译,文本分析 数据概述: 该数据集包含了俄语(RUS)到英语(EN)的虚假新闻翻译数据,旨在促进虚假信息检测和跨语言分析的研究。主要特征如下:... -
电影评论情感分析数据集IMDBReviewSentimentAnalysisDataset-princegupta19998
电影评论情感分析数据集IMDBReviewSentimentAnalysisDataset-princegupta19998 数据来源:互联网公开数据 标签:自然语言处理,情感分析,数据集,文本挖掘,机器学习,电影评论,人工智能,大数据 数据概述:... -
合并的Dataverse语言识别数据集MergedDataverseBhashaLanguageRecognitionDataset-samansarkerjoy
合并的Dataverse语言识别数据集MergedDataverseBhashaLanguageRecognitionDataset-samansarkerjoy 数据来源:互联网公开数据 标签:语言识别,数据集,自然语言处理,机器学习,语音识别,多语言,人工智能,数据分析 数据概述:... -
数据2024中国计算机学会CCF检索增强生成RAG数据集-yxw666
2024中国计算机学会CCF检索增强生成RAG数据集-yxw666 数据来源:互联网公开数据 标签:自然语言处理,检索增强生成,数据集,文本生成,信息检索,机器学习,人工智能,CCF 数据概述: 该数据集由中国计算机学会(CCF)提供,旨在促进检索增强生成(RAG)技术的研究与发展。主要特征如下: 时间跨度:数据记录的时间范围为2024年。... -
改进型图像字幕数据集ImprovedCaptionsDataset-sameerbairwa07
改进型图像字幕数据集ImprovedCaptionsDataset-sameerbairwa07 数据来源:互联网公开数据 标签:图像字幕,数据集,自然语言处理,计算机视觉,深度学习,文本生成,视觉理解,人工智能 数据概述: 该数据集包含经过改进的图像字幕数据,记录了与图像内容相匹配的,经过优化的描述性文本。主要特征如下:... -
数学竞赛解题API数据集MathematicsContestSolvingviaAPIDataset-sumansuhag
数学竞赛解题API数据集MathematicsContestSolvingviaAPIDataset-sumansuhag 数据来源:互联网公开数据 标签:数学竞赛,解题,API,数据集,人工智能,自然语言处理,数学建模,编程 数据概述: 该数据集包含通过API解决数学竞赛问题的相关数据,记录了使用API解答数学竞赛试题的过程和结果。主要特征如下:... -
LLM文本检测数据集-wcylxh
LLM文本检测数据集-wcylxh 数据来源:互联网公开数据 标签:自然语言处理,文本检测,数据集,机器学习,语言模型,文本分析,内容识别,风险评估 数据概述: 该数据集包含用于检测大型语言模型(LLM)生成的文本数据,旨在帮助研究人员和开发人员识别由LLM生成的文本。主要特征如下: 时间跨度:数据记录的时间范围为近期,包含最新LLM生成的内容。... -
文本生成模型Gemma数据集-minhsienweng
文本生成模型Gemma数据集-minhsienweng 数据来源:互联网公开数据 标签:文本生成,机器学习,自然语言处理,数据集,人工智能,语言模型,深度学习,文本分析... -
飞机航班评价与情感分析数据集AirplaneTweetsDataset-abdelrahmangamil
飞机航班评价与情感分析数据集AirplaneTweetsDataset-abdelrahmangamil 数据来源:互联网公开数据 标签:航空业,社交媒体,数据集,情感分析,文本挖掘,机器学习,客户服务,自然语言处理 数据概述: 该数据集包含来自Twitter平台关于飞机航班的用户评价和反馈数据,记录了乘客对航班服务的情感态度和具体评价。主要特征如下:... -
疾病诊断信息数据集DiagnosisMessageDataset-zenbot99
疾病诊断信息数据集DiagnosisMessageDataset-zenbot99 数据来源:互联网公开数据 标签:医疗健康,诊断信息,数据集,临床研究,机器学习,自然语言处理,医学文本,数据分析 数据概述: 该数据集包含来自医疗诊断场景的信息数据,记录了疾病诊断相关的文本或结构化信息。主要特征如下:... -
预处理数据集含停用词-文本处理与分析数据集PreprocessedDatawithStopwords-TextProcessingandAnalysisD...
预处理数据集含停用词-文本处理与分析数据集PreprocessedDatawithStopwords-TextProcessingandAnalysisDataset-solomonschwiger 数据来源:互联网公开数据 标签:文本处理,数据集,自然语言处理,停用词,机器学习,数据预处理,文本分析,信息检索 数据概述:... -
基于OpenAI生成的数据集DS3GeneratedDatafromOpenAI-devayani14
基于OpenAI生成的数据集DS3GeneratedDatafromOpenAI-devayani14 数据来源:互联网公开数据 标签:人工智能,数据集,自然语言处理,文本生成,机器学习,数据挖掘,OpenAI,数据分析 数据概述: 该数据集包含由OpenAI模型生成的各种文本数据,涵盖了广泛的主题和应用场景。主要特征如下:... -
诗歌分类数据集PoemsCategorizationDatasets-harunshimanto
诗歌分类数据集PoemsCategorizationDatasets-harunshimanto 数据来源:互联网公开数据 标签:诗歌,文本分类,自然语言处理,数据集,情感分析,文学研究,机器学习,创作风格 数据概述: 该数据集包含了各类诗歌作品,旨在用于诗歌的自动分类和分析。主要特征如下: 时间跨度:数据涵盖了不同历史时期和流派的诗歌作品。... -
德国2021年患者对医生评论与评分数据集
德国2021年患者对医生评论与评分数据集 数据来源:互联网公开数据 标签:患者评论,医生评分,文本分类,自然语言处理,德国医疗,情感分析,机器学习,数据科学 数据概述:...