-
歌曲歌词数据集SongLyricsData-hiesenberg
歌曲歌词数据集SongLyricsData-hiesenberg 数据来源:互联网公开数据 标签:歌词,音乐,数据集,自然语言处理,文本分析,情感分析,机器学习,音乐文化 数据概述: 该数据集包含了大量的歌曲歌词数据,涵盖了不同国家,不同语言,不同风格的歌曲。主要特征如下: 时间跨度:数据记录的时间范围跨度较大,从早期音乐到现代流行音乐均有收录。...
-
无事实依据的笑话数据集-j0hann
无事实依据的笑话数据集-j0hann 数据来源:互联网公开数据 标签:笑话,数据集,文本分析,自然语言处理,情感分析,娱乐,语言学,机器学习 数据概述: 该数据集包含了大量无事实依据的笑话,旨在用于文本分析,自然语言处理和机器学习模型训练。主要特征如下: 时间跨度:数据记录的时间范围不限,涵盖了不同时期和来源的笑话。...
-
主题模型反馈数据集-hirohigashi
主题模型反馈数据集-hirohigashi 数据来源:互联网公开数据 标签:主题模型,文本分析,数据集,自然语言处理,情感分析,用户反馈,机器学习,数据挖掘 数据概述:该数据集包含了用户对产品的反馈信息,旨在用于主题模型的研究和应用。主要特征如下: 时间跨度:数据记录的时间范围不限,取决于具体的数据来源。...
-
强化学习训练数据数据集-vishwashsharma
强化学习训练数据数据集-vishwashsharma 数据来源:互联网公开数据 标签:强化学习,数据集,智能体,环境交互,策略优化,算法训练,机器学习,人工智能 数据概述:该数据集包含用于强化学习算法训练的各种智能体与环境交互的数据记录。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于数据集的创建时间,可能涵盖不同时间段。...
-
NumPy学习资源数据集LearnNumpyDataset-npscul
NumPy学习资源数据集LearnNumpyDataset-npscul 数据来源:互联网公开数据 标签:编程学习,数据分析,Python,库教程,科学计算,教育材料,基础教学,计算机科学 数据概述:该数据集包含来自开源社区和在线教育平台的NumPy学习资源,记录了学习NumPy所需的基础教程,代码示例和练习题。主要特征如下:...
-
华为Mate60Pro京东用户评论数据集-haoxuanzhong
华为Mate60Pro京东用户评论数据集-haoxuanzhong 数据来源:互联网公开数据 标签:华为手机,Mate 60 Pro,用户评论,京东,产品评价,情感分析,自然语言处理,市场调研 数据概述: 该数据集包含了来自京东平台的用户对华为Mate 60 Pro手机的评论数据,记录了用户对该手机的各种评价和反馈。主要特征如下:...
-
电影类型分类数据集MovieGenreClassificationDataset-lamiasaiyara
电影类型分类数据集MovieGenreClassificationDataset-lamiasaiyara 数据来源:互联网公开数据 标签:电影,类型分类,自然语言处理,文本分析,机器学习,情感分析,电影推荐,数据集 数据概述: 该数据集包含电影的相关信息,用于电影类型的自动分类任务。主要特征如下: 时间跨度:数据记录的时间范围覆盖了不同年代的电影。...
-
电话通话记录全文本数据集TranscriptsAllCallsDataset-prathamagarwal1302
电话通话记录全文本数据集TranscriptsAllCallsDataset-prathamagarwal1302 数据来源:互联网公开数据 标签:通信记录,数据集,文本分析,自然语言处理,机器学习,语音识别,客服分析,数据挖掘 数据概述: 该数据集包含来自多个电话通信记录的文本转录内容,记录了电话通话的详细对话信息。主要特征如下:...
-
Python自然语言处理实践数据集-ndrianahani
Python自然语言处理实践数据集-ndrianahani 数据来源:互联网公开数据 标签:自然语言处理,NLP,文本分析,数据集,Python,机器学习,语言模型,文本挖掘 数据概述: 该数据集包含用于Python自然语言处理实践的文本数据,涵盖了多种NLP任务和应用场景。主要特征如下: 时间跨度: 数据记录的时间范围不限,数据集内容持续更新。...
-
数据2023图像匹配挑战赛数据集ImageMatchingChallenge2023Dataset-motono0223
2023图像匹配挑战赛数据集ImageMatchingChallenge2023Dataset-motono0223 数据来源:互联网公开数据 标签:计算机视觉,图像匹配,数据集,深度学习,图像处理,视觉识别,人工智能,竞赛数据 数据概述: 该数据集由2023年图像匹配挑战赛提供,专注于图像之间的特征匹配和对应关系识别。主要特征如下:...
-
越南语字幕数据集DataCaptiontoVietnameseDataset-tndtnguyn
越南语字幕数据集DataCaptiontoVietnameseDataset-tndtnguyn 数据来源:互联网公开数据 标签:字幕翻译,越南语,数据集,机器翻译,自然语言处理,文本分析,语言学,跨语言 数据概述:该数据集包含从英语到越南语的字幕翻译数据,用于字幕翻译任务。主要特征如下: 时间跨度:数据记录的时间范围不明确,取决于数据来源。...
-
全球旅游景点评论数据集PointofGlobal-TouristSpotReviewDataset-wertyuyuio
全球旅游景点评论数据集PointofGlobal-TouristSpotReviewDataset-wertyuyuio 数据来源:互联网公开数据 标签:旅游,景点,评论,情感分析,自然语言处理,数据集,文本挖掘,旅游业 数据概述: 该数据集包含来自全球旅游景点的大量评论数据,记录了游客对不同景点的评价和体验。主要特征如下:...
-
意图分类数据集IntentClassifierDataset-interviewturabit
意图分类数据集IntentClassifierDataset-interviewturabit 数据来源:互联网公开数据 标签:自然语言处理,意图识别,数据集,文本分类,机器学习,人工智能,对话系统,语义理解 数据概述: 该数据集包含用于意图分类任务的文本数据,旨在训练和评估文本分类模型,以识别用户输入文本的意图。主要特征如下:...
-
测试训练上下文大型语言模型数据集-quctngngvng
测试训练上下文大型语言模型数据集-quctngngvng 数据来源:互联网公开数据 标签:大型语言模型,数据集,自然语言处理,文本生成,机器学习,模型训练,语言模型,上下文学习 数据概述: 该数据集包含用于训练和评估大型语言模型(LLM)的文本数据,专注于测试训练(Test-Train)场景下的上下文学习能力。主要特征如下: 时间跨度:...
-
多领域罗马乌尔都语语料库数据集Multi-DomainRomanUrduCorpusDataset-marwakhanfastnulhr
多领域罗马乌尔都语语料库数据集Multi-DomainRomanUrduCorpusDataset-marwakhanfastnulhr 数据来源:互联网公开数据 标签:自然语言处理,语料库,罗马乌尔都语,文本分析,多领域,文本分类,机器翻译,语言学 数据概述:...
-
医疗转录数据集MedicalTranscriptionSamplesDataset-oyesaurav
医疗转录数据集MedicalTranscriptionSamplesDataset-oyesaurav 数据来源:互联网公开数据 标签:医疗,转录,临床,文本分析,自然语言处理,数据集,健康,医学 数据概述: 该数据集包含来自MT Samples的临床转录数据,记录了医疗领域的各种临床报告和病历。主要特征如下:...
-
越南车牌识别数据集VietnamLicensePlateDataset-haitonthat
越南车牌识别数据集VietnamLicensePlateDataset-haitonthat 数据来源:互联网公开数据 标签:车牌识别,数据集,计算机视觉,图像处理,人工智能,交通管理,机器学习,越南 数据概述: 该数据集包含来自越南的真实车牌图像数据,专注于车牌字符的识别与分割。主要特征如下:...
-
休斯顿太空人队丑闻事件数据集HoustonAstrosScandalDataset-emilioaraos
休斯顿太空人队丑闻事件数据集HoustonAstrosScandalDataset-emilioaraos 数据来源:互联网公开数据 标签:棒球,丑闻,数据集,数据分析,体育,欺诈,机器学习,事件调查 数据概述: 该数据集包含关于美国职业棒球大联盟(MLB)休斯顿太空人队(Houston...
-
邮件分类数据集EmailCategoriesDataset-tobniislam
邮件分类数据集EmailCategoriesDataset-tobniislam 数据来源:互联网公开数据 标签:邮件分类,文本分析,自然语言处理,数据集,机器学习,情感分析,文本挖掘,信息检索 数据概述: 该数据集包含来自不同来源的电子邮件数据,旨在用于邮件分类和文本分析任务。主要特征如下: 时间跨度:数据记录的时间范围跨度不明确,取决于具体来源。...
-
虚假新闻检测数据集FakeNewsDetectionDataset-lethaldiran
虚假新闻检测数据集FakeNewsDetectionDataset-lethaldiran 数据来源:互联网公开数据 标签:新闻,虚假信息,自然语言处理,文本分类,机器学习,情感分析,社交媒体,信息安全 数据概述: 该数据集包含经过预处理并使用GloVe词嵌入的虚假新闻检测数据,记录了新闻文章的文本内容及其真实性标签。主要特征如下:...



