数据集 - 海数据

乌克兰危机背景下法国政治言论数据集Ukraine-FrenchCrisisPoliticalDiscourseDataset-khemkhammohamed

2025年4月24日

乌克兰危机背景下法国政治言论数据集Ukraine-FrenchCrisisPoliticalDiscourseDataset-khemkhammohamed 数据来源：互联网公开数据标签：乌克兰危机，法国，政治言论，文本分析，情感分析，舆情分析，自然语言处理，国际关系数据概述：...

ZIP

英语词汇频率统计数据集WordsCSVDataset-jasperbutcher

2025年4月24日

英语词汇频率统计数据集WordsCSVDataset-jasperbutcher 数据来源：互联网公开数据标签：自然语言处理，文本分析，词频统计，数据集，语言学，词汇学习，机器学习，统计分析数据概述：该数据集包含了来自互联网的大量文本数据，记录了英语词汇的出现频率。主要特征如下：...

ZIP

阿拉伯诗歌韵律模式数据集ArabicPoemPatternDataset-m7mdalbaddawi

2025年4月24日

阿拉伯诗歌韵律模式数据集ArabicPoemPatternDataset-m7mdalbaddawi 数据来源：互联网公开数据标签：诗歌，韵律，阿拉伯文学，数据集，语言研究，文本分析，文化研究，机器学习数据概述：该数据集包含来自阿拉伯文学领域的诗歌韵律数据，记录了阿拉伯诗歌的韵律模式，结构和风格特征。主要特征如下：...

ZIP

StackOverflow问答数据集StackOverflowQuestionsDataset-sukuzhanay

2025年4月24日

StackOverflow问答数据集StackOverflowQuestionsDataset-sukuzhanay 数据来源：互联网公开数据标签：问答系统，编程，数据集，自然语言处理，文本分析，机器学习，开发者社区，数据挖掘数据概述：该数据集包含来自 Stack Overflow...

ZIP

歌曲创作与语言分析平台歌词数据集

2025年4月24日

歌曲创作与语言分析平台歌词数据集数据来源：互联网公开数据标签：歌词,音乐,歌曲,语言,文本分析,自然语言处理,创作,文化,流派数据概述：...

ZIP

Reddit短内容数据集RedditShortDataset-swathikone

2025年4月24日

Reddit短内容数据集RedditShortDataset-swathikone 数据来源：互联网公开数据标签：社交媒体，文本分析，数据集，情感分析，机器学习，自然语言处理，网络行为，内容分类数据概述：该数据集包含来自Reddit平台的短内容数据，记录了用户发布在各个板块的简短文本信息。主要特征如下：...

ZIP

arXiv论文摘要数据集FDL-Arxiv-FinalDataset-alssioalfonso

2025年4月24日

arXiv论文摘要数据集FDL-Arxiv-FinalDataset-alssioalfonso 数据来源：互联网公开数据标签：自然语言处理，机器学习，论文摘要，文本分析，数据集，学术研究，论文推荐，深度学习数据概述：该数据集包含来自arXiv（预印本服务器）的论文摘要数据，主要用于自然语言处理，机器学习等相关研究。主要特征如下：...

ZIP

今日俄罗斯新闻Telegram频道头条新闻数据集-2013年至2023年12月22日-goshaserbin

2025年4月24日

今日俄罗斯新闻Telegram频道头条新闻数据集-2013年至2023年12月22日-goshaserbin 数据来源：互联网公开数据标签：俄罗斯,新闻,Telegram,头条新闻,政治,社会,国际关系,媒体,时间序列,文本分析数据概述：本数据集收录了今日俄罗斯（RT, Russia...

ZIP

金融新闻情感分析数据集EliciaNewsFinBERTDataset-a0204261w

2025年4月24日

金融新闻情感分析数据集EliciaNewsFinBERTDataset-a0204261w 数据来源：互联网公开数据标签：金融新闻，情感分析，自然语言处理，数据集，机器学习，文本分析，金融科技，新闻媒体数据概述：该数据集包含来自Elicia新闻的金融新闻数据，记录了新闻文章及其对应的情感标签。主要特征如下：...

ZIP

欧洲议会代词数据集ItalianLanguagePronounDataset-harshitdhankhar

2025年4月24日

欧洲议会代词数据集ItalianLanguagePronounDataset-harshitdhankhar 数据来源：互联网公开数据标签：语言处理，数据集，自然语言，机器学习，文本分析，意大利语，代词研究，多语言数据概述：该数据集来源于欧洲议会会议记录，专注于意大利语中的代词使用情况。主要特征如下：...

ZIP

美国和加州立法提案摘要数据集-undersc0re

2025年4月24日

美国和加州立法提案摘要数据集-undersc0re 数据来源：互联网公开数据标签：立法,提案,摘要,文本分析,自然语言处理,美国,加州,法律,文本长度数据概述：本数据集包含了美国联邦立法提案和加州立法提案的摘要信息，总计超过23000条记录。数据分为训练集（train）、加州测试集（ca_test）和测试集（test）三个部分。...

ZIP

欺凌事件标注数据集2018年-felicitaarcadia

2025年4月24日

欺凌事件标注数据集2018年-felicitaarcadia 数据来源：互联网公开数据标签：欺凌，校园欺凌，数据集，文本分析，自然语言处理，情感分析，社会学，教育数据概述：该数据集包含2018年收集的欺凌事件相关文本数据，记录了各种形式的欺凌行为描述。主要特征如下：时间跨度：数据记录的时间范围为2018年。...

ZIP

国际法律信息检索竞赛COLIEE2024图卷积网络数据集COLIEE2024GCNDataset-nguynkhnhhuyn

2025年4月24日

国际法律信息检索竞赛COLIEE2024图卷积网络数据集COLIEE2024GCNDataset-nguynkhnhhuyn 数据来源：互联网公开数据标签：法律文本，信息检索，图卷积网络，数据集，自然语言处理，机器学习，法律科技，文本分析数据概述：该数据集来源于国际法律信息检索竞赛（COLIEE...

ZIP

推特社交平台网络欺凌数据集TwitterCyberbullyingDataset-saitejave

2025年4月24日

推特社交平台网络欺凌数据集TwitterCyberbullyingDataset-saitejave 数据来源：互联网公开数据标签：社交媒体，网络欺凌，数据集，文本分析，情感分析，自然语言处理，机器学习，社会学数据概述：...

ZIP

孟加拉电子产品分词数据集BanglaElectronicsLemmatizedFinalDataset-nirajmahi

2025年4月24日

孟加拉电子产品分词数据集BanglaElectronicsLemmatizedFinalDataset-nirajmahi 数据来源：互联网公开数据标签：电子产品，数据集，分词，自然语言处理，机器学习，文本分析，语言学，数据挖掘数据概述：该数据集包含来自孟加拉国电子产品领域的分词数据，记录了电子产品相关的文本信息。主要特征如下：...

ZIP

EMNIST字母图像数据集EMNISTLettersDataset-mzaink14

2025年4月24日

EMNIST字母图像数据集EMNISTLettersDataset-mzaink14 数据来源：互联网公开数据标签：图像识别，字符识别，数据集，机器学习，深度学习，计算机视觉，文本分析，字母数据概述：该数据集包含来自EMNIST项目的字母图像数据，主要用于训练和评估字母识别模型。主要特征如下：时间跨度：数据记录的时间范围为数据集创建时期。...

ZIP

口述历史访谈记录数据集LokisTranscriptDataset-anomic

2025年4月24日

口述历史访谈记录数据集LokisTranscriptDataset-anomic 数据来源：互联网公开数据标签：口述历史，访谈记录，数据集，历史研究，文本分析，社会研究，语言处理，人文科学数据概述：该数据集包含来自口述历史项目的访谈记录，记录了个人口述历史访谈的完整文本内容。主要特征如下：时间跨度：数据记录的时间范围从20世纪初到现代。...

ZIP

数据2024年数据科学学生锦标赛专利摘要分类数据集-lokeshsgupta

2025年4月24日

2024年数据科学学生锦标赛专利摘要分类数据集-lokeshsgupta 数据来源：互联网公开数据标签：专利,摘要,分类,EPO,欧洲专利局,机器学习,文本分析,数据科学,竞赛,标签数据概述：...

ZIP

阿达尼集团相关推文数据集TweetsonAdani10kDataset-vidiptvashist

2025年4月24日

阿达尼集团相关推文数据集TweetsonAdani10kDataset-vidiptvashist 数据来源：互联网公开数据标签：社交媒体，数据集，文本分析，情感分析，舆情监测，机器学习，自然语言处理，商业研究数据概述：该数据集包含来自社交媒体平台Twitter（推文）的公开数据，记录了与阿达尼集团（Adani...

ZIP

信息科学582挑战赛数据集-saranga7

2025年4月24日

信息科学582挑战赛数据集-saranga7 数据来源：互联网公开数据标签：机器学习，数据集，文本分析，自然语言处理，情感分析，社交媒体，竞赛，新闻数据概述：该数据集包含来自信息科学582挑战赛的数据，主要记录了与新闻文章相关的文本数据。主要特征如下：时间跨度：数据记录的时间范围，涵盖了挑战赛期间的新闻文章。...

ZIP

找到5,810个数据集

注册成功！