-
雅思写作数据集IELTSWritingDataset-sebasga79
雅思写作数据集IELTSWritingDataset-sebasga79 数据来源:互联网公开数据 标签:雅思,写作,数据集,英语学习,语言分析,教育评估,自然语言处理,学术研究 数据概述:该数据集包含来自雅思考试写作部分的数据,记录了考生的写作样本及其评分。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。...
-
数据2014至2016年婴儿女孩名字数据集BabyGirlNames2014-2016Dataset-stephaniejones
2014至2016年婴儿女孩名字数据集BabyGirlNames2014-2016Dataset-stephaniejones 数据来源:互联网公开数据 标签:婴儿名字,数据集,人口统计,社会研究,语言分析,文化研究,教育研究,流行趋势 数据概述:...
-
学习平等高级数据集
学习平等高级数据集 数据来源:互联网公开数据 标签:内容分析,主题建模,自然语言处理,词性标注,许可证限制,数据特征提取,语言标准化 数据概述: 本数据集包含三个主要文件:content_advanced.csv、topics_advanced.csv 和 license_limitations.csv。 1. content_advanced.csv...
-
摩洛哥方言语言学研究数据集MoroccanDialectDataset-yassinemekrany
摩洛哥方言语言学研究数据集MoroccanDialectDataset-yassinemekrany 数据来源:互联网公开数据 标签:语言学,方言研究,数据集,语音识别,自然语言处理,非洲文化,机器学习,语言分析 数据概述: 该数据集包含来自摩洛哥的方言语音和文本数据,记录了摩洛哥方言的发音,词汇和语法特征。主要特征如下:...
-
西班牙语歌曲歌词数据集SpanishSongsLyricsDataset-pinooxd
西班牙语歌曲歌词数据集SpanishSongsLyricsDataset-pinooxd 数据来源:互联网公开数据 标签:音乐,歌词,数据集,语言分析,自然语言处理,文化研究,机器学习,多语言 数据概述: 该数据集包含来自互联网公开渠道的西班牙语歌曲歌词数据,记录了多种西班牙语歌曲的歌词文本。主要特征如下:...
-
阿拉伯方言数据集DialectArabicDataset-arawee
阿拉伯方言数据集DialectArabicDataset-arawee 数据来源:互联网公开数据 标签:阿拉伯语,方言研究,数据集,语言分析,机器学习,自然语言处理,语音识别,文化研究 数据概述: 该数据集包含来自多个阿拉伯国家的方言语音和文本数据,记录了阿拉伯语在不同地区的方言特征。主要特征如下: 时间跨度:数据记录的时间范围从近年到现代。...
-
阿拉伯语仇恨言论检测数据集ArabicHateSpeechDetectionDataset-malkim
阿拉伯语仇恨言论检测数据集ArabicHateSpeechDetectionDataset-malkim 数据来源:互联网公开数据 标签:仇恨言论,语言分析,数据集,机器学习,文本分类,社会媒体,自然语言处理,情感分析 数据概述: 该数据集包含来自阿拉伯语社交媒体平台的文本数据,记录了用户发布的内容及其是否被标记为仇恨言论。主要特征如下:...
-
韩国极右翼网站WOMAD仇恨言论数据集KoreanExtremistWebsiteWOMADHateSpeechDataset-captainnemo9292
韩国极右翼网站WOMAD仇恨言论数据集KoreanExtremistWebsiteWOMADHateSpeechDataset-captainnemo9292 数据来源:互联网公开数据 标签:仇恨言论,数据集,极右翼,社交媒体,语言分析,自然语言处理,社会学,网络安全...
-
澳大利亚总理公开演讲与访谈文本数据集2020-2021-mattrosinski
澳大利亚总理公开演讲与访谈文本数据集2020-2021-mattrosinski 数据来源:互联网公开数据 标签:澳大利亚,总理,演讲,访谈,文本数据,政治,公共记录,语言分析,情感分析,主题分析 数据概述:...
-
元学习共读理解数据集MetaLearningforCommonLitReadingComprehensionDataset-syndri224
元学习共读理解数据集MetaLearningforCommonLitReadingComprehensionDataset-syndri224 数据来源:互联网公开数据 标签:元学习,阅读理解,数据集,自然语言处理,机器学习,教育研究,语言分析,学术资源...
-
单词统计与频率分析数据集WordStatisticsandFrequencyAnalysisDataset-ment696
单词统计与频率分析数据集WordStatisticsandFrequencyAnalysisDataset-ment696 数据来源:互联网公开数据 标签:语言分析,文本挖掘,数据集,频率统计,自然语言处理,词汇研究,机器学习,教育研究 数据概述:...
-
卡内基梅隆大学印地语英语混合语数据集CMUHinglishDataset-abhishek28069
卡内基梅隆大学印地语英语混合语数据集CMUHinglishDataset-abhishek28069 数据来源:互联网公开数据 标签:印地语英语混合语,数据集,自然语言处理,多语言研究,机器学习,语言分析,文本挖掘,语言技术 数据概述:...
-
电影行业数据洞察全面解析电影市场动态
标题:电影行业数据洞察全面解析电影市场动态 数据内容:该数据集包含了丰富的电影相关信息,涵盖了电影的预算、类型、主页链接、唯一标识符、关键词、原始语言、原始标题、剧情概述、流行度、制作公司、制作国家、上映日期、收入、时长、使用的语言、状态、标语、标题、平均评分和评分数量等详细信息。 数据来源:互联网公开数据...
-
巴马腊法语平行语料库数据集-ozaresearch1
巴马腊法语平行语料库数据集-ozaresearch1 数据来源:互联网公开数据 标签:巴马腊,法语,平行语料库,机器学习,翻译,文本生成,语言分析 数据概述:...
-
印地语MBTI人格类型数据集HindiMBTIPersonalityTypeDataset-rachitj180
印地语MBTI人格类型数据集HindiMBTIPersonalityTypeDataset-rachitj180 数据来源:互联网公开数据 标签:人格类型,MBTI,印地语,心理学,数据集,机器学习,语言分析,社会研究 数据概述: 该数据集包含来自印地语社区的MBTI人格类型数据,记录了不同个体在印地语环境下的MBTI人格类型信息。主要特征如下:...
-
卡拉巴赫战争推特数据分析集-用户与事件2020至2022-yantashe
卡拉巴赫战争推特数据分析集-用户与事件2020至2022-yantashe 数据来源:互联网公开数据 标签:卡拉巴赫战争,推特分析,社交媒体,用户行为,冲突分析,语言分析,地缘政治 数据概述: 本数据集包含了2020年至2022年间与卡拉巴赫战争相关的推特记录,共计数万条。每条推特记录了推特的基本信息、发布内容、用户特征以及相关标签。数据字段包括:...
-
乌克兰新闻数据集2023年12月31日至2024年1月9日-shyshcuk
乌克兰新闻数据集2023年12月31日至2024年1月9日-shyshcuk 数据来源:互联网公开数据 标签:乌克兰新闻,时政报道,语言分析,新闻内容,时间序列,媒体研究 数据概述: 本数据集收录了2023年12月31日至2024年1月9日期间乌克兰语新闻文章的集合,包含三类关键字段: 出版时间: 表示每篇新闻文章的发布时间戳。 标题:...
-
专业咨询对话质量评估与分析数据集AnnoMI-rahulbaburaj
专业咨询对话质量评估与分析数据集AnnoMI-rahulbaburaj 数据来源:互联网公开数据 标签:咨询对话,心理健康,语言分析,情感识别,治疗方法,自然语言处理,动机性访谈,MI,专家标注 数据概述: AnnoMI数据集是首个公开、免费的专家标注咨询对话数据集,专注于动机性访谈(MI,Motivational...
-
解密中央情报局情报报告数据集1950-2000年-stuartbladon
解密中央情报局情报报告数据集1950-2000年-stuartbladon 数据来源:互联网公开数据 标签:CIA,情报报告,国家安全,冷战,历史,威胁评估,语言分析,偏见研究,解密文档 数据概述:...
-
威尔士语词典语料库词汇及语境分析数据集-rtatman
威尔士语词典语料库词汇及语境分析数据集-rtatman 数据来源:互联网公开数据 标签:威尔士语,词典,语言学,语料库,词汇,语言分析,凯尔特语,翻译,双语,单语 数据概述:...



