-
NIT项目-自然语言处理数据集NITProject-NaturalLanguageProcessingDataset-peculiarview
NIT项目-自然语言处理数据集NITProject-NaturalLanguageProcessingDataset-peculiarview 数据来源:互联网公开数据 标签:自然语言处理,NLP,数据集,文本分析,机器翻译,情感分析,信息抽取,文本分类 数据概述: 该数据集由NIT项目提供,包含了多种自然语言处理任务的文本数据。主要特征如下:...
-
印地语-英语平行语料库数据集-harshityadavjnu
印地语-英语平行语料库数据集-harshityadavjnu 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,印地语,英语,语料库,语言学,文本分析,跨语言 数据概述:该数据集包含印地语和英语的平行文本数据,旨在用于机器翻译、跨语言信息检索等任务。主要特征如下: 时间跨度:数据记录的时间跨度不明确,取决于语料库的收集时间。...
-
学生学术写作评价数据集DF-LLM-StudentDataset-alvaromendizabal
学生学术写作评价数据集DF-LLM-StudentDataset-alvaromendizabal 数据来源:互联网公开数据 标签:学术写作,数据集,自然语言处理,LLM,文本分析,教育,写作评估,机器学习 数据概述: 该数据集包含来自不同学生的学术写作样本,旨在用于评估和改进学生学术写作能力。主要特征如下:...
-
通用拼音输入法词库数据集GPNUAllWordsDataset-nazmuddhohaansary
通用拼音输入法词库数据集GPNUAllWordsDataset-nazmuddhohaansary 数据来源:互联网公开数据 标签:词库,输入法,数据集,中文,自然语言处理,语言资源,文本处理,机器学习 数据概述: 该数据集包含通用拼音输入法(GPNU)的完整词库数据,记录了中文词语及其对应的拼音信息。主要特征如下:...
-
语音识别人物声纹验证数据集SpeakerVerificationDataset-yosrahashem
语音识别人物声纹验证数据集SpeakerVerificationDataset-yosrahashem 数据来源:互联网公开数据 标签:声纹识别, 语音识别, 说话人验证, 音频分析, 机器学习, 深度学习, 数据集, 语音信号处理 数据概述:...
-
阿拉伯诗人诗歌作品数据集-adhamdiaa
阿拉伯诗人诗歌作品数据集-adhamdiaa 数据来源:互联网公开数据 标签:诗歌,阿拉伯文化,文学,数据集,自然语言处理,文本分析,情感分析,文化研究 数据概述: 该数据集包含了来自多个阿拉伯诗人的诗歌作品,旨在为研究阿拉伯文学和文化提供数据支持。主要特征如下: 时间跨度: 数据涵盖了从古典时期到现代的阿拉伯诗歌。 地理范围:...
-
人工智能生成文本对比人类文本清洗数据集-dillonwongso
人工智能生成文本对比人类文本清洗数据集-dillonwongso 数据来源:互联网公开数据 标签:人工智能,文本生成,文本清洗,数据集,自然语言处理,机器学习,文本分析,对比研究 数据概述: 该数据集包含来自不同来源的人工智能生成文本和人类编写的文本,并经过清洗处理,旨在用于比较分析。主要特征如下:...
-
大规模语言模型扩充训练数据集LargeLanguageModelSEExtraTrainDatasets-ranchantan
大规模语言模型扩充训练数据集LargeLanguageModelSEExtraTrainDatasets-ranchantan 数据来源:互联网公开数据 标签:自然语言处理,语言模型,数据集,机器学习,文本生成,深度学习,人工智能,多语言支持 数据概述: 该数据集包含来自多个来源的大规模文本数据,用于扩充和训练大规模语言模型。主要特征如下:...
-
越南语-苗语翻译平衡语料库数据集Pho-MTBalanceLabelDataset-baotanguyen
越南语-苗语翻译平衡语料库数据集Pho-MTBalanceLabelDataset-baotanguyen 数据来源:互联网公开数据 标签:机器翻译,语料库,越南语,苗语,语言学,自然语言处理,双语数据,文本数据 数据概述: 该数据集包含越南语和苗语的双语平行文本,旨在促进越南语和苗语之间的机器翻译研究。主要特征如下:...
-
韩国留学论文翻译数据集TranslatedEssaysKODataset-umgeeyo
韩国留学论文翻译数据集TranslatedEssaysKODataset-umgeeyo 数据来源:互联网公开数据 标签:论文翻译,韩国留学,数据集,机器翻译,自然语言处理,语言学,文本分析,韩语 数据概述: 该数据集包含韩国留学申请相关的论文翻译数据,旨在促进机器翻译和语言学习研究。主要特征如下:...
-
多语言字幕数据集Opensubtitles6LanguagesforJigsaw2020-ratthachat
多语言字幕数据集Opensubtitles6LanguagesforJigsaw2020-ratthachat 数据来源:互联网公开数据 标签:自然语言处理,多语言文本,字幕数据,机器学习,文本分类,情感分析,数据集,人工智能 数据概述:...
-
图像描述生成数据集ImageCaptionsDataset-sandhyas29
图像描述生成数据集ImageCaptionsDataset-sandhyas29 数据来源:互联网公开数据 标签:图像描述,数据集,计算机视觉,自然语言处理,深度学习,图像识别,文本生成,人工智能 数据概述: 该数据集包含图像及其对应的文字描述,旨在用于训练图像描述生成模型。主要特征如下: 时间跨度:数据记录的时间范围不定,涵盖了不同时期和场景的图像。...
-
高级数据分析与PySpark应用数据集AssignmentNo-2AdvancedAnalyticsUsingPySparkDataset-shahbaz58
高级数据分析与PySpark应用数据集AssignmentNo-2AdvancedAnalyticsUsingPySparkDataset-shahbaz58 数据来源:互联网公开数据 标签:数据分析,PySpark,机器学习,大数据,数据挖掘,商业智能,编程工具,教育研究 数据概述:...
-
以太坊ERC721代币交易数据EthereumERC721TokenTransactionData-tczplv
以太坊ERC721代币交易数据EthereumERC721TokenTransactionData-tczplv 数据来源:互联网公开数据 标签:区块链, 以太坊, ERC721, NFT, 交易数据, 数据分析, 智能合约, 数据挖掘 数据概述:...
-
电影推荐数据集MovieLens-uurdndr
电影推荐数据集MovieLens-uurdndr 数据来源:互联网公开数据 标签:电影,推荐系统,数据集,用户行为,评分,机器学习,数据分析,娱乐 数据概述: 该数据集包含来自 MovieLens 的电影数据,记录了用户对电影的评分和相关信息。主要特征如下: 时间跨度:数据记录的时间跨度涵盖了不同时期的电影作品。...
-
亚马逊商品元数据数据集AmazonMeta-DataDataset-dartigb
亚马逊商品元数据数据集AmazonMeta-DataDataset-dartigb 数据来源:互联网公开数据 标签:电商,商品,元数据,文本分析,推荐系统,自然语言处理,机器学习,数据挖掘 数据概述: 该数据集包含来自亚马逊电商平台的商品元数据,记录了大量商品的详细信息。主要特征如下:...
-
斯坦福大学地震数据集StanfordEarthquakeDataset-mostafamousavi
斯坦福大学地震数据集StanfordEarthquakeDataset-mostafamousavi 数据来源:互联网公开数据 标签:地震,地质,数据集,地震学,地球科学,震级,地理,自然灾害 数据概述: 该数据集包含斯坦福大学收集的地震相关数据,记录了全球范围内的地震事件信息。主要特征如下:...
-
目标检测图像与标签数据集YOLOImagesandLabelDataset-semskieman
目标检测图像与标签数据集YOLOImagesandLabelDataset-semskieman 数据来源:互联网公开数据 标签:目标检测,图像标注,数据集,计算机视觉,深度学习,机器学习,图像识别,人工智能 数据概述: 该数据集包含用于目标检测任务的图像及其对应的标注信息,遵循YOLO(You Only Look...
-
法律电子卷宗解析训练数据集LECRUnsupervisedTrainingDataTop-N96Dataset-hasegawatsuyoshi
法律电子卷宗解析训练数据集LECRUnsupervisedTrainingDataTop-N96Dataset-hasegawatsuyoshi 数据来源:互联网公开数据 标签:法律科技,自然语言处理,数据集,电子卷宗,无监督学习,文本分类,人工智能,机器学习 数据概述:...
-
GEMA课程SQL数据集GEMACourseSQLDataset-catadanna
GEMA课程SQL数据集GEMACourseSQLDataset-catadanna 数据来源:互联网公开数据 标签:SQL,数据库,数据集,编程学习,教育技术,数据分析,信息技术,课程资源 数据概述: 该数据集由GEMA课程提供,主要记录了与SQL相关的课程内容和示例数据。主要特征如下:...



