数据集 - 海数据

人工智能与法律合并数据集AILAMergeDataset-michaelhsie1024

2025年4月25日

人工智能与法律合并数据集AILAMergeDataset-michaelhsie1024 数据来源：互联网公开数据标签：人工智能，法律，数据集，机器学习，法律研究，数据分析，文本处理，智能合约数据概述：该数据集为 AILA 项目的一部分，主要记录了人工智能在法律领域的应用数据，适用于法律研究，文本处理和智能合约分析等任务。主要特征如下：...
- ZIP
额外文件数据集ExtraFilesDataset-nhmquang

2025年4月25日

额外文件数据集ExtraFilesDataset-nhmquang 数据来源：互联网公开数据标签：文件分析，数据集，数据挖掘，文本处理，机器学习，数据安全，信息检索，文件类型数据概述：该数据集包含了各种文件类型的数据，旨在为文件分析，数据挖掘和机器学习研究提供支持。主要特征如下：时间跨度：...
- ZIP
BERT基础模型未分大小写文本处理数据集BERT-base-uncased-fresh-ep1Dataset-blackitten13

2025年4月25日

BERT基础模型未分大小写文本处理数据集BERT-base-uncased-fresh-ep1Dataset-blackitten13 数据来源：互联网公开数据标签：自然语言处理，文本分析，机器学习，深度学习，BERT模型，语言模型，数据集，AI应用数据概述：...
- ZIP
数据集与分词器工具集DatasetandTokenizerToolkit-sopanhariemsoeun

2025年4月25日

数据集与分词器工具集DatasetandTokenizerToolkit-sopanhariemsoeun 数据来源：互联网公开数据标签：自然语言处理，数据集，分词器，文本处理，机器学习，语言模型，数据预处理，工具集数据概述：该数据集包含用于自然语言处理的多种工具和数据集，主要支持文本分词，数据预处理等任务。主要特征如下：...
- ZIP
HuggingFace文档数据集HuggingFaceDocumentationDataset-sanjay74

2025年4月25日

HuggingFace文档数据集HuggingFaceDocumentationDataset-sanjay74 数据来源：互联网公开数据标签：自然语言处理，数据集，文档分析，机器学习，文本处理，人工智能，语言模型，文本分类数据概述：该数据集包含来自 Hugging Face...
- ZIP
项目文件分析数据集FilestoUseforProjectDataset-justingrima

2025年4月24日

项目文件分析数据集FilestoUseforProjectDataset-justingrima 数据来源：互联网公开数据标签：项目管理，文件分析，数据集，文本处理，数据挖掘，信息检索，文档管理，软件工程数据概述：该数据集包含了用于项目的文件信息，旨在支持项目管理，文件分析和相关研究。主要特征如下：...
- ZIP
预处理数据集含停用词-文本处理与分析数据集PreprocessedDatawithStopwords-TextProcessingandAnalysisD...

2025年4月24日

预处理数据集含停用词-文本处理与分析数据集PreprocessedDatawithStopwords-TextProcessingandAnalysisDataset-solomonschwiger 数据来源：互联网公开数据标签：文本处理，数据集，自然语言处理，停用词，机器学习，数据预处理，文本分析，信息检索数据概述：...
- ZIP
模糊匹配输出数据集FuzzyWuzzyOutputDataset-leed67

2025年4月24日

模糊匹配输出数据集FuzzyWuzzyOutputDataset-leed67 数据来源：互联网公开数据标签：模糊匹配，相似度分析，数据集，自然语言处理，文本匹配，文本处理，数据清洗，人工智能数据概述：该数据集包含使用FuzzyWuzzy库进行文本相似度匹配的输出结果，记录了不同文本字符串之间的相似度分数。主要特征如下：...
- ZIP
小型英语文本转换数据集ETT-smallDataset-neptureillusion

2025年4月24日

小型英语文本转换数据集ETT-smallDataset-neptureillusion 数据来源：互联网公开数据标签：文本处理，时间序列，机器学习，自然语言处理，英语，数据集，文本分析，预测数据概述：该数据集包含小型英语文本数据，专注于文本转换和预测任务。主要特征如下：时间跨度：数据记录的时间范围为特定时间段，具体取决于数据集的构建方式。...
- ZIP
单模型输入文本情感分析数据集-ocden22

2025年4月24日

单模型输入文本情感分析数据集-ocden22 数据来源：互联网公开数据标签：情感分析，数据集，文本处理，自然语言处理，机器学习，情感分类，文本情感，人工智能数据概述：该数据集包含用于单模型输入文本情感分析的文本数据，主要用于训练和评估情感分析模型。主要特征如下：时间跨度：数据无特定时间范围，涵盖各类文本数据。...
- ZIP
BM25基础训练集数据集-danielphalen

2025年4月24日

BM25基础训练集数据集-danielphalen 数据来源：互联网公开数据标签：信息检索，文本处理，数据集，自然语言处理，BM25，搜索算法，文本相似度，机器学习数据概述：该数据集包含用于训练和评估BM25（Best Match 25）模型的文本数据，主要用于信息检索任务。主要特征如下：时间跨度：数据涵盖了从特定时间段内收集的文本数据。...
- ZIP
英文文本序列长度验证数据集SequenceLength128-bamps53

2025年4月24日

英文文本序列长度验证数据集SequenceLength128-bamps53 数据来源：互联网公开数据标签：自然语言处理，文本处理，序列建模，数据集，机器学习，文本验证，文本分析，深度学习数据概述：该数据集包含经过处理的英文文本数据，主要用于验证和测试自然语言处理模型，特别是针对序列长度为128的文本序列。主要特征如下：...
- ZIP
尼泊尔名字数据集含性别信息

2025年4月24日

尼泊尔名字数据集含性别信息数据来源：互联网公开数据标签：尼泊尔,名字,性别,语言文化,数据清洗,文本处理,机器学习数据概述：本数据集包含尼泊尔语名字及其对应的性别信息，数据以德文那格里文字呈现。数据来源于尼泊尔选举委员会的公开信息，经过清洗和格式化处理，确保数据的准确性和可用性。数据用途概述：...
- ZIP
数据增强与反向翻译训练数据集AugmentedTrainDataBacktranslationDataset-konradb

2025年4月24日

数据增强与反向翻译训练数据集AugmentedTrainDataBacktranslationDataset-konradb 数据来源：互联网公开数据标签：数据增强，反向翻译，数据集，自然语言处理，机器学习，文本处理，语言模型，翻译技术数据概述：...
- ZIP
表情符号列表数据集ListofAllEmojisDataset-chroline

2025年4月24日

表情符号列表数据集ListofAllEmojisDataset-chroline 数据来源：互联网公开数据标签：表情符号，数据集，社交媒体，情感分析，机器学习，文本处理，数字文化，数据挖掘数据概述：该数据集包含来自互联网公开资源的表情符号列表，记录了各类表情符号的符号编码，名称，类别及使用场景等信息。主要特征如下：...
- ZIP
索赔数据标准化标签数据集ClaimsNormalizedLabelsDataset-maramalshammary

2025年4月24日

索赔数据标准化标签数据集ClaimsNormalizedLabelsDataset-maramalshammary 数据来源：互联网公开数据标签：索赔数据，数据集，标准化，标签，保险行业，数据分析，机器学习，文本处理数据概述：该数据集包含对保险索赔数据的标准化标签信息，记录了各种索赔案例的详细信息及其标准化标签。主要特征如下：时间跨度：...
- ZIP
加密提示数据集CipheredPromptsDataset-noob456

2025年4月24日

加密提示数据集CipheredPromptsDataset-noob456 数据来源：互联网公开数据标签：数据集，密码学，文本处理，机器学习，自然语言处理，数据安全，提示工程，人工智能数据概述：该数据集包含经过加密处理的文本提示数据，记录了多种加密算法下的提示信息。主要特征如下：时间跨度：数据记录的时间范围从2020年到2023年。...
- ZIP
大规模语言模型LLM生成文本分割数据集GSM-DataSplit-magnusgarl

2025年4月24日

大规模语言模型LLM生成文本分割数据集GSM-DataSplit-magnusgarl 数据来源：互联网公开数据标签：自然语言处理，文本分割，数据集，大规模语言模型，文本处理，机器学习，数据增强，语言模型训练数据概述：该数据集包含用于评估和改进大规模语言模型（LLM）生成文本分割能力的数据。主要特征如下：...
- ZIP
替换逗号数据集ReplacingCommaDataset-rojaramani

2025年4月24日

替换逗号数据集ReplacingCommaDataset-rojaramani 数据来源：互联网公开数据标签：数据清理，文本处理，数据集，自然语言处理，数据预处理，文本分析，数据科学，编程数据概述：该数据集包含来自互联网公开的数据，记录了需要进行逗号替换的文本片段。主要特征如下：时间跨度：数据记录的时间范围从2020年到2022年。...
- ZIP
预处理与词形还原测试数据数据集-marouanesidali

2025年4月24日

预处理与词形还原测试数据数据集-marouanesidali 数据来源：互联网公开数据标签：文本预处理，词形还原，自然语言处理，数据集，文本分析，机器学习，NLP，测试数据数据概述：该数据集包含了经过预处理和词形还原处理的文本数据，主要用于测试和评估文本处理算法的性能。主要特征如下：...
- ZIP

«
1
...
11
12
13
14
15
16
»

智能助手

您好！我是海数据平台的智能助手，有什么可以帮助您的吗？