-
越南语精神健康文本数据集
越南语精神健康文本数据集_Vietnamese_Mental_Health_Text_Dataset 数据来源:互联网公开数据 标签:越南语, 精神健康, 文本分析, 自然语言处理, 文本分类, 医学, 心理学, 语料库 数据概述: 该数据集包含来自越南语的文本数据,记录了与精神健康相关的文本内容。主要特征如下:... -
学术论文标题文本主题分析数据集
学术论文标题文本主题分析数据集_Academic_Paper_Title_Text_Topic_Analysis 数据来源:互联网公开数据 标签:文本分析, 学术论文, 标题提取, 文本挖掘, 主题模型, TF-IDF, 机器学习, 语料库 数据概述: 该数据集包含从学术论文中提取的标题文本,用于主题分析和文本挖掘研究。主要特征如下:... -
股票市场情绪分析数据集
股票市场情绪分析数据集_Stock_Market_Sentiment_Analysis 数据来源:互联网公开数据 标签:股票市场, 情绪分析, 文本分析, 情感分类, 自然语言处理, 金融数据, 市场预测, 数据挖掘 数据概述: 该数据集包含来自金融市场的数据,记录了与股票市场相关的文本信息和相关的情绪指标。主要特征如下:... -
比特币政策对话访谈问答与议题结构数据集
数据简介: 本数据集系统整理了2024年与比特币相关的播客节目内容,共计1819条记录。数据聚焦于宏观经济、货币政策、技术演进、制度接受度与社会应用等方面,涵盖来自多个播客节目的嘉宾访谈、对话要点、关键词抽取、核心议题梳理与延伸性问题汇总。该数据集为比特币政策研究、传播趋势分析与公众认知建模提供结构化信息支持。 数据来源: 播客节目平台(如... -
国际新闻文本数据集
国际新闻文本数据集_International_News_Text_Data 数据来源:互联网公开数据 标签:新闻文本, 自然语言处理, 文本分析, 舆情分析, 情感分析, 跨语言, 新闻内容, 数据挖掘 数据概述: 该数据集包含来自CNN新闻频道的数据,记录了国际新闻报道的文本内容。主要特征如下:... -
家用电器用户评价与商品信息数据集
家用电器用户评价与商品信息数据集_Appliances_User_Reviews_and_Product_Information 数据来源:互联网公开数据 标签:用户评价, 商品信息, 亚马逊, 家用电器, 评分, 时间序列, 文本分析, 数据挖掘 数据概述:... -
阿拉伯语语音转录数据集
阿拉伯语语音转录数据集_Arabic_Speech_Transcription_Dataset 数据来源:互联网公开数据 标签:语音识别, 语音转录, 阿拉伯语, 声学模型, 文本分析, 多模态数据, 语音情感, 数据标注 数据概述: 该数据集包含阿拉伯语语音数据及其对应的文本转录,旨在为语音识别和相关研究提供支持。主要特征如下:... -
文本流畅度评估多维度打分数据集
文本流畅度评估多维度打分数据集_Text_Fluency_Multi_dimensional_Scoring_Dataset 数据来源:互联网公开数据 标签:文本评估, 语言模型, 文本分析, 多维度评分, 机器学习, 自然语言处理, 文本质量, 语料分析 数据概述:... -
印度社交媒体情感分析数据集
印度社交媒体情感分析数据集_India_Social_Media_Sentiment_Analysis 数据来源:互联网公开数据 标签:情感分析, 社交媒体, 印度, 文本分析, 自然语言处理, 情绪识别, 数据挖掘, 用户行为 数据概述: 该数据集包含来自印度社交媒体平台的数据,记录了用户发布的推文及其对应的情感和情绪信息。主要特征如下:... -
俄罗斯招聘信息薪资预测数据集
俄罗斯招聘信息薪资预测数据集_Russian_Job_Salary_Prediction 数据来源:互联网公开数据 标签:招聘信息, 薪资预测, 机器学习, 文本分析, 俄罗斯, 劳动力市场, 数据挖掘, 职业 数据概述:... -
语义相似度模型训练评估结果数据集
语义相似度模型训练评估结果数据集_Semantic_Similarity_Model_Training_Evaluation_Results 数据来源:互联网公开数据 标签:语义相似度, 文本嵌入, 模型评估, 深度学习, 文本分析, 自然语言处理, 机器学习, STS-dev 数据概述:... -
新闻文本摘要生成训练数据集
新闻文本摘要生成训练数据集_News_Text_Summarization_Training_Data 数据来源:互联网公开数据 标签:文本摘要, 自然语言处理, 机器学习, 新闻语料, 文本生成, 深度学习, 数据集, 文本分析 数据概述: 该数据集包含来自新闻报道的文本数据,记录了用于训练文本摘要模型的原始新闻文章。主要特征如下:... -
俄语新闻文本关键词提取数据集
俄语新闻文本关键词提取数据集_Russian_News_Text_Keyword_Extraction_Dataset 数据来源:互联网公开数据 标签:文本分析, 关键词提取, 自然语言处理, 俄语, 新闻, 文本挖掘, 语料库, 信息检索 数据概述: 该数据集包含来自俄罗斯新闻网站的文章文本数据,主要用于关键词提取和文本分析任务。主要特征如下:... -
学术论文写作结构识别数据集
学术论文写作结构识别数据集_Academic_Paper_Writing_Structure_Identification 数据来源:互联网公开数据 标签:文本分析, 自然语言处理, 论文结构, 文本标注, 机器学习, 深度学习, 语料库, 结构化文本 数据概述:... -
文本标点符号校正数据集
文本标点符号校正数据集_Text_Punctuation_Correction_Dataset 数据来源:互联网公开数据 标签:文本处理, 自然语言处理, 标点符号, 文本校正, 数据标注, 机器学习, 语料库, 文本分析 数据概述: 该数据集包含来自公开文本的数据,记录了用于文本标点符号校正的语料。主要特征如下:... -
商品描述异常值检测数据集
商品描述异常值检测数据集_Product_Description_Outlier_Detection_Dataset 数据来源:互联网公开数据 标签:异常值检测, 商品描述, 文本分析, 机器学习, 数据清洗, 零售, 文本挖掘, 数据预处理 数据概述:... -
社交媒体用户情感分析测试数据集
社交媒体用户情感分析测试数据集_Social_Media_User_Sentiment_Analysis_Test_Data 数据来源:互联网公开数据 标签:情感分析, 社交媒体, 文本分析, 情绪识别, 自然语言处理, 机器学习, 文本分类, 数据标注 数据概述:... -
英语写作质量评估多维度数据集
英语写作质量评估多维度数据集_English_Writing_Quality_Multi_dimensional_Dataset 数据来源:互联网公开数据 标签:英语写作, 质量评估, 文本分析, 多维度评价, 自然语言处理, 机器学习, 写作技能, 语言学 数据概述:... -
音频文件重命名元数据映射数据集
音频文件重命名元数据映射数据集_Audio_File_Renaming_Metadata_Mapping 数据来源:互联网公开数据 标签:音频处理, 文件管理, 元数据, 映射关系, 数据清洗, 批量重命名, 文本分析, 数据集 数据概述: 该数据集包含音频文件重命名过程中产生的元数据映射关系,记录了原始文件名与其对应的新文件名。主要特征如下:...