-
印地语语料库数据集HindiCorpusDataset-flaming0
印地语语料库数据集HindiCorpusDataset-flaming0 数据来源:互联网公开数据 标签:印地语,语料库,自然语言处理,文本分析,语言学,机器学习,数据集,印度 数据概述: 该数据集包含来自互联网和公开资源的印地语文本数据,记录了印地语的丰富文本信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。... -
NCAA篮球赛推特数据集NCAATweetsDataset-mika30
NCAA篮球赛推特数据集NCAATweetsDataset-mika30 数据来源:互联网公开数据 标签:NCAA,篮球,社交媒体,推特,数据集,文本分析,体育分析,社会学研究 数据概述:该数据集包含来自推特的关于NCAA篮球赛的处理后的推文数据,记录了球迷的实时互动和讨论内容。主要特征如下: 时间跨度:数据记录的时间范围从2017年到2021年。... -
自然语言处理与教育领域多层次问题嵌入数据集2-LevelQuestionEmbeddingsDatasetforNLPandEducation-hariwu1995
自然语言处理与教育领域多层次问题嵌入数据集2-LevelQuestionEmbeddingsDatasetforNLPandEducation-hariwu1995 数据来源:互联网公开数据 标签:自然语言处理,教育技术,数据集,问题嵌入,文本分析,机器学习,语义理解,知识图谱 数据概述:... -
歌词清洗与预处理数据集-kalyanitewari
歌词清洗与预处理数据集-kalyanitewari 数据来源:互联网公开数据 标签:歌词,文本分析,自然语言处理,数据集,情感分析,音乐,数据清洗,中文 数据概述: 该数据集包含了经过清洗和预处理的歌词数据,旨在为自然语言处理和文本分析任务提供高质量的文本资源。主要特征如下: 时间跨度:数据记录的时间范围不明确,但包含了不同年代的歌词。... -
多源文本与图像综合分析数据集Multi-sourceTextandImageIntegratedAnalysisDataset-qiexifan
多源文本与图像综合分析数据集Multi-sourceTextandImageIntegratedAnalysisDataset-qiexifan 数据来源:互联网公开数据 标签:文本分析, 图像识别, 情感分析, 新闻数据, 社交媒体, 图像分类, 数据融合, 机器学习 数据概述:... -
东南亚足球赛事新闻摘要数据集SoutheastAsiaFootballNewsSummarization-tungchu
东南亚足球赛事新闻摘要数据集SoutheastAsiaFootballNewsSummarization-tungchu 数据来源:互联网公开数据 标签:足球, 新闻摘要, 自然语言处理, 文本分析, 赛事报道, 东南亚, 越南, 机器学习 数据概述:... -
民宿租赁市场用户评价与房源信息数据集AirbnbUserReviewsandListingInformation-leandroborba
民宿租赁市场用户评价与房源信息数据集AirbnbUserReviewsandListingInformation-leandroborba 数据来源:互联网公开数据 标签:民宿, Airbnb, 用户评价, 房源信息, 租赁市场, 文本分析, 市场调研, 价格预测 数据概述:... -
社交媒体平台ChatGPT相关话题讨论数据集SocialMediaChatGPTTopicDiscussionDataset-monserratromero
社交媒体平台ChatGPT相关话题讨论数据集SocialMediaChatGPTTopicDiscussionDataset-monserratromero 数据来源:互联网公开数据 标签:ChatGPT, 社交媒体, 文本分析, 自然语言处理, 情感分析, 话题挖掘, 人工智能, 机器学习 数据概述:... -
文本拼写纠错数据集DF-SpellcheckDataset-alvaromendizabal
文本拼写纠错数据集DF-SpellcheckDataset-alvaromendizabal 数据来源:互联网公开数据 标签:拼写纠错,自然语言处理,数据集,文本校对,机器学习,语言模型,文本分析,中文 数据概述: 该数据集包含用于拼写纠错任务的文本数据,专注于中文文本的拼写错误及其对应的正确文本。主要特征如下:... -
联系人识别预测数据集ContactIdentificationPredictionDataset-aruaru0
联系人识别预测数据集ContactIdentificationPredictionDataset-aruaru0 数据来源:互联网公开数据 标签:联系人识别, 预测模型, 机器学习, 文本分析, 交叉验证, 目标检测, 数据融合, 深度学习 数据概述: 该数据集包含用于联系人识别预测任务的数据,主要用于构建和评估预测模型。主要特征如下:... -
电子邮件钓鱼检测数据集-dhruvagarwal433
电子邮件钓鱼检测数据集-dhruvagarwal433 数据来源:互联网公开数据 标签:电子邮件,钓鱼检测,网络安全,机器学习,自然语言处理,文本分析,恶意软件,欺诈 数据概述: 该数据集包含了用于电子邮件钓鱼检测的数据,旨在帮助研究人员和安全专家开发和评估钓鱼邮件的识别技术。主要特征如下:... -
布拉斯-数字图书馆数据集Bolsa-DLDataset-luisandresgarcia
布拉斯-数字图书馆数据集Bolsa-DLDataset-luisandresgarcia 数据来源:互联网公开数据 标签:数字图书馆,数据集,文本分析,信息检索,机器学习,学术资源,自然语言处理,知识管理 数据概述: 该数据集包含来自布拉斯-数字图书馆(Bolsa-DL)的文本数据,记录了该数字图书馆中的学术文献和书籍信息。主要特征如下:... -
印尼新闻文本数据集IndonesianNewsTextDataset-rizkia14
印尼新闻文本数据集IndonesianNewsTextDataset-rizkia14 数据来源:互联网公开数据 标签:新闻文本,数据集,自然语言处理,印尼语,机器学习,文本分析,数据挖掘,信息处理 数据概述: 该数据集包含来自印尼新闻网站和媒体平台的新闻文本数据,记录了印尼各领域的新闻报道。主要特征如下:... -
书籍作者作品信息数据集BookAuthorWorkInformation-nico404
书籍作者作品信息数据集BookAuthorWorkInformation-nico404 数据来源:互联网公开数据 标签:书籍, 作者, 作品, 文学, 文本分析, 自然语言处理, 数据挖掘, 古腾堡项目 数据概述: 该数据集包含来自古腾堡项目的数据,记录了书籍的作者及其作品信息。主要特征如下: 时间跨度:数据未明确时间范围,可视为静态书籍信息。... -
英语写作水平评估与文本特征数据集EnglishWritingSkillAssessmentandTextFeatureDataset-hoangtranba
英语写作水平评估与文本特征数据集EnglishWritingSkillAssessmentandTextFeatureDataset-hoangtranba 数据来源:互联网公开数据 标签:英语写作, 文本分析, 可读性评估, 写作质量, 自然语言处理, 机器学习, 文本特征, 语言模型 数据概述:... -
数据2024年互联网文本语料库1024-corpus-2024年互联网文本语料库-dinhnhattruong
2024年互联网文本语料库1024-corpus-2024年互联网文本语料库-dinhnhattruong 数据来源:互联网公开数据 标签:互联网文本,自然语言处理,语料库,大数据,机器学习,文本分析,人工智能,语言学 数据概述:该数据集为2024年互联网公开的文本数据,涵盖了广泛的互联网文本资源,适用于自然语言处理、文本分析等任务。主要特征如下:... -
招聘信息分析数据集RecruitmentInformationAnalysisDataset-stevemarcelloliem
招聘信息分析数据集RecruitmentInformationAnalysisDataset-stevemarcelloliem 数据来源:互联网公开数据 标签:招聘, 职位, 薪资, 公司, 行业, 技能, 文本分析, 市场调研 数据概述:... -
写作过程行为数据与得分预测数据集WritingProcessBehaviorDataandScorePredictionDataset-amanrajbose
写作过程行为数据与得分预测数据集WritingProcessBehaviorDataandScorePredictionDataset-amanrajbose 数据来源:互联网公开数据 标签:写作行为, 文本分析, 时间序列分析, 行为建模, 机器学习, 自然语言处理, 写作评估, 预测模型 数据概述:... -
维基百科词条点击量预测数据集WikipediaArticleClickPrediction-zacchaeus
维基百科词条点击量预测数据集WikipediaArticleClickPrediction-zacchaeus 数据来源:互联网公开数据 标签:维基百科, 点击量预测, 文本分析, 数据挖掘, 时间序列分析, 机器学习, 词条浏览, 数据统计 数据概述: 该数据集包含来自维基百科的数据,记录了词条的浏览量信息,可用于预测词条的未来点击量。主要特征如下:... -
Reddit华尔街赌注帖子数据集RedditWallStreetBetsPostDataset-lactrodectus
Reddit华尔街赌注帖子数据集RedditWallStreetBetsPostDataset-lactrodectus 数据来源:互联网公开数据 标签:社交媒体,股票市场,投资,数据集,文本分析,情绪分析,自然语言处理,金融 数据概述:...