BERT与LSTM模型研究数据集

数据集概述

本数据集围绕BERT与LSTM模型研究构建,包含Twitter/X用户帖子数据及GOTO股票市场价格历史数据,数据按年份分类存储,主要以CSV格式为主,为相关模型研究提供数据支持。

文件详解

  • 目录结构:
  • 根目录:BERT and LSTM Research/
  • 数据目录:BERT and LSTM Research/Data - New 2025/,包含2022、2023、2024三个子目录
  • 股票价格文件:
  • 文件名称:History Harga Saham GOTO.xlsx
  • 文件格式:xlsx
  • 内容:GOTO股票市场价格历史数据
  • 社交媒体帖子文件:
  • 文件格式:csv(共36个文件)
  • 命名规则:按年份和月份命名,如goto_januari_2022.csv、goto_februari_2023_1.csv等
  • 字段示例:conversation_id_str(对话ID)、created_at(创建时间)、favorite_count(点赞数)、full_text(帖子全文)、id_str(帖子ID)、image_url(图片链接)、lang(语言)、location(位置)、retweet_count(转发数)等

适用场景

  • 自然语言处理研究:用于BERT与LSTM模型在社交媒体文本分析中的性能对比
  • 金融市场分析:探究社交媒体舆论与GOTO股票价格波动的关联性
  • 时间序列预测:结合文本情感特征与历史价格数据构建股票预测模型
  • 社交媒体数据挖掘:分析Twitter/X用户对GOTO相关话题的讨论趋势与情感倾向
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.93 MiB
最后更新 2025年11月28日
创建于 2025年11月28日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。