# TimeSeries-Forecasting-Dataset **Repository Path**: duyu09/TimeSeries-Forecasting-Dataset ## Basic Information - **Project Name**: TimeSeries-Forecasting-Dataset - **Description**: Time Series Forecasting Benchmark Datasets - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: main - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 1 - **Forks**: 0 - **Created**: 2026-02-01 - **Last Updated**: 2026-02-01 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 时间序列预测基准数据集 ## 文档语言 [**简体中文**](./README.zh-CN.md) | [**English**](./README.md) | [**Tiếng Việt**](./README.vi.md) ## 数据集下载 [**https://github.com/duyu09/TimeSeries-Forecasting-Dataset/releases/download/v1.0.0/dataset.7z**](https://github.com/duyu09/TimeSeries-Forecasting-Dataset/releases/download/v1.0.0/dataset.7z) ## 数据集描述 * **`ETT`** Electricity Transformer Temperature (ETT) 数据集是评估电力预测的关键基准。它包含来自中国两个不同县市的两年的数据。为分析时间粒度的影响,该数据集被分为四个具有不同采样频率的子集:ETTh1和ETTh2以1小时为间隔采样,而ETTm1和ETTm2以15分钟为间隔采样。每个数据点包含六个电力负荷相关特征以及一个目标变量,即油温。 * **`ECL`** Electricity数据集包含了370个客户的小时级用电量数据,为消费者层面的负荷模式提供了洞察。数据自2011年1月1日开始收集,采样间隔为15分钟。 * **`Weather`** Weather数据集包含德国马克斯·普朗克生物地球化学研究所21个气象站记录的为期一年的气象测量数据,每10分钟记录一次。它包含21个变量,如气温、湿度和风速等。 * **`Exchange`** Exchange数据集包含了1990年至2016年间八种外币的每日汇率记录,包括澳大利亚、英国、中国、日本、加拿大、新加坡、瑞士和新西兰的货币。数据采样间隔为一天。 * **`ILI`** Influenza-like Illness (ILI) 数据集记录了每周报告的伴有严重并发症的流感症状病例数。 * **`Electricity`** 该数据集代表了2012年至2014年间321个客户的小时级电力消耗(以千瓦为单位)。它最初提取自UCI知识库。 * **`Solar`** 该数据集包含137条时间序列,代表了2006年全年亚拉巴马州的小时级太阳能发电量。 * **`Wind`** 该数据集包含一条每日采样的长时间序列,代表自2019年8月1日开始以4秒间隔记录的风力发电功率(以兆瓦计)。该数据下载自澳大利亚能源市场运营商(AEMO)在线平台。 * **`Traffic`** 该数据集包含15个月的每日数据(440条每日记录),描述了旧金山湾区高速公路上不同车道的占用率(介于0和1之间)随时间的变化。 * **`Taxi`** 该数据集包含纽约市出租车出行的时空交通时间序列,于2015年1月和2016年1月期间在1,214个地点每30分钟记录一次。 * **`Pedestrian`** 该数据集包含自2009年5月开始从墨尔本66个传感器捕获的小时级行人计数。原始数据集在有新观测数据时定期更新。此处使用的数据集包含截至2020年4月30日的行人计数。 * **`Air-Quality`** 该数据集曾用于KDD Cup 2018预测竞赛。它包含2017年1月1日至2018年3月31日期间,来自北京(35个站点)和伦敦(24个站点)共59个站点的每小时空气质量测量数据。空气质量测量指标包括PM2.5、PM10、NO2、CO、O3和SO2等多种。缺失值已使用前导零或最后观测值结转法进行插补。 * **`Temperature`** 该数据集包含32,072条每日时间序列,记录了澳大利亚气象局在2015年5月2日至2017年4月26日期间从全国422个气象站收集的温度观测数据和降雨预测数据。缺失值已替换为零,并提取了平均温度列以供使用。 * **`Rain`** 该数据集聚焦于从与Temperature数据集相同来源提取的降雨数据。 * **`NN5`** 该数据集曾用于NN5预测竞赛。它包含来自银行业领域的111条时间序列,目标是预测英国ATM机的每日现金取款量。缺失值已用整个序列中对应星期几的中位数替换。 * **`Fred-MD`** 该数据集包含107条月度时间序列,反映了来自美联储FRED-MD数据库的各种宏观经济指标。这些序列已根据文献中的既定实践进行了差分和对数转换。 * **`Web`** 该数据集曾用于Kaggle维基百科网络流量预测竞赛。它包含145,063条每日时间序列,代表了2015年7月1日至2017年9月10日期间维基百科页面的点击量或网络流量。缺失值已替换为零。 * **`M4`** M4数据集包含来自多个领域的100,000条时间序列,用于由Spyros Makridakis组织的第四届Makridakis预测竞赛(M4竞赛)。它包括具有多种频率(年度、季度、月度、周度、每日和每小时)的序列,以及一个提供序列ID、类别、频率、预测范围、季节性周期和起始日期等详细信息的Info文件。