# BatteryData **Repository Path**: bao-jiachen/battery-data ## Basic Information - **Project Name**: BatteryData - **Description**: 🔥MobiBat | 专注于智能手机电池研究的开源数据集整理 - **Primary Language**: Unknown - **License**: MIT - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 27 - **Forks**: 0 - **Created**: 2026-01-30 - **Last Updated**: 2026-02-12 ## Categories & Tags **Categories**: datasets **Tags**: 数据集, 美赛, 电池 ## README # ⚡MobiBat
![LOGO.png](Img/LOGO.png) **专注于智能手机电池研究的开源数据集整理** star [![License](https://img.shields.io/badge/license-MIT-blue.svg)](LICENSE) [![Dataset](https://img.shields.io/badge/dataset-8%2B%20datasets-orange.svg)](#数据集概览)
--- ## 📋 目录 - [项目简介](#项目简介) - [更新日志](#更新日志) - [核心数据集推荐](#核心数据集推荐) - [一、CALCE电池数据集](#一calce电池数据集) - [1、INR 18650-20R电池(27个文件)](#1inr-18650-20r电池27个文件) - [2、A123电池(16个文件)](#2a123电池16个文件) - [3、CS2电池(15个文件)](#3cs2电池15个文件) - [4、CX2电池(12个文件)](#4cx2电池12个文件) - [5、PL Sample软包电池(19个文件)](#5pl-sample软包电池19个文件) - [二、NASA电池数据集](#二nasa电池数据集) - [1、NASA PCoE电池数据集](#1nasa-pcoe电池数据集重要) - [2、NASA随机电池使用数据集](#2nasa随机电池使用数据集重要) - [三、Stanford-Relyion二次锂电池数据集](#三stanford-relyion二次锂电池数据集) - [四、UCF随机电池数据集](#四ucf随机电池数据集) - [五、智能手机功耗数据集](#五智能手机功耗数据集) - [1、GeorgeHanyMilad移动设备使用与用户行为数据集](#1georgehanymilad移动设备使用与用户行为数据集重要) - [2、MBT数据集](#2mbt数据集重要) - [3、GreenHub Farmer数据集](#3greenhub-farmer数据集重要) - [4、Samsung设备实测功耗数据](#4samsung设备实测功耗数据) - [六、其他数据集](#六其他数据集) - [1、Oxford电池退化数据集](#1oxford电池退化数据集) - [2、Hawaii自然能源研究所数据集](#2hawaii自然能源研究所数据集) - [七、快速下载指南](#七快速下载指南) - [1、CALCE数据集](#1calce数据集) - [2、NASA数据集](#2nasa数据集) - [3、Stanford数据集](#3stanford数据集) - [4、智能手机数据集](#4智能手机数据集) - [八、数据使用许可与引用](#八数据使用许可与引用) - [1、CALCE数据集](#1calce数据集-1) - [2、NASA数据集](#2nasa数据集-1) - [3、Stanford数据集](#3stanford数据集-1) - [4、UCF数据集](#4ucf数据集) - [九、异常处理与替代方案](#九异常处理与替代方案) - [1、NASA S3链接失效](#1nasa-s3链接失效) - [2、GreenHub下载失败](#2greenhub下载失败) - [3、文件格式不兼容](#3文件格式不兼容) - [十、总结](#十总结) --- ## 项目简介 本项目专注于整理和筛选与**智能手机电池**相关的公开数据集,为学术研究以及电池性能分析提供高质量的数据支持。 --- ## 更新日志 ### 📅 2026-02-02 - 🔧 修正了[CALCE数据集文件命名规则详解文档](CALCE/CALCE_intro.md)中的若干错误 - 📝 给出了论文写作提示以及CALCE数据集下载链接的获取途径 ### 📅 2026-02-01 - 📖 新增详细的[CALCE数据集文件命名规则详解文档](CALCE/CALCE_intro.md) - 🎮 针对游戏、视频、GPS导航场景提供详细的[CALCE CX2-3 数据集使用指南](CALCE/CALCE_how2use_cx2_3.md) - 📌 修改CALCE电池数据集的[说明文档](CALCE/CALCE_select.md),明确数据定位 - 🗺️ 强调GPS等高负载场景的数据集选择(CX2 Battery-Type4子数据集) ### 📅 2026-01-31 - ✏️ 修正MBT数据集第十二列单位为mAh以避免歧义 - 📊 根据官方描述,对MBT数据集的列标签进行补全 - 🔗 新增MBT数据集的国内镜像下载链接 - 🆕 新增MBT数据集(移动设备电池使用数据 + 时间序列信息) - 🏗️ 进一步梳理项目结构,针对不同手机应用场景对CALCE电池数据集进行删减 ### 📅 2026-01-30 - 🔬 深度剖析GreenHub Farmer数据集,给出更加清晰的结构 ## 核心数据集推荐 ### 🔥 精选数据集下载 > **🎯 专为手机电池研究精选,轻量化易获取** | 数据集名称 | 下载链接 | 特点说明 | |-----------|---------|---------| | **精选数据集合集** | [百度网盘](https://pan.baidu.com/s/10A06UcvrTgsBsH-D5c9oWg?pwd=1024) | 已按手机应用场景筛选整理 | | **预处理MBT数据集** | [百度网盘](https://pan.baidu.com/s/114XwyJI9hAn7DKhHuM0WOQ?pwd=1024) | 列标签已补全处理 | ### 📦 精选数据集清单 ✅ **已筛选整合的数据集**: 1. **📱 GeorgeHanyMilad移动设备行为数据集** - 700个用户的真实使用行为数据 - 包含应用使用时间、屏幕开启时间、电池消耗等关键指标 2. **📱 Samsung设备实测功耗数据集** - 多款Samsung设备的详细功耗测量 - 涵盖WiFi、蓝牙、4G等不同网络场景 3. **🔋 CALCE电池数据集(手机场景精选版)** - 按照手机电池特性精心筛选 - 详见:[CALCE数据集筛选思路](CALCE/CALCE_select.md) 🔥 - 重点推荐:CX2电池脉冲充放电数据(模拟游戏/视频/GPS场景) 4. **🔋 NASA精选电池数据集** - NASA锂电池老化数据集 - NASA随机负载电池数据集 5. **📊 MBT移动设备电池数据集** ⭐ - 网络状态、屏幕状态等使用数据 - 完整的时间序列信息 ### ⚠️ 使用说明 > **💡 温馨提示**: > - 以上精选数据集已针对**手机电池应用场景**进行筛选 > - 主要考虑了**获取便利性**和**文件大小**因素 > - 如需更全面的数据集,可参考后文的详细整理 > - 建议优先使用上述精选数据集,足以满足大部分研究需求 ### 🎯 项目特色 本项目的核心价值在于: 1. **🔍 精准筛选**:专注手机电池相关数据,避免无关数据干扰 2. **📋 场景匹配**:按照游戏、视频、GPS导航等具体使用场景分类 3. **⚡ 轻量化**:优选易于获取的小型数据集,提高研究效率 4. **📚 文档完善**:提供详细的使用指南和筛选说明 > **🌟 特别提醒**:网上很多数据集整理过于庞杂,而本项目专注于手机电池领域,特别是对CALCE数据集按照手机应用场景进行了专业筛选,这是本项目的核心优势所在。 ## 一、CALCE电池数据集 > 👉这是完整数据集的梳理,若需要的是按照手机电池的精简版本,请看[CALCE数据集筛选思路](CALCE/CALCE_select.md),保留这一部分是为了筛选留下痕迹,便于参赛选手调整数据集(如果您对我们的实验划分和数据筛选不满意的话) CALCE(马里兰大学先进可持续储能中心)提供了丰富的电池测试数据,是电池老化研究领域最权威的公开数据源之一。以下给出完整版本数据集的整理(因为是完整数据集的版本,因此本节的内容会涵盖非手机电池的部分,请注意甄别)。 ### 1、INR 18650-20R电池(27个文件) #### 低电流OCV测试 低电流开路电压测试用于获取电池在不同温度下的平衡电压特性。Sample 1和Sample 2分别在不同温度条件(0°C、25°C、45°C)下进行了测试,并提供了初始容量数据。 **Sample 1数据**: - 初始容量数据:https://web.calce.umd.edu/batteries/data/SP1_Initial%20capacity_10_16_2015.zip - 0°C数据:https://web.calce.umd.edu/batteries/data/SP1_0C_LC_OCV_02_24_2016.zip - 25°C数据:https://web.calce.umd.edu/batteries/data/SP1_25C_LC_OCV_11_5_2015.zip - 45°C数据:https://web.calce.umd.edu/batteries/data/SP1_45C_LC_OCV_11_21_2015.zip **Sample 2数据**: - 初始容量数据:https://web.calce.umd.edu/batteries/data/SP3_Initial%20capacity_10_16_2015.zip - 0°C数据:https://web.calce.umd.edu/batteries/data/SP3_0C_LC_OCV_03_03_2016.zip - 25°C数据:https://web.calce.umd.edu/batteries/data/SP3_25C_LC_OCV_11_16_2015.zip - 45°C数据:https://web.calce.umd.edu/batteries/data/SP3_45C_LC_OCV_11_21_2015.zip #### 增量电流OCV测试 增量电流测试通过改变放电电流来获取更详细的电池响应特性。 **Sample 1数据**: - 0°C数据:https://web.calce.umd.edu/batteries/data/SP1_0C_IC_OCV_02_26_2016.zip - 25°C数据:https://web.calce.umd.edu/batteries/data/SP1_25C_IC_OCV_12_2_2015.zip - 45°C数据:https://web.calce.umd.edu/batteries/data/SP1_45C_IC_OCV_12_09_2015.zip **Sample 2数据**: - 0°C数据:https://web.calce.umd.edu/batteries/data/SP3_0C_IC_OCV_03_09_2016.zip - 25°C数据:https://web.calce.umd.edu/batteries/data/SP3_25C_IC_OCV_12_2_2015.zip - 45°C数据:https://web.calce.umd.edu/batteries/data/SP3_45C_IC_OCV_12_09_2015.zip #### 动态工况测试 动态测试模拟真实使用场景,包括DST(动态压力测试)、FUDS(城市驾驶工况)、US06(高速公路驾驶工况)和BJDST(北京动态压力测试)。 **初始容量**:https://web.calce.umd.edu/batteries/data/SP2_Initial_capacity_10_16_2015.zip **DST动态压力测试**: - 0°C:https://web.calce.umd.edu/batteries/data/SP2_0C_DST.zip - 25°C:https://web.calce.umd.edu/batteries/data/SP2_25C_DST.zip - 45°C:https://web.calce.umd.edu/batteries/data/SP2_45C_DST.zip **FUDS城市驾驶工况**: - 0°C:https://web.calce.umd.edu/batteries/data/SP2_0C_FUDS.zip - 25°C:https://web.calce.umd.edu/batteries/data/SP2_25C_FUDS.zip - 45°C:https://web.calce.umd.edu/batteries/data/SP2_45C_FUDS.zip **US06高速公路驾驶工况**: - 0°C:https://web.calce.umd.edu/batteries/data/SP2_0C_US06.zip - 25°C:https://web.calce.umd.edu/batteries/data/SP2_25C_US06.zip - 45°C:https://web.calce.umd.edu/batteries/data/SP2_45C_US06.zip **BJDST北京动态压力测试**: - 0°C:https://web.calce.umd.edu/batteries/data/SP2_0C_BJDST.zip - 25°C:https://web.calce.umd.edu/batteries/data/SP2_25C_BJDST.zip - 45°C:https://web.calce.umd.edu/batteries/data/SP2_45C_BJDST.zip ### 2、A123电池(16个文件) A123 Systems生产的磷酸铁锂电池,以其优异的安全性和循环寿命著称。 #### 低电流OCV测试 测试覆盖从-10°C到50°C的广泛温度范围,每个温度点都提供了完整的开路电压特性数据。 - -10°C:https://web.calce.umd.edu/batteries/data/A123_OCV-10-20120629.zip - 0°C:https://web.calce.umd.edu/batteries/data/A123_OCV0-20120618.zip - 10°C:https://web.calce.umd.edu/batteries/data/A123_OCV10-20120611.zip - 20°C:https://web.calce.umd.edu/batteries/data/A123_OCV20-20120614.zip - 25°C:https://web.calce.umd.edu/batteries/data/A123_OCV25-20120905.zip - 30°C:https://web.calce.umd.edu/batteries/data/A123_OCV30-20120625.zip - 40°C:https://web.calce.umd.edu/batteries/data/A123_OCV40-20120627.zip - 50°C:https://web.calce.umd.edu/batteries/data/A123_OCV50-20120702.zip #### 动态工况测试 将DST、US06和FUDS三种工况整合测试,评估电池在综合负载条件下的性能表现。 - -10°C:https://web.calce.umd.edu/batteries/data/A123_DST-US06-FUDS-N10.zip - 0°C:https://web.calce.umd.edu/batteries/data/A123_DST-US06-FUDS-0.zip - 10°C:https://web.calce.umd.edu/batteries/data/A123_DST-US06-FUDS-10.zip - 20°C:https://web.calce.umd.edu/batteries/data/A123_DST-US06-FUDS-20.zip - 25°C:https://web.calce.umd.edu/batteries/data/A123_DST-US06-FUDS-25.zip - 30°C:https://web.calce.umd.edu/batteries/data/A123_DST-US06-FUDS-30.zip - 40°C:https://web.calce.umd.edu/batteries/data/A123_DST-US06-FUDS-40.zip - 50°C:https://web.calce.umd.edu/batteries/data/A123_DST-US06-FUDS-50.zip ### 3、CS2电池(15个文件) CS2是方形锂离子电池,测试涵盖了多种循环策略,对研究电池老化机制具有重要参考价值。 #### Type 1 - 0.5C恒流循环 恒流充电和放电是最基础的电池测试方法,用于评估电池的基本容量和循环稳定性。 - CS2_8:https://web.calce.umd.edu/batteries/data/CS2_8.zip - CS2_21:https://web.calce.umd.edu/batteries/data/CS2_21.zip - CS2_33:https://web.calce.umd.edu/batteries/data/CS2_33.zip - CS2_34:https://web.calce.umd.edu/batteries/data/CS2_34.zip #### Type 2 - 1C恒流循环 1C倍率测试模拟较快充放电条件下的电池行为。 - CS2_35:https://web.calce.umd.edu/batteries/data/CS2_35.zip - CS2_36:https://web.calce.umd.edu/batteries/data/CS2_36.zip - CS2_37:https://web.calce.umd.edu/batteries/data/CS2_37.zip - CS2_38:https://web.calce.umd.edu/batteries/data/CS2_38.zip #### Type 3 - 可变电流循环 交替使用0.11A和2.2A电流,模拟复杂的使用场景。 - CS2_3:https://web.calce.umd.edu/batteries/data/CS2_3.zip - CS2_9:https://web.calce.umd.edu/batteries/data/CS2_9.zip #### Type 4 - 随机截止电压模拟 模拟电池在不规则截止条件下的工作情况。 - CS2_7:https://web.calce.umd.edu/batteries/data/CS2_7.zip #### Type 5 - 低SOC区间部分循环 在3.77V至2.7V的低荷电状态区间进行循环测试。 - CS2_5:https://web.calce.umd.edu/batteries/data/CS2_5.zip - CS2_6:https://web.calce.umd.edu/batteries/data/CS2_6.zip #### Type 6 - 高SOC区间部分循环 在4.2V至3.77V的高荷电状态区间进行循环测试。 - CS2_24:https://web.calce.umd.edu/batteries/data/CS2_24.zip - CS2_25:https://web.calce.umd.edu/batteries/data/CS2_25.zip ### 4、CX2电池(12个文件) CX2电池测试包含多种特殊的测试策略,包括高倍率放电和温度循环测试。 #### Type 1和Type 2 - 0.5C恒流循环 提供了多个样本的恒流循环数据,用于评估样本间的一致性。 Type 1: - CX2_16:https://web.calce.umd.edu/batteries/data/CX2_16.zip - CX2_31:https://web.calce.umd.edu/batteries/data/CX2_31.zip - CX2_33:https://web.calce.umd.edu/batteries/data/CX2_33.zip - CX2_35:https://web.calce.umd.edu/batteries/data/CX2_35.zip Type 2: - CX2_34:https://web.calce.umd.edu/batteries/data/CX2_34.zip - CX2_36:https://web.calce.umd.edu/batteries/data/CX2_36.zip - CX2_37:https://web.calce.umd.edu/batteries/data/CX2_37.zip - CX2_38:https://web.calce.umd.edu/batteries/data/CX2_38.zip #### Type 3 - 3C高倍率放电 3C放电倍率测试评估电池在高负载条件下的性能表现。 - CX2_8:https://web.calce.umd.edu/batteries/data/CX2_8.zip #### Type 4 - 脉冲放电 0.5C和1C交替的脉冲放电测试,用于分析电池的瞬态响应特性。 - CX2_3:https://web.calce.umd.edu/batteries/data/CX2_3.zip #### Type 5 - 温度循环测试 在25°C至55°C范围内进行温度变化测试,评估温度对电池的影响。 - CX2_4:https://web.calce.umd.edu/batteries/data/CX2_4.zip #### Type 6 - 脉冲放电负载 多级脉冲放电测试,电流从0.5C逐步增加到2C。 - CX2_32:https://web.calce.umd.edu/batteries/data/CX2_32.zip ### 5、PL Sample软包电池(19个文件) 软包电池具有能量密度高、重量轻等优点,是消费电子产品的首选。 #### 部分SOC循环测试 不同荷电状态区间和放电倍率下的循环性能测试。 - 0%-60% SOC at C/2:https://web.calce.umd.edu/batteries/data/pl/SOC_0-60_HalfC.zip - 40%-60% SOC at C/2:https://web.calce.umd.edu/batteries/data/pl/SOC_40-60_HalfC.zip - 40%-60% SOC at 2C放电:https://web.calce.umd.edu/batteries/data/pl/SOC_40-60_2C.zip - 0%-100% SOC at C/2:https://web.calce.umd.edu/batteries/data/pl/SOC_0-100_HalfC.zip - 0%-100% SOC at 2C放电:https://web.calce.umd.edu/batteries/data/pl/SOC_0-100_2C.zip - 20%-80% SOC at 2C放电:https://web.calce.umd.edu/batteries/data/pl/SOC_20-80_2C.zip - 40%-100% SOC at C/2:https://web.calce.umd.edu/batteries/data/pl/SOC_40-100_HalfC.zip - 20%-80% SOC at C/2:https://web.calce.umd.edu/batteries/data/pl/SOC_20-80_HalfC.zip #### 存储测试 大规模存储老化测试,包含144个电池在4个温度点和3个不同SOC值下的长期存储数据。 **初始化数据**: - 电池编号SOC温度存储周期:https://web.calce.umd.edu/batteries/data/pln/PLN_Number_SOC_Temp_StoragePeriod.zip - 容量初始化:https://web.calce.umd.edu/batteries/data/pln/Capacity%20Characterization_Initialization.zip - 阻抗初始化:https://web.calce.umd.edu/batteries/data/pln/Impedance%20Characterization_Initialization.zip **容量测试**: - -40°C:https://web.calce.umd.edu/batteries/data/pln/Capacity_-40C.zip - -5°C:https://web.calce.umd.edu/batteries/data/pln/Capacity_-5C.zip - 25°C:https://web.calce.umd.edu/batteries/data/pln/Capacity_25C.zip - 50°C:https://web.calce.umd.edu/batteries/data/pln/Capacity_50C.zip **阻抗测试**: - -40°C:https://web.calce.umd.edu/batteries/data/pln/Impedance_-40C.zip - -5°C:https://web.calce.umd.edu/batteries/data/pln/Impedance_-5C.zip - 25°C:https://web.calce.umd.edu/batteries/data/pln/Impedance_25C.zip - 50°C:https://web.calce.umd.edu/batteries/data/pln/Impedance_50C.zip ## 二、NASA电池数据集 NASA艾姆斯研究中心提供了多个经典的电池数据集,是电池寿命预测研究的基准数据源。 ### 1、NASA PCoE电池数据集(重要) 这是最广泛使用的电池老化数据集之一,包含详细的充放电循环和阻抗谱测量数据。 **下载方式**: - AWS S3存储桶(首选):https://phm-datasets.s3.amazonaws.com/NASA/5.+Battery+Data+Set.zip - Data.gov镜像:https://catalog.data.gov/dataset/li-ion-battery-aging-datasets - Python包(推荐):使用`progpy`包可直接加载数据 **Python加载示例**: ```python from progpy.datasets import nasa_battery description, data = nasa_battery.load_data('RW1') # 支持RW1-28 ``` **数据集特性**: - 电池类型:18650锂离子电池,额定容量2Ah - 测试条件:多种环境温度 - 操作模式:充电、放电、阻抗谱(EIS)测量 - 文件格式:.mat(MATLAB格式) - 容量衰减:从2Ah降至约1.4Ah(30%衰减) - 采样频率:约10Hz **引用格式**: > B. Saha and K. Goebel (2007). "Battery Data Set", NASA Prognostics Data Repository, NASA Ames Research Center, Moffett Field, CA ### 2、NASA随机电池使用数据集(重要) 该数据集模拟了真实世界中电池的随机使用模式,更接近实际应用场景。 **下载地址**:https://data.nasa.gov/dataset/randomized-and-recommissioned-battery-dataset **数据集特点**: - 26个电池包的测试数据 - 包含恒定负载和随机负载两种测试条件 - 提供二寿命电池数据(经过一次使用后重新测试) - 数据格式:CSV,总大小约500MB ## 三、Stanford-Relyion二次锂电池数据集 这是目前最全面的二次利用锂电池数据集之一,来源于储能系统的实际运行数据。 **主要下载地址**: - OSF平台(推荐):https://osf.io/fns57/ - 完整数据包:RelyionStanfordDataset.zip(约17.8GB) **数据集特性**: - 电池型号:INR21700-M50T(LG Chem) - 电池类型:NMC/石墨-硅负极 - 额定容量:4.85Ah - 测试周期:24个月的二寿命测试 - 样本数量:6个电池的储能应用数据 - 温度条件:20°C和35°C交替(模拟季节变化) - 测试内容:老化循环、HPPC、C/20、C/40特性测试 **引用格式**: > Moy, K., Khan, M.A., Fasolato, S., Pozzato, G., Allam, A., Onori, S. "Second-life lithium-ion battery aging dataset based on grid storage cycling," Data in Brief, Volume 57, 111046, 2024, doi: 10.1016/j.dib.2024.111046 ## 四、UCF随机电池数据集 UCF(中佛罗里达大学)概率力学实验室提供的电池数据集。 **下载地址**:https://data.nasa.gov/dataset/randomized-and-recommissioned-battery-dataset **数据集特点**: - 26个电池组(每组包含2个18650电池) - 恒定电流组和随机电流组对比测试 - 提供二寿命电池数据 - 负载范围:0.5A至5A - 多种环境温度条件 **引用格式**: > Fricke, K., Nascimento, R., Corbetta, M., Kulkarni, C., & Viana, F. "Accelerated Battery Life Testing Dataset", NASA Prognostics Data Repository, Probabilistic Mechanics Lab, University of Central Florida, and NASA Ames Research Center, Moffett Field, CA ## 五、智能手机功耗数据集 智能手机功耗数据对于理解移动设备电池行为至关重要。 ### 1、GeorgeHanyMilad移动设备使用与用户行为数据集(重要) GitHub上开源的700个用户的行为数据样本。 **直接下载**: - GitHub仓库:https://github.com/GeorgeHanyMilad/Mobile-Usage-Behavior-Analysis - CSV文件:https://github.com/GeorgeHanyMilad/Mobile-Usage-Behavior-Analysis/blob/master/user_behavior_dataset.csv **数据集结构**: | 列名 | 描述 | 示例值 | |------|------|--------| | User ID | 用户ID | 1-700 | | Device Model | 设备型号 | Google Pixel 6, Samsung S21等 | | Operating System | 操作系统 | Android 12/13 | | App Usage Time (min/day) | 日应用使用时间(分钟) | 120-480 | | Screen On Time (hours/day) | 日屏幕开启时间(小时) | 2.5-8.5 | | Battery Drain (mAh/day) | 日电池消耗(mAh) | 1500-4500 | | Installed Apps | 已安装应用数量 | 25-150 | | Data Usage (GB/day) | 日数据使用量(GB) | 0.5-10 | ### 2、MBT数据集(重要) #### 数据集基本情况 | 项目 | 信息 | | -------------- |--------------------------------| | **数据集名称** | Mobile Battery with Time (MBT) | | **作者** | rahulgarg28 | | **平台** | Kaggle | | **数据类型** | 移动设备电池使用数据 + 时间序列信息 | | **文件格式** | CSV | | **主要用途** | 电池寿命预测、充电/放电分析、移动设备性能评估 | #### 获取方式 **数据集主页**: - 官方网址: https://www.kaggle.com/datasets/rahulgarg28/mobile-battery-with-time - 预处理后的数据集(仅对列标签做了预处理): https://pan.baidu.com/s/114XwyJI9hAn7DKhHuM0WOQ?pwd=1024 **下载步骤**: ##### 方法一:直接下载 1. 访问Kaggle数据集页面 2. 点击"Download"按钮 3. 选择需要的文件进行下载 ##### 方法二:使用Kaggle API **1)准备工作**: ```bash # 1. 安装kaggle库 pip install kaggle # 2. 配置API Token # - 登录Kaggle账号 # - 进入个人设置页面 # - 下载kaggle.json文件 # - 将文件放置在 ~/.kaggle/ 目录下(Linux/Mac)或 C:\Users\用户名\.kaggle\(Windows) ``` **2)下载命令**: ```bash # 下载数据集 kaggle datasets download -d rahulgarg28/mobile-battery-with-time # 【如果】数据集在特定目录下 kaggle datasets download -d rahulgarg28/mobile-battery-with-time -p /path/to/save # 解压下载的文件 unzip mobile-battery-with-time.zip ``` #### 数据集字段(按照数据集说明推测) 由于原始数据集并未给出每列标签,因此我们从官方给出的文字表述以及给出的数据样本结合来看,补全了标签: | 列序号 | 字段含义 | 对应表中的值(示例) | |--------|-------------|-----------------------| | 1 | 设备ID (IMEI) | 352944080639365 | | 2 | 手机型号 | samsung SM-A910F | | 3 | Android版本 | 8.0.0 | | 4 | 电池类型 | Li-ion | | 5 | 电池容量 | 5000.0 | | 6 | 时间戳 | 1570599938843 | | 7 | 充电状态 | false | | 8 | 电池温度(°C) | 37 | | 9 | 应用包名 | com.zopper.batteryage | | 10 | 电流值 | 0 | | 11 | 电池电压(V) | 24.7 | | 12 | 电量水平(mAh) | 3741 | | 13 | 其他测量值 | 130 | | 14 | 网络状态 | none/wi-fi | | 15 | 屏幕状态 | false | 我们的增补依据是: 1. **第6列时间戳**:这是Unix时间戳(毫秒),例如 `1570599938843` 对应 2019-10-08,多个文件信息对照一致 2. **第12列电量水平**:基本确定是电量水平,因为考虑到一般手机的电量水平范围是 0-5500mAh(有一些旗舰手机可能会更高,可以按照数据集中的`手机型号`具体判断),数据分布处于这个范围内,再结合数据发布官方所描述的电量水平范围,因此可以确定。 3. **第14列网络状态**:在不同文件中显示为 `none` 或 `wi-fi`,符合数据发布官方的表述 只有这样才能完美对应上数据发布者的官方表述。 ### 3、GreenHub Farmer数据集(重要) 大规模Android设备功耗数据集,是研究移动设备电池消耗的宝贵资源。 #### 数据集基本情况 - 数据集名称: GreenHub Farmer - 发表会议: 2019 IEEE/ACM 16th International Conference on Mining Software Repositories (MSR) - 项目目标: 通过众包方式收集真实世界中的 Android 设备能源消耗数据,帮助理解使用习惯、应用、操作系统、硬件和用户习惯如何影响电池寿命 #### 获取方式1(本项目整理的) 👉 注意:这个数据集比较大,如果网络不好很容易下载失败,如果比赛时间紧张建议不要把精力花在这个数据集上,可能等了很久还是下载失败。但推荐方式二和方式三的下载方式,只下载数据集的局部可能更加稳定 ##### 方式一:完整数据集下载 **CSV格式完整数据集** - **下载链接**: https://farmer.greenhubproject.org/storage/dataset.7z - **格式**: 7z压缩包,包含CSV文件 - **大小**: 约5.2GB (2018年12月数据) - **内容**: 每个数据表一个CSV文件 **Parquet格式优化数据集** - **下载链接**: https://farmer.greenhubproject.org/storage/dataset.parquet.7z - **格式**: Parquet二进制格式(更高效的列式存储) - **优势**: 查询和分析效率比纯文本更高 **MariaDB数据库转储文件** - **下载链接**: https://farmer.greenhubproject.org/storage/greenhubfarmer_dump.sql - **格式**: SQL数据库转储文件 - **用途**: 可直接导入到MariaDB数据库进行SQL查询 ##### 方式二:REST API访问 **API文档**: https://docs.greenhubproject.org/ **API端点示例**: 1. **获取设备列表** ``` GET https://farmer.greenhubproject.org/api/v1/devices?api_token=yourTokenHere ``` 2. **获取特定设备的样本** ``` GET https://farmer.greenhubproject.org/api/v1/devices/123/samples?api_token=yourTokenHere ``` 3. **按品牌筛选设备** ``` GET https://farmer.greenhubproject.org/api/v1/devices?brand=google&api_token=yourTokenHere ``` **注意**: - API访问需要先获取API密钥 - App_Processes数据因过大未包含在API中,建议直接下载数据集 ##### 方式三:Lumberjack命令行工具 **GitHub仓库**: https://github.com/greenhub-project/lumberjack **使用示例**: ```bash # 获取Google品牌设备列表 greenhub lumberjack devices brand:google -o googleDevices.json # 获取Nexus型号且在指定日期前的样本 greenhub lumberjack samples model:nexus -R...2018-05-31 # 获取特定国家的样本 greenhub lumberjack samples country:us -o us_samples.json ``` #### 获取方式2(官方给出的) - INESTEC仓库:https://repositorio.inesctec.pt/server/api/core/bitstreams/c6cc9c68-8dc0-4606-aca9-da2b7f55268c/content - 【不重要】Google Play Store(软件)下载地址:https://play.google.com/store/apps/details?id=com.hmatalonga.greenhub - 项目主页:https://greenhubproject.org/ - Github地址:https://github.com/greenhub-project - **BatteryHub (Android应用)** - 仓库: https://github.com/greenhub-project/batteryhub - 语言: Java - 描述: Android电池监控应用 - **Farmer (后端和Web仪表板)** - 仓库: https://github.com/greenhub-project/farmer - 语言: PHP (Laravel框架) - 描述: GreenHub后端和Web仪表板模块 - **Lumberjack (命令行工具)** - 仓库: https://github.com/greenhub-project/lumberjack - 语言: JavaScript - 描述: 与GreenHub REST API交互的命令行应用 - **GreenHub项目网站** - 仓库: https://github.com/greenhub-project/greenhubproject.org - 语言: Vue - 描述: GreenHub项目官网 - **文档** - 仓库: https://github.com/greenhub-project/docs - 描述: GreenHub项目文档 - **数据分析和笔记本** - 仓库: https://github.com/greenhub-project/notebooks - 描述: 用于数据分析的Jupyter笔记本 - **数据集优化工具** - 仓库: https://github.com/greenhub-project/dataset-file-optimizer - 描述: 将文本文件转换为Parquet格式的辅助脚本 - **Farmer Showcase** - 仓库: https://github.com/hmatalonga/farmer-showcase - 描述: 使用GreenHub Farmer数据集的数据分析实验 #### 数据集规模 - 样本数量:2300万+匿名样本 - 设备覆盖:1600+品牌,11800+型号 - 地域覆盖:160+国家 - 数据大小:压缩后约1.8GB | 时间点 | 样本数量 | 设备数量 | 品牌数量 | 型号数量 | Android版本 | 国家/地区 | | --------------------- | ----------- | -------- | -------- | -------- | ----------- | --------- | | 2018年12月 (论文原始) | 12.22+ 百万 | 36,933 | 964 | 5,665 | 36 | 160 | | 最新更新 | 23+ 百万 | 307,000+ | 1,600+ | 11,800+ | 50+ | 160+ | #### 数据内容 - 电池电压和温度 - 运行应用列表 - 网络连接详情(WiFi/4G/5G) - 传感器使用情况 - 设备信息(品牌、型号、Android版本) #### 数据集数据表结构 ##### 1. **Samples (样本表)** - 核心表 包含每个采样点的详细信息: | 字段名 | 类型 | 示例值 | 说明 | | ----------------- | --------- | --------------------------------------- | --------------------- | | id | - | - | 样本唯一标识 | | device_id | - | - | 设备标识 | | timestamp | timestamp | 2017-10-08 11 | 时间戳 | | battery_state | varchar | "Charging" | 电池状态(充电/放电) | | battery_level | decimal | 0.90 | 电池电量 | | memory_active | int | 505296 | 活动内存 | | memory_inactive | int | 502392 | 非活动内存 | | memory_free | int | 1442060 | 空闲内存 | | memory_user | int | 60724 | 用户内存 | | triggered_by | varchar | "android.intent.action.BATTERY_CHANGED" | 触发事件 | | network_status | varchar | "lte" | 网络状态 | | timezone | varchar | "America/Chicago" | 时区 | | country_code | varchar | "us" | 国家代码 | | screen_brightness | int | -1 | 屏幕亮度 | | screen_on | tinyInt | 1 | 屏幕是否开启 | ##### 2. **Battery_Details (电池详细信息)** | 字段名 | 类型 | 示例值 | 说明 | | ----------- | ------- | ----------- | ------------ | | charger | varchar | "unplugged" | 充电器状态 | | health | varchar | "Good" | 电池健康状态 | | voltage | decimal | 4.03 | 电压值 | | temperature | decimal | 29.20 | 温度值 | ##### 3. **Cpu_Statuses (CPU状态)** | 字段名 | 类型 | 示例值 | 说明 | | ---------- | ------- | ------ | --------- | | usage | decimal | 0.03 | CPU使用率 | | up_time | bigInt | 409480 | 运行时间 | | sleep_time | bigInt | 141369 | 休眠时间 | ##### 4. **Devices (设备信息)** | 字段名 | 类型 | 示例值 | 说明 | | -------------- | ------- | ---------------- | ------------ | | model | varchar | "Nexus" | 设备型号 | | manufacturer | varchar | "LGE" | 制造商 | | brand | varchar | "google" | 品牌 | | product | varchar | "hammerhead" | 产品名 | | os_version | varchar | "6.0.1" | 操作系统版本 | | kernel_version | varchar | "3.4.0-gcf10b7e" | 内核版本 | | is_root | tinyInt | 0 | 是否root | ##### 5. **Network_Details (网络详细信息)** | 字段名 | 类型 | 示例值 | 说明 | | -------------------- | ------- | ----------- | ------------ | | network_type | varchar | "WIFI" | 网络类型 | | mobile_network_type | varchar | "lte" | 移动网络类型 | | mobile_data_status | varchar | "connected" | 移动数据状态 | | mobile_data_activity | varchar | "inout" | 数据活动状态 | | roaming_enabled | tinyInt | 0 | 漫游是否启用 | | wifi_status | varchar | "enabled" | WiFi状态 | | wifi_signal_strength | int | -71 | WiFi信号强度 | | wifi_link_speed | int | 39 | WiFi链接速度 | | network_operator | varchar | "verizon" | 网络运营商 | | sim_operator | varchar | "unknown" | SIM卡运营商 | | mcc | varchar | "311" | 移动国家代码 | | mnc | varchar | "480" | 移动网络代码 | ##### 6. **Settings (设置信息)** | 字段名 | 类型 | 说明 | | ------------------- | ------- | ------------------ | | bluetooth_enabled | tinyInt | 蓝牙是否启用 | | location_enabled | tinyInt | 定位是否启用 | | power_saver_enabled | tinyInt | 省电模式是否启用 | | flashlight_enabled | tinyInt | 手电筒是否启用 | | nfc_enabled | tinyInt | NFC是否启用 | | unknown_sources | tinyInt | 未知来源是否允许 | | developer_mode | tinyInt | 开发者模式是否开启 | ##### 7. **Storage_Details (存储详细信息)** | 字段名 | 类型 | 说明 | | -------------- | ---- | ---------------- | | free | int | 可用空间 | | total | int | 总空间 | | free_external | int | 外部存储可用空间 | | total_external | int | 外部存储总空间 | | free_system | int | 系统可用空间 | | total_system | int | 系统总空间 | ##### 8. **App_Processes (应用进程)** - 最大的表 包含设备上运行的所有进程信息: | 字段名 | 类型 | 示例值 | 说明 | | -------------------- | ------- | --------------------- | ------------ | | name | varchar | "com.facebook.katana" | 包名 | | application_label | varchar | "Facebook" | 应用名称 | | is_system_app | tinyInt | 0 | 是否系统应用 | | importance | varchar | "Service" | 重要性级别 | | version_name | varchar | "8.2.0" | 版本名称 | | version_code | int | 802000871 | 版本代码 | | installation_package | varchar | com.android.vending | 安装包 | **注意**: App_Processes 表非常庞大,包含超过 7.49 亿条数据点,因此在 API 中不直接提供访问。 #### 论文引用 > [1]Matalonga, H., Cabral, B., Castor, F., Couto, M., Pereira, R., de Sousa, S. M., & Fernandes, J. P. (2019). GreenHub Farmer: Real-world data for Android Energy Mining. In 2019 IEEE/ACM 16th International Conference on Mining Software Repositories (MSR) (pp. 171-175). IEEE. > [2]Pereira, R., Couto, M., Fernandes, J. P., Saraiva, J., Cunha, J., & Castor, F. (2021). GreenHub: a large-scale collaborative dataset to battery consumption analysis of android devices. Empirical Software Engineering, 26(2), 1-55. ### 4、Samsung设备实测功耗数据 针对Samsung设备的详细功耗测量数据。 **下载地址**:https://github.com/pspachos/SmartphoneMeasurements **数据集特点**: - 设备型号:Samsung S4 Mini、Galaxy Note 3/4、MEGA - 测试项目:WiFi、WiFi Direct、蓝牙、4G LTE功耗对比 - 文件格式:CSV - 每设备数据量:约50-100MB **克隆仓库**: ```bash git clone https://github.com/pspachos/SmartphoneMeasurements.git ``` ## 六、其他数据集 ### 1、Oxford电池退化数据集 **获取途径**:通过Battery Archive平台获取 - 平台地址:https://www.batteryarchive.org/ - 数据特点:多种电池化学体系,长期老化数据 ### 2、Hawaii自然能源研究所数据集 **获取方式**:通过HNEI官方渠道获取 - 官网:https://www.hnei.hawaii.edu/ - 提供多种电池测试数据 ## 七、快速下载指南 ### 1、CALCE数据集 1. 直接点击上述分类链接 2. 所有链接格式:`https://web.calce.umd.edu/batteries/data/` 3. 文件格式:.zip压缩包,解压后为Excel或TXT格式 4. 总计89个文件,约2-3GB ### 2、NASA数据集 1. 首选AWS S3链接下载完整数据包 2. 如链接失效,使用Python的progpy包 3. 文件格式:.mat(MATLAB格式) **Python读取示例**: ```python import scipy.io data = scipy.io.loadmat('battery_data.mat') ``` ### 3、Stanford数据集 1. 从OSF平台下载完整数据包(17.8GB) 2. 使用MATLAB或Python处理.xlsx文件 ### 4、智能手机数据集 1. Mobile-Device-Usage:直接下载GitHub CSV文件(37.8KB) 2. GreenHub:通过INESTEC链接下载7z压缩包 3. Smartphone Measurements:git克隆仓库 ## 八、数据使用许可与引用 ### 1、CALCE数据集 **许可**:学术研究免费使用 **引用要求**:在论文中注明数据来源于马里兰大学CALCE电池数据中心 ### 2、NASA数据集 **许可**:美国政府作品,公有领域 **引用格式**:B. Saha and K. Goebel (2007). "Battery Data Set", NASA Prognostics Data Repository ### 3、Stanford数据集 **许可**:CC BY 4.0(署名-相同方式共享) **引用格式**:Moy, K., et al. (2024). "Second-life lithium-ion battery aging dataset based on grid storage cycling," Data in Brief, 57, 111046 ### 4、UCF数据集 **许可**:美国政府作品 **引用格式**:Fricke, K., et al. (2023). "Accelerated Battery Life Testing Dataset", NASA Prognostics Data Repository ## 九、异常处理与替代方案 ### 1、NASA S3链接失效 **解决方案**: 1. 使用ProgPy Python包: ```python pip install progpy from progpy.datasets import nasa_battery desc, data = nasa_battery.load_data('RW1') ``` 2. 联系NASA官方:christopher.a.teubert@nasa.gov ### 2、GreenHub下载失败 **解决方案**: 1. 使用INESTEC备用链接 2. 通过REST API按需获取数据(需查阅项目文档) ### 3、文件格式不兼容 **Python读取方案**: - .mat文件:`scipy.io.loadmat()` - .xlsx文件:`pandas.read_excel()` - .csv文件:`pandas.read_csv()` - .zip文件:`zipfile`模块或手动解压 ## 十、总结 本项目整理的电池数据集为2026年美赛A题提供了全面的数据支持。 **CALCE数据集**包含89个可直接下载的文件,涵盖温度特性、SOC估计、动态工况和存储测试,是研究锂电池温度特性的首选数据源。 **NASA数据集**提供了经典的18650电池老化数据,可通过AWS S3或ProgPy Python包获取。 **Stanford数据集**包含17.8GB的二次利用锂电池数据和电动汽车驾驶数据。 **智能手机数据集**则提供了从小型样本(700用户)到大规模数据(2300万样本)的多种选择,可用于移动设备功耗分析。 ⚠ **版权声明**:数据均来自公开数据集(文档中已标注来源)。