# NeteaseCloudMusic-Crawler **Repository Path**: xiaomingcai/NeteaseCloudMusic-Crawler ## Basic Information - **Project Name**: NeteaseCloudMusic-Crawler - **Description**: 一个用Java实现的在网易云音乐爬虫 - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2021-09-27 - **Last Updated**: 2021-09-27 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # NeteaseCloudMusic Crawler 问题: 网易云音乐似乎发生了变化,在抓取评论以及抓取歌单歌曲时只能获取歌单的第一首歌(原因应该是网易云对请求头做出了限制,伪造一个即可)。大概有空会改吧= = --------- 概述: --------- 一个使用Java实现的爬虫程序,用于爬取网易云音乐上的音乐信息。 ## 使用方法: 1.访问localhost:8080/init?auth=888888 初始化歌曲分类。 2.访问localhost:8080/crawl?auth=888888。 3.点击歌曲评论数排行榜,可查看网易云音乐上评论量最多的歌曲(根据评论数降序排序)。 4.点击歌单播放量/收藏量排行榜可分别查看播放量与收藏量较高的歌单。 5.点击根据url获取歌曲信息,输入要查询的歌曲页面对应的url,可从页面上看到歌曲的基本信息及其热门评论,评论信息会存入数据库中。 6.点击根据url获取歌单信息,输入要查询的歌单页面对应的url,可从页面上看到歌单的相关信息。 7.点击热门评论排行榜可查询之前查找过的热门评论(按评论点赞数降序排序)。 程序会在凌晨一点自动更新评论数。 ## 注意: 数据库使用mysql,由于网易云音乐内容评论采用utf8mb4,因此也要注意mysql的编码(可能还要修改配置文件中编码设置)。 运行爬虫前需要创建名为crawl的数据库