利用request库编写爬虫

以下是使用Python编写一个音乐类爬虫来获取音乐信息：

首先，您需要安装必要的库。这个示例使用BeautifulSoup库进行HTML解析和requests库发送HTTP请求，还使用了json和os库进行数据的处理和保存。您可以使用以下命令安装这些库：

pip install beautifulsoup4
pip install requests

然后，可以使用以下代码编写音乐类爬虫：

import requests
from bs4 import BeautifulSoup
import json
import os


class MusicCrawler:
    def __init__(self):
        self.base_url = 'http://example.com'  # 替换为您要爬取的音乐网站的URL

    def crawl(self):
        # 发送HTTP请求获取音乐页面的内容
        response = requests.get(self.base_url)
        if response.status_code == 200:
            # 使用BeautifulSoup解析页面
            soup = BeautifulSoup(response.content, 'html.parser')

            # 找到所有音乐列表项
            music_list = soup.find_all('div', class_='music-item')

            # 遍历音乐列表并获取音乐信息
            for music in music_list:
                music_info = {
                    'title': music.find('h3').text,
                    'artist': music.find('span', class_='artist').text,
                    'duration': music.find('span', class_='duration').text
                }

                # 将音乐信息保存为JSON文件
                self.save_music_info(music_info)

    def save_music_info(self, music_info):
        # 将音乐信息保存为JSON文件
        filename = f"{music_info['title']}.json"
        file_path = os.path.join('music', filename)  # 设置保存路径
        with open(file_path, 'w') as file:
            json.dump(music_info, file, indent=4)

# 创建音乐爬虫对象并调用crawl方法开始爬取音乐信息
crawler = MusicCrawler()
crawler.crawl()

请确保将 http://example.com 替换为您要爬取的音乐网站的实际URL，并根据需要调整代码以匹配正确的HTML结构。此示例中，音乐信息将保存为JSON文件，并在 music 文件夹中创建。

请注意，爬取网站内容时，请遵守网站的使用条款和法律法规。此示例仅供参考，并可能需要根据实际情况进行修改。