Lenskit 2018-07-05
喜马拉雅FM是国内分享平台,3月手机客户端上线,两年多时间手机用户规模已突破2亿 [1] ,成为国内发展最快、规模最大的在线移动音频分享平台。
今天小编分享爬取喜马拉雅的单本全集的音频文件和全网站的音频
环境配置:
Windows + Python 3.6
import json
import re
import requests
import re
import requests
from lxml import etree
from onexima import Xima
其实你点开网站里面的任意一个音频都会发现他们都有一个ID
我们需要做的就是把每一个音频的ID和整个音频的ID获取、每本书籍的名称,然后保存下载
其实思路还是很简单的。
下面是爬取一本书籍的Python代码
这个是爬取全站的音频的Python代码
关注后私信【学习资料】可以获取Python海量的学习资料