前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >python下载百度音乐

python下载百度音乐

作者头像
bear_fish
发布2018-09-20 14:48:10
7990
发布2018-09-20 14:48:10
举报
文章被收录于专栏:用户2442861的专栏

之前看到有人写过类似的代码,感觉有点累赘,其中登陆那些东西其实可以避免的

我把百度音乐的网页代码稍微分析了一下,如果要求不高,下载普通音质的歌曲是不需要登陆的(当然如果你用浏览器打开下载的话,普通音质也是要求登陆下载的)

看其代码发现,即使你没有登陆,其实下载链接也已经暴露出来了,只是用javascript阻止了你在浏览器中下载,

我下面写了一个下载的demo,顺便测试了一下多进程,批量下载很实用:

[python] view plaincopyprint?

  1. #!/usr/bin/env python
  2. #-*- coding: UTF-8 -*-
  3. import sys,os  
  4. import urllib,urllib2  
  5. from bs4 import BeautifulSoup  
  6. import json  
  7. from multiprocessing import Process  
  8. class BaiDuMusic():  
  9. def __init__(self):  
  10.         reload(sys)    
  11.         sys.setdefaultencoding('utf8')     
  12. def search(self,songName):  
  13.         firstUrl = "http://music.baidu.com/search?key="+urllib.quote(str(songName))  
  14.         userAgent = " User-Agent:Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.71 Safari/537.36 "
  15.         headers = { 'User-Agent' : userAgent }  
  16.         requst = urllib2.Request(firstUrl,headers = headers)   
  17.         result = urllib2.urlopen(requst).read()  
  18. #使用BeautifulSoup快速解析html文档
  19.         soup = BeautifulSoup(result,from_encoding="utf-8")  
  20.         res_arr = []  
  21. try:  
  22.             tmpjson = soup.find_all("li", { "class" : "bb-dotimg clearfix song-item-hook " })  
  23. for x in tmpjson:  
  24.                 tmpobj = json.loads(x['data-songitem'])  
  25.                 value = unicode(tmpobj['songItem']['oid'])+"+++"+unicode(tmpobj['songItem']['author'])+"+++"+unicode(tmpobj['songItem']['sname'])[4:-5]  
  26.                 res_arr.append(value)  
  27. return res_arr  
  28. except Exception, e:  
  29. print u"抱歉没有找到相关资源".encode("utf-8")  
  30. return 0
  31. def download(self,songid,songName,savePath="down/"):  
  32.         songNewUrl = "http://music.baidu.com/data/music/file?link=&song_id="+str(songid)  
  33. if not os.path.isdir(savePath):   
  34.             os.makedirs(savePath)  
  35.         savemp3 = savePath.decode('utf-8')+songName.decode('utf-8')+u".mp3"
  36.         urllib.urlretrieve(songNewUrl, savemp3)   
  37. if __name__=='__main__':  
  38.     bMusic = BaiDuMusic()  
  39.     res = bMusic.search(u"冰雨")  
  40. # for x in res: 
  41. # print x
  42. # 1128053+++刘德华+++冰雨
  43. # 7327899+++李翊君+++冰雨
  44. # 53535187+++张恒+++冰雨
  45.     Process(target=bMusic.download, args=(1128053,"刘德华-冰雨")).start()  
  46.     Process(target=bMusic.download, args=(7327899,"李翊君-冰雨")).start()  
  47.     Process(target=bMusic.download, args=(53535187,"张恒-冰雨")).start()  

多次测试发现还有一些小问题,比如你搜的歌曲不完整,歌曲:”我可以抱你吗“,你搜的是“我可以抱你” 那么结果会把“我可以抱你”加上em标签

上面代码是没有去掉的,需要用正则处理一下

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2015年04月17日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档