# coding=gbkimport requestsimport jsonc='网易云爬虫实战一'print(c)music_url = 'https://music.163.com/#/song?id=28815250'id = music_url.split('=')[1]# print(id)url = 'https://music.163.com/weapi/v1/resource/comments/r_so_4_%s?csrf_token=7e19029fe28aa3e09cfe87e89d2e4eeb' %(id)headers = { 'user-agent': 'mozilla/5.0 (windows nt 6.1; wow64) applewebkit/537.36 (khtml, like gecko) chrome/55.0.2883.87 safari/537.36', 'referer': 'https://music.163.com/song?id=%s' %(id), 'origin': 'https://music.163.com', }formdata = { 'params': 'aof/zxuccqvtacmcphecfgvpfrbtdj4jfpjsaz3tyn9j+r0ncnkphzdvecdz/jm+1cpa+byvao2j9d44b/mg97whjmxwkfo4tm++afybgk11nnsbksuq5bxjr6ye0myfhu8spq7wb9diupfks2ulw0gxwu/il1ns/elrq+bbyikk/cyne90s/ygs6ldxpbcnd1yqtuol176abzxtjecgkfbxy+mlkcwscacck1s3sto=', 'encseckey': '365b4c31a9c7e2ddc002e9c42942281d7e450e5048b57992146633181efe83c1e26acbc8d84b988d746370d788b6ae087547bace402565cca3ad59ccccf7566b07d364aa1d5b2bbe8ccf2bc33e0f03182206e29c66ae4ad6c18cb032d23f1793420ceda05e796401f170dbdb825c20356d27f07870598b2798f8d344807ad6f2', }response = requests.post(url, headers = headers, data = formdata)messages = json.loads(response.text)data_list=[]data={}for message in messages['hotcomments']: data['nickname']=message['user']['nickname'] data['content']=message['content'] data_list.append(data) data={}#print(data_list)for i in data_list: c = ' '+i['nickname']+':'+i['content'] print('\n\n'+c.replace('\n',''))
总结:
1、第一行的“# coding=gbk”表示的是可以在文本编辑器中输入文字字符串。
2、id = music_url.split('=')[1]中split()函数表示对元素进行分组,例中为“https://music.163.com/#/song?id=”,“28815250”
3、由requests模块获取的html文本需要用json.loads()方法进行转化为python可读的文本,否则会报错。在jupyter notebook中则不会出现这种情况。
4、replace()函数可以去除字符串中的元素,例中将换行符变为空。
最终显示结果如下图:
本文介绍了网易云音乐评论爬取 的相关内容,请关注。
相关推荐:
简易 php+mysql 分页类
两个不用递归的树形数组构造函数
html转excel,并实现打印,下载功能
以上就是网易云音乐评论爬取的详细内容。