这里获取网页上图片的下载地址是正在写的数据采集中的一段,代码如下:
代码如下:
#!/user/bin/python3
import urllib2
from htmlparser import htmlparser
class myhtmlparser(htmlparser):
links = []
def handle_starttag(self, tag, attrs):
if tag == img:
if len(attrs) == 0:
pass
else:
for name, value in attrs:
if name == src:
self.links.append(value)
if __name__ == __main__:
uri = http://dy.163.com/v2/article/t1374483113516/agsne9l000964k4o
file = urllib2.urlopen(uri).read()
# file =
titlei'm a paragraph!
hy = myhtmlparser()
hy.feed(file)
hy.close()
print(hy.links)希望本文所述对大家的python程序设计有所帮助。
