chaochao 2010-03-04
利用Python编程语言进行网页内容的抓取是一个比较常用的编程技术。那么,今天我们将会为大家详细介绍一下有关Python抓取网页图片的操作方法,以方便大家在实际应用中获得一些帮助。
Python抓取网页图片代码示例:
ImgDownloader import win32com.client,time,win32inet,win32file,os class ImgDownloader: def __init__(self,url,dir): self.__dir=dir self.__ie=win32com.client.Dispatch('InternetExplorer.Application') self.__ie.Navigate(url) self.__wait__() def __wait__(self): while self.__ie.Busy: time.sleep(0.1) def start(self): self.__wait__() imgs=self.__ie.Document.getElementsByTagName('img') for i in range(imgs.length): try: cachInfo=win32inet.GetUrlCacheEntryInfo(imgs[i].src) if cachInfo: path=cachInfo['LocalFileName'] pathpathinfo=path.split('\\') pathinfo.reverse() filename=('[%d]' % i) + pathinfo[0] win32file.CopyFile(path,os.path.join(self.__dir,filename),True) except: pass def close(self): self.__ie.Quit() if __name__=='__main__': d=ImgDownloader('http://image.baidu.com/i?ct=201326592&cl=2& lm=-1&tn=baiduimage&pv=&word=boy&z=0','c:\\temp\\') d.start() d.close()