letheashura 2020-08-14
有时候我们爬取网页数据,并不希望看其中的过程,只想看到最后的数据结果就可以了,这时候,***面就很有必要了!
from selenium import webdriver from time import sleep #实现无可视化界面 from selenium.webdriver.chrome.options import Options #实现规避检测 from selenium.webdriver import ChromeOptions #实现无可视化界面的操作 chrome_options = Options() chrome_options.add_argument(‘--headless‘) chrome_options.add_argument(‘--disable-gpu‘) #实现规避检测 option = ChromeOptions() option.add_experimental_option(‘excludeSwitches‘, [‘enable-automation‘]) #如何实现让selenium规避被检测到的风险 bro = webdriver.Chrome(executable_path=‘./chromedriver‘,chrome_options=chrome_options,options=option) #无可视化界面(无头浏览器) phantomJs bro.get(‘https://www.baidu.com‘) print(bro.page_source) sleep(2) bro.quit()
打印出网页代码,证明爬取网站信息成功
5.环境变量配置在linux系统下,需要将可执行文件配置到环境变量或将文件移动到属于环境变量的目录里面方法一:将文件移动到属于环境变量目录中sudo mv chromedriver /user/bin