songerxing 2020-05-28
pip install selenium
2.selenium查找元素就八种方法
from selenium import webdriver
driver=webdriver.Chrome()
#说明find_elements_by 多了一个s,返回的就是一个列表形式
1) driver.find_element_by_id()
#传入元素标签对里面的id数据 driver.find_element_by_id("kw")
2) driver.find_element_by_name()
#传入元素标签对里面的name数据 driver.find_element_by_name("wd")
3)driver.find_element_by_class_name()
#传入元素标签对里面class的名称 driver.find_element_by_class_name("s_ipt")
4) driver.find_elements_by_link_text()
#传入元素标签对a里面的文本数据 driver.find_elements_by_link_text("hao123")
5) driver.find_element_by_partial_link_text()
#传入元素标签对a里面的部分文本数据 driver.find_element_by_partial_link_text("hao")
6) driver.find_element_by_tag_name()
#传入元素标签对的标签名 driver.find_element_by_tag_name("a")
7) driver.find_element_by_xpath() #格式://+标签名+[@属性(例如,id,name,class)="属性对应的值"]
一.以普通元素定位
driver.find_element_by_xpath(‘//a[@name="tj_trnews"]’) #定位新闻
二.以text()进行元素定位
driver.find_element_by_xpath(‘//a[text()="新闻"]’) #定位新闻 //为固定格式,a为标签名,text()取标签对中间的文本
三.以contains()进行元素定位
driver.find_element_by_xpath(‘//a[contains(text(),"hao")]’) #定位hao123 //为固定格式,a为标签名,text()取标签对中间的文本,contains为匹配部分数据
四.以or ,and 辅助定位,有时候一个属性定位不了,那么可以用or,and辅助一起定位 #格式: //+标签名+[@属性(例如,id,name,class)="属性对应的值" and或or @属性(例如,id,name,class)="属性对应的值"]
driver.find_element_by_xpath(‘//a[@name="tj_briicon" and @class="bri"]‘) #定位更多产品
五.轴定位,parent(父亲),ancestor(祖先,包括父亲),perceding-sibling(当前元素节点标签之前的所有兄弟结点),following-sibling(当前元素节点标签之后的所有兄弟结点) #格式://+标签名+[@属性(例如,id,name,class)="属性对应的值"]+/+轴定位+::+标签名
1)定位父亲
driver.find_element_by_xpath(‘//a[@name="tj_briicon"]/parent::div[@id="u1"]‘) #定位更多产品的父亲那么就是u1
2)定位祖先
driver.find_element_by_xpath(‘//a[@name="tj_briicon"]/ancestor::div‘) #定位更多产品的祖先有4个,包括父亲
3)perceding-sibling(当前元素节点标签之前的所有兄弟结点)
driver.find_element_by_xpath(‘//a[@name="tj_briicon"]/preceding-sibling::a[@name="tj_settingicon"]’) #定位更多产品前面的兄弟节点设置,如果不写[@name="tj_settingicon"],那么会出现8个兄弟节点
4)following-sibling(当前元素节点标签之后的所有兄弟结点)
driver.find_element_by_xpath(‘//a[@name="tj_trnews"]/following-sibling::a[@name="tj_trhao123"]‘) #定位新闻后面的兄弟节点hao123,如果不写[@name="tj_trhao123"],那么会出现8个兄弟节点
8) driver.find_element_by_css_selector()
一.以ID进行元素定位
#号表示通过id属性来定位元素
driver.find_element_by_css_selector("#kw")
二.以class属性定位元素
.号表示通过class属性来定位元素
driver.find_element_by_css_selector(".s_ipt")
三.以元素属性定位元素(常用)
driver.find_element_by_css_selector(‘[name=“wd”]‘)
driver.find_element_by_css_selector(‘[maxlength=“100”]‘)
~号表示匹配部分属性值
属性值包含s_btn:适用于由空格分隔的属性值。
driver.find_element_by_css_selector(‘[class~="s_btn”]‘)
四.以父子定位元素
查找有父级元素的标签名为span,它的所有标签名叫input的子元素
driver.find_element_by_css_selector("span>input")
五.以组合定位元素
标签名#id属性值:指的是该input标签下id属性为kw的元素
driver.find_element_by_css_selector("input#kw")
标签名.class属性值:指的是该input标签下class属性为s_ipt的元素
driver.find_element_by_css_selector("input.s_ipt")
标签名[属性=’属性值‘]:指的是该input标签下name属性为wd的元素
driver.find_element_by_css_selector(‘input[name=“wd”]‘)
父级元素标签名>标签名.class属性值:指的是span下的input标签下class属性为s_ipt的元素
find_element_by_css_selector("span>input.s_ipt")
多个属性组合定位元素(常用)
指的是input标签下id属性为kw且name属性为wd的元素
driver.find_element_by_css_selector(‘input.s_ipt[name=“wd”]‘)
指的是input标签下name属性为wd且maxlength为100的元素
driver.find_element_by_css_selector(‘input[name=“wd“][maxlength=“100“]‘)
3.查找元素返回WebElement对象背后的属性(以id为例子)
1)返回元素属性值
1 ele=driver.find_element_by_id("kw").get_attribute("class") 2 print(ele)结果:s_ipt
2)返回元素属性值,但是该方法只能获取元素中id或name的属性值,其他的都不能获取
ele=driver.find_element_by_id("kw").get_property("id") print(ele) ele1=driver.find_element_by_class_name("s_ipt").get_property("id") print(ele1) ele2=driver.find_element_by_id("kw").get_property("name") print(ele2) ele3=driver.find_element_by_class_name("s_ipt").get_property("name") print(ele3) ele4=driver.find_element_by_class_name("s_ipt").get_property("class") #这种是不行的返回None print(ele4)结果:
kw
kw
wd
wd
None
property是DOM中的属性,是JavaScript里的对象;attribute是HTML标签上的特性,它的值只能够是字符串;
3)返回内部存储id,这个属性用于判断两个webelements是否引用同个元素
ele=driver.find_element_by_id("kw").id print(ele) ele1=driver.find_element_by_name("wd").id print(ele1)结果:因为都是引用同一个标签对里面的数据所以id肯定一样
0.822772467010251-1
0.822772467010251-14)
4)返回标签对的名称
1 ele=driver.find_element_by_id("kw").tag_name 2 print(ele)结果:input5)判断元素是否可见(返回bool值)
1 ele=driver.find_element_by_id("kw").is_displayed() 2 print(ele)结果:True
6)判断元素是否被选中(一般用于单选框或者复选框)
from selenium import webdriver from selenium.webdriver.common.action_chains import ActionChains driver=webdriver.Chrome() driver.get("http://www.baidu.com") ele=driver.find_element_by_xpath(‘//a[@name="tj_login"]/following-sibling::a[text()="设置"]‘) ActionChains(driver).move_to_element(ele).perform() driver.find_element_by_class_name("setpref").click() time.sleep(3) a=driver.find_element_by_id("sh_2").is_selected() print(a) driver.quit()结果:True7)判断元素是否存在HTML上(is_displayed()本身这个函数用于判断某个元素是否存在页面上(这里的存在不是肉眼看到的存在,而是html代码的存在,很少用到)
from selenium import webdriver driver=webdriver.Chrome() driver.get("http://www.baidu.com") a=driver.find_element_by_id(‘su‘).is_displayed() print(a) driver.quit()
结果:True
5.环境变量配置在linux系统下,需要将可执行文件配置到环境变量或将文件移动到属于环境变量的目录里面方法一:将文件移动到属于环境变量目录中sudo mv chromedriver /user/bin