欢迎光临高大百科网

我们一直在努力
当前位置:首页 > 更多 > 购物 >

早报网zaobaocom,aobaocom

日期: 来源:高大网收集编辑:www.gdy.net.cn
后台-插件-广告管理-首页/栏目/内容广告位一(PC)
早报网zaobaocom,aobaocom

今天给各位分享aobaocom的知识,其中也会对早报网zaobaocom进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!

本文目录一览:

劳保用品批发市场

云南省昆明市,吴井路是卖劳保用品最集中的地方。董家湾也有十多家在做。现在大一点的劳保用品公司都在向二环外发展(二环内进不了大车)华洋五金机电市场,蓝天五金机电市场,昌宏五金机电市场,浩宏五金机电市场,众天五金机电市场这几个市场内都有做劳保用品的。环城南路靠东站这边也有几家在做的。五一路有两家还是三家就不清楚了。南坝路也有卖劳保用品和军品的,新南站也有一两家。东站五金机电市场也有两三家。真正的叫做劳保用品市场的就没有。

昆明劳保用品网

云南劳保用品网

如何让淘宝店铺优惠券链接变得更短,复制出来的优惠券链接太长了,哪位亲教一下啊?

这个其实很简单,只需要通过工具把淘宝链接生成为短连接即可。

以这个淘宝商品链接为例:aobao.com/list?nofestival=0q=新品bcoffset=tab=allloc=sort=source=style=gridbucket_id=filter=cat=54900006sortn=sort2=fs=1seller_type=taobaospm=a219r.lm5693cps=yesrsclick=stats_click=auction_tag%5B%5D=1154

使用工具进行缩短:

是不是十分简洁方便,并且可以防各大平台屏蔽。

是不是十分简洁方便,并且可以不让大平台屏蔽。

传送门:3w.cm

用python写爬虫程序怎么调用工具包selenium

一、什么是Selenium

selenium 是一套完整的web应用程序测试系统,包含了测试的录制(selenium IDE),编写及运行(Selenium Remote Control)和测试的并行处理(Selenium Grid)。Selenium的核心Selenium Core基于JsUnit,完全由JavaScript编写,因此可以用于任何支持JavaScript的浏览器上。

selenium可以模拟真实浏览器,自动化测试工具,支持多种浏览器,爬虫中主要用来解决JavaScript渲染问题。

二、selenium基本使用

用python写爬虫的时候,主要用的是selenium的Webdriver,我们可以通过下面的方式先看看Selenium.Webdriver支持哪些浏览器

执行结果如下,从结果中我们也可以看出基本山支持了常见的所有浏览器:

这里要说一下比较重要的PhantomJS,PhantomJS是一个而基于WebKit的服务端JavaScript API,支持Web而不需要浏览器支持,其快速、原生支持各种Web标准:Dom处理,CSS选择器,JSON等等。PhantomJS可以用用于页面自动化、网络监测、网页截屏,以及无界面测试

声明浏览器对象

上面我们知道了selenium支持很多的浏览器,但是如果想要声明并调用浏览器则需要:

from selenium import webdriver

browser = webdriver.Chrome()

browser = webdriver.Firefox()

这里只写了两个例子,当然了其他的支持的浏览器都可以通过这种方式调用

访问页面

from selenium import webdriver

browser = webdriver.Chrome()

browser.get("httidu.com")print(browser.page_source)

browser.close()

上述代码运行后,会自动打开Chrome浏览器,并登陆百度打印百度首页的源代码,然后关闭浏览器

查找元素

单个元素查找

from selenium import webdriver

browser = webdriver.Chrome()

browser.get("bao.com")

input_first = browser.find_element_by_id("q")

input_second = browser.find_element_by_css_selector("#q")

input_third = browser.find_element_by_xpath('//*[@id="q"]')print(input_first)print(input_second)print(input_third)

browser.close()

这里我们通过三种不同的方式去获取响应的元素,第一种是通过id的方式,第二个中是CSS选择器,第三种是xpath选择器,结果都是相同的。

结果如下:

这里列举一下常用的查找元素方法:

find_element_by_name

find_element_by_id

find_element_by_xpath

find_element_by_link_text

find_element_by_partial_link_text

find_element_by_tag_name

find_element_by_class_name

find_element_by_css_selector

下面这种方式是比较通用的一种方式:这里需要记住By模块所以需要导入

from selenium.webdriver.common.by import By

from selenium import webdriverfrom selenium.webdriver.common.by import By

browser = webdriver.Chrome()

browser.get("obao.com")

input_first = browser.find_element(By.ID,"q")print(input_first)

browser.close()

当然这种方法和上述的方式是通用的,browser.find_element(By.ID,"q")这里By.ID中的ID可以替换为其他几个

多个元素查找

其实多个元素和单个元素的区别,举个例子:find_elements,单个元素是find_element,其他使用上没什么区别,通过其中的一个例子演示:

from selenium import webdriver

browser = webdriver.Chrome()

browser.get("obao.com")

lis = browser.find_elements_by_css_selector('.service-bd li')print(lis)

browser.close()

这样获得就是一个列表

当然上面的方式也是可以通过导入from selenium.webdriver.common.by import By 这种方式实现

lis = browser.find_elements(By.CSS_SELECTOR,'.service-bd li')

同样的在单个元素中查找的方法在多个元素查找中同样存在:

find_elements_by_name

find_elements_by_id

find_elements_by_xpath

find_elements_by_link_text

find_elements_by_partial_link_text

find_elements_by_tag_name

find_elements_by_class_name

find_elements_by_css_selector

元素交互操作

对于获取的元素调用交互方法

from selenium import webdriverimport time

browser = webdriver.Chrome()

browser.get("bao.com")

input_str = browser.find_element_by_id('q')

input_str.send_keys("ipad")

time.sleep(1)

input_str.clear()

input_str.send_keys("MakBook pro")

button = browser.find_element_by_class_name('btn-search')

button.click()

运行的结果可以看出程序会自动打开Chrome浏览器并打开淘宝输入ipad,然后删除,重新输入MakBook pro,并点击搜索

交互动作

将动作附加到动作链中串行执行

from selenium import webdriverfrom selenium.webdriver import ActionChains

browser = webdriver.Chrome()

url = "ry/try.php?filename=jqueryui-api-droppable"browser.get(url)

browser.switch_to.frame('iframeResult')

source = browser.find_element_by_css_selector('#draggable')

target = browser.find_element_by_css_selector('#droppable')

actions = ActionChains(browser)

actions.drag_and_drop(source, target)

actions.perform()

执行JavaScript

这是一个非常有用的方法,这里就可以直接调用js方法来实现一些操作,

下面的例子是通过登录知乎然后通过js翻到页面底部,并弹框提示

from selenium import webdriver

browser = webdriver.Chrome()

browser.get("u.com/explore")

browser.execute_script('window.scrollTo(0, document.body.scrollHeight)')

browser.execute_script('alert("To Bottom")')

获取元素属性

get_attribute('class')

from selenium import webdriver

browser = webdriver.Chrome()

url = 'hihu.com/explore'browser.get(url)

logo = browser.find_element_by_id('zh-top-link-logo')print(logo)print(logo.get_attribute('class'))

获取文本值

text

from selenium import webdriver

browser = webdriver.Chrome()

url = 'com/explore'browser.get(url)

input = browser.find_element_by_class_name('zu-top-add-question')print(input.text)

获取ID,位置,标签名

id

location

tag_name

size

from selenium import webdriver

browser = webdriver.Chrome()

url = 'com/explore'browser.get(url)

input = browser.find_element_by_class_name('zu-top-add-question')print(input.id)print(input.location)print(input.tag_name)print(input.size)

Frame

在很多网页中都是有Frame标签,所以我们爬取数据的时候就涉及到切入到frame中以及切出来的问题,通过下面的例子演示

这里常用的是switch_to.from()和switch_to.parent_frame()

import timefrom selenium import webdriverfrom selenium.common.exceptions import NoSuchElementException

browser = webdriver.Chrome()

url = 'oob.com/try/try.php?filename=jqueryui-api-droppable'browser.get(url)

browser.switch_to.frame('iframeResult')

source = browser.find_element_by_css_selector('#draggable')print(source)try:

logo = browser.find_element_by_class_name('logo')except NoSuchElementException:    print('NO LOGO')

browser.switch_to.parent_frame()

logo = browser.find_element_by_class_name('logo')print(logo)print(logo.text)

等待

当使用了隐式等待执行测试的时候,如果 WebDriver没有在 DOM中找到元素,将继续等待,超出设定时间后则抛出找不到元素的异常, 换句话说,当查找元素或元素并没有立即出现的时候,隐式等待将等待一段时间再查找 DOM,默认的时间是0

隐式等待

到了一定的时间发现元素还没有加载,则继续等待我们指定的时间,如果超过了我们指定的时间还没有加载就会抛出异常,如果没有需要等待的时候就已经加载完毕就会立即执行

from selenium import webdriver

browser = webdriver.Chrome()

browser.implicitly_wait(10)

browser.get('com/explore')

input = browser.find_element_by_class_name('zu-top-add-question')print(input)

显示等待

指定一个等待条件,并且指定一个最长等待时间,会在这个时间内进行判断是否满足等待条件,如果成立就会立即返回,如果不成立,就会一直等待,直到等待你指定的最长等待时间,如果还是不满足,就会抛出异常,如果满足了就会正常返回

from selenium import webdriverfrom selenium.webdriver.common.by import Byfrom selenium.webdriver.support.ui import WebDriverWaitfrom selenium.webdriver.support import expected_conditions as EC

browser = webdriver.Chrome()

browser.get('.taobao.com/')

wait = WebDriverWait(browser, 10)

input = wait.until(EC.presence_of_element_located((By.ID, 'q')))

button = wait.until(EC.element_to_be_clickable((By.CSS_SELECTOR, '.btn-search')))print(input, button)

上述的例子中的条件:EC.presence_of_element_located()是确认元素是否已经出现了

EC.element_to_be_clickable()是确认元素是否是可点击的

常用的判断条件:

title_is 标题是某内容

title_contains 标题包含某内容

presence_of_element_located 元素加载出,传入定位元组,如(By.ID, 'p')

visibility_of_element_located 元素可见,传入定位元组

visibility_of 可见,传入元素对象

presence_of_all_elements_located 所有元素加载出

text_to_be_present_in_element 某个元素文本包含某文字

text_to_be_present_in_element_value 某个元素值包含某文字

frame_to_be_available_and_switch_to_it frame加载并切换

invisibility_of_element_located 元素不可见

element_to_be_clickable 元素可点击

staleness_of 判断一个元素是否仍在DOM,可判断页面是否已经刷新

element_to_be_selected 元素可选择,传元素对象

element_located_to_be_selected 元素可选择,传入定位元组

element_selection_state_to_be 传入元素对象以及状态,相等返回True,否则返回False

element_located_selection_state_to_be 传入定位元组以及状态,相等返回True,否则返回False

alert_is_present 是否出现Alert

浏览器的前进和后退

back()

forward()

import timefrom selenium import webdriver

browser = webdriver.Chrome()

browser.get('ww.baidu.com/')

browser.get('aobao.com/')

browser.get('ww.python.org/')

browser.back()

time.sleep(1)

browser.forward()

browser.close()

cookie操作

get_cookies()

delete_all_cookes()

add_cookie()

from selenium import webdriver

browser = webdriver.Chrome()

browser.get('om/explore')print(browser.get_cookies())

browser.add_cookie({'name': 'name', 'domain': '', 'value': 'zhaofan'})print(browser.get_cookies())

browser.delete_all_cookies()print(browser.get_cookies())

选项卡管理

通过执行js命令实现新开选项卡window.open()

不同的选项卡是存在列表里browser.window_handles

通过browser.window_handles[0]就可以操作第一个选项卡

import timefrom selenium import webdriver

browser = webdriver.Chrome()

browser.get('baidu.com')

browser.execute_script('window.open()')print(browser.window_handles)

browser.switch_to_window(browser.window_handles[1])

browser.get('bao.com')

time.sleep(1)

browser.switch_to_window(browser.window_handles[0])

browser.get('hon.org')

异常处理

这里只进行简单的演示,查找一个不存在的元素

from selenium import webdriverfrom selenium.common.exceptions import TimeoutException, NoSuchElementException

browser = webdriver.Chrome()try:

browser.get('du.com')except TimeoutException:    print('Time Out')try:

browser.find_element_by_id('hello')except NoSuchElementException:    print('No Element')finally:

browser.close()

所有的努力都值得期许,每一份梦想都应该灌溉!

aobaocom的介绍就聊到这里吧,感谢你花时间阅读本站内容,更多关于早报网zaobaocom、aobaocom的信息别忘了在本站进行查找喔。

后台-插件-广告管理-首页/栏目/内容广告位二(PC)
后台-插件-广告管理-首页/栏目/内容广告位二(手机)
后台-插件-广告管理-内容广告位三(PC)
后台-插件-广告管理-内容广告位三(手机)

相关阅读

  • searchtaobaocom的简单介绍

  • 本篇文章给大家谈谈searchtaobaocom,以及对应的知识点,希望对各位有所帮助,不要忘了收藏本站喔。本文目录一览:1、淘宝网页商品图片都显示不出来怎么解决2、如何在360浏览器右键/搜索引擎中添加淘宝搜索3、红异端典藏版淘宝店哪有的买?4、淘宝 怎么找这个?5、屏幕右下角总是弹出淘宝的小网页,求解决淘宝网页商品图片都显示不出来怎么解决如果搜索淘宝宝贝后,图片不显示,建议进行如下操作:1、打开IE的“工具”,选择“谨桐Internet选项”,在“安全”选项卡中,贺胡选择“受限站点”,点击“站点”,只
  • 淘宝网淘宝网电脑版,taobaocom淘宝电脑版

  • 本篇文章给大家谈谈taobaocom淘宝电脑版,以及淘宝网淘宝网电脑版对应的知识点,希望对各位有所帮助,不要忘了收藏本站喔。本文目录一览:1、淘宝官网登录电脑版2、淘宝网电脑版登陆首页3、淘宝有电脑客户端吗4、在电脑上怎样下载淘宝并安装到桌面淘宝官网登录电脑版在浏览器中搜索淘宝网,点击登录,输入账号和密码即可,具体步骤如下:1、打开浏览器,搜索淘宝网,找到带有官方标识的淘宝网。2、进入主页后,点击请登录。3、输入账号和密码,点击登录。4、登录成功后,可以查看我的淘宝,已买到的宝贝等。5、进入后可以看到当前
  • taobaocom淘宝电脑版,taobaocom官方网站

  • 今天给各位分享taobaocom官方网站的知识,其中也会对taobaocom淘宝电脑版进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!本文目录一览:1、淘宝的网址www.taobao.com和www.taobao.com.cn那个是真的2、淘宝网的网址3、淘宝网的官方链接是什么4、淘宝网的网址是什么??5、正宗的淘宝网网址是多少啊淘宝的网址www.taobao.com和www.taobao.com.cn那个是真的是真的。查询结果如下:查询结果。如何辨别真假网站方法:查询网站备案就可以
  • 关于淘宝网wwwtaobaocom的信息

  • 今天给各位分享淘宝网wwwtaobaocom的知识,其中也会对进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!本文目录一览:1、淘宝网的官方链接是什么2、淘宝网网址是多少3、淘宝网的网址是多少,如何建立商店?4、淘宝的网址www.taobao.com和www.taobao.com.cn那个是真的淘宝网的官方链接是什么淘宝网的官方链接为: 淘宝网是亚太地区较大的网络零、商圈,由阿里巴巴集团在2003年5月创立。 截至2014年底,淘宝网拥有注册会员近5亿,日活跃用户超1.2亿,在线商品
  • taobaocom淘宝电脑版登录帐户中心,taobaocom

  • 今天给各位分享taobaocom的知识,其中也会对taobaocom淘宝电脑版登录帐户中心进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!本文目录一览:1、怎么找出自己在淘宝店铺网址2、怎样打开淘宝网3、淘宝的网址www.taobao.com和www.taobao.com.cn那个是真的怎么找出自己在淘宝店铺网址找出自己在淘宝店铺网址的方法有:1、进入卖家中心,点击左侧菜单栏的店铺管理,点击查看淘宝店铺即可。2、直接在网页上搜索店铺名,进入店铺后,在浏览器地址栏里就会出现您的店铺地址
后台-插件-广告管理-内容广告位四(PC)
后台-插件-广告管理-内容广告位四(手机)

热门文章

后台-插件-广告管理-侧边广告位一(PC)
后台-插件-广告管理-侧边广告位一(手机)
  • CTMT舒缓抗皱养颜面膜怎么样

  • CTMT舒缓抗皱养颜面膜成分除了牛还是牛!,里面的玻色因和水解质酸钠相当优秀,有着三重舒缓成分,急救舒缓非常强大。泛红闹情绪的小脸蛋一敷它就乖乖的快速褪红,急救效果贼拉好,敏感
  • CTMT舒缓抗皱养颜面膜好不好

  • 这个CTMT舒缓抗皱养颜面膜补水修复能力真的牛,面膜里面无酒精无香精,敏感肌肤也放心用。这款修护面膜上脸冰冰凉凉的,膜布服帖又很透气,每次敷完都感觉皮肤喝饱水,脸蛋光滑又水润
  • 大力矿机是哪个国家的品牌?

  • 大力矿机是山东省淄博市品牌。淄博大力矿山机械有限公司(原淄博矿山机械厂)始建于1956年。厂区占地14.9万平方米,坐落于有着悠久历史和灿烂文化的齐国故都--山东淄博,位于周村
  • 悦木之源泥娃娃面膜效果怎么样

  • 悦木之源泥娃娃虽然是泥状但是非常好推开,清洁能力杠杠的,用完鼻头上的脏东西一扫而光,温和不刺激。清水洗掉后的感觉就是直击黑头毛孔老巢,毛孔被彻彻底底地冲刷了一遍,把毛孔里
后台-插件-广告管理-侧边广告位二(PC)
后台-插件-广告管理-侧边广告位二(手机)
后台-插件-广告管理-侧边广告位三(PC)
后台-插件-广告管理-侧边广告位三(手机)