xpath的使用:定位,獲取文本和屬性值-創新互聯

myPage = '''<html>
<title>TITLE</title>
<body>
<h2></h2>
<div>
</div>
<div id="photos">
<img src="pic1.jpeg"/><span id="pic1">*</span>
<img src="pic2.jpeg"/><span id="pic2">****
</span>
<p><a href="http://www.example.com/more_pic.html">*
</a></p>
<a href="http://www.baidu.com">****</a>
<a href="http://www.163.com">*****</a>
<a href="http://www.sohu.com">****</a>
</div>
<p class="myclassname">Hello,\nworld!<br/>-- by Adam</p>
<div class="foot">放在尾部的其他一些說明</div>
</body>
</html>'''

創新互聯是一家專業提供長嶺企業網站建設,專注與做網站、網站制作H5開發、小程序制作等業務。10年已為長嶺眾多企業、政府機構等服務。創新互聯專業網站設計公司優惠進行中。

html = etree.fromstring(myPage)


#一、定位
divs1 = html.xpath('//div')
divs2 = html.xpath('//div[@id]')
divs3 = html.xpath('//div[@class="foot"]')
divs4 = html.xpath('//div[@]')
divs5 = html.xpath('//div[1]')
divs6 = html.xpath('//div[last()-1]')
divs7 = html.xpath('//div[position()<3]')
divs8 = html.xpath('//div|//h2')
divs9 = html.xpath('//div[not(@
)]')


二、取文本 text() 區別 html.xpath('string()')

text1 = html.xpath('//div/text()')
text2 = html.xpath('//div[@id]/text()')
text3 = html.xpath('//div[@class="foot"]/text()')
text4 = html.xpath('//div[@*]/text()')
text5 = html.xpath('//div[1]/text()')
text6 = html.xpath('//div[last()-1]/text()')
text7 = html.xpath('//div[position()<3]/text()')
text8 = html.xpath('//div/text()|//h2/text()')


#三、取屬性 @
value1 = html.xpath('//a/@href')
value2 = html.xpath('//img/@src')
value3 = html.xpath('//div[2]/span/@id')


#四、定位(進階)
#1.文檔(DOM)元素(Element)的find,findall方法
divs = html.xpath('//div[position()<3]')
for div in divs:
ass = div.findall('a') # 這里只能找到:div->a, 找不到:div->p->a
for a in ass:
if a is not None:
#print(dir(a))
print(a.text, a.attrib.get('href')) #文檔(DOM)元素(Element)的屬性:text, attrib

2.與1等價

a_href = html.xpath('//div[position()<3]/a/@href')
print(a_href)

#3.注意與1、2的區別
a_href = html.xpath('//div[position()<3]//a/@href')
print(a_href)

參考:https://www.cnblogs.com/hhh6460/p/5079465.html

另外有需要云服務器可以了解下創新互聯scvps.cn,海內外云服務器15元起步,三天無理由+7*72小時售后在線,公司持有idc許可證,提供“云服務器、裸金屬服務器、高防服務器、香港服務器、美國服務器、虛擬主機、免備案服務器”等云主機租用服務以及企業上云的綜合解決方案,具有“安全穩定、簡單易用、服務可用性高、性價比高”等特點與優勢,專為企業上云打造定制,能夠滿足用戶豐富、多元化的應用場景需求。

文章標題:xpath的使用:定位,獲取文本和屬性值-創新互聯
本文鏈接:http://m.kartarina.com/article40/ccgseo.html

成都網站建設公司_創新互聯,為您提供虛擬主機電子商務小程序開發網站設計自適應網站網站營銷

廣告

聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯

商城網站建設
主站蜘蛛池模板: 中文字幕久久精品无码| 少妇人妻偷人精品无码视频新浪| 亚洲欧洲精品无码AV| 国产乱人伦Av在线无码| 亚洲AV无码国产精品色| 青春草无码精品视频在线观| 一区二区三区无码视频免费福利 | 人妻无码一区二区三区免费| 亚洲精品无码久久久久久| 亚洲AV中文无码乱人伦| 性无码一区二区三区在线观看| 无码专区人妻系列日韩精品少妇| 久久久无码精品亚洲日韩软件| 日韩精品人妻系列无码专区| 久久久久久国产精品无码下载 | 精品日韩亚洲AV无码| 国内精品人妻无码久久久影院导航| 久久无码人妻一区二区三区 | 久久av高潮av无码av喷吹| 高清无码v视频日本www| 狠狠躁天天躁中文字幕无码| 精品久久久久久无码中文字幕漫画 | 人妻老妇乱子伦精品无码专区 | 国产精品亚洲专区无码不卡| 精品无码无人网站免费视频| 韩国19禁无遮挡啪啪无码网站| 在线A级毛片无码免费真人 | 国产精品成人99一区无码| 99国产精品无码| 人禽无码视频在线观看| 亚洲∧v久久久无码精品| 亚洲精品无码Av人在线观看国产| 亚洲一级Av无码毛片久久精品 | 无码AV一区二区三区无码| 国产精品无码久久久久久久久久 | 无码h黄肉3d动漫在线观看| 亚洲youwu永久无码精品| 亚洲爆乳精品无码一区二区| 亚洲av无码不卡久久| 亚洲精品无码久久| 国产精品无码一区二区三区在|