這篇文章主要介紹Python如何爬取房天下新樓盤信息,文中介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們一定要看完!
站在用戶的角度思考問題,與客戶深入溝通,找到岱山網站設計與岱山網站推廣的解決方案,憑借多年的經驗,讓設計與互聯網技術結合,創造個性化、用戶體驗好的作品,建站類型包括:網站建設、成都網站制作、企業官網、英文網站、手機端網站、網站推廣、域名與空間、網站空間、企業郵箱。業務覆蓋岱山地區。
前言
import requests from lxml import etree import re from bs4 import BeautifulSoup import openpyxl import csv def get_price(): headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:73.0) Gecko/20100101 Firefox/73.0', 'Refrer': 'https://ganzhou.newhouse.fang.com/house/s/b9{}/', } for i in range(1, 10): url = "https://ganzhou.newhouse.fang.com/house/s/b9{}/".format(str(i)) response = requests.get(url, headers=headers) if response.status_code == 200: xml = etree.HTML(response.content.decode('gbk')) name = xml.xpath('//div[@class="nl_con clearfix"]//div[@class="nlc_details"]//a[@data-yd=""]//text()') for index in range(len(name)): name[index] = name[index].strip() address = xml.xpath('//div[@class="nl_con clearfix"]//div[@class="nlc_details"]//div[@class="address"]/a/text()') for index in range(len(address)): address[index] = address[index].strip() price = xml.xpath('//div[@class="nl_con clearfix"]//div[@class="nlc_details"]//div[@class="nhouse_price"]/span/text()') for index in range(len(price)): price[index] = price[index].strip() with open('贛州房價.csv', 'w') as f: writer = csv.writer(f) writer.writerows(zip(name, price, address)) f.close() if __name__ == '__main__': get_price()
以上是“Python如何爬取房天下新樓盤信息”這篇文章的所有內容,感謝各位的閱讀!希望分享的內容對大家有幫助,更多相關知識,歡迎關注創新互聯行業資訊頻道!
標題名稱:Python如何爬取房天下新樓盤信息
標題URL:http://m.kartarina.com/article18/jedhdp.html
成都網站建設公司_創新互聯,為您提供企業網站制作、網站收錄、域名注冊、網站改版、靜態網站、標簽優化
聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯