源碼下載鏈接:ppt.rar - 藍(lán)奏云
成都創(chuàng)新互聯(lián)主營紅橋網(wǎng)站建設(shè)的網(wǎng)絡(luò)公司,主營網(wǎng)站建設(shè)方案,成都app軟件開發(fā)公司,紅橋h5微信平臺(tái)小程序開發(fā)搭建,紅橋網(wǎng)站營銷推廣歡迎紅橋等地區(qū)企業(yè)咨詢PPT下載鏈接:https://pan.baidu.com/s/1HUAEe_-4IEV6ttOKC_VPuA?pwd=96px?
提取碼:96px
采集的參數(shù)
page_count = 1 # 每個(gè)欄目開始業(yè)務(wù)content="text/html; charset=gb2312"
base_url = "https://sc.chinaz.com/" # 采集的網(wǎng)址 https://sc.chinaz.com/tag_ppt/zhongguofeng.html
save_path = "D:\\Sprider\\ChinaZ\\"
sprider_count = 110 # 采集數(shù)量
haved_sprider_count = 0 # 已經(jīng)采集的數(shù)量
word_content_list = []
folder_name = ""
first_column_name = "ppt"
sprider_start_count=800 # 從第幾個(gè)序號開始 直接改數(shù)量即可 會(huì)做除法操作正 正在采集第32頁的第16個(gè)資源 debug
max_pager=20 #每頁的數(shù)量
采集主體代碼
def sprider(self, second_column_name):
"""
采集Coder代碼
:return:
"""
if second_column_name == "zhongguofeng":
self.folder_name = "中國風(fēng)"
self.first_column_name="tag_ppt"
elif second_column_name == "xiaoqingxin":
self.folder_name = "小清新"
self.first_column_name = "tag_ppt"
elif second_column_name == "kejian":
self.folder_name = "課件"
self.first_column_name = "ppt"
merchant = int(self.sprider_start_count) // int(self.max_pager) + 1
second_folder_name = str(self.sprider_count) + "個(gè)" + self.folder_name
self.save_path = self.save_path+ os.sep + "PPT" + os.sep + second_folder_name
BaseFrame().debug("開始采集ChinaZPPT...")
sprider_url = (self.base_url + "/" + self.first_column_name + "/" + second_column_name + ".html")
response = requests.get(sprider_url, timeout=10, headers=UserAgent().get_random_header(self.base_url))
response.encoding = 'UTF-8'
soup = BeautifulSoup(response.text, "html5lib")
#print(soup)
div_list = soup.find('div', attrs={"class": 'ppt-list'})
div_list =div_list.find_all('div', attrs={"class": 'item'})
#print(div_list)
laster_pager_url = soup.find('a', attrs={"class": 'nextpage'})
laster_pager_url = laster_pager_url.previous_sibling
#89
page_end_number = int(laster_pager_url.find('b').string)
#print(page_end_number)
self.page_count = merchant
while self.page_count<= int(page_end_number): # 翻完停止
try:
if self.page_count == 1:
self.sprider_detail(div_list,self.page_count,page_end_number)
else:
if self.haved_sprider_count == self.sprider_count:
BaseFrame().debug("采集到達(dá)數(shù)量采集停止...")
BaseFrame().debug("開始寫文章...")
self.builder_word(self.folder_name, self.save_path, self.word_content_list)
BaseFrame().debug("文件編寫完畢,請到對應(yīng)的磁盤查看word文件和下載文件!")
break
#https://www.a5xiazai.com/android/youxi/qipaiyouxi/list_913_1.html
#https://www.a5xiazai.com/android/youxi/qipaiyouxi/list_913_2.html
#next_url = sprider_url + "/list_{0}_{1}.html".format(str(url_index), self.page_count)
# (self.base_url + "/" + first_column_name + "/" + second_column_name + "/"+three_column_name+"")
next_url =(self.base_url + "/" + self.first_column_name + "/" + second_column_name + "_{0}.html").format(self.page_count)
# (self.base_url + "/" + self.first_column_name + "/" + second_column_name + "")+"/list_{0}_{1}.html".format(str(self.url_index), self.page_count)
response = requests.get(next_url, timeout=10, headers=UserAgent().get_random_header(self.base_url))
response.encoding = 'UTF-8'
soup = BeautifulSoup(response.text, "html5lib")
div_list = soup.find('div', attrs={"class": 'ppt-list'})
div_list = div_list.find_all('div', attrs={"class": 'item'})
self.sprider_detail(div_list, self.page_count,page_end_number)
pass
except Exception as e:
print("sprider()執(zhí)行過程出現(xiàn)錯(cuò)誤" + str(e))
pass
self.page_count = self.page_count + 1 # 頁碼增加1
def sprider_detail(self, element_list, page_count,max_page):
try:
element_length = len(element_list)
self.sprider_start_index = int(self.sprider_start_count) % int(self.max_pager)
index = self.sprider_start_index
while index< element_length:
a=element_list[index]
if self.haved_sprider_count == self.sprider_count:
BaseFrame().debug("采集到達(dá)數(shù)量采集停止...")
break
index = index + 1
sprider_info = "正在采集第" + str(page_count) + "頁的第" + str(index) + "個(gè)資源"
BaseFrame().debug(sprider_info)
title_image_obj = a.find('img', attrs={"class": 'lazy'})
url_A_obj=a.find('a', attrs={"class": 'name'})
next_url = self.base_url+url_A_obj.get("href")
coder_title = title_image_obj.get("alt")
response = requests.get(next_url, timeout=10, headers=UserAgent().get_random_header(self.base_url))
response.encoding = 'UTF-8'
soup = BeautifulSoup(response.text, "html5lib")
#print(next_url)
down_load_file_div = soup.find('div', attrs={"class": 'download-url'})
if down_load_file_div is None:
BaseFrame().debug("需要花錢無法下載因此跳過哦....")
continue
down_load_file_url = down_load_file_div.find('a').get("href")
#print(down_load_file_url)
image_obj = soup.find('div', attrs={"class": "one-img-box"}).find('img')
image_src = "https:"+ image_obj.get("data-original")
#print(image_src)
if (DownLoad(self.save_path).__down_load_file__(down_load_file_url, coder_title, self.folder_name)):
DownLoad(self.save_path).down_cover_image__(image_src, coder_title) # 資源的 封面
sprider_content = [coder_title,
self.save_path + os.sep + "image" + os.sep + coder_title + ".jpg"] # 采集成功的記錄
self.word_content_list.append(sprider_content) # 增加到最終的數(shù)組
self.haved_sprider_count = self.haved_sprider_count + 1
BaseFrame().debug("已經(jīng)采集完成第" + str(self.haved_sprider_count) + "個(gè)")
if (int(page_count) == int(max_page)):
self.builder_word(self.folder_name, self.save_path, self.word_content_list)
BaseFrame().debug("文件編寫完畢,請到對應(yīng)的磁盤查看word文件和下載文件!")
except Exception as e:
print("sprider_detail:" + str(e))
pass
采集的文件名
手繪風(fēng)格樂器素材ppt背景圖片
水粉手繪小清新花卉ppt背景圖片
水彩手繪綠葉素材ppt背景圖片
粉色兒童成長相冊ppt背景圖片
彩色手繪蔬菜食材ppt背景圖片
水彩手繪開學(xué)季返校ppt背景圖片
新的學(xué)期新的起點(diǎn)主題班會(huì)ppt模板
綠色漸變水彩風(fēng)ppt背景模板
彩色卡通健康蔬果ppt圖片背景
手繪拼貼畫新冠防疫知識ppt背景圖
手繪風(fēng)介紹立秋節(jié)氣ppt模板
兒童手繪致敬醫(yī)學(xué)工作者ppt背景圖片
手繪風(fēng)幼兒園兒童節(jié)PPT課件
黑板手繪風(fēng)備戰(zhàn)高考PPT模板
小清新藍(lán)綠植物文藝風(fēng)ppt模板
期末家長會(huì)PPT模板
大學(xué)生職業(yè)規(guī)劃書PPT模板
小學(xué)生秋游安全教育PPT模板
活動(dòng)流程策劃案例PPT模板
綠色手繪風(fēng)葉子開學(xué)家長會(huì)PPT模板
小學(xué)教學(xué)工作匯報(bào)PPT模板
手繪風(fēng)學(xué)業(yè)生涯規(guī)劃書PPT模板
手繪策劃方案答辯PPT模板
手繪綠植畢業(yè)生答辯PPT模板
手繪風(fēng)卡通期中家長會(huì)PPT模板
轉(zhuǎn)正述職報(bào)告PPT模板
大學(xué)生調(diào)研報(bào)告PPT模板
小清新財(cái)務(wù)總結(jié)報(bào)告PPT模板
美妝銷售年初總結(jié)PPT模板
手繪風(fēng)旅游旅行PPT模板
銷售經(jīng)理年終總結(jié)PPT模板
卡通手繪風(fēng)2021慶典PPT模板
卡通兒童旅行相冊PPT模板
手繪風(fēng)圣誕節(jié)ppt背景
商務(wù)時(shí)尚企業(yè)PPT模板
秋天的圖畫ppt
小學(xué)語文ppt模板
卡通ppt背景圖片
ppt模板免費(fèi)下載
精美ppt模板免費(fèi)下載
水彩手繪風(fēng)感恩教師節(jié)ppt
手繪風(fēng)快樂61兒童節(jié)PPT模板
文藝趣味手繪風(fēng)商務(wù)總結(jié)PPT模板
手繪風(fēng)醫(yī)療醫(yī)藥數(shù)據(jù)報(bào)告PPT模板
創(chuàng)意手繪風(fēng)動(dòng)態(tài)工作匯報(bào)PPT模板
手繪風(fēng)可愛小班家長會(huì)PPT模板
創(chuàng)意手繪電商節(jié)活動(dòng)策劃PPT模板
手繪感恩節(jié)主題班會(huì)PPT模板
手繪清新教學(xué)課件PPT模板
綠色手繪花卉植物個(gè)人工作總結(jié)PPT模板
手繪卡通風(fēng)端午節(jié)習(xí)俗PPT模板
手繪風(fēng)唯美創(chuàng)意三八女神節(jié)PPT模板
日系風(fēng)手繪美麗38女王節(jié)PPT模板
清新綠色手繪插畫風(fēng)藝術(shù)設(shè)計(jì)PPT模板
文藝小清新手繪插畫風(fēng)情人節(jié)PPT模板
創(chuàng)意粉筆手繪感恩教師節(jié)ppt模板
素雅文藝手繪插畫師ppt模板
創(chuàng)意可愛手繪風(fēng)童年回憶ppt模板
個(gè)性涂鴉色彩手繪風(fēng)ppt模板
清新水彩手繪ppt模板
創(chuàng)意卡通鉛筆手繪風(fēng)ppt模板
卡通鉛筆手繪大數(shù)據(jù)整理ppt模板
創(chuàng)意手繪卡通論文答辯ppt模板
創(chuàng)意手繪卡通ppt模板
灰色可愛卡通背景ppt模板
趣味簡約手繪線稿ppt模板
創(chuàng)意趣味手繪涂鴉ppt模板下載
創(chuàng)意低碳環(huán)保ppt模板
創(chuàng)意彩色手繪論文答辯ppt模板
創(chuàng)意手繪涂鴉褶皺紙張背景ppt模板
創(chuàng)意趣味手繪ppt模板下載
精美彩繪ppt模板下載
水彩手繪說課ppt模板下載
創(chuàng)意手繪ppt卡通動(dòng)畫模板下載
個(gè)性創(chuàng)意手繪ppt模板下載
春天氣息的ppt模板
化學(xué)說課ppt模板下載
玫瑰情人節(jié)ppt模板免費(fèi)下載
手繪涂鴉PPT圖表下載
師范類通用ppt模板下載
手繪沙灘海洋生物ppt模板
手繪綠色公園ppt模板下載
手繪夢幻櫻花ppt模板下載
手繪女孩ppt模板下載
手繪女孩ppt模板下載
手繪愛心ppt模板下載
粉紅女孩ppt模板下載
粉彩美女ppt模板下載
你是否還在尋找穩(wěn)定的海外服務(wù)器提供商?創(chuàng)新互聯(lián)www.cdcxhl.cn海外機(jī)房具備T級流量清洗系統(tǒng)配攻擊溯源,準(zhǔn)確流量調(diào)度確保服務(wù)器高可用性,企業(yè)級服務(wù)器適合批量采購,新人活動(dòng)首月15元起,快前往官網(wǎng)查看詳情吧
當(dāng)前文章:Python采集87個(gè)手繪風(fēng)格PPT模板-創(chuàng)新互聯(lián)
網(wǎng)址分享:http://m.kartarina.com/article28/cddgcp.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供自適應(yīng)網(wǎng)站、網(wǎng)站建設(shè)、網(wǎng)頁設(shè)計(jì)公司、企業(yè)建站、App設(shè)計(jì)、搜索引擎優(yōu)化
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容