蜘蛛抓取但是收錄不放出來為什么

2014-03-28    分類: 網站收錄


1、爬取和收錄的關系:

爬取和收錄并不是包含關系,他們兩個是搜索引擎工作的環節,蜘蛛爬取頁面后放入臨時數據庫,等內容通過審查后背放出就形成了收錄。所以這兩個環節是前后關系,但是沒有必然的聯系。



2.蜘蛛抓取頁面的過程:

第一階段:大小通吃
搜索引擎蜘蛛過來抓取時,就需要對網站的URL進行一個統一的抓取,也就是站長常說的大小通吃的情況。搜索引擎蜘蛛對網頁中出現地鏈接,都會逐一加入到待抓取URL中,機械性的將新抓取的網頁中的URL提取出來。這對于很多的站點來說,是比較好的情況。搜索引擎蜘蛛過來抓取時,站長可以通過網站日志有一個清楚的記錄。站長可以通過網站日志分析網站優化的基本情況,這僅僅是第一階段。

第二階段:網頁評級
搜索引擎蜘蛛對網站的頁面進行抓取以后,就需要對網站的頁面進行評級。PageRank是一種著名的鏈接分析算法,可以用來衡量網頁的重要性,很自然的,站長可以用PageRank的思路來對URL進行排序。搜索引擎蜘蛛抓取頁面后,會對網站的頁面進行下載。但PageRank是個全局性算法,也就是當所有網頁有下載完成后,其計算結果才是可靠的。對于中小網站來講,服務器如果質量不好,如果在抓取過程中,只看到部分內容,在抓取階段是無法獲得可靠的PageRank得分。

3、蜘蛛爬取成功卻不放出來的原因:

蜘蛛爬取后會將頁面放入到臨時數據庫,搜索引擎再對臨時數據庫中的內容進行審查,將優質的內容放出并建立索引。所以并不是說爬取就會被收錄,還需要內容質量過關才能被放出來并建立索引。不同的蜘蛛抓取的頁面評測也不一樣,有的是低權重的蜘蛛,有的是高權重的蜘蛛和抓取待定的蜘蛛,這個可以百度搜下各種蜘蛛的情況,來做出各種應對情況

正常情況下網站提交后次日,spider會放出一個網站主頁的快照。再接下來的時間內,會不斷的收錄索引內容頁,并持續的放出。這個過程維護一月、二月、或者是三月,時間不等。如果網站已經有首頁放出,說明百度蜘蛛已經有來抓取過,只是內容還沒有放出來,多等待些時間即可。如果在等待收錄放出的時間階段不要做任何大的發動。比如說 修改title標題、修改url 等。否則會延長放出的時間,周期也會變長。

其次,如果內容和首頁都沒有放出來,就需要重新向百度提交,通知百度蜘蛛來抓取網站的內容,最好是提交個sitemap地圖,手動提交一下。

分享標題:蜘蛛抓取但是收錄不放出來為什么
分享路徑:http://m.kartarina.com/news/6866.html

網站建設、網絡推廣公司-創新互聯,是專注品牌與效果的網站制作,網絡營銷seo公司;服務項目有網站營銷網站收錄

廣告

聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯

綿陽服務器托管
主站蜘蛛池模板: 亚洲精品97久久中文字幕无码 | 亚洲av无码乱码在线观看野外| 无码人妻品一区二区三区精99| 人妻丰满熟妇AV无码区乱| 精品无码人妻夜人多侵犯18| 国产成人无码午夜视频在线观看| 一本色道无码不卡在线观看| 无码人妻一区二区三区兔费| 国产精品无码久久久久久| 免费无码又黄又爽又刺激| 国内精品人妻无码久久久影院| 无码一区二区波多野结衣播放搜索 | 亚洲av中文无码乱人伦在线咪咕| 亚洲精品无码成人| 亚洲AV无码精品无码麻豆| 国内精品久久人妻无码不卡 | 久久精品无码专区免费东京热| 久久久久久国产精品无码下载 | 亚洲一区爱区精品无码| 亚洲精品国产日韩无码AV永久免费网 | 亚洲av无码成人精品区| 亚洲av成本人无码网站| 久久久久av无码免费网| 无码日韩精品一区二区三区免费| 亚洲va中文字幕无码| 色综合久久久无码中文字幕 | 日韩AV高清无码| 久久久91人妻无码精品蜜桃HD| 日韩少妇无码一区二区三区| 波多野结衣VA无码中文字幕电影| 亚洲AV无码成人精品区在线观看| 国产成人无码专区| 亚洲国产成人精品无码久久久久久综合 | 无码成人精品区在线观看| 亚洲国产精品无码久久久不卡| 亚洲av无码一区二区三区网站 | 精品少妇人妻AV无码专区不卡| 亚洲AV无码一区二区三区性色 | 无码国产乱人伦偷精品视频| 国产午夜鲁丝无码拍拍| 国产精品无码AV一区二区三区 |