來源:http://m.qanho.com/ 發(fā)布時間:2021-03-22
不論是大的網(wǎng)站的還是小的網(wǎng)站,對于百度蜘蛛 seo優(yōu)化人員來說都是需要進行日志文件分析的。 本篇文章將為您詳細介紹何為網(wǎng)站日志文件?借助日志文件可以分析什么等。
日志文件是什么:
日志文件是包含有關(guān)向網(wǎng)站服務(wù)器發(fā)出請求的人員和內(nèi)容的詳細日志的文件。每次機器人向您的站點發(fā)出請求時,數(shù)據(jù)(例如時間,日期IP地址,用戶代理等)都存儲在此日志中。這些有價值的數(shù)據(jù)允許任何SEO找出百度搜索引擎和其他抓取工具在您的網(wǎng)站上正在做什么。與常規(guī)抓取不同,例如"濟南微道商",這是真實世界的數(shù)據(jù) - 而不是估計您的網(wǎng)站被抓取的方式。它是您網(wǎng)站抓取方式的精確概述。
通過日志文件分析什么內(nèi)容:
1、百度蜘蛛總體抓取量(以及趨勢)
搜索引擎的收錄是由抓取量以及文章質(zhì)量來決定的,當(dāng)文章質(zhì)量不變的情況下,蜘蛛抓取量越大,那么收錄的就會越多。所以我們通過日志分析,可知道網(wǎng)站每天的抓取量,以及預(yù)測之后的發(fā)展趨勢。
2、統(tǒng)計百度蜘蛛抓取的狀態(tài)碼
當(dāng)百度蜘蛛抓取了你的頁面后,不但抓取了你的內(nèi)容,而且還會有一個抓取返回碼的,這些返回碼我們要記錄下來,特別是一些類似301、404、500等這些狀態(tài)碼,我們從這些狀態(tài)碼中我們找出網(wǎng)站的一些潛在的問題。
3、統(tǒng)計搜索引擎蜘蛛來的次數(shù)、來的時間
統(tǒng)計出百度蜘蛛蜘蛛每天來的次數(shù),一天一共在我們網(wǎng)站停留了多久,有沒有IP蜘蛛一天24小時都在我們網(wǎng)站不停的抓取,這樣的蜘蛛越多越好,往往是你網(wǎng)站權(quán)重提升的表現(xiàn)。
日志文件如何打開:
日志文件一般是log為擴展名的文件,有的是GZ壓縮后的文件,我們下載下來,可以直接用記事本打開log文件,可看到里面的爬取記錄。