可能還有些朋友不知道什么叫網站日志,我們怎么去看網站日志,這里我簡單的說一下。畢竟我們今天的重點還是如何通過分析我們的網站日志,結合我們的SEO知識來提高我們的網站收錄與蛛蛛爬取這個才是重要的。
網站日志他其它是一個.log的文本文件,一般都是以天為統計成一個文本。如果你是買的虛擬機,我們可以通過虛擬機的后臺設置來生成.log日志文件。這個文件一般會在你的根目錄下的log 文件目錄下。在這個文件目錄下我們就可以看到每日生成的日志文件了,它的作用也就是記錄下當天的網站訪問情況。
我們來看一段代碼:2010-08-03 00:09:12 W3SVC962713505 203.171.226.111 GET /index.html – 80 – 61.135.168.39 Baiduspider
( //www.baidu.com/search/spider.htm) 200 0 64
上面的這個是大家經常會看到網站日志代碼,我簡單的給大家說一下他大概的意思,2010年08月03日00點09分12秒IP為61.135.168.39的百度蛛蛛爬蟲通過80端口有效的訪訪問了IP地址為203.171.226.111W3SVC962713505目錄的index.html文件。這個是這段日志的譯文。當然在我們的日志文件里,類似這樣的信息應該會有比較多,如果你的站確實比較受歡迎的,那么一個小時內來十幾次都是有可能的。
通過我們分析網站的日志,我們是不是不難發現。百度蛛蛛對于我們的網站首頁的爬取率是最高的(權重頁),這個也不難理解,因為做為網站來說更新的最快的,而且我們做錨文本鏈接的時候幾乎都是以首頁為主。那么結合著來說,我們的好些欄目頁的蛛蛛爬取大多數是通過我們首頁給他做的鏈接誘餌,引導蛛蛛來爬取我們的欄目從而收錄。
特別是我們做企業站與商城的時候,我們會發現有些個頁面非常難收錄,在我們減少了網站的重復率來提高網站收錄。那么我們能不能通過自己我的網站來做一個有效的引導呢。因為只有蛛蛛來爬過了我們的網頁才有可能被收錄。所以結合網站日志來提高網站收錄的一個比較重要的思路:利用那些蛛蛛爬取頻率比較高的頁面上來做鏈接誘餌,來引導蛛蛛爬取我們的內頁,從而達到網站收錄量提高的這么一個目的。
本文由寧波SEO何濤提供,網址http:www.nb-seoer.com