智能識別爬蟲機器人返回定期更新的緩存頁面的非實時靜態化SEO原理。
具體分為:①在項目部署或者在設定的一段時間后,對頁面進行后臺的獲取、遍歷,通過配置文件設定的遍歷深度開始對首頁進行深度的鏈接獲取以及轉義,將各個鏈接對應的頁面交給下一步處理,直到所有遍歷結束;②對遍歷的頁面進行SEO處理, 生成或更新靜態HTML緩存放入靜態頁面池,即配置文件設置的緩存路徑,并在遍歷結束后及時對無效鏈接的緩存進行清理;③網絡請求首先通過攔截器(SEOFilter),攔截器根據HTTP請求的請求頭中包含的“User-Agent”等參數判斷此請求是否為爬蟲機器人的請求,如果不是則返回正常的頁面用于AngularJS內部渲染顯示, 反之則通過URL轉義查詢并返回對應的SEO緩存頁面給爬蟲機器人用于抓取關鍵字。
由于此策略是非實時的,所以它適用于較為穩定且對于搜索引擎的實時性要求不高的網站。例如政府辦公網站,它每日更新的內容不多且不會頻繁地修改頁面內容,則可以每日對服務器的靜態頁面進行更新,即可滿足每日更新搜索引擎詞條的需求。
當前題目:行業動態非實時的靜態化
網站地址:http://vcdvsql.cn/news3/144453.html
成都網站建設公司_創新互聯,為您提供網站內鏈、網站設計、網站導航、網站排名、微信小程序、自適應網站
廣告
聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源:
創新互聯