網站上線之後,嘗試在Google搜尋,才發現還有好多事要做喔!
Google Search Console提交Sitemap!加快搜尋引擎找到網站!
網站上線後,到 http://www.xml-sitemaps.com/ 來生產自己的網站地圖。
首先在首頁中【輸入網址】之後按【Start】下載,
再把sitemap.xml檔案上傳到虛擬主機的系統根目錄,
最後再到Google Search Console提交sitemap.xml檔即可!
Google Search Console 移除網址
由於新舊網站交替時期,Google上會有很多舊的錯誤的連結,這時可以回報Google來移除網址
製作robots.txt 禁止不想讓人搜尋到的網頁或資料夾
robots.txt 檔案主要用於管理網路爬蟲等善意機器人的活動。Disallow 命令是 Robots 排除通訊協定中最常見的命令,把不想被搜尋到的網頁或資料夾寫在Disallow即可。它告訴機器人不要存取命令後面的單個或多個網頁。不允許的頁面不一定是「隱藏的」。大多數情況下,使用者如果知道網址,則仍然可以導覽到這些頁面。
透過 .htaccess 來導向錯誤網頁、自動導向404、403
因為新舊網站的路徑/檔名都不同,在GOOGLE搜尋的時候,會跑出舊有的錯誤連結,所以先做一個指示服务器找不到请求的錯誤页面通知,檔名就是404.html,我本來是跟網站其他網頁風格一致,但我發現有時網址路徑錯亂的時候會抓不到CSS,索性做一個很簡單的網頁放置在根目錄,只要能有正確網址可以連結就好
.htaccess 設置404頁面
404.html做好了之後,還要用.htaccess設置404頁面,讓網頁不存在時會自動導向404.html,另外,為了防止用戶瀏覽網站目錄下的索引列表,我在 .htaccess 文件中添加了 Options -Indexes 指令。這樣瀏覽器會顯示403 Forbidden 錯誤,而不是顯示該目錄下的所有檔案列表。當然也可以自訂義一個403頁面.但我懶! 哈!
.htaccess文件在慣用的網頁編輯器,例如VS Code上建立即可,特別注意不要有副檔名