สิ่งหนึ่งที่ Google เขียนไว้ในเว็บไซต์ของ Google เองในส่วนของคำแนะนำสำหรับเว็บมาสเตอร์ นั้นมีอยู่ส่วนหนึ่งเช่นกันที่ Google แนะนำให้ ทำ [tag]Google Sitemap[/tag] ด้วย
ซึ่งหากมองกันทั่วไปแล้ว ก็คงดูว่า นั่นเป็นสิ่งดี ที่ Google ให้เราทำเพื่อที่จะช่วยให้ Google เข้าใจเว็บเรามากขึ้น สนใจเว็บเรามากขึ้น
แต่พอลองคิดอยู่ แล้ว เอ?? เหมือนมันมีผลประโยชน์ อะไรรึป่าว ถึงมาทำให้กันฟรีๆ แถมยังสนับสนุนให้ใช้กันอีก
ถามว่า ทำไม ผมถึงคิดว่า Google มีอะไรประหลาดหรือว่า ผลประโยชน์อะไร ??
อันดับแรก ผมเคยเขียน ถึง [tag]Googlebot[/tag] เกี่ยวกับการ [tag]crawl[/tag] ตามหน้าเว็บไซต์ โดย Googlebot จะวิ่งไปตามลิ้งค์จำนวนมากมาย โดยเมื่อ Googlebot (รวมทั้ง Robots ตัวอื่นๆด้วย) เข้ามาในหน้าเว็บของเราแล้ว Googlebot จะทำการ ตรวจสอบในหน้าเว็บไซต์ ว่า
มี คีย์เวิร์ด มีรายละเอียด อะไรบ้าง และที่สำคัญ มีลิ้งค์อะไรบ้าง
เมื่อ GoogleBot พบลิ้งค์แล้ว ก็จะทำการ เก็บลิ้งค์ และเรียงลำดับของลิ้งค์ 1,2,3.... จนถึงประมาณ 100 ลิ้งค์ จากนั้น ก็จะทำเมื่อทำการเก็บลิ้งค์ในหน้าแรกไปเรียบร้อยแล้ว ก็จะทำการวิ่งตามลิ้งค์ ที่ 1 ที่เก็บไว้ จากนั้น ก็จะวิ่งไปยังหน้าเว็บในลิ้งค์ 1 แล้วก็จะทำการเก็บไว้ลิ้งค์ มาเรียงไว้ อีกเช่นเดิม
ซึ่ง googlebot ทำอย่างนี้ไปเรื่อยๆ เรื่อยๆ ดังนั้น สมมติว่า ในหน้า A มีอยู่ร้อยลิ้งค์ หน้า B อีกร้อยลิ้งค์ กลายเป็นว่า Googlebot จะต้อง Store link เหล่านั้นไปเรื่อยๆ ซึ่งผมคิดว่า หากเจอลิ้งค์ที่ซ้ำกัน ก็จะตัดลิ้งค์ที่ซ้ำออก แล้วให้คะแนนลิ้งค์เพิ่มมากขึ้น ลำดับของลิ้งค์ที่ store ไว้อยู่ต้นๆ เพราะถือว่า ลิ้งค์นั้น มีความสำคัญ มากกว่าลิ้งค์ที่พบเพียงครั้งเดียว
ทีนี้ตัดไปดูเจ้า google sitemap กันบ้าง ซึ่งรูปแบบที่สำคัญของ google sitemap จะน่าจะอยู่ที่ tag url ใน Sitemap
(ตัวอย่าง Google sitemap www.i-morm.com)
จะเห็นได้ว่า ตัว tag url จะประกอบไปด้วย url , lastmod,changfreq และ priority
แล้วมันมีอะไรน่าสงสัยล่ะ ???
จุดที่น่าสงสัย หรือเรียกว่าน่าสนใจก็ได้ อยู่ตรงที่ ใน Google sitemap จะประกอบไปด้วย
1. url
2.priority
ซึ่งเมื่อเรามองย้อนกลับไปดู วิธีการ Store ข้อมูลของ Googlebot ซึ่ง ผมตัดในส่วนของ คีย์เวิร์ดออกไป เพราะว่า มันไม่ได้เกี่ยวข้องในการ crawl ตามลิ้งค์เท่าไหร่นัก ก็จะประกอบไปด้วย
1. url
2.priority
เช่นกัน นี่ล่ะครับจุดน่าสนใจ เพราะ ถ้าเป็น Googlebot มาทำการ crawl หน้าเว็บ Googlebot จะต้องทำ 2 ขั้นตอนหลัก คือ หาคีย์เวิร์ด และ crawl ลิ้งค์ หรือ url มา store และจัดลำดับ
ในขณะที่ ถ้า Googlebot อาศัย Google sitemap เป็นแหล่งข้อมูล ก่อนที่จะมาเที่ยว Crawl ในหน้าเว็บแล้ว Googlebot ก็จะทำแค่การ หาคีย์เวิร์ด ในแต่ละหน้า ของ url ใน sitemap เท่านั้น
Googlebot ไม่ต้องมานั่ง ทำการเช็คลิ้งค์ ให้คะแนนลิ้งค์ จัดลำดับลิ้งค์ที่จะไปต่อ แต่อย่างใด
เห็นไหมครับว่า googlebot สามารถลดภาระ หน้าที่ ที่จะต้องทำลงได้อีกมาก จาก ต้องทำ ทั้งหาคีย์เวิร์ด หาลิ้งค์และจัดลำดับ ( 2 ขั้นตอน) เหลือเพียง หาคีย์เวิร์ด ตามลิ้งค์ของ sitemap (หรืออาจจะมีการจัดลำดับใหม่ ตาม priority) เท่านั้นเอง
นี่ล่ะครับ ที่ผมคิดว่า มันเป็นผลประโยชน์ของ Google ที่ลดภาระหน้าที่ ของ robot ของตนลงเพื่อให้สามารถ crawl หน้าเว็บได้ไวขึ้น เก็บข้อมูลได้มากขึ้น
และ ผลคือ ทำให้ Google สามารถ ทำ indexs หน้าเว็บไซต์ ได้มากกว่า คู่แข่งนั่นเอง
ผมคงคิดไม่ผิดใช่ไหมครับ ????


Comments
Post new comment