Posted on January 12th, 2006 in General
สำหรับท่านที่แวะเวียนเข้ามา ช่วยลงชื่อหรือ comment กันด้วยนะครับ
อยากจะรู้ ว่า ที่เขียนๆ เนี่ย มีคนเข้าใจรึป่าว หรือว่า มีคนสนใจรึป่าวนะครับ
For visitors.
if u have any thing or commnet.
pls. comment me
oh. pls.
Posted on January 12th, 2006 in SEO
[tag]Robots[/tag] หรือ[tag]Spider[/tag] ส่วนใหญ่จะทำหน้าที่ crawl ไปตามหน้าเว็บผ่านทางลิ้งค์ต่างๆ ซี่งนั่นเองเป็นสิ่งที่ทำให้เราต้องหันมาใส่ใจกับ Link และ URL ด้วย
เว็บไซต์ในปัจจุบัน มักจะใช้ลิ้งค์ในรูปแบบของ[tag]Dynamic link[/tag] เพราะการทำระบบด้วยภาษาสคริปต์นั้น สามารถทำให้ง่ายต่อการใช้งาน ง่ายต่อการจัดการ และสามารถพัฒนาต่อยอดได้ง่าย ไม่ว่าจะเป็นการทำ search, การปรับไปทำระบบ RSS หรือ Feed หรืออื่นๆ
โดยลักษณะของลิ้งค์จะเป็น
< a href="url?var1=x&var2=y&var3=z" mce_href="url?var1=x&var2=y&var3=z">link text
ซึ่งการลิ้งค์ในรูปแบบนี้ ดูเหมือนจะไม่น่ามีปัญหาอะไรต่อการใช้งาน แต่นั่นไม่ใช่สำหรับ spider
เพราะเหล่า spider หรือ robots หลังจากที่ crawl ไปตามลิ้งค์แล้ว จะต้องนำข้อมูลลิ้งมาใช้งานต่อ
มิใช่แค่ลิ้งค์ไปแล้วจบ
การที่ลิ้งค์ มี parameter ต่างๆ มากกว่า 2 เริ่มจะส่งผลร้าย ทำให้ robots หรือ spider ทำงานหนักขึ้น
และทำให้ มันทำงานได้ช้าลง โอกาสที่จะทำให้การพิจารณาให้ pagerank กระทบทันที
ปัญหายังไม่จบสำหรับคนไทย เมื่อคำในภาษาไทย จะถูกเข้ารหัสเป็น[tag]UTF-8 สำหรับ google[/tag] ในการประมวลผลของ [tag]googlebot[/tag] ซึ่งหาก programmer ส่งค่าใน parameter เป็นภาษาไทย ก็จะเป็นลักษณะด้านล่าง
%E0%B9%84%E0%B8%AD%E0%B9%89%E0%B8%A1%E0%B8%AD%E0%B8%A1%E0%B8%94%E0%B8%AD%E0%B8%97%E0%B8%84%E0%B8%AD%E0%B8%A1
ซึ่งยาวมาก (ส่วนท่านที่อยากรู้ว่า ข้อความนี้เป็นอะไร ลองคลิกดูได้ ที่นี่ ) นั่นเอง มันกลายเป็นยาขมสำหรับ Spider ไปในที่สุด
ประเด็นต่อมาคือ การสร้างเว็บในปัจจุบัน มักจะมีเว็บบอร์ด เพื่อสร้าง Comunity ภายในเว็บไซต์ และสคริปต์ฟรีเว็บบอร์ดลูกเล่นเยอะจึงเป็นทางเลือกที่ได้รับความนิยม ไม่ว่าจะเป็น IBP หรือในตระกูล Nuke ทั้งหลายแหล่ ซึ่งส่วนหนึ่งนั้น จะใช้การส่งค่า [tag]sesion หรือ cookies[/tag] ไปกับ url เพื่อตรวจสอบ หรือเพื่ออะไรบางอย่างก็แล้วแต่
ประเด็นอยู่ที่ว่า search engine ทั้งหลาย จะไม่สามารถใช้ประโยชน์จากลิ้งค์ ที่มีค่าพวกนี้ได้เลยแม้แต่น้อย เพราะ sesion และ cookies ถูกสร้างขึ้นเฉพาะตัวและเฉพาะเวลาหนึ่งเท่านั้น ไม่นาน sesion ,cookies เหล่านั้น ก็จะตายไป ลิ้งค์ ก็จะไม่สามารถใช้ได้ในที่สุดนั่นเอง
จากที่ได้กล่าวมาแล้วว่า Robots ทั้งหลาย จะ crawl ไปตามลิ้งค์ในหน้าเว็บ ดังนั้น เราใส่ลิ้งเยอะๆ ก็จะดี bots จะอ่านหน้าเว็บเราได้ทุกหน้า เป็นความคิดดี แต่ไม่รุ่ง เพราะว่า Robots มักจะไม่อ่านลิ้งค์ ที่มากเกินกว่า 100-300 ลิ้งค์ในหน้าเว็บ
ทั้งนื้ เพื่อป้องกันการหลอกล่อ spider ข้างต้น ป้องกันการทำ [tag]link farm[/tag] รวมทั้ง เป็นการลดภาระ และลดเวลาในการอ่านหน้าเว็บอีกทางหนึ่งด้วย
นอกจากการไม่ทำลิ้งค์เกินกว่า 100-300 ลิ้งแล้วนั้น การทำลิ้งค์ที่ต้องคลิกมากกว่า 3 ครั้ง จึงจะไปถึงข้อมูล ยังทำให้ googlebots ไม่อ่านหน้าเว็บภายในอีกด้วย
สาเหตุนั้น น่าจะมาจาก การที่ google พยายามจะทำตัวให้เป็น search engine ที่ดี คนส่วนมาก ไม่คิดที่จะคลิกลิ้งค์ เกินกว่า 3-4 ลิ้งค์ จึงจะถึงข้อมูล ทำให้น่าจะเป็นที่มาที่ทำให้ spider ส่วนใหญ่ไม่อ่านลิ้งค์ ที่ลึกเกินกว่า 3 คลิก