February 2008

How to get back into Google.

เอาล่ะครับ หลังจากที่พูดมาหลายวันถึงเรื่องของการโดนแบนจาก Google ในเว็บต่างๆ อ่ะนะครับ วันนี้เลยมาพูดถึงกันดีกว่าครับว่า ทำอย่างไรจึงจะได้ index กลับคืนมาใน google ครับ

ในกรณีนี้ เคยเกิดขึ้นที่เป็นกระฉ่อนโลก ก็คือเคสของ BMW.de ครับ ซึ่งรายนั้นได้จ้างบริษัททำ seo รายหนึ่ง แล้วจัดการปั่นอันดับให้ด้วยการทำ Cloaking ครับ [ดูรายละเอียดเกี่ยวกับ cloaking และเคสของ BMW.de] โดยในคราวนั้นทาง BMW ใช้เวลาประมาณ 5 วันหลังจากโดนแบนเพื่อกู้ index กลับคืนมานะครับ

แน่นอนว่า ในการกู้ index กลับมาในแต่ละครั้ง แต่ละเว็บใช้เวลาไ่ม่เหมือนกันนะครับ ในการกู้ รวมทั้งจะได้หรือไม่นั้นก็เอาแน่นอนไม่ได้เหมือนกันครับ เท่าที่ทราบมาใช้เวลาตั้งแต่ 48 ชั่วโมง ไปจนถึง 6 เดือน หรือตลอดไป

สำหรับการกู้เว็บนั้นให้เริ่มต้นอย่างนี้นะครับ

1. ให้ทำการเช็คก่อนว่า เว็บเราผิดตรงไหนบ้าง พยายามหาที่ผิดกฏให้ได้ครับ ไม่ว่าจะเป็นสิ่งที่ทำผิดกฏไปเช่น Doorway page, Cloaking,hidden text, duplicate site/content ตรงไหนบ้าง ซึ่งงานนี้ต้องหาให้เจอครับ (จริงๆ แล้วถ้าทำอะไรไปควรจะต้องรู้ว่าทำอะไรไปบ้าง)

2. ในข้อถัดมานั้น อาจจะทำหรือไม่ทำก็ได้นะครับ เพราะเท่าที่ผมทราบมามีทั้งที่ทำและก็ไม่ได้ทำครับ นั่นคือการ block google bot ไว้ก่อนเพื่อไม่ให้ bot เข้ามาเก็บเนื้อหาส่วนที่เรายังแก้ไม่เรียบร้อยครับ เพราะหลายครั้งการแก้ไขไม่ใช่วันหรือสองวันเท่านั้นครับ แล้วแต่กรณีที่ทำไว้มา่กน้อยเพียงใด ครับ โดยการเขียน robot.txt ก็ได้ หรือจะใช้ meta="robot"  ก็ได้นะครับแล้วแต่สะดวก

3. ให้เช็คจนแน่ใจอีกครั้งครับว่า สิ่งที่ทำลงไปนั้นมีส่วนใดผิด อีกหรือไม่ หรือหลงเหลืออะไรอยู่บ้างที่ยังผิดอยู่ เรียกง่ายว่า Cleaning ให้หมดจดล่ะครับ

4. ให้เข้าไปที่ Google webmaster central ครับ สำหรับท่านที่สมัครไว้แล้วก็ไม่ต้องสมัครใหม่ แต่ถ้าใครไม่เคยใช้งานเลยก็ให้สมัครใช้งานครับ

5. ให้ทำการเพิ่ม site เข้าไปครับ สำหรับท่านที่เพิ่งจะสมัครใหม่นะครับ และให้ทำการ verify site ด้วยครับ ส่วนท่านที่สมัครไว้ก่อนแล้วให้ทำการข้ามขั้นนี้ไปเลยนะครับ

6. หลังจากนั้นเมื่อทำการ verify site แล้วนะครับ ให้ทำการยื่นอุทรณ์ ครับ (ผมเรียกว่าอย่างนั้นอ่ะนะครับ) ให้คลิกเข้าไปที่ tool แล้วก็ คลิกตรง Reinclusion request ครับ แล้วให้ทำไปตามขั้นตอนในนั้นครับผม

สุดท้ายแล้ว ก็ให้รอครับ รอการพิจารณาจาก google อีกทีครับ ซึ่งจะได้ไม่ได้อย่างไรนั้น ขึ้นอยู่กับว่าเรา Cleaning site ได้แค่ไหนนะครับ โดยไม่มีระยะเวลาที่ตายตัวนะครับ ดังนั้นต้องรออย่างเดียวเลยครับ

ปล.ขออภัยท่านที่ถามเข้ามาด้วยอ่ะนะครับ พอดีเมื่อวานไม่ได้เข้าเช็คเมล์กะบล็อกในตอนเย็นน่ะครับ เหอๆ พอดีนั่ง Design เว็บบล็อกใหม่น่ะครับ เลยทำให้ไม่ได้เช็คครับผม ซึ่งถ้าอ่านแล้วมีปัญหาอะไร ก็สอบถามเข้ามาได้ครับ จะพยายามเช็คอยู่เป็นระยะๆ นะครับ

New eblogbiz.com

Update 02/02/2008 : Download this Theme click here.

About This Theme.

Free wordpress theme - eblogbiz 2.0
This theme is 3-column.

Feature.
- Clean design.
- xhtml and CSS Valid.
- Built one box for google adsense/other ads. (edit in sidebar.php)
- Best view for Firefox, IE6 and IE7.
- Design for 1024x768 (fix width).
- Compatible with WordPress Version 2.2.1, 2.2.2 and 2.3

-----------------------------------

วันนี้แวะมาอัพเดทตอนดึกหน่อยครับ ไม่มีอะไรมากครับ แค่ทดสอบ Theme ใหม่ของ eblogbiz ครับผม นั่งคิดมาตั้งแต่ปีใหม่แล้วครับ แต่ยังไม่มีเวลาทำ เลยนั่งเล่นซะเมื่อวานเย็น ไปเรื่อยจนถึงตอนดึก

ก็ได้โครงหน้าออกมาครับ วันนี้ก็เลยนั่งเก็บรายละเอียดให้ครบถ้วนครับ พร้อมทั้ง valid xhtml, css ให้ผ่าน แต่เหมือนว่ายังติดอยู่อีกนิดหน่อยครับ กับพวก plug-in และ tag เก่าๆ ครับ

ซึ่งถ้าเป็นบล็อกที่ลงใหม่ ก็จะผ่านได้เลยทันที เหอๆ

ไม่ไหวล่ะครับ เหนื่อย ไปอาบน้ำนอนแล้ว เหอๆ

ADSL or Dial-up.

แวะมาอัพบล็อกครับ ไม่รู้จะหาที่บ่นตรงไหนดี เพราะพักนี้เน็ตที่บ้านเน่ามากๆ ครับ บางทีเปิดรูปไม่ขึ้น เลยเหอๆ ใครเป็นมั่งอ่ะครับ กับเน็ตทรูเนี่ยครับ สงสัย

Hello Thailand ICT.

เอาละ่ครับ นอกเรื่องอีกวันนึง หลังจากที่ประเทศไทย เราก็ได้ทำการปฏิวัติ รัฐประหาร กันไปอ่ะนะครับ ถูกใจใครหลายคนไปแล้ว (หนึ่งในนั้นคือผม 555+) แน่นอนครับว่า มันก็ไม่ใช่เรื่องดีนัก แต่ในที่สุดก็มีการเลือกตั้งไปครับ แม้ว่าหน้าตาของทีมงานในสภาจะไม่ได้ต่างไปจากเดิมเท่าไหร่ ไม่ว่าฝ่ายไหนครับ (ไม่ถูกใจซักคน)

แต่ที่แน่ๆ ครับว่า มันจะดูไ่ม่ค่อยเกี่ยวข้องกันเท่าไหร่ แต่ก็อดไ่่ม่ได้ครับที่จะต้องไปดูหน้าตาของ รมว.ไอซีทีซะหน่อย เพราะอย่างน้อยคิดว่ามันคงต้องมีส่วนของเนื้อหาในงานเีกี่ยวข้อง หรือาจจะมีผลกระทบต่อทางด้านเว็บไซต์กันบ้างล่ะครับ

นายมั่น พัธโนทัย รมว.กระทรวงเทคโนโลยีสารสนเทศและการสื่อสาร

มีชื่อติดทำเนียบสภาล่างตั้งแต่ปี 2531 ในฐานะส.ส. สมุทรปราการ ด้วยเพราะเป็น “เด็กสร้าง” ของ “เจ้าพ่อปากน้ำ” ที่ชื่อ “วัฒนา อัศวเหม” ประธานพรรคเพื่อแผ่นดิน อดีตหัวหน้าพรรคราษฎร แต่ต่อมาได้รับการพิสูจน์ฝีมือและความไว้วางใจ จนขยับชั้นขึ้นเป็น “มือขวาเจ้าพ่อ” ได้รับการผลักดันให้เป็นเลขาธิการพรรคราษฎร นอกจากนี้ไม่ว่า “วัฒนา” จะย้ายไปนั่งเก้าอี้รัฐมนตรีในกระทรวงใด “มั่น” ก็จะตามไปเป็นเลขานุการรัฐมนตรีทุกครั้งทั้งในกระทรวงอุตสาหกรรม กระทรวงมหาดไทย รมต. ประจำสำนักนายกรัฐมนตรี ฯลฯ

กระทั่งปี 2544 ชีวิตการเมืองของเขาเข้าสู่ยุคตกอับ เมื่อ “วัฒนา” ตัดสินใจเซ้งพรรคราษฎรให้ ก่อนเปลี่ยนหัวใหม่เป็นพรรคมหาชน ซึ่งปรากฏว่า “พล.ต. สนั่น ขจรประศาสน์” “วัฒนา” และลูกหลานสอบตกยกครัวเพราะพ่ายคู่แข่งขันจากพรรคไทยรักไทย ทำให้ชื่อของ “มั่น” พลอยหายไปจากสาระบบการเมืองด้วย ก่อนโผล่ขึ้นมาใหม่ในนามส.ว. สมุทรปราการปี 2549 แต่เมื่อ “วัฒนา” กลับมาลงทุน-ลงแรง-ลุยทำพรรคการเมืองอีกครั้ง ก็ปรากฏชื่อ “มั่น” เป็นรองหัวหน้าพรรคน้องใหม่ทันที

ดูหน้าดูตาแล้ว ไม่รู้นะครับ ว่าหลายๆท่านจะคิดอย่างไร ส่วนผมเีนี่ย หุหุ ไม่ขอเอ่ยดีกว่า เดี๋ยวจะโดนไม่ใช่น้อย ขอดูผลงานอยู่ห่างๆ ดีกว่าครับ

จบดีๆ ว่าสำหรับ entry นี้เนี่ย เพื่อความสงบสุขของโลกครับ

ประกาศพักการอัพบล็อกชั่วคราวครับ

ไม่ได้งอน หรือไม่ได้โดนสั่งปิดครับ

อันนี้ กว่าจะอัพได้ประมาณ ครึ่งชั่งโมง 

แค่ไว้อาลัยให้กับ

อินเตอร์เน็ตห่วย บ้านเราครับ พอดีผมเลือก ทุยอินเตอร์เน็ต อยู่ครับ มันก็ทุยใช้ได้เลย วันดีคืนดีนั่งทำเว็บตัวเอง ดัน connect host ไม่ติด แต่เข้าเว็บตัวเองได้ วันดีคืนดี เข้า host ได้แต่เข้าเว็บตัวเองไม่ได้ DNS วิ่งเพี้ยนๆ บางทีสัง flushdns หายบ้างเป็นพักๆ

เร่งหน่อย ก็ต้องใช้ proxy มั่ง ใช้ tor มั่ง แต่ก็ไม่ได้เร็วเท่าไหร่

เห้อ เสียค่าเน็ตเดือนละเกือบพัน แต่เวลาใช้งานอย่างกับขอเน็ตเค้าใช้ครับ

เซ็งจิต

ปล.แวะมาบ่นและก่นด่าหน่อยล่ะกัน อัดอั้นครับ ทีแรกว่าวันนี้จะอัพบล็อกเรื่องอื่น แต่เข้าบล็อกตัวเองไม่ได้ ซักกะเว็บเดียว หมดอารมณ์เขียนเลยครับ เห้ออออออออออ

ปล2. บ่นไว้ก่อน เผื่อว่า ทีมงานทุย ห่วยสปีดอินเตอร์เน็ตจะแวะมาเห็น

Good job! Thailand ICT.

อดไม่ได้ครับ แต่ไม่เป็นไรครับ เพราะว่าเน็ตที่ Office ไม่ได้ใช้บริการของ ทุยไหสปีด ครับ เลยสามารถใช้งานได้ บวกกับลงเจ้า flock browser ครับ ซึ่งมีลูกเล่นแจ่มใช้ได้ จริงๆ ลงมารอบที่สองหรือสามแล้วครับ แต่ว่าเวอร์ชั่นก่อนลองลงพวก addon ของ firefox ไปแล้วมันเจ๊งๆ เลยเลิกไป แต่คราวนี้ลองดูอีกรอบนึง ใช้ได้หมดเลย แจ่มโคตร

กลังมาเข้าเรื่องครับ ที่วันนี้ต้องมาอัพ เพราะว่าได้อ่านเจอนโยบายของรัฐมนตรี ICT คนใหม่ครับ ซึ่งมันแจ่มเป็ดมากๆ ครับ เลยเอามาให้ดูกันทีละข้อครับ

1. จัดทำแผนแม่บทไอซีทีฉบับที่ 2 ให้แล้วเสร็จ
2. ส่งเสริมการมีสัญญาณไวไฟและไวแม็กซ์สาธารณะ เพื่อให้ประชาชนใช้ได้โดยไม่เสียค่าใช้จ่าย โดยเฉพาะในสถานศึกษา กำหนดครอบคลุมในปีหน้า
3.พัฒนาและส่งเสริมการสร้างสื่อแบบเปิด ลักษณะเดียวกับวิกิพีเดีย
4. สนับสนุนการพัฒนาระบบซอฟต์แวร์ปฏิบัติการแบบเปิด นำร่องที่กระทรวงไอซีที
5.พัฒนาโครงข่ายสารสนเทศความเร็วสูง อินเทอร์เน็ตความเร็วสูงเข้าถึงระดับตำบล
6. สนับสนุนอุตสาหกรรมซอฟต์แวร์
7. ปรับปรุงกฎหมายอาชญากรรมคอมพิวเตอร์ให้ปฏิบัติได้จริง และออกกฎหมายป้องกันความเป็นส่วนตัว
8. จัดตั้งโครงการ ไอ-สคูล ใช้สื่อสารสนเทศพัฒนาหลักสูตรการเรียนการสอน

อ่านข่าวเต็มๆ ที่ กรุงเทพธุรกิจ ครับ

ซึ่งสำหรับในบางข้อดูแล้ว แจ่มครับ อย่างข้อ 2 กับ 5 เพราะเรื่องของ wifi เนี่ยผมจะได้วางแผนเล่น macbook air ได้ เหอๆ

ส่วนข้อ 5 เนี่ยไม่ต้องบอกครับ entry ก่อนหน้านี้ บ่งบอกถึงความเร็วของ ทุย อินเตอร์เน็ตได้ดี

ส่วนข้ออื่นๆ นี่เห็นมาแทบทุกสมัยแล้วนะครับ Open source ก็ไม่เห็นจะเป็นเรื่องเป็นราวกันเท่าไหร่ เพราะว่า สุดท้ายแล้ว คนไทย ไม่กล้าที่จะเปลี่ยนครับ อย่างผมลองเปลี่ยนมาสามสี่รอบแล้ว แต่คนอื่นๆ ไม่เปลี่ยน เวลาส่งไฟล์ไปเจ๊ง ผมก็โดนด่าอีกว่าทำไม ไม่ใช่ word, excel ไอ้ผมก็สวนกลับไปว่า แล้วทำไมต้องใช้ word, excel ด้วย ... ยาวล่ะครับงานนี้ 5555+

Google toolbar version 5 Update!

ช่วงนี้ อาจจะพอได้อัพเดทบ่อยขึ้นครับ หลังจากที่พึ่งพาเข้า Flock ซึ่งมีระบบ bloging ในตัวครับ ทำให้เขียน blog ได้ง่าย เลยเร็วขึ้นครับ ไม่ต้อง login เข้าเว็บตัวเองด้วยซ้ำ แถมยังเก็บไว้บนเครื่องได้ก่อนด้วยครับ ใครอยากลองก้ลองหาโหลดมาใช้งานดูครับ โดยถ้าผมชอบอะไร ก็คลิกๆ ลากๆ คลิกขวา แล้วกด blog มันก็มี text editor ขึ้นมาให้เขียนแล้ว แจ่มใช่ไหมครับ อีกทั้งมันก็ login ให้เสร็จเลย คราวนี้เน็ตเน่าเน็ตช้ายังไง ก็ยังเขียน blog ได้

เช้านี้เลยแวะเข้ามา update ข่าวของ Google Toolbar กันหน่อยครับ เหมือนว่าเพิ่ม feature ใหม่เข้าไปอีกน่ะครับ ซึ่งคิดว่าเยอะทีเดียวครับ รวมถึงการสร้างหน้า 404 ได้เองอีกด้วยครับ ซึ่งอันนี้ ยังไม่ว่างลองครับ เพราะเดี๋ยวเช้านี้มีประชุม ถ้าโหลดแล้ว ลองแล้วจะมา update อีกรบอนึงนะครับ

Embedded Video

คราวนี้มี video ด้วยนะครับ ไม่รู้ว่ามันจะเล่นรึเปล่า เพราะว่า ยังไม่ได้เข้า blog นะครับ เหอๆ ถ้ายังไง เดี๋ยวประชุมเสร็จจะมา update กันอีกรอบนึงครับ

Flock มันแจ่มจริงๆ เลย แต่ว่าเหมือนยังไม่ผู้ระบบโพสต์ tag ของ wordpress นะเนี่ย

ปล. เมื่อไหร่ ดาราโอเกะ อะไรนี่ มันจะเลิก spam ครับ เซ็ง เดี๋ยวปั่น keyword ด่าเลยนี่ครับ

Tags: ,

Tags :

Twitthis!

หลังจากที่ลองเล่น twitter เป็นพักๆ ไม่ได้เล่นเป็นจริงเป็นจัง แต่หลังจากที่ช่วงติดตามข่าวการเปิดตัวของ macbook air แล้วทำให้รู้สึกชื่นชอบเป็นการส่วนตัว บวกกับมีผู้คลั่งไคล้ twitter สนับสนุนให้เล่นด้วยครับ  แล้วมารวมกับเจ้า flock อีก มันยิ่งทำให้ แค่ผมคลิกขวา แล้วกด twitthis แค่นั้น ก็สามารถส่งข้อความเข้าในระบบได้แล้วครับ

ยิ่งตอนนี้ ลง plugin twit tool ไปด้วย ยิ่งทำให้ง่ายเข้าไปใหญ่ ทั้งสามารถให้มันรวมสิ่งที่ผม tweet ไว้ทั้งวันมาเก็บเป็น daily post ได้อีกด้วย

โอ้วว มันช่างแจ่มจริงๆ เลย

7 must-read Webmaster Central blog posts from Google Webmaster Central Blog

คิดว่าเป็นสิ่งที่คนทำ seo ส่วนใหญ่ หรือว่ามือใหม่มักจะสงสัยครับ อ่านเจอเลยเอมาให้อ่านกัน เอาไว้ จะมาแปลงเป็นไทยให้อ่านกันอีกทีนะครับ (โอ้ว เห็นป่าวว่า flock มันดีอย่างนี้ล่ะ)

1. Googlebot can't access my website.
Web hosters seem to be getting more aggressive about blocking spam bots and aggressive crawlers from their servers, which is generally a good thing; however, sometimes they also block Googlebot without knowing it. If you or your hoster are "allowing" Googlebot through by whitelisting Googlebot IP addresses, you may still be blocking some of our IPs without knowing it (since our full IP list isn't public, for reasons explained in the post). In order to be sure you're allowing Googlebot access to your site, use the method in this blog post to verify whether a crawler is Googlebot.

2.URL blocked by robots.txt
Sometimes the web crawl section of Webmaster Tools reports a URL as "blocked by robots.txt", but your robots.txt file doesn't seem to block crawling of that URL. Check out this list of troubleshooting tips, especially the part about redirects. This thread from our Help Group also explains why you may see discrepancies between our web crawl error reports and our robots.txt analysis tool.

4. Why was my URL removal request denied?
(Okay, I'm cheating a little: this one is a Help Center article and not a blog post.) In order to remove a URL from Google search results you need to first put something in place that will prevent Googlebot from simply picking that URL up again the next time it crawls your site. This may be a 404 (or 410) status code, a noindex meta tag, or a robots.txt file, depending on what type of removal request you're submitting. Follow the directions in this article and you should be good to go.

5.Flash best practices
Flash continues to be a hot topic for webmasters interested in making visually complex content accessible to search engines. In this post Bergy, our resident Flash expert, outlines best practices for working with Flash.

6.The supplemental index
The "supplemental index" was a big topic of conversation in 2007, and it seems some webmasters are still worried about it. Instead of worrying, point your browser to this post on how we now search our entire index for every query.

7.Duplicate content
Duplicate content—another perennial concern of webmasters. This post talks in detail about duplicate content caused by URL parameters, and also references Adam's previous post on deftly dealing with duplicate content, which gives lots of good suggestions on how to avoid or mitigate problems caused by duplicate content.

8.Sitemaps FAQs
This post answers the most frequent questions we get about Sitemaps. And I'm not just saying it's great because I posted it. :-)

Official Google Webmaster Central Blog: 7 must-read Webmaster Central blog posts

Tags: , ,

Tags :

Twitter Updates for 2008-02-13

  • Microsoft Live Search Streamlines Web Crawler Efficiency {more at http://www.searchengineworld.com/microsoft/3456873.htm} #
  • Google toolbar V.5 http://tinyurl.com/2yjk2y #
  • Reading: "Bloomberg.com: Exclusive" (http://tinyurl.com/34xu8e) #
  • Reading: "Firefox 3 Beta 3 Released - Try It If You Dare" (http://tinyurl.com/2rh89s) #
  • Looking at: "Spottt - Free Link Exchange" (http://tinyurl.com/2k35jd) #
  • meeting!!! #
  • Looking at: "Twitter for WordPress - Rick’s HideOut" (http://tinyurl.com/yw6gr4) #
  • Reading: "SearchEngineWorld" (http://tinyurl.com/bdf7a) #
  • Reading: "Techcrunch" (http://tinyurl.com/otym4) #
  • work inhttp://www.yicrosoft-directory-th.com #
  • Reading: "Search Engine Strategies - the intersection of search, marketing & commerce" (http://tinyurl.com/e5cbx) #
  • Valentine day is One day on calendar,Not important. #
Tags :

About Google and Crawl rate.

อัพเดท กันอีกแล้วครับ 555+ หลายท่านที่แวะเวียนเข้ามา อาจจะเห็นก่อนหน้านี้ เห็นว่าผมเขียนประกาศพักอัพเดทชั่วคราว แต่พฤติกรรมมันกลับตรงกันข้ามโดยสิ้นเชิงครับ 555+

งานนี้ ก็คงต้องบอกว่า มันเป็นผลมาจากเจ้า flock นี่ล่ะครับ ที่ช่วยให้ผมสามารถทำอะไรได้สะดวกขึ้น เหอๆ เพราะแม้ว่า ผมกลับบ้าน นึกอยากจะเขียน blog อะไร ก็ทำได้เลยครับ แม้ว่า up ใน blog ไม่ได้ก็ เก็บไว้ก่อน เช้ามาถึง office เปิดมาสั่ง public ก็จบแล้วครับ เหอๆ

อีกทั้งมันยังเป็น social network browser จริงๆ ครับ ทำให้หลายอย่าง ง่ายที่จะแชร์ ง่ายที่จะ tweet ซะอย่างงั้น

กลับเข้าเรื่องของเราครับ ซึ่งหลายท่านกระซิบถามเข้ามาเกี่ยวกับเรื่องของ google bot แล้วก็เรื่องของการ crawling ของ bot น่ะครับ เลยจะเอ่ยถึงปัจจัยในเรื่องของการ crawl ของ google กันคร่าวๆ ครับ

1. เรื่องของ Backlink กับ Relevant link
เชื่อว่า หลายท่านคงจะพอรู้แล้วครับว่า bot ทั้งหลายแหล่ นั้นวิ่งเก็บเว็บไซตืได้ด้วยลิ้งค์เท่านั้น ดังนั้นการที่ bot จะวิ่งมาได้ ก็ต้องอาศัยลิ้งค์มายังเว็บไซต์ของเราครับ ดังนั้น การที่เรามีเว็บไซต์ ลิ้งค์ มายังที่เว็บเราเยอะ เหมือนกับการสร้างทางมายังเว็บไซต์ ครับ นอกจากนี้ การมี Relevant link จากเว็บไซตืที่เกี่ยวข้องหรือเว็บไซต์ที่คล้ายคลึงกัน จะช่วยให้ การ crawl ของ bot ทำได้ดีขึ้นครับ เพราะเว็บไซต์ เนื้อหาในแต่ละกลุ่มนั้น จะมีอัตราการวิ่งของ bot ที่ต่างกันไปครับ

2. Link Structure
ในที่นี้หมายถึงลิ้งค์ภายในไซต์ของเรานะครับ ว่ามีโคลงสร้าง หรือมีการวางลิ้งค์ในรูปแบบไหนกันบ้าง เป็นประโยชน์หรือเป็นโทษกับ bot ในการวิ่งไปมาในเว็บของเราครับ ซึ่งอันนี้ต้องสงสัยครับ เพราะว่า ถ้าเราวางลิ้งค์ไม่ดี bot ก็วิ่งไม่ทั่วเว็บ ส่งผลต่อ อัตรา crawl ของ bot เหมือนกัน

3.Sitemap.
แน่นอนครับว่า อันนี้้ก็มีผล เช่นกัน แม้ว่า ทั้งน้องๆ ที่ office หรือคนรู้จักที่มาปรึกษาเรื่องนี้ ผมมักจะบอกว่า พร้อมหรือยังที่จะส่งเว็บไปออกรบในแนวหน้า ถ้าพร้อมจะพลีชีพแล้วล่ะก็ ให้ส่ง sitemap ไปเลย

อันนี้ไม่ได้ขุ่นะครับ แม้ว่า มันจะมีข้อดี แต่มันก็มีข้อเสียมากทีเดียวครับ ไม่ขอลงรายละเอียดแล้วกัน เพราะเรื่องของ sitemap เอง ในบล็อกผมก็เอ่ยมาหลายรอบแล้วเช่นกันครับ

4.Site Feed/RSS.
อย่างที่ผมเคยพูดถึงเจ้า Rss/feed เหล่านี้ มาตั้งแต่เมื่อช่วงเปิด Blog ใหม่ๆ และย้ำเสมอว่า มันคือ Format ในอนาคตที่จะช่วยให้เราทำ seo ง่ายขึ้น เพราะนอกจากมันจะมี bot ที่วิ่งเก็บ feed ต่างหากแล้ว ยังมีลักษณะเหมือน sitemap.xml อีกด้วย ดังนั้น จึงไม่แปลกที่ Search engine หลายๆ ที่ให้ความสำคัญ จนเปิดรับการ submit feed ของเราครับ

5.Pinging or Content Update.
เมื่อมีระบบ feed แล้ว การมีระบบ pinging ก็ถือเป็นสิ่งที่ระบบ Blog มาตรฐานทั่วไปต้องมีครับ เพราะระบบนี้มันเป็นเหมือนกับระบบที่เราส่งคนไปกดกริ่งหน้าบ้านของ Bot ทั้งหลายแหล่ครับว่า "Hey! googlebot, my site/blog updated. Please come to see me!"

นอกจากนี้ แม้ว่าเว็บเราจะไม่มีระบบ pinging แต่ว่ามีการ update สม่ำเสมอ ก็จะเป็นการช่วยให้ bot วิ่งบ่อยขึ้นครับ เพราะ bot ทุกค่ายเวลาเข้ามาเก็บ มันจะเก็บวันเวลาที่เข้ามาไว้ด้วย (เวลาที่เก็บไปของ Cache page ไงครับ) และเจ้า bot พวกนี้ ก็จะมีค่าหนึ่งที่กำหนดไว้ว่า ถ้าถึงจุดนี้แล้ว เนื้อหา/หน้าเว็บ ไม่มีการ อัพเดท มันก็จะลดอัตราการแวะเวียนเข้ามาเก็บ และท้ายที่สุด มันก็จะเลิกเก็บครับ ดังนั้น ควร update บ่อยๆ จะเป็นดีนะครับ

6. Server Speed.
อันนี้ เห็นผลมากทีเดียวครับ เพราะแม้ว่า คุณจะ update กันทุกลมหายใจ แต่ bot มาแล้วได้เป็น timeout กลับไป มันก็ไม่ได้ประโยชน์ ในการ crawl เลยแม้แต่น้อย เพราะ index ก็ไม่ได้, Cache ก็ไม่ได้ นอกจากนี้ bot ก็ไม่สามารถวิ่งต่อๆ ไปยังเนื้อหาตัวอื่นๆ ได้ครับ

7.Crawl rate setting in Google webmaster tool.
สำหรับข้อสุดท้ายนี้ สำหรับท่านที่ใช้ google sitemap ครับ แน่นอนหลังจากที่เรา verify site เป็นที่เรียบร้อยแล้ว (ไม่ต้อง submit sitemap ก็ได้นะครับ) จะมีให้เราเลือก set เจ้า crawl rate ตัวนี้ด้วยครับ จะมีให้เลือก 3 level ครับคือ Faster, Normal และ Slower ครับ ซึ่งในแต่ละ level จะมีให้เราเลือกได้ครับ

สำหรับเว็บเล็กๆ จะไม่สามารถเปิดในระดับของ Faster ได้นะครับ จะต้องมีเนื้อหา/page พวกนี้เป็นจำนวนมากๆ และมีการ update เป็นประจำ ถึงจะเปิดได้ครับ นอกจากนี้ การเปิด Faster ก็อาจจะส่งผลเสียต่อ server ได้อีกด้วยครับ จะมีอาการถูก Request จำนวนมาก และถี่ เข้ามาที่ server ครับ จะเรียกว่า น้องๆ ของการยิง server ก็ว่าได้ครับ

ส่วนเว็บไหนที่ server ต้องรับภาระหนักอยู่แล้วหรืออาจจะไม่กล้าแข็งพอที่จะรองรับได้ก็ ให้ลอง set เป็น slow ก็ได้ครับ ประมาณว่า ช้าแต่ชัวร์ อะไรพวกนี้ล่ะครับ

Leading Search Engines - January, 2008

เจอข้อมูล Update เลยเอามาฝากกันครับ แต่เป็นชองทางฝั่ง USA นะครับ

Rank : Search Engine Volume
1. www.google.com 65.98%
2. search.yahoo.com 20.94%
3. search.msn.com 5.16%
4. www.ask.com 4.21%
Source - Hitwise - January, 2008 - based on volume of searches.

Hitwise US - Leading Search Engines - January, 2008

Twitter Updates for 2008-02-14

  • At: "Seo Book Keyword Suggestion Tool" (http://tinyurl.com/2n3etc) #
  • Reading: "Link Building Guide for 2008 | Creative Link Building" (http://tinyurl.com/38fxxy) #
Tags :

Twitter Updates for 2008-02-15

  • Reading: "Social Gaming Network" (http://tinyurl.com/22pyqt) #
  • Reading: "zynga game network" (http://tinyurl.com/3ygazb) #
  • Looking at: "Topper Search" (http://tinyurl.com/35mu7o) #
  • Reading: "Fwdder.com - Body Limited Mouse สุดเซ็กซี่" (http://tinyurl.com/3ab73p) #
  • Fucking ISP. #
  • i want to sleep......... #
  • Reading: "Snow in Vietnam - Manager Online" (http://tinyurl.com/37hdwj) #
  • Looking at: "WordPress 2.5 Demo Site" (http://tinyurl.com/2ueta6) #
  • Oh!!! wordpress admin big change. #
  • Can't open gmail.com. #
  • Yes, Internet is comeback. #
  • Money received from Ziddu #
  • Godaddy domain renew code: cjcbentld
    $6.99 #
Tags :

Twitter Updates for 2008-02-16

  • Reading: "Babyplays - online baby toy rental" (http://tinyurl.com/2ubchj) #
Tags :

Twitter Updates for 2008-02-17

  • Cool ISP. can't open gmail. #
  • True internet is suck! Can't open gmail2. #
  • Reading: "David Lawee New Head Of Google Corporate Development" (http://tinyurl.com/otym4) #
Tags :

Twitter Updates for 2008-02-18

Tags :

Twitter Updates for 2008-02-19

  • Reading: "Yahoo Can’t Find the Pirate Bay" (http://tinyurl.com/2sg9nd) #
  • Looking at: "PHP: PHP.net Search Bars" (http://tinyurl.com/2wybgt) #
  • Reading: "Lawsuit claims Google stole idea for Sky layer in Earth | Tech news blog - CNET News.com" (http://tinyurl.com/34te27) #
  • Reading: "30 Google Apps You’ve Never Heard Of" (http://tinyurl.com/24zs27) #
  • Looking at: "ลุงหมัก โชว์พาว" (http://tinyurl.com/2nc3ro) #
  • Reading: "v7n being sold!!" (http://tinyurl.com/3crvsm) #
  • Reading: "What's new in PHP 5.3? [PHP & MySQL Tutorials]" (http://tinyurl.com/33mdjv) #
Tags :

Twitter Updates for 2008-02-20

  • Reading: "Oh!! Noooooooo :ชงตั้ง"วัน(เฉลิม)-ชนมสวัสดิ์" เป็นเลขานุการ รัฐมนตรีวันนี้ " (http://tinyurl.com/2r9hu6) #
  • Reading: "รวมเคล็ดลับการอ่านหนังสือสอบ ให้ได้ผล" (http://tinyurl.com/364nh6) #
Tags :

Twitter Updates for 2008-02-21

  • Hello world!!! #
  • find something at yakruu.com,eiei. #
Tags :

SE News :Yahoo! Search Webmap (Yahoo! Developer Network blog)

แวะมาอัพเดทข่าวก่อนแล้วกัน เรื่องของ Yahoo search webmap.

The Webmap build starts with every Web page crawled by Yahoo! and produces a database of all known Web pages and sites on the internet and a vast array of data about every page and site. This derived data feeds the Machine Learned Ranking algorithms at the heart of Yahoo! Search.Some Webmap size data:

* Number of links between pages in the index: roughly 1 trillion links
* Size of output: over 300 TB, compressed!
* Number of cores used to run a single Map-Reduce job: over 10,000
* Raw disk used in the production cluster: over 5 Petabytes
Source : Hadoop running in production on the Yahoo! Search Webmap (Yahoo! Developer Network blog)

Blogged with Flock


Tags: , ,

Tags :

Twitter Updates for 2008-02-22

  • Reading: "500 Million Downloads of Firefox (almost)" (http://tinyurl.com/3dv2ph) #
  • Reading: "Hadoop running in production on the Yahoo! Search Webmap (Yahoo! Developer Network blog)" (http://tinyurl.com/22ek6f) #
  • Reading: "Yahoo! Search Blog: It's About the Customers" (http://tinyurl.com/yw6nsy) #
Tags :

Twitter Updates for 2008-02-23

  • Reading: "FinePix S100FS : Features - Film Simulation Mode, Bracketing Function. WoW!!!" (http://tinyurl.com/394x8f) #
Tags :

Twitter Updates for 2008-02-25

  • Reading: "Cmodz-Hosting - Quality not Quantity" (http://tinyurl.com/2njamr) #
  • Reading: "CyberBiz - Manager Online" (http://tinyurl.com/2wogdg) #
Tags :

Twitter Updates for 2008-02-27

  • Good moring #
  • what a hell!! จะบ้าตาย ตามเช็คขี้ไม่หมดซักที จะบ้า #
  • รวมเว็บส.ว. http://tinyurl.com/3ctgte #
  • @pittaya meeting room1 pls. #
Tags :

Twitter Updates for 2008-02-28

  • taksura is cool restaurant neer Rachatawee. #
Tags :