วันศุกร์ที่ 30 พฤศจิกายน พ.ศ. 2555

ประเภทของ search engine

Search engine

1. เว็บไซต์ Google (www.Google.com) เป็นเว็บไซต์ที่ให้บริการในการค้นหาข้อมูลในโลกของอินเตอร์เน็ต โดยค้นหาข้อมูลจากข้อความ หรือตัวอักษรที่พิมพ์เข้าไป แล้วทำการค้นหาข้อมูล รูปภาพ หรือเว็บเพจที่เกี่ยวข้องนำมาแสดงผล เว็บไซต์ Google ได้รับความนิยมอย่างมากในกลุ่มผู้ใช้งาน  อินเทอร์เน็ตที่ต้องการค้นหาข้อมูล

2.ยาฮู (Yahoo! Inc.)  คือบริษัทผู้ให้บริการอินเตอร์เน็ตสัญชาติอเมริกันซึ่งประกอบไปด้วยเว็บท่า เสริช์เอนจิน Yahoo! Directory, Yahoo! Mail, Yahoo! News, Yahoo! Photos (ซึ่งในวันที่ 20 กันยายน ปี 2550 ได้โอนไปรวมเข้ากับ Flickr), ฯลฯ ยาฮู! ก่อตั้งขึ้นโดยนักศึกษาปริญญาเอกสองคนจากมหาวิทยาลัยแสตนฟรอด เจอร์รี่ หยาง (Jerry Yang) และ เดวิด ฟิโล (David Filo) ในเดือนมกราคมปี 1994 และเริ่มดำเนินกิจการในรูปแบบบริษัทครั้งแรกในวันที่ 2 มีนาคม ปี 1995 ปัจจุบัน ยาฮู! มีบริษัทมีสำนักงานใหญ่ตั้งอยู่ที่เมืองซันนีเวล รัฐแคลิฟอร์เนีย ประเทศสหรัฐอเมริกา

3.เอ็มเอสเอ็น (MSN) หรือ ไมโครซอฟท์ เน็ตเวิร์ก (Microsoft Network) เป็นบริการทางอินเทอร์เน็ต โดยบริษัทไมโครซอฟ  โดยเริ่มจากการให้บริการฮอตเมล  และได้ขยายการบริการไปยังอื่น เช่น เอ็มเอสเอ็นเมสเซนเจอร์ ที่ได้รับความนิยมสูง จนล่าสุดได้เปลี่ยนชื่อเป็น วินโดวส์ไลฟ์ เมสเซนเจอร์

4.เอโอแอล  ย่อมาจาก America Online, Inc เป็นบริษัทอเมริกันที่ให้บริการทางด้านมัลติมีเดีย ของ Time WarnerAOL เป็นผู้ให้บริการข้อมูลทางเครือข่ายรายใหญ่ในสหรัฐอเมริกา ให้บริการในรูปแบบของศูนย์ BBS และให้บริการเข้าใช้อินเทอร์เน็ตนับตั้งแต่ปี 1993 และนับเป็นศูนย์บริการเครือข่ายขนาดใหญ่ที่สุดในสหรัฐอเมริกา




search engine



        search engine

เสิร์ชเอนจิน (search engine) คือโปรแกรมที่ช่วยในการสืบค้นหาข้อมูล โดยเฉพาะข้อมูลบนอินเทอร์เน็ตโดยครอบคลุมทั้งข้อความ รูปภาพ ภาพเคลื่อนไหว เพลง ซอฟต์แวร์ แผนที่ ข้อมูลบุคคล กลุ่มข่าว และอื่น ๆ ซึ่งแตกต่างกันไปแล้วแต่โปรแกรมหรือผู้ให้บริการแต่ละราย. เสิร์ชเอนจินส่วนใหญ่จะค้นหาข้อมูลจากคำสำคัญที่ผู้ใช้ป้อนเข้าไป จากนั้นก็จะแสดงรายการผลลัพธ์ที่มันคิดว่าผู้ใช้น่าจะต้องการขึ้นมา ในปัจจุบัน เสิร์ชเอนจินบางตัว เช่น กูเกิล จะบันทึกประวัติการค้นหาและการเลือกผลลัพธ์ของผู้ใช้ไว้ด้วย และจะนำประวัติที่บันทึกไว้นั้น มาช่วยกรองผลลัพธ์ในการค้นหาครั้งต่อ ๆ ไป
ประเภท Search Engine
1. Keyword Index   เป็นการค้นหาข้อมูล โดยการค้นจากข้อความในWeb Pageที่ได้ผ่านการสำรวจมาแล้ว จะอ่านข้อความ ข้อมูล อย่างน้อยๆ ก็ประมาณ ๒๐๐-๓๐๐ ตัวอักษรแรกของWeb Pageนั้นๆ โดยการอ่านนี้จะหมายรวมไปถึงอ่านข้อความที่อยู่ในโครงสร้างภาษา HTML ซึ่งอยู่ในรูปแบบของข้อความที่อยู่ในคำสั่ง Alt  ซึ่งเป็นคำสั่งภายใน TAG คำสั่งของรูปภาพ แต่จะไม่นำคำสั่งของ TAG อื่นๆ ในภาษา HTML และคำสั่งในภาษา JAVA มาใช้ในการค้นหา วิธีการค้นหาของ Search Engine ประเภทนี้จะให้ความสำคัญกับการเรียงลำดับข้อมูลก่อน-หลัง และความถี่ในการนำเสนอข้อมูลนั้น การค้นหาข้อมูล โดยวิธีการเช่นนี้จะมีความรวดเร็วมาก แต่มีความละเอียดในการจัดแยกหมวดหมู่ของข้อมูลค่อนข้างน้อย เนื่องจากไม่ได้คำนึงถึงรายละเอียดของเนื้อหาเท่าที่ควร แต่หากว่าต้องการแนวทางด้านกว้างของข้อมูล และความรวดเร็วในการค้นหา วิธีการนี้ก็ใช้ได้ผลดี
2. SubjectDirectories   การจำแนกหมวดหมู่ข้อมูล Search Engine ประเภทนี้ จะจัดแบ่งโดยการวิเคราะห์เนื้อหา รายละเอียด ของแต่ละWeb Page ว่ามีเนื้อหาเกี่ยวกับอะไร โดยการจัดแบ่งแบบนี้จะใช้แรงงานคนในการพิจารณาWeb Page ซึ่งทำให้การจัดหมวดหมู่ขึ้นอยู่กับวิจารณญาณของคนจัดหมวดหมู่แต่ละคนว่าจะจัดเก็บข้อมูลนั้นๆ อยู่ในเครือข่ายข้อมูลอะไร ดังนั้นฐานข้อมูลของ Search Engine ประเภทนี้จะถูกจัดแบ่งตามเนื้อหาก่อน แล้วจึงนำมาเป็นฐานข้อมูลในการค้นหาต่อไป การค้นหาค่อนข้างจะตรงกับความต้องการของผู้ใช้ และมีความถูกต้องในการค้นหาสูง เป็นต้นว่า หากเราต้องการหาข้อมูลเกี่ยวกับเว็บไซต์ หรือWeb Pageที่นำเสนอข้อมูลเกี่ยวกับคอมพิวเตอร์ Search Engine ก็จะประมวลผลรายชื่อเว็บไซต์ หรือWeb Pageที่เกี่ยวกับคอมพิวเตอร์ล้วนๆ มาให้
3. Metasearch Engines   จุดเด่นของการค้นหาด้วยวิธีการนี้ คือ สามารถเชื่อมโยงไปยัง Search Engine ประเภทอื่นๆ และยังมีความหลากหลายของข้อมูล แต่การค้นหาด้วยวิธีนี้มีจุดด้อย คือ วิธีการนี้จะไม่ให้ความสำคัญกับขนาดเล็กใหญ่ของตัวอักษร และมักจะผ่านเลยคำประเภท Natural Language (ภาษาพูด) ดังนั้น หากจะใช้ Search Engine แบบนี้ละก็ ขอให้ตระหนักถึงข้อบกพร่องเหล่านี้ด้วย

การทำงานของ
 Search Engine  

ประกอบไปด้วย ๓ ส่วนหลัก ๆ คือ
๑. Spider หรือ Web Robot จะเป็นตัวที่ทำหน้าที่เข้าสำรวจเว็บไซต์ต่างๆ แล้วดึงข้อมูลเหล่านั้นมาอัพเดทใส่ในรายการฐานข้อมูล ส่วนมาก Spider มักจะเข้าไปอัพเดทข้อมูลเป็นรายเดือน
๒. ฐานข้อมูล (Database) เป็นส่วนที่เก็บรายการเว็บไซต์ ฐานข้อมูลที่ดีควรจะมีขนาดใหญ่เพียงพอที่จะรองรับกับการเติบโตของเว็บไซต์ในปัจจุบัน การออกแบบฐานข้อมูลที่ดีก็เป็นส่วนสำคัญเพราะถ้าฐานข้อมูลออกแบบมาทำงานช้าก็ทำให้การรอผลนานและจะไม่ได้รับความนิยมไปในที่สุด
๓.โปรแกรม Search Engine มีหน้าที่รับคำหรือข้อความที่ผู้ใช้งานป้อนเข้ามา แล้วเข้าค้นหาตามเว็บไซต์ต่างๆ ที่จัดเก็บไว้ในฐานข้อมูล จากนั้นก็จะรายงานผลเว็บไซต์ที่ค้นพบให้กับผู้ใช้ การสืบค้นด้วยวิธีนี้นอกจากจะต้องมีระบบการสืบค้นข้อมูลที่รวดเร็วและมีประสิทธิภาพแล้ว การกลั่นกรองผลที่ได้ เพื่อให้ตรงกับความต้องการของผู้ใช้ก็เป็นอีกส่วนหนึ่งที่สำคัญของการสืบค้นข้อมูล