การจัดเก็บ
การค้นคืนและการค้น(หา)
การค้นคืนสารสนเทศ
สารสนเทศ (Information) มีความสำคัญเกี่ยวข้องกับการดำรงชีวิตของมนุษย์ แหล่งที่จะอำนวยความสะดวกมากที่สุดที่ทำให้เข้าถึงสารสนเทศที่ต้องการ คือ แหล่งสารสนเทศที่เป็นทางการและเป็นระบบซึ่งทำหน้าที่จัดรวบรวมสารสนเทศและ จัดเก็บอย่างเป็นระบบ และสามารถค้นคืนได้อย่างมีประสิทธิภาพ ได้แก่ ระบบสารสนเทศ (Information system) ระบบสารสนเทศทำหน้าที่เกี่ยวข้องโดยตรง กับการจัดเก็บและการค้นคืนสารสนเทศให้แก่ผู้ใช้ ประสิทธิภาพของระบบขึ้นอยู่กับการดำเนินงานจัดเก็บและค้นคืน
ระบบสารสนเทศบางครั้งเรียกว่า ระบบจัดเก็บและค้นคืนสารสนเทศ (Information and Retrieval Sytem หรือใช้คำย่อว่า ISARS) หรือ ระบบค้นคืนสารสนเทศ (Information Retrieval System หรือ IRS )
การจัดเก็บและการค้นคืน (knowledge storage and retrieval) ต้องกำหนดสิ่งสำคัญที่จะเก็บไว้เป็นองค์ความรู้ และต้องพิจารณาถึงวิธีการในการรักษา และการนำมาใช้ให้เกิดประโยชน์ตามความต้องการ ผู้จัดเก็บต้องเก็บรักษาสิ่งที่เรียกว่าเป็นความรู้ไว้ให้ดีที่สุด ไม่ว่าจะเป็นข้อมูลสารสนเทศ ตลอดจนผลสะท้อนกลับ การวิจัยและ การทดลอง การจัดเก็บเกี่ยวกับด้านเทคนิค เช่น การบันทึกเป็นฐานข้อมูล หรือการบันทึกเป็นลายลักษณ์อักษรที่ชัดเจน รวมทั้งที่เกี่ยวข้องกับกระบวนการทางมนุษย์ด้วย เช่น การสร้างและการจดจำของปัจเจกบุคคล เป็นต้น ทั้งนี้การสะสมความรู้ ผู้จัดเก็บควรคำนึงถึง โครงสร้างการจัดเก็บความรู้ ควรเป็นระบบที่สามารถค้นหาและส่งมอบได้อย่างถูกต้องและรวดเร็ว ทันเวลาและเหมาะสมกับความต้องการ และจัดให้มีการจำแนกรายการต่าง ๆ ที่อยู่บนพื้นฐานความจำเป็นในการเรียนรู้ ผู้จัดเก็บต้องพิจารณาความแตกต่างของกลุ่มคนในการค้นคืนความรู้ ต้องมีการจัดหมวดหมู่ตามองค์ประกอบต่าง ๆ เช่น ตามวัตถุประสงค์ของงาน ความชำนาญของผู้ใช้ เป็นต้น และผู้จัดเก็บต้องหาวิธีทำให้ผู้ใช้ทราบถึงช่องทางหรือวิธีการสำหรับค้นหาความรู้ เช่น การทำสมุดจัดเก็บรายชื่อ และทักษะของผู้เชี่ยวชาญ
การค้นคืน (Retrieval) หมายถึง การได้รับสิ่งที่ต้องการกลับคืนมา การค้นคืนสารสนเทศ (Information retrieval) จึงเป็นการกระทำใด ๆ ที่คัดเลือกสารสนเทศจากแหล่งเก็บเพื่อทำให้ได้รับสารสนเทศตามที่ต้องการ ซึ่งอาจเป็นข้อมูล หรือ รายการเอกสารซึ่งบรรจุเนื้อหาที่ต้องการ การค้นคืนสารสนเทศมีความหมายเช่นเดียวกับการค้นวรรณกรรม (Literature searching) ซึ่งหมายถึง กระบวนการค้นเอกสาร เพื่อให้ได้เอกสารที่เกี่ยวข้องกับเรื่องใดเรื่องหนึ่ง หลักการสำคัญของการค้นคืนสารสนเทศ คือ การค้นหาและนำสารสนเทศที่ตรงตามความต้องการ ส่งให้แก่ผู้ใช้อย่างรวดเร็ว ทันการ ระบบใดก็ตามที่ได้รับการออกแบบเพื่ออำนวยความสะดวกในการค้นสิ่งพิมพ์ จึงเรียกว่า ระบบค้นคืนสารสนเทศ ตัวอย่างเช่น บัตรรายการ สิ่งพิมพ์ดรรชนี เป็นต้น
ความรู้ไม่สามารถถ่ายทอดจากบุคคลหนึ่ง ไปสู่อีกบุคคลหนึ่งโดยตรงเสมอไป จึงต้องมีแหล่งเก็บรวบรวมความรู้ คือ ระบบสารสนเทศ ซึ่งเป็นระบบที่ทำหน้าที่รวบรวม จัดเก็บ และนำสารสนเทศไปใช้ในองค์กร ระบบทำหน้าที่เป็นช่องทาง (Channel) ของสารสนเทศ ระบบประกอบด้วยคน ครุภัณฑ์ และกระบวนการ
บ่อยครั้งที่คนมักคิดว่าระบบสารสนเทศประกอบด้วยระบบคอมพิวเตอร์และมี ฐานข้อมูล (Databases) จัดเก็บสารสนเทศเท่านั้น โดยลืมนึกถึง "คน" ซึ่งทำหน้าที่รวบรวมสารสนเทศจากแหล่งต่างๆ และจัดเก็บไว้ในฐานข้อมูล
ระบบสารสนเทศเป็นการสื่อสารในรูปแบบหนึ่ง ประกอบด้วยการส่งสาร จากแหล่งหนึ่งไปสู่แหล่งหนึ่ง ระหว่างการส่งสาร สารจะมีคุณภาพต่อผู้รับหรือไม่ ขึ้นอยู่กับว่ามีสิ่งรบกวน (Noise) มากน้อยเพียงไร ซึ่งเป็นอุปสรรคทำให้ระบบสารสนเทศ ไม่ตอบสนองความต้องการเท่าที่ควร
*เพื่อเป็นสื่อประสานระหว่างผู้ใช้และทรัพยากร
*นำผู้ใช้ให้สามารถเข้าถึงทรัพยากรได้อย่างมีประสิทธิภาพ และอย่างประหยัด
บทบาทของระบบสารสนเทศมี 2 ประการคือ
อ้างอิง :
1. http://www.stks.or.th/wiki/doku.php?id=computer:information-tech
2.http://www.ru.ac.th/hu812/a3.doc หน้า3-4
การจัดเก็บเพื่อประโยชน์ของการใช้และการเข้าถึงสารสนเทศ
การจัดเก็บ มุ่งจัดโครงสร้างในทาง
กายภาพ เช่น รหัสหมวดหมู่ ดรรชนีเชื่อมโยงไปยังที่จัดเก็บสารสนเทศ (แฟ้มข้อมูล)
เนื้อหา เช่น ศัพท์ดรรชนี (คำแทนสาระ) สาระสังเขป โครงร่างเนื้อหา (สารบัญ) เป็นต้น
การค้นคืนและการค้น
การค้นคืน (retrieval) เป็น การค้นเพื่อให้ได้ผลการค้นตามต้องการ มุ่งเน้นที่ผลการค้นเป็นสำคัญ
การค้น การค้นหา (searching) เป็นกระบวนการค้น เช่น การค้นจากหนังสือ การค้นจากฐานข้อมูลโดยใช้ชื่อผู้แต่ง
ระบบจัดเก็บและค้นคืนสารสนเทศ (Information Storage and Retrieval System – ISAR system) ระบบค้นคืนสารสนเทศ (Information Retrieval System – IR system)
ระบบจัดเก็บและค้นหาสารสนเทศ ใช้น้อย (จากวรรณกรรม)
การค้นคืน วิธีการค้นหาแบ่งออกเป็น
browsing หรือ การสำรวจเลือกดู
searching หรือ analytical search หรือ การค้นด้วยคำหรือลักษณะของสารสนเทศ เช่น สี ขนาด
จุดประสงค์หลัก คือ ให้ค้นคืนสารสนเทศที่ “เข้าเรื่อง” (relevance) หรือ “ตรงกับความต้องการ” (pertinence)
ความซับซ้อนของการจัดเก็บและการค้นคืนสารสนเทศ
สารสนเทศปริมาณมาก
สารสนเทศในรูปแอนะล็อก และ ดิจิทัล
สารสนเทศต่างรูปลักษณ์หรือรูปแบบ (format) เช่น เอกสาร บทความ หนังสือ วารสาร แผ่นพับ
สารสนเทศต่างประเภท เช่น เสียง ภาพลักษณ์ ภาพกราฟิก และข้อความ
ที่มา : เอกสารประกอบการเรียน การค้นคืน ( retrieve ) หมายถึงการได้รับสิ่งที่ต้องการกลับคืนมา การค้นคืนสารสนเทศ (information retrieval) จึงเป็นการการกระทำใดๆ ที่ให้ได้รับสารนิเทศที่ต้องการ ซึ่งอาจเป็นข้อมูลหรือรายการเอกสารซึ่งบรรจุเนื้อหาที่ต้องการ และส่งให้กับผู้รับอย่างรวดเร็ว ระบบค้นคืนสารสนเทศ หมายถึง ระบบที่ได้รับการออกแบบเพื่อวัตถุประสงค์ในการค้นคืนสารสนเทศที่จัดเก็บอยู่ในระบบนั้น ซึ่งอาจค้นโดยแรงงานคน หรือคอมพิวเตอร์ก็ได้ หน้าที่ของระบบการค้นคืนสารสนเทศ เพื่อช่วยแก้ปัญหาการติดตามสารนิเทศใหม่ๆ ซึ่งมีปริมาณเพิ่มขึ้น ระบบสารสนเทศจะช่วยค้น คัดเลือก และกล่นกรองสารนิเทศที่เกี่ยวของ เพื่อการใช้ประโยชน์ต่อไป ในทัศนของ Lancaster ระบบสารสนเทศมีหน้าที่จัดหา จัดระเบียบและควบคุมเพื่อให้มีการเข้าถึงสารนิเทศ สรุปก็คือคือ ระบบการค้นคืนสารนิเทคือ ระบบสารนิเทศที่ทำหน้าที่นำเสนอและแจกจ่ายสารนิเทศแก่ผู้ที่ต้องการ ซึ่งระบบสารนิเทศประกอบด้วยระบบการดำเนินงานย่อยๆ 5 ระบบ คือ 1. การคัดเลือก เป็นการการรวบรวมสารนิเทศตามเกณฑ์และนโยบายที่กำหนดไว้ ซึ่งสอดคล้องกับความต้องการของผู้ใช้ 2. การวิเคราะห์เอกสาร ได้แก่การจัดหมวดหมู่ การจัดทำรายการ การทำดรรชนี และการทำสารสังเขป 3. การจัดระเบียบ ในระบบสารนิเทศที่ใช้คอมพิวเตอร์ในการประมวลผล จะมีการจัดระเบียบแฟ้มข้อมูล โดยทั่วไปจะเรียงลำดับเลขทะเบียน 4. การค้นคืน เป็นกระบวนการสำคัญในการประเมินศักยภาพของระบบสารนิเทศ เป็นจุดเริ่มต้นของการค้นคืน online เพื่อให้ตอบสนองความต้องการของผู้ใช้บริการ คือ ขั้นตอนการวิเคราะห์แนวคิด และขั้นตอนการกำหนดศัพท์ หลังจากนั้นก็นำคำศัพท์ไปดำเนินการค้น ถ้าคำศัพท์ตรงกับดรรชนีคำค้นของเอกสารนั้น จะได้รับเอกสารจำนวนหนึ่ง หรือผู้ค้นจะทำการปรับปรุงเอกสารให้เป็นที่พอใจของผู้ใช้บริการ 5. การแจกจ่าย เป็นการนำส่งผลการค้นคืนให้แก่ผู้ใช้ ที่มีความต้องการเอกสารเอกสารในเรื่องนั้นๆ โดยทั่วไปคือ รายการอ้างอิงทางบรรณานุกรม โดยการสืบค้นสารสนเทศจะสิ้นสุดเมื่อผู้สืบค้นสารสนเทศได้รับเอกสารเหล่านั้นเรียบร้อยแล้ว องค์ประกอบเหล่านี้เป็นเป็นกิจกรรมทางสติปัญญาซึ่งดำเนินการโดยคน มิใช่เครื่องจักร หรือเรียบอีกนัยหนึ่งว่า ประสิทธิภาพของระบบค้นคืนสารนิเทศ จึงขึ้นอยู่กับองค์ประกอบ สามารถจำแนกได้ 2 กลุ่มก็คือ - องค์ประกอบด้านฐานข้อมูล คือเอกสารที่จัดเก็บความละเอียดของดรรชนี ความเพียงพอของคำศัพท์ ในระบบที่ใช้แทนเนื้อหาของเอกสาร - องค์ประกอบด้านการใช้ระบบ คือ ความเข้าใจของนักเอกสารสนเทศ ในเรื่องความต้องการของผู้ใช้ รูแบบของระบบค้นคืนสารนิเทศระบบค้นคืนสารนิเทศสามารถแบ่งได้ 3 ประเภทคือ 1. ระบบค้นคืนที่ให้คำถาม – คำตอบ เป็นการบริการค้นคำตอบสำหรับคำถามที่ต้องการคำตอบ ที่เป็นข้อเท็จจริง 2. ระบบค้นคืนที่ให้ข้อมูลเป็นตัวเลข คือ สัญญาลักษณ์ เป็นระบบจัดเก็บข้อมูลทางฟิสิกส์ เคมี สำะโนประชากร เป็นต้น 3. ระบบค้นคืนข้อความจากวารสาร เป็นระบบที่จัดเก็บตัวเนื้อหาเอกสารและสามารถเรียกข้อความส่วนใดส่วนหนึ่งของเอกสารได้ เช่น ฐานข้อมูลทางกฎหมาย เป็นต้น บริการค้นคืนระบบโอแพ็กระบบโอแพ็ก คือ ระบบการค้นหารายการทรัพยากรสารนิเทศด้วยระบบคอมพิวเตอร์ออนไลน์ จะใช้เครื่องปลายทางเป็นเครื่องมือค้นหารายการสารนิเทศที่ต้องการ โดยใช้โปรแกรมสำเร็จ หรือโปรแกรมการจัดการฐานข้อมูลในระยะบบห้องสมุดอัตโนมัติ ปัจจุบันระบบโอแพ็กได้ใช้ในโปรแกรมจัดการฐานข้อมูลใน 3 รูปแบบคือ 1. โปรแกรมสำเร็จที่มีหน่วยงาน องค์กรบริบัษต่างๆที่พัฒนาขึ้นมาใช้แล้วเช่นโปรแกรม ซีดีเอส/ไอซีส ดีเบส ฟอกซ์เบส และบี อาร์เอส 2. เขียนโปรแกรมเฉพาะแห่งโดยใช้ภาษาคอมพิวเตอร์ ภาษาภาษี 3. โปรแกรมห้องสมุดอัตโนมัติ หรือโปรแกรมสำเร็จพร้อมใช้งานในระบบบูรณาการ หรือเรียกทั่วไปว่าระบบเทิร์นคีย์ เช่น URICA VTLS TINLIB เป็นต้น ประโยชน์ของการค้นคืนระบบโอแพ็ก - ผู้ค้นสามารถค้นรายการสารนิเทศที่ต้องการได้มากวิธีกว่าการค้นคืนจากบัตรรายการซึ่งจำกัดการเข้าถึงสารนิเทศด้วยช่อผู้แต่ง ชื่อเรื่อง หัวเรื่อง ในระบบโอแพ็กผู้ค้นสามารถค้นได้จขากดรรชนีหลายประเภท เช่น สามารถค้นได้จากหลักการประสานคำที่เรียกว่า ลักบลูลีน Boolean หรือ ค้นคำจากเขตข้อมูล เฉพาะที่ต้องการได้เช่น เขตข้อมูลปีที่พิมพ์ หมายเลขมาตรฐาน หนังสือสากล เลขเรียกหนังสือ หรือค้นจากคำสำคัญอื่นๆ - ทำให้ได้รับความสะดวกค้นคืนรายการสารนิเทศได้ถูกต้อง แม่นยำ และเป็นระบบที่ใช้ง่าย - เป็นระบบที่ช่วยกระตุ้นและส่งเสริมให้ผู้ใช้เกิดความต้องการใช้ทรัพยากรสารนิเทศอย่างคุ้มค่า เนื่องจากความง่ายและสะดวกในการเข้าถึง - ผู้ใช้สามารถค้นคืนรายการทรัพยากรสารนิเทศจากสถานที่ๆตนสะดวก หากมีการใช้ระบบเชื่อมโยงเครื่องปลายทางไปยังสถาบันบริการสารนิเทศที่ให้บริการค้นคืนระบบโอแพ็ก - สามารถเชื่อมโยงไปยังรายการทรัพยากรสารนิเทศกับระบบโอแพ็กของสถาบันบริการอื่นๆทั้งในประเทศและต่างประเทศระบบเครือข่าย ลักษณะการค้นคืนระบบโอแพ็กผู้ใช้สามารถใช้ระบบเป็นจุดเริ่มต้นของการค้นหาสารนิเทศ ในสถาบันบริการแห่งหนึ่ง เช่นเดียวกับการใช้บัตรรายการ โดยทั่วไปผู้ใช้สามารถเลือกค้นได้จากคำหรือวิธีต่างๆดังต่อไปนี้ - ค้นคืนโดยใช้ชื่อผู้แต่ง - ค้นคืนโดยใช้คำสำคัญ - ค้นคืนโดยใช้ชื่อเรื่อง - ค้นคืนโดยใช้วลี - ค้นคืนโดยใช้หัวเรื่อง - ค้นคืนโดยใช้คำในดรรชนี - ค้นคืนโดยใช้เลขหมู่ - ค้นคืนโดยใช้การตัดคำ - ค้นคืนโดยการจำกัดคำค้นในเขตข้อมูลที่ต้องการ - ค้นคืนโดยวิธีไล่ดูรายการตามลำดับระเบียน บริการบนอินเตอร์เน็ตอินเตอร์เน็ตไดรับความนิยมเนื่องมาจากการใช้บิการทางอินเตอร์เน็ตเป็นไปอย่างรวดเร็ว สะดวกในการติดต่อสื่อสารและส่งผ่านข้อมูลและสารสนเทศ บริการต่างๆในอินเตอร์เน็ตเป็นที่รู้จักและนิยมใช้กันอย่างกว้างขวาง แยกออกเป็น4 ลักษณะดังนี้ 1. บริการถ่ายโอนแฟ้ม หรือเรียกย่อๆ ว่า FPT เป็นบริการที่ช่วยให้การติดต่อและถ่ายโอน หรือคัดลอกแฟ้มข้อมูลระหว่างเครื่องคอมพิวเตอร์จากเครื่องหนึ่งไปอีกเครื่องหนึ่งที่เชื่อมต่ออยู่ในอินเตอร์เน็ต ทีร่บริการถ่ายโอนแฟ้มข้อมูลที่อยู่ระยะไกลอ้างอิง
|
การค้นคืน (retrieval) เป็น การค้นเพื่อให้ได้ผลการค้นตามต้องการ มุ่งเน้นที่ผลการค้นเป็นสำคัญ
การค้นหา (searching) เป็นกระบวนการค้น เช่น การค้นจากหนังสือ การค้นจากฐานข้อมูลโดยใช้ชื่อผู้แต่ง
การค้นคืน วิธีการค้นหาแบ่งออกเป็น
- browsing หรือ การสำรวจเลือกดู
- searching หรือ analytical search หรือ การค้นด้วยคำหรือลักษณะของสารสนเทศ เช่น สี ขนาด
จุดประสงค์หลัก คือ ให้ค้นคืนสารสนเทศที่ “เข้าเรื่อง” (relevance) หรือ “ตรงกับความต้องการ” (pertinence)
อ้างอิง seashore.buu.ac.th/~50124473/245271/.../google-week01.ppt
การค้นคืน (retrieval) เป็น การค้นเพื่อให้ได้ผลการค้นตามต้องการ มุ่งเน้นที่ผลการค้นเป็นสำคัญ การค้น การค้นหา (searching) เป็นกระบวนการค้น เช่น การค้นจากหนังสือ การค้นจากฐานข้อมูลโดยใช้ชื่อผู้แต่ง การค้นคืน วิธีการค้นหาแบ่งออกเป็น - browsing หรือ การสำรวจเลือกดู - searching หรือ analytical search หรือ การค้นด้วยคำหรือลักษณะของสารสนเทศ เช่น สี ขนาด จุดประสงค์หลัก คือ ให้ค้นคืนสารสนเทศที่ “เข้าเรื่อง” (relevance) หรือ “ตรงกับความต้องการ” (pertinence) อ้างอิง seashore.buu.ac.th/~50124473/245271/.../google-week01.ppt
การจัดเก็บข้อมูลสารสนเทศ ข้อมูลนั้นอาจแบ่งออกได้เป็น 2 ลักษณะ คือ
4.1 ข้อมูลที่เป็นเหตุการณ์ต่อเนื่อง เช่น การไหลของน้ำในแม่น้ำ การเติบโตด้านความสูงหรือน้ำหนักของนักเรียน การเคลื่อนที่ของสัตว์ เป็นต้น เราเก็บหรือบันทึกข้อมูลในลักษณะนี้ด้วยการวัด เช่น การวัดความเร็วของกระแสน้ำ การวัดความสูงและการชั่งน้ำหนัก ของนักเรียน วัดความเร็วที่สัตว์วิ่งจากจุดหนึ่งไปอีกจุดหนึ่ง เป็นต้น ข้อมูลที่เกี่ยวข้องกับเหตุการณ์ที่ต่อเนื่องนั้น ปกติมักเก็บเป็นตัวเลขที่จุดทศนิยม หรือเป็นเลขเศษส่วน เช่น กระแสน้ำมีความเร็ว 4.5 กิโลเมตรต่อชั่วโมง ด.ช. รักดี สูง 168.7 เซนติเมตร หนัก 50.5 กิโลกรัม เป็นต้น 4.2 ข้อมูลที่มีลักษณะไม่ต่อเนื่อง เป็นจำนวนที่นับได้เป็นชิ้นเป็นอัน เช่น วัวในคอกมีจำนวน 15 ตัว นักเรียนในห้อง ม.1/1 มีจำนวน 47 คน เป็นต้น ข้อมูลประเภทนี้มักเก็บเป็นตัวเลขจำนวนเต็ม
ข้อมูลทั้งสองลักษณะไม่จำเป็นต้องบันทึกในรูปของตัวเลขเสมอไป ข้อมูลบางอย่างอาจจะเก็บในรูปแบบตัวอักษร เช่น รายชื่อนักเรียนในชั้น
การค้นคืน ( retrieve ) หมายถึงการได้รับสิ่งที่ต้องการกลับคืนมา การค้นคืนสารสนเทศ (information retrieval) จึงเป็นการการกระทำใดๆ ที่ให้ได้รับสารนิเทศที่ต้องการ ซึ่งอาจเป็นข้อมูลหรือรายการเอกสารซึ่งบรรจุเนื้อหาที่ต้องการ และส่งให้กับผู้รับอย่างรวดเร็ว
ระบบค้นคืนสารสนเทศ หมายถึง ระบบที่ได้รับการออกแบบเพื่อวัตถุประสงค์ในการค้นคืนสารสนเทศที่จัดเก็บอยู่ในระบบนั้น ซึ่งอาจค้นโดยแรงงานคน หรือคอมพิวเตอร์ก็ได้
หน้าที่ของระบบการค้นคืนสารสนเทศ เพื่อช่วยแก้ปัญหาการติดตามสารนิเทศใหม่ๆ ซึ่งมีปริมาณเพิ่มขึ้น ระบบสารสนเทศจะช่วยค้น คัดเลือก และกล่นกรองสารนิเทศที่เกี่ยวของ เพื่อการใช้ประโยชน์ต่อไป ในทัศนของ Lancaster ระบบสารสนเทศมีหน้าที่จัดหา จัดระเบียบและควบคุมเพื่อให้มีการเข้าถึงสารนิเทศ
สรุปก็คือคือ ระบบการค้นคืนสารนิเทคือ ระบบสารนิเทศที่ทำหน้าที่นำเสนอและแจกจ่ายสารนิเทศแก่ผู้ที่ต้องการ ซึ่งระบบสารนิเทศประกอบด้วยระบบการดำเนินงานย่อยๆ 5 ระบบ คือ
1. การคัดเลือก เป็นการการรวบรวมสารนิเทศตามเกณฑ์และนโยบายที่กำหนดไว้ ซึ่งสอดคล้องกับความต้องการของผู้ใช้
2. การวิเคราะห์เอกสาร ได้แก่การจัดหมวดหมู่ การจัดทำรายการ การทำดรรชนี และการทำสารสังเขป
3. การจัดระเบียบ ในระบบสารนิเทศที่ใช้คอมพิวเตอร์ในการประมวลผล จะมีการจัดระเบียบแฟ้มข้อมูล โดยทั่วไปจะเรียงลำดับเลขทะเบียน
4. การค้นคืน เป็นกระบวนการสำคัญในการประเมินศักยภาพของระบบสารนิเทศ เป็นจุดเริ่มต้นของการค้นคืน online เพื่อให้ตอบสนองความต้องการของผู้ใช้บริการ คือ ขั้นตอนการวิเคราะห์แนวคิด และขั้นตอนการกำหนดศัพท์ หลังจากนั้นก็นำคำศัพท์ไปดำเนินการค้น ถ้าคำศัพท์ตรงกับดรรชนีคำค้นของเอกสารนั้น จะได้รับเอกสารจำนวนหนึ่ง หรือผู้ค้นจะทำการปรับปรุงเอกสารให้เป็นที่พอใจของผู้ใช้บริการ
5. การแจกจ่าย เป็นการนำส่งผลการค้นคืนให้แก่ผู้ใช้ ที่มีความต้องการเอกสารเอกสารในเรื่องนั้นๆ โดยทั่วไปคือ รายการอ้างอิงทางบรรณานุกรม โดยการสืบค้นสารสนเทศจะสิ้นสุดเมื่อผู้สืบค้นสารสนเทศได้รับเอกสารเหล่านั้นเรียบร้อยแล้ว องค์ประกอบเหล่านี้เป็นเป็นกิจกรรมทางสติปัญญาซึ่งดำเนินการโดยคน มิใช่เครื่องจักร หรือเรียบอีกนัยหนึ่งว่า ประสิทธิภาพของระบบค้นคืนสารนิเทศ จึงขึ้นอยู่กับองค์ประกอบ สามารถจำแนกได้ 2 กลุ่มก็คือ
- องค์ประกอบด้านฐานข้อมูล คือเอกสารที่จัดเก็บความละเอียดของดรรชนี ความเพียงพอของคำศัพท์ ในระบบที่ใช้แทนเนื้อหาของเอกสาร
- องค์ประกอบด้านการใช้ระบบ คือ ความเข้าใจของนักเอกสารสนเทศ ในเรื่องความต้องการของผู้ใช้
รูแบบของระบบค้นคืนสารนิเทศ
ระบบค้นคืนสารนิเทศสามารถแบ่งได้ 3 ประเภทคือ
1. ระบบค้นคืนที่ให้คำถาม – คำตอบ เป็นการบริการค้นคำตอบสำหรับคำถามที่ต้องการคำตอบ ที่เป็นข้อเท็จจริง
2. ระบบค้นคืนที่ให้ข้อมูลเป็นตัวเลข คือ สัญญาลักษณ์ เป็นระบบจัดเก็บข้อมูลทางฟิสิกส์ เคมี สำะโนประชากร เป็นต้น
3. ระบบค้นคืนข้อความจากวารสาร เป็นระบบที่จัดเก็บตัวเนื้อหาเอกสารและสามารถเรียกข้อความส่วนใดส่วนหนึ่งของเอกสารได้ เช่น ฐานข้อมูลทางกฎหมาย เป็นต้น
บริการค้นคืนระบบโอแพ็ก
ระบบโอแพ็ก คือ ระบบการค้นหารายการทรัพยากรสารนิเทศด้วยระบบคอมพิวเตอร์ออนไลน์ จะใช้เครื่องปลายทางเป็นเครื่องมือค้นหารายการสารนิเทศที่ต้องการ โดยใช้โปรแกรมสำเร็จ หรือโปรแกรมการจัดการฐานข้อมูลในระยะบบห้องสมุดอัตโนมัติ
ปัจจุบันระบบโอแพ็กได้ใช้ในโปรแกรมจัดการฐานข้อมูลใน 3 รูปแบบคือ
1. โปรแกรมสำเร็จที่มีหน่วยงาน องค์กรบริบัษต่างๆที่พัฒนาขึ้นมาใช้แล้วเช่นโปรแกรม ซีดีเอส/ไอซีส ดีเบส ฟอกซ์เบส และบี อาร์เอส
2. เขียนโปรแกรมเฉพาะแห่งโดยใช้ภาษาคอมพิวเตอร์ ภาษาภาษี
3. โปรแกรมห้องสมุดอัตโนมัติ หรือโปรแกรมสำเร็จพร้อมใช้งานในระบบบูรณาการ หรือเรียกทั่วไปว่าระบบเทิร์นคีย์ เช่น URICA VTLS TINLIB เป็นต้น
ประโยชน์ของการค้นคืนระบบโอแพ็ก
- ผู้ค้นสามารถค้นรายการสารนิเทศที่ต้องการได้มากวิธีกว่าการค้นคืนจากบัตรรายการซึ่งจำกัดการเข้าถึงสารนิเทศด้วยช่อผู้แต่ง ชื่อเรื่อง หัวเรื่อง ในระบบโอแพ็กผู้ค้นสามารถค้นได้จขากดรรชนีหลายประเภท เช่น สามารถค้นได้จากหลักการประสานคำที่เรียกว่า ลักบลูลีน Boolean หรือ ค้นคำจากเขตข้อมูล เฉพาะที่ต้องการได้เช่น เขตข้อมูลปีที่พิมพ์ หมายเลขมาตรฐาน หนังสือสากล เลขเรียกหนังสือ หรือค้นจากคำสำคัญอื่นๆ
- ทำให้ได้รับความสะดวกค้นคืนรายการสารนิเทศได้ถูกต้อง แม่นยำ และเป็นระบบที่ใช้ง่าย
- เป็นระบบที่ช่วยกระตุ้นและส่งเสริมให้ผู้ใช้เกิดความต้องการใช้ทรัพยากรสารนิเทศอย่างคุ้มค่า เนื่องจากความง่ายและสะดวกในการเข้าถึง
- ผู้ใช้สามารถค้นคืนรายการทรัพยากรสารนิเทศจากสถานที่ๆตนสะดวก หากมีการใช้ระบบเชื่อมโยงเครื่องปลายทางไปยังสถาบันบริการสารนิเทศที่ให้บริการค้นคืนระบบโอแพ็ก
- สามารถเชื่อมโยงไปยังรายการทรัพยากรสารนิเทศกับระบบโอแพ็กของสถาบันบริการอื่นๆทั้งในประเทศและต่างประเทศระบบเครือข่าย
ลักษณะการค้นคืนระบบโอแพ็ก
ผู้ใช้สามารถใช้ระบบเป็นจุดเริ่มต้นของการค้นหาสารนิเทศ ในสถาบันบริการแห่งหนึ่ง เช่นเดียวกับการใช้บัตรรายการ โดยทั่วไปผู้ใช้สามารถเลือกค้นได้จากคำหรือวิธีต่างๆดังต่อไปนี้
- ค้นคืนโดยใช้ชื่อผู้แต่ง - ค้นคืนโดยใช้คำสำคัญ
- ค้นคืนโดยใช้ชื่อเรื่อง - ค้นคืนโดยใช้วลี
- ค้นคืนโดยใช้หัวเรื่อง - ค้นคืนโดยใช้คำในดรรชนี
- ค้นคืนโดยใช้เลขหมู่ - ค้นคืนโดยใช้การตัดคำ
- ค้นคืนโดยการจำกัดคำค้นในเขตข้อมูลที่ต้องการ
- ค้นคืนโดยวิธีไล่ดูรายการตามลำดับระเบียน
http://planet.kapook.com/peebom/blog/viewnew/65121
http://www.mc.ac.th/icts/104.html
การจัดเก็บสารสนเทศ (Information storage)
การจัดและควบคุมโครงสร้างทางบรรณานุกรม โดยนำคอมพิวเตอร์เข้ามาใช้ในการเก็บข้อมูลในลักษณะระบบแฟ้มข้อมูล และจัดเก็บข้อมูลในรูปสื่อต่างๆ รวมทั้งต้องสร้างฐานข้อมูลเพื่อที่จะให้สามารถค้นหาสารสนเทศที่เก็บไว้ได้อย่างถูกต้อง ซึ่งจะทำให้สารสนเทศถูกจัดเก็บและค้นหาอย่างเป็นระบบ
การค้นคืนสารสนเทศ (Information retrieval)
การค้นคืนสารสนเทศเป็นกระบวนการค้นหาดึงข้อมูลสารสนเทศตามหัวข้อที่สนใจที่ได้ถูกจัดเก็บไว้อย่างเป็นระบบ จากในเครื่องคอมพิวเตอร์ หรือเชื่อมโยงเข้าในระบบคอมพิวเตอร์ที่ใช้โปรแกรมเฉพาะสำหรับการค้นหาสารสนเทศ เช่น ระบบโปรแกรมงานห้องสมุด โปรแกรมสืบค้นออนไลน์ ที่ได้ทำการเชื่อมโยงเข้าสู่ระบบอินเตอร์เน็ต เพื่อที่จะได้ค้นหาสารสนเทศได้ง่ายสะดวกยิ่งขึ้น เช่น Web Browser และ Search Engine
การเข้าถึง
เป็นวิธีการที่ผู้ใช้สามารถค้นหา ค้นคืน ข้อมูลสารสนเทศและได้รับสารสนเทศที่ต้องการ จากแหล่งที่ให้บริการค้นคืนสารสนเทศในแหล่งต่างๆ ที่จัดเตรียมไว้ให้บริการผู้ใช้
การค้นหา
เป็นการป้อนคำสั่งโดยผู้ค้นเตรียมประโยคคำค้นไว้และ ปฏิสัมพันธ์กับระบบค้นคืนและพิจารณาผลที่ได้รับซึ่งเป็นขั้นตอนในกระบวนการค้นหา
การสำรวจเลือกดู
เป็นอาการตรวจสอบดูเอกสาร หรือเลือกดูข้อมูลสารสนเทศ และทำการเลือกค้นหารายการสารสนเทศที่ตนสนใจหรือเป็นการดูสารสนเทศทั่วไป
เทคนิคการค้นคืนสารสนเทศ
1. การใช้คำสำคัญ (Words/Keywords)
2. การใช้หัวเรื่อง (Subject/Subject headings)
3. การใช้เทคนิคการตัดปลายคำ (Truncation)
4. การใช้ตรรกะแบบบูลีน (Boolean Logic)
5. การจำกัดการสืบค้น (Limit search)
อ้างอิง : http://webstaff.kmutt.ac.th/~werapon.chi/...1.../ca301_chapter08.pdf
อะไรคือการจัดเก็บข้อมูล
สารสนเทศที่ถูกเก็บไว้ไม่ใช่เพียงแค่อยู่ในรูปแบบหนังสือหรือสิ่งพิมพ์ต่างๆ เท่านั้น แต่ยังรวมไปถึงสารสนเทศในรูปแบบต่าง ๆ เช่น จัดเก็บข้อมูลด้วยคอมพิวเตอร์ อาจจะเป็นการเก็บข้อมูลในรูปแบบไฟล์เอกสาร หรือเก็บในฐานข้อมูล เป็นต้น และสารสนเทศสำเร็จรูปด้วย ซึ่งการจัดเก็บข้อมูลอาจจำแนกออกได้เป็น 6 ประเด็น ดังนี้
1. ใช้ระบุการมีอยู่ของสารสนเทศที่ถูกรวบรวมไว้ในรูปแบบต่าง ๆ การระบุให้ทราบถึงที่อยู่ของสารสนเทศนั้น
2. ใช้ระบุถึงงานที่ถูกบรรจุไว้ในสารสนเทศรูปแบบต่างๆ คือ การจัดหมวดหมู่ของสารสนเทศที่ได้ถูก
รวบรวมไว้ ยกตัวอย่างเช่น การจัดหมวดหมู่ของเว็บไซต์เกี่ยวกับบุคคลที่มีชื่อเสียง เป็นต้น
3. ใช้เป็นระบบการจัดเก็บสารสนเทศ สามารถค้นคืนได้จากห้องสมุด หอจดหมายเหตุ พิพิธภัณฑ์
อินเทอร์เน็ต และการจัดเก็บสารสนเทศในรูปแบบอื่นๆ
4. ใช้ในการจัดเก็บสารสนเทศที่ได้มีการรวบรวมไว้ในรูปแบบต่างๆ ตามกฎเกณฑ์มาตรฐานสำหรับใช้ในการอ้างอิงซึ่งรายการที่ถูกจัดทำขึ้นได้แก่ บรรณานุกรม ดรรชนี ระเบียนบัตรรายการ เป็นต้น
5. ใช้ในการค้นคืนโดยการค้นคืนสารสนเทศเรื่องใดเรื่องหนึ่งนั้นจะค้นคืนได้โดยใช้คำศัพท์มากกว่า 1 คำ ที่มีความหมายมากกว่า 1 ความหมายซึ่งจะครอบคลุมและนำไปสู่คำศัพท์ที่มีความหมายเหมือนกันภายในคำศัพท์เดียวกัน ซึ่งจะช่วยในการค้นคืนสารสนเทศได้อย่างรวดเร็ว
6. ใช้ในการบ่งชี้สถานที่ในการจัดเก็บสารสนเทศที่ได้มีการรวบรวมไว้ในรูปแบบต่างๆ รวมไปถึง
สถานะการใช้งานต่างๆ
การค้นคืนสารสนเทศ
คือการค้นหาข้อมูลที่มีการจัดเก็บไว้ในรูปแบบต่างๆ โดยค้นหาตามหัวข้อที่ต้องการ หรือมีความสนใจ จากแหล่งข้อมูลสารสนเทศต่างๆ เช่น ค้นหาจากคอมพิวเตอร์ ที่อาจใช้โปรแกรมจัดเก็บและค้นคืนสารสนเทศ เช่น โปรแกรมการจัดการห้องสมุด หรือค้นหาจากระบบอินเทอร์เน็ต เป็นต้น
อ้างอิง : ชัชวาลย์ วงษ์ประเสริฐ. 2548. การจัดการสารสนเทศเบื้องต้น. กรุงเทพฯ:เอ็กซเปอร์เน็ท.
http://webstaff.kmutt.ac.th/~werapon.chi/...1.../ca301_chapter08.pdf
การค้นคืน (retrieval) เป็น การค้นเพื่อให้ได้ผลการค้นตามต้องการ มุ่งเน้นที่ผลการค้นเป็นสำคัญ
การค้น การค้นหา (searching) เป็นกระบวนการค้น เช่น การค้นจากหนังสือ การค้นจากฐานข้อมูลโดยใช้ชื่อผู้แต่ง
ระบบจัดเก็บและค้นคืนสารสนเทศ (Information Storage and Retrieval System – ISAR system) ระบบค้นคืนสารสนเทศ (Information Retrieval System – IR system)
ระบบจัดเก็บและค้นหาสารสนเทศ ใช้น้อย (จากวรรณกรรม)
การค้นคืน วิธีการค้นหาแบ่งออกเป็น
จุดประสงค์หลัก คือ ให้ค้นคืนสารสนเทศที่ “เข้าเรื่อง” (relevance) หรือ “ตรงกับความต้องการ” (pertinence)
การจัดเก็บข้อมูล
การจัดเก็บข้อมูล หมายถึง การเก็บรักษาข้อมูลเพื่อการบริหาร โดยการเก็บไว้ในรูปแบบต่างๆ ไม่ว่าจะทำด้วยมือ ซึ่งเป็นแฟ้ม เอกสารหรือ ด้วยคอมพิวเตอร์ ในรูปของแฟ้มข้อมูลในระบบแฟ้มข้อมูล พอจะแบ่งเป็น 7 ประเภท
1.แฟ้มข้อมูลหลัก เป็นเพื่อที่เก็บข้อมูลที่บรรจุข้อมูลหลักซึ่งอาจจะแยกออกเป็ยแต่ละงาน
2.แฟ้มข้อมูลย่อย เป็นแฟ้มที่รวบรวมขึ้นมาใหม่ล่าสุดสำหรับการปลับข้อมูลหลักให้เป็นปัจจุ
3.แฟ้มดัชนี เป็ยแฟ้มเก็บดัชนีคล้ายๆกับบัตรรายการ
4.แฟ้มตรางอ้างอิง เป็นการรวบรวมข้อมูลที่ใช้อ้างอิง สำหรับตรวจสอบความถูกต้องเกี่ยวกับมาตรฐาน
5.แฟ้มข้อมูลสรุป เป็นแฟ้มของการรวบรวมข้อมูลโดยสรุปเพื่อนำเสนอรายงานต่อไป
6.แฟ้มข้อมูลเก่า เป็นแฟ้มที่ใช้สำหรับการเปรียบเทียบ
7.แฟ้มข้อมูลศำรอง ในการจัดเก็บข้อมูลโดยสรุปข้อมูลความปลอดภัย ป้องกันความสูญหายของข้อมูลในการดำเนินการจัดเก็บข้อมูลสารสนเทศ ได้แก่ การจำแนก การจัดเรียง หรือการจัดเก็บตาม
การค้นคืน (Retrieval)
หมายถึง การได้รับสิ่งที่ต้องการกลับคืนมา การค้นคืนสารสนเทศ (Information retrieval)
จึงเป็นการกระทำใดๆที่คัดเลือกสารสนเทศจากแหล่งเก็บเพื่อทำให้ ได้รับสารสนเทศตามที่
ต้องการซึ่งอาจเป็นข้อมูลหรือรายการเอกสารซึ่งบรรจุเนื้อหาที่ต้องการการค้นคืน สารสนเทศ
มีความหมายเช่นเดียวกับการค้นวรรณกรรม (Literature searching) ซึ่งหมายถึงกระบวนการ
ค้นเอกสารเพื่อให้ได้เอกสารที่เกี่ยวข้องกับเรื่องใดเรื่องหนึ่งหลักการ สำคัญของการค้นคืน
สารสนเทศคือ การค้นหาและนำสารสนเทศที่ตรงตามความต้องการ ส่งให้แก่ผู้ใช้อย่างรวดเร็ว
ทันการ ระบบใดก็ตามที่ได้รับการออกแบบเพื่ออำนวยความสะดวกในการค้นสิ่งพิมพ์จึงเรียกว่า
ระบบค้นคืนสารสนเทศ ตัวอย่างเช่น บัตรรายการ สิ่งพิมพ์ดรรชนี เป็นต้น
ความรู้ไม่สามารถถ่ายทอดจากบุคคลหนึ่งไปสู่อีกบุคคลหนึ่งโดยตรงเสมอไปจึงต้องมี
แหล่ง เก็บรวบรวมความรู้ คือ ระบบสารสนเทศ ซึ่งเป็นระบบที่ทำหน้าที่รวบรวม จัดเก็บ และ
นำสารสนเทศไปใช้ในองค์กร ระบบทำหน้าที่เป็นช่องทาง (Channel) ของสารสนเทศ ระบบ
ประกอบด้วยคน ครุภัณฑ์ และกระบวนการ บ่อยครั้งที่คนมักคิดคงระบบสารสนเทศว่าประกอบ
ด้วยระบบคอมพิวเตอร์และมีฐานข้อมูล (Databases) จัดเก็บสารสนเทศเท่านั้น โดยลืมนึกถึง
คน ซึ่งทำหน้าที่รวบรวมสารสนเทศจากแหล่งต่าง ๆ และจัดเก็บไว้ในฐานข้อมูล
อ้างอิง
สมพร พุทธาพิทักษ์ผล “ทฤษฎีพื้นฐานเกี่ยวกับการจัดเก็บและการค้นคืนสารสนเทศ” ในประมวลสาระชุด วิชาการจัดเก็บและการค้นคืนสารสนเทศ เล่ม 1 หน่วยที่ 2 นนทบุรี สาขาวิชาศิลปศาสตร์
มหาวิทยาลัยสุโขทัยธรรมาธิราช 2545
http://www.kroobannok.com/blog/view.php?article_id=30414
library.sut.ac.th/Learning/school/Social/204316_9.ppt
http://suanpalm3.kmutnb.ac.th/teacher/ochin/readpublication%5Ba%5D.asp?id=55
1531051541329 ภูษิต ภู่สุด
การค้นคืน (retrieval) เป็น การค้นเพื่อให้ได้ผลการค้นตามต้องการ มุ่งเน้นที่ผลการค้นเป็นสำคัญ
การค้น การค้นหา (searching) เป็นกระบวนการค้น เช่น การค้นจากหนังสือ การค้นจากฐานข้อมูลโดยใช้ชื่อผู้แต่ง
ระบบจัดเก็บและค้นคืนสารสนเทศ (Information Storage and Retrieval System – ISAR system) ระบบค้นคืนสารสนเทศ (Information Retrieval System – IR system)
ระบบจัดเก็บและค้นหาสารสนเทศ ใช้น้อย (จากวรรณกรรม)
การจัดเก็บข้อมูล
การจัดเก็บข้อมูล หมายถึง การเก็บรักษาข้อมูลเพื่อการบริหาร โดยการเก็บไว้ในรูปแบบต่างๆ ไม่ว่าจะทำด้วยมือ ซึ่งเป็นแฟ้ม เอกสารหรือ ด้วยคอมพิวเตอร์ ในรูปของแฟ้มข้อมูลในระบบแฟ้มข้อมูล พอจะแบ่งเป็น 7 ประเภท
1.แฟ้มข้อมูลหลัก เป็นเพื่อที่เก็บข้อมูลที่บรรจุข้อมูลหลักซึ่งอาจจะแยกออกเป็ยแต่ละงาน
2.แฟ้มข้อมูลย่อย เป็นแฟ้มที่รวบรวมขึ้นมาใหม่ล่าสุดสำหรับการปลับข้อมูลหลักให้เป็นปัจจุ
3.แฟ้มดัชนี เป็ยแฟ้มเก็บดัชนีคล้ายๆกับบัตรรายการ
4.แฟ้มตรางอ้างอิง เป็นการรวบรวมข้อมูลที่ใช้อ้างอิง สำหรับตรวจสอบความถูกต้องเกี่ยวกับมาตรฐาน
5.แฟ้มข้อมูลสรุป เป็นแฟ้มของการรวบรวมข้อมูลโดยสรุปเพื่อนำเสนอรายงานต่อไป
6.แฟ้มข้อมูลเก่า เป็นแฟ้มที่ใช้สำหรับการเปรียบเทียบ
7.แฟ้มข้อมูลศำรอง ในการจัดเก็บข้อมูลโดยสรุปข้อมูลความปลอดภัย ป้องกันความสูญหายของข้อมูลในการดำเนินการจัดเก็บข้อมูลสารสนเทศ ได้แก่ การจำแนก การจัดเรียง หรือการจัดเก็บตาม
การค้นคืน (Retrieval)
หมายถึง การได้รับสิ่งที่ต้องการกลับคืนมา การค้นคืนสารสนเทศ (Information retrieval)
จึงเป็นการกระทำใดๆที่คัดเลือกสารสนเทศจากแหล่งเก็บเพื่อทำให้ ได้รับสารสนเทศตามที่
ต้องการซึ่งอาจเป็นข้อมูลหรือรายการเอกสารซึ่งบรรจุเนื้อหาที่ต้องการการค้นคืน สารสนเทศ
มีความหมายเช่นเดียวกับการค้นวรรณกรรม (Literature searching) ซึ่งหมายถึงกระบวนการ
ค้นเอกสารเพื่อให้ได้เอกสารที่เกี่ยวข้องกับเรื่องใดเรื่องหนึ่งหลักการ สำคัญของการค้นคืน
สารสนเทศคือ การค้นหาและนำสารสนเทศที่ตรงตามความต้องการ ส่งให้แก่ผู้ใช้อย่างรวดเร็ว
ทันการ ระบบใดก็ตามที่ได้รับการออกแบบเพื่ออำนวยความสะดวกในการค้นสิ่งพิมพ์จึงเรียกว่า
ระบบค้นคืนสารสนเทศ ตัวอย่างเช่น บัตรรายการ สิ่งพิมพ์ดรรชนี เป็นต้น
ความรู้ไม่สามารถถ่ายทอดจากบุคคลหนึ่งไปสู่อีกบุคคลหนึ่งโดยตรงเสมอไปจึงต้องมี
แหล่ง เก็บรวบรวมความรู้ คือ ระบบสารสนเทศ ซึ่งเป็นระบบที่ทำหน้าที่รวบรวม จัดเก็บ และ
นำสารสนเทศไปใช้ในองค์กร ระบบทำหน้าที่เป็นช่องทาง (Channel) ของสารสนเทศ ระบบ
ประกอบด้วยคน ครุภัณฑ์ และกระบวนการ บ่อยครั้งที่คนมักคิดคงระบบสารสนเทศว่าประกอบ
ด้วยระบบคอมพิวเตอร์และมีฐานข้อมูล (Databases) จัดเก็บสารสนเทศเท่านั้น โดยลืมนึกถึง
คน ซึ่งทำหน้าที่รวบรวมสารสนเทศจากแหล่งต่าง ๆ และจัดเก็บไว้ในฐานข้อมูล
อ้างอิง
สมพร พุทธาพิทักษ์ผล “ทฤษฎีพื้นฐานเกี่ยวกับการจัดเก็บและการค้นคืนสารสนเทศ” ในประมวลสาระชุด วิชาการจัดเก็บและการค้นคืนสารสนเทศ เล่ม 1 หน่วยที่ 2 นนทบุรี สาขาวิชาศิลปศาสตร์
มหาวิทยาลัยสุโขทัยธรรมาธิราช 2545
http://www.kroobannok.com/blog/view.php?article_id=30414
library.sut.ac.th/Learning/school/Social/204316_9.ppt
http://suanpalm3.kmutnb.ac.th/teacher/ochin/readpublication%5Ba%5D.asp?id=55
1531051541329 ภูษิต ภู่สุด
การจัดเก็บและการค้นคืนสารนิเทศ
(Information storage and retrieval) คือ ”กระบวนการทั้งการคัดเลือกควบคุมโครงสร้างสารนิเทศ การจัดหา การจัดเก็บสารนิเทศ เพื่อการเข้าถึงและกระบวนการสำคัญใดๆ ในการแสวงหาทรัพยากรสารนิเทศ ซึ่งครอบคลุมการค้นหา การดึงสารนิเทศที่เข้าเรื่อง เรื่องใดเรื่องหนึ่งโดยเฉพาะจากแหล่งต่างๆ ทั้งแหล่งจัดเก็บภายในและแหล่งภายนอก เพื่อให้ผู้ใช้ได้รับสารนิเทศหรือรายการทรัพยากรสารนิเทศ ซึ่งบรรจุเนื้อหาตรงตามต้องการ และในการบริการจะนำส่งให้ผู้ใช้อย่างรวดเร็วทันการณ์ ทั้งนี้การจัดเก็บและการค้นคืนสารนิเทศเป็นระบบที่จัดทำทั้งด้วยแรงงานคนและด้วยคอมพิวเตอร์” (มาลี ล้ำสกุล, 2545, หน้า 8)
นอกจากนี้ นิศาชล จำนงศรี
(2546, หน้า 1) ยังได้สรุปความหมายของ การจัดเก็บและการค้นคืนสารนิเทศ ว่าคือ “กระบวนการในการรวบรวมสารนิเทศและทำรายการให้กับสารนิเทศ ที่รวบรวมไว้ ทั้งนี้เพื่อให้ทราบที่อยู่ของสารนิเทศและสามารถแสดงผลการค้นออกมาตามรูปแบบที่ต้องการ หลักสำคัญ คือ การกำหนดตัวแทนของเอกสาร และโครงสร้างในการจัดกลุ่มของเอกสาร เพื่อใช้เป็นดรรชนีนำทางเข้าถึงเอกสาร ซึ่งการนำคอมพิวเตอร์เข้ามาใช้จะช่วยให้การเข้าถึงเอกสารในลักษณะ Full-text searching ทำได้ง่ายขึ้น โดยคอมพิวเตอร์จะจัดเก็บสารนิเทศตามโครงสร้างที่ออกแบบไว้”
สรุปได้ว่า
“การจัดเก็บและการค้นคืนสารนิเทศ” คือ กระบวนการในการรวบรวมรายละเอียดของสารนิเทศและทรัพยากรสารนิเทศ ที่จัดเก็บไว้ในแหล่งสารนิเทศ หรือฐานข้อมูล เพื่อให้สามารถค้นสารนิเทศและทรัพยากรสารนิเทศที่ต้องการกลับคืนมาได้อย่างสะดวกและรวดเร็ว ด้วยวิธีการและเทคนิคอย่างเป็นขั้นตอน โดยอาศัยเทคโนโลยีสารนิเทศเป็นเครื่องมือในการเข้าถึงสารนิเทศอย่างสะดวก รวดเร็ว และตรงกับความต้องการของผู้ใช้
อ้างอิงจาก : http://202.183.233.73/human/member/prisana_mut/retrieval/a_ch2_storage2.pdf
สรุป
การจัดเก็บและการค้นคืนสารนิเทศเป็นกระบวนการในการรวบรวมรายละเอียดของสารนิเทศและทรัพยากรสารนิเทศ
ที่จัดเก็บไว้ในแหล่งสารนิเทศ หรือฐานข้อมูล เพื่อให้สามารถค้นสารนิเทศและทรัพยากรสารนิเทศที่ต้องการกลับคืนมา
ได้อย่างสะดวกและรวดเร็ว ด้วยวิธีการและเทคนิคอย่างเป็นขั้นตอน โดยอาศัยเทคโนโลยีสารนิเทศเป็นเครื่องมือ
ในการเข้าถึงสารนิเทศอย่างสะดวก รวดเร็ว และตรงกับความต้องการของผู้ใช้ ดังนั้นการจัดเก็บและการค้นคืน
สารนิเทศจึงประกอบด้วยทรัพยากรสารนิเทศ ฐานข้อมูล และบุคลากร ซึ่งการจัดเก็บและการค้นคืนสารนิเทศ
อย่างเป็นระบบมีความสำคัญทั้งกับสถาบันบริการสารนิเทศและผู้ใช้อย่างมากมาย โดยการจัดเก็บและการค้นคืน
สารนิเทศในระยะแรก เป็นการพัฒนาระบบและเครื่องมือการจัดเก็บสื่อบันทึกความรู้และการค้นหาทรัพยากร
สารนิเทศในลักษณะสิ่งพิมพ์ ได้แก่ ระบบการจัดหมวดหมู่ การทำรายการสารนิเทศ ดรรชนี และสาระสังเขป
ต่อมาเมื่อสารนิเทศมีปริมาณมากขึ้น จึงเกิดปัญหาในการจัดการและการใช้สารนิเทศ จึงมีการนำเทคโนโลยี
ในการจัดทำเครื่องมือค้นสารนิเทศมาใช้ เพื่อแก้ปัญหาดังกล่าว ซึ่งต่อมานอกจากสารนิเทศจะมีปริมาณมากแล้ว
รูปแบบยังหลากหลายอีกด้วย ทำให้เกิดการค้นคว้าวิจัยระบบการจัดเก็บและการค้นคืนสารนิเทศขึ้น
จนทำให้เกิดการใช้งานระบบผ่านทางอินเทอร์เน็ตได้ โดยมีตัวแบบพื้นฐานในการจัดเก็บและการค้นคืนสารนิเทศ
ที่เน้นกระบวนการในการจับคู่ระหว่างทรัพยากรสารนิเทศที่จัดเก็บไว้กับความต้องการสารนิเทศของผู้ใช้
หากจับคู่ได้ตรงกัน ย่อมได้ผลการค้นคืนตามต้องการ แต่ถ้าจับคู่ไม่ตรงกัน ก็จะได้ผลการค้นคืนที่ไม่ตรงกับความต้องการ
ของผู้ใช้ หรือไม่ได้ผลการค้นคืนเลย ซึ่งหากต้องการสร้างฐานข้อมูลให้มีการจัดเก็บสารนิเทศให้เป็นไปในแนวทางเดียวกัน
สามารถแลกเปลี่ยนและใช้สารนิเทศร่วมกันได้และสามารถค้นคืนสารนิเทศที่อยู่ในฐานข้อมูลต่างระบบ ต่างรูปแบบ
และต่างภาษาได้ รวมทั้งเป็นปัจจัยสำคัญในการประกันคุณภาพของสารนิเทศด้วย ซึ่งต้องอาศัยมาตรฐานในการจัดเก็บ
และการค้นคืนสารนิเทศ โดยมาตรฐานสำหรับการจัดทำสารนิเทศแบบดิจิตอลมีชื่อว่า Dublin Core Metadata โดยมีเป้าหมาย
ให้พัฒนาฐานข้อมูลและทำดรรชนีได้ง่าย สามารถสืบค้นได้ถูกต้องกว่าการสืบค้นแบบเอกสารฉบับเต็ม ที่ใช้กันในอินเทอร์เน็ต
และนำไปใช้งานได้กับหลายโปรแกรม ซึ่งในการค้นคืนสารนิเทศต้องพิจารณาพฤติกรรมการแสวงหาสารนิเทศที่เป็นกิจกรรม
หรือปฏิสัมพันธ์ที่บุคคลกระทำเพื่อแสวงหาสารนิเทศอย่างมีจุดมุ่งหมาย ซึ่งกระบวนการแสวงหาสารนิเทศ ประกอบด้วย
การระบุปัญหาและเข้าใจปัญหา การเลือกระบบการค้นคืนสารนิเทศ การกำหนดข้อคำถาม การดำเนินการค้นคืน การตรวจสอบผลลัพธ์
การพิจารณาสารนิเทศที่ต้องการ และการค้นหาซ้ำหรือยุติการค้นหา เพื่อตอบสนองความต้องการของผู้แสวงหาสารนิเทศ
ซึ่งต้องอาศัยเทคโนโลยีเพื่อการจัดการกับสารนิเทศ
http://202.183.233.73/human/member/prisana_mut/retrieval/a_ch2_storage2.pdf
การจัดเก็บและการค้นคืนสารสนเทศ
กระบวนการที่มีการคัดเลือก ควบคุมโครงสร้างสารสนเทศการจัดหา การจัดเก็บสารสนเทศเพื่อ การเข้าถึง และกระบวนการใดๆ ในการแสวงหาทรัพยากรสารสนเทศซึ่งครอบคลุม การค้นหา การสำรวจเลือกดู การดึงสารสนเทศจากแหล่งภายในและภายนอกเพื่อให้ได้ผู้ใช้ได้รับสารสนเทศตามความต้องการโดยเป็นทั้งระบบที่จัดทำด้วยแรงงานคนและด้วยคอมพิวเตอร์
การจัดเก็บสารสนเทศ (information storage)
- การจัดโครงสร้างและควบคุมทางบรรณานุกรมโดยใช้คอมพิวเตอร์ด้วยวิธีการทำรายการและข้อมูลบรรณานุกรมในลักษณะเก็บข้อมูลเข้าแฟ้มข้อมูล จัดเตรียมแฟ้มรวมไปถึงการจัดทำสื่อจัดเก็บข้อมูลลักษณะต่างๆ และฐานข้อมูลเพื่อการค้นหาและการค้นคืนสารสนเทศ ช่วยให้สารสนเทศได้รับการจัดเก็บอย่างเป็นระบบ บอกได้ว่ามีทรัพยากรอะไร เก็บไว้ในแหล่งใด ที่ใด
การค้นคืนสารสนเทศ (information retrieval)
- กระบวนการดึงหรือค้นหาข้อมูลย้อนหลังที่มีจัดเก็บไว้ตามหัวข้อความต้องการตามความสนใจ จากเครื่องคอมพิวเตอร์โดยตรงหรือเชื่อมโยงเข้าระบบคอมพิวเตอร์ที่ใช้โปรแกรมจัดเก็บและค้นคืนสารสนเทศ เช่น ระบบโปรแกรมการจัดการห้องสมุดอัตโนมัติ และมีโปรแกรมสืบค้นรายการสาธารณะออนไลน์ (OPAC) และทำการเชื่อมโยงสู่ระบบอินเตอร์เน็ตเพื่อการค้นหาข้อมูลจากแหล่งต่างๆ ผ่านโปรแกรมการสืบค้นค้นมูล W e b B r o w s e r และ S e a r c h E n g i n e
เทคโนโลยีที่เกี่ยวข้องกับการจัดเก็บและการค้นคืนสารสนเทศ
• เทคโนโลยีที่ใช้ในการบันทึก จัดเก็บและแสดงผล ได้แก่Hardware Software
• กลยุทธ์การสืบค้น
• เทคนิคการค้นคืน
• ฐานข้อมูล และ การเลือกฐานข้อมูล
• ระบบการสื่อสาร เครือข่ายอินเตอร์เน็ต
• การประยุกต์เทคโนโลยีไฮเปอร์มีเดีย
http://webstaff.kmutt.ac.th/~werapon.chi/CA301/CA301_1_2007/ca301_chapter08.pdf
ทฤษฎีพื้นฐานเกี่ยวกับการจัดเก็บและการค้นคืนสารสนเทศ
การจัดเก็บและการค้นคืนสารสนเทศกระบวนการที่มีการคัดเลือก ควบคุมโครงสร้างสารสนเทศการจัดหา การจัดเก็บสารสนเทศเพื่อ การเข้าถึง และกระบวนการใดๆ ในการแสวงหาทรัพยากรสารสนเทศซึ่งครอบคลุม การค้นหา การสำรวจเลือกดู การดึงสารสนเทศจากแหล่งภายในและภายนอกเพื่อให้ได้ผู้ใช้ได้รับสารสนเทศตามความต้องการโดยเป็นทั้งระบบที่จัดทำด้วยแรงงานคนและด้วยคอมพิวเตอร์
การจัดเก็บสารสนเทศ (information storage) การจัดโครงสร้างและควบคุมทางบรรณานุกรมโดยใช้คอมพิวเตอร์ด้วยวิธีการทำรายการและข้อมูลบรรณานุกรมในลักษณะเก็บข้อมูลเข้าแฟ้มข้อมูล จัดเตรียมแฟ้มรวมไปถึงการจัดทำสื่อจัดเก็บข้อมูลลักษณะต่างๆ และฐานข้อมูลเพื่อการค้นหาและการค้นคืนสารสนเทศ ช่วยให้สารสนเทศได้รับการจัดเก็บอย่างเป็นระบบ บอกได้ว่ามีทรัพยากรอะไร เก็บไว้ในแหล่งใด ที่ใด
การค้นคืนสารสนเทศ (information retrieval) กระบวนการดึงหรือค้นหาข้อมูลย้อนหลังที่มีจัดเก็บไว้ตามหัวข้อความต้องการตามความสนใจ จากเครื่องคอมพิวเตอร์โดยตรงหรือเชื่อมโยงเข้าระบบคอมพิวเตอร์
ที่ใช้โปรแกรมจัดเก็บและค้นคืนสารสนเทศ เช่น ระบบโปรแกรมการจัดการห้องสมุดอัตโนมัติ และมีโปรแกรมสืบค้นรายการสาธารณะออนไลน์ (OPAC) และทำการเชื่อมโยงสู่ระบบอินเตอร์เน็ตเพื่อการค้นหาข้อมูลจากแหล่งต่างๆ ผ่านโปรแกรมการสืบค้นค้นมูล W e b B r o w s e r และ S e a r c h E n g i n e
การเข้าถึง (access) เป็นวิธีการที่ผู้ใช้สามารถค้น ค้นหาค้นคืน และได้รับสารสนเทศที่ต้องการสารสนเทศที่เข้าถึงเป็นทรัพยากรสารสนเทศที่สถาบันบริการสารสนเทศและแหล่งต่างๆจัดไว้บริการผู้ใช้
การค้นหา (searching) เป็นการป้อนคำสั่งโดยผู้ค้นเตรียมประโยคคำค้นไว้และ ปฏิสัมพันธ์กับระบบค้นคืนและพิจารณาผลที่ได้รับซึ่งเป็นขั้นตอนในกระบวนการค้นหา
การสำรวจเลือกดู (browsing) เป็นการปฏิสัมพันธ์ในลักษณะตรวจสอบดูเอกสาร และทำการเลือกค้นหารายการสารสนเทศที่ตนสนใจหรือเห็นการดูสารสนเทศทั่วไป หรือ
ภาพรวมของรายการตามหัวข้อที่เป็นจุดหมาย
เทคโนโลยีที่เกี่ยวข้องกับการจัดเก็บและการค้นคืนสารสนเทศ
- เทคโนโลยีที่ใช้ในการบันทึก จัดเก็บและแสดงผล ได้แก่ Hardware Software
-กลยุทธ์การสืบค้น
-เทคนิคการค้นคืน
-ฐานข้อมูล และ การเลือกฐานข้อมูล
-ระบบการสื่อสาร เครือข่ายอินเตอร์เน็ต
-การประยุกต์เทคโนโลยีไฮเปอร์มีเดีย
การเตรียมการค้นคืนสารสนเทศ Online & Offline
1. เตรียมรายละเอียดข้อมูลที่ต้องการใช้หลัก 5W1H
2. พิจารณาเลือกฐานข้อมูล
- ขอบเขตเนื้อหาสาระของสารสนเทศในฐานฯ
- ระยะเวลาของสารสนเทศที่บันทึกอยู่ในฐานฯ
- ราคาค่าใช้จ่ายที่ต้องใช้ในการสืบค้นฐานฯ
- ภาษาของสารสนเทศ
- จำนวนสารสนเทศที่มีอยู่และการเพิ่มขึ้นของข้อมูล
- ลักษณะของสารสนเทศที่ให้ เป็นสาระสังเขป หรือ ข้อมูลเต็มรูป
- บริการอำนวยความสะดวกแก่ผู้ใช้ เช่น การพิมพ์ผลการสืบค้น หรือการส่งข้อมูลผ่าน email
เทคนิคการค้นคืนสารสนเทศ
1. การใช้คำสำคัญ(Words/Keywords)
2. การใช้หัวเรื่อง(Subject/Subject headings)
3. การใช้เทคนิคการตัดปลายคำ(Truncation)
4. การใช้ตรรกะแบบบูลีน(Boolean Logic)
5. การจำกัดการสืบค้น(Limit search)
ทฤษฎีพื้นฐานเกี่ยวกับการจัดเก็บและการค้นคืนสารสนเทศ
การจัดเก็บและการค้นคืนสารสนเทศกระบวนการที่มีการคัดเลือก ควบคุมโครงสร้างสารสนเทศการจัดหา การจัดเก็บสารสนเทศเพื่อ การเข้าถึง และกระบวนการใดๆ ในการแสวงหาทรัพยากรสารสนเทศซึ่งครอบคลุม การค้นหา การสำรวจเลือกดู การดึงสารสนเทศจากแหล่งภายในและภายนอกเพื่อให้ได้ผู้ใช้ได้รับสารสนเทศตามความต้องการโดยเป็นทั้งระบบที่จัดทำด้วยแรงงานคนและด้วยคอมพิวเตอร์
การจัดเก็บสารสนเทศ (information storage) การจัดโครงสร้างและควบคุมทางบรรณานุกรมโดยใช้คอมพิวเตอร์ด้วยวิธีการทำรายการและข้อมูลบรรณานุกรมในลักษณะเก็บข้อมูลเข้าแฟ้มข้อมูล จัดเตรียมแฟ้มรวมไปถึงการจัดทำสื่อจัดเก็บข้อมูลลักษณะต่างๆ และฐานข้อมูลเพื่อการค้นหาและการค้นคืนสารสนเทศ ช่วยให้สารสนเทศได้รับการจัดเก็บอย่างเป็นระบบ บอกได้ว่ามีทรัพยากรอะไร เก็บไว้ในแหล่งใด ที่ใด
การค้นคืนสารสนเทศ (information retrieval) กระบวนการดึงหรือค้นหาข้อมูลย้อนหลังที่มีจัดเก็บไว้ตามหัวข้อความต้องการตามความสนใจ จากเครื่องคอมพิวเตอร์โดยตรงหรือเชื่อมโยงเข้าระบบคอมพิวเตอร์
ที่ใช้โปรแกรมจัดเก็บและค้นคืนสารสนเทศ เช่น ระบบโปรแกรมการจัดการห้องสมุดอัตโนมัติ และมีโปรแกรมสืบค้นรายการสาธารณะออนไลน์ (OPAC) และทำการเชื่อมโยงสู่ระบบอินเตอร์เน็ตเพื่อการค้นหาข้อมูลจากแหล่งต่างๆ ผ่านโปรแกรมการสืบค้นค้นมูล W e b B r o w s e r และ S e a r c h E n g i n e
การเข้าถึง (access) เป็นวิธีการที่ผู้ใช้สามารถค้น ค้นหาค้นคืน และได้รับสารสนเทศที่ต้องการสารสนเทศที่เข้าถึงเป็นทรัพยากรสารสนเทศที่สถาบันบริการสารสนเทศและแหล่งต่างๆจัดไว้บริการผู้ใช้
การค้นหา (searching) เป็นการป้อนคำสั่งโดยผู้ค้นเตรียมประโยคคำค้นไว้และ ปฏิสัมพันธ์กับระบบค้นคืนและพิจารณาผลที่ได้รับซึ่งเป็นขั้นตอนในกระบวนการค้นหา
การสำรวจเลือกดู (browsing) เป็นการปฏิสัมพันธ์ในลักษณะตรวจสอบดูเอกสาร และทำการเลือกค้นหารายการสารสนเทศที่ตนสนใจหรือเห็นการดูสารสนเทศทั่วไป หรือ
ภาพรวมของรายการตามหัวข้อที่เป็นจุดหมาย
เทคโนโลยีที่เกี่ยวข้องกับการจัดเก็บและการค้นคืนสารสนเทศ
- เทคโนโลยีที่ใช้ในการบันทึก จัดเก็บและแสดงผล ได้แก่ Hardware Software
-กลยุทธ์การสืบค้น
-เทคนิคการค้นคืน
-ฐานข้อมูล และ การเลือกฐานข้อมูล
-ระบบการสื่อสาร เครือข่ายอินเตอร์เน็ต
-การประยุกต์เทคโนโลยีไฮเปอร์มีเดีย
การเตรียมการค้นคืนสารสนเทศ Online & Offline
1. เตรียมรายละเอียดข้อมูลที่ต้องการใช้หลัก 5W1H
2. พิจารณาเลือกฐานข้อมูล
- ขอบเขตเนื้อหาสาระของสารสนเทศในฐานฯ
- ระยะเวลาของสารสนเทศที่บันทึกอยู่ในฐานฯ
- ราคาค่าใช้จ่ายที่ต้องใช้ในการสืบค้นฐานฯ
- ภาษาของสารสนเทศ
- จำนวนสารสนเทศที่มีอยู่และการเพิ่มขึ้นของข้อมูล
- ลักษณะของสารสนเทศที่ให้ เป็นสาระสังเขป หรือ ข้อมูลเต็มรูป
- บริการอำนวยความสะดวกแก่ผู้ใช้ เช่น การพิมพ์ผลการสืบค้น หรือการส่งข้อมูลผ่าน email
เทคนิคการค้นคืนสารสนเทศ
1. การใช้คำสำคัญ(Words/Keywords)
2. การใช้หัวเรื่อง(Subject/Subject headings)
3. การใช้เทคนิคการตัดปลายคำ(Truncation)
4. การใช้ตรรกะแบบบูลีน(Boolean Logic)
5. การจำกัดการสืบค้น(Limit search)
ทฤษฎีพื้นฐานเกี่ยวกับการจัดเก็บและการค้นคืนสารสนเทศ
การจัดเก็บและการค้นคืนสารสนเทศกระบวนการที่มีการคัดเลือก ควบคุมโครงสร้างสารสนเทศการจัดหา การจัดเก็บสารสนเทศเพื่อ การเข้าถึง และกระบวนการใดๆ ในการแสวงหาทรัพยากรสารสนเทศซึ่งครอบคลุม การค้นหา การสำรวจเลือกดู การดึงสารสนเทศจากแหล่งภายในและภายนอกเพื่อให้ได้ผู้ใช้ได้รับสารสนเทศตามความต้องการโดยเป็นทั้งระบบที่จัดทำด้วยแรงงานคนและด้วยคอมพิวเตอร์
การจัดเก็บสารสนเทศ (information storage) การจัดโครงสร้างและควบคุมทางบรรณานุกรมโดยใช้คอมพิวเตอร์ด้วยวิธีการทำรายการและข้อมูลบรรณานุกรมในลักษณะเก็บข้อมูลเข้าแฟ้มข้อมูล จัดเตรียมแฟ้มรวมไปถึงการจัดทำสื่อจัดเก็บข้อมูลลักษณะต่างๆ และฐานข้อมูลเพื่อการค้นหาและการค้นคืนสารสนเทศ ช่วยให้สารสนเทศได้รับการจัดเก็บอย่างเป็นระบบ บอกได้ว่ามีทรัพยากรอะไร เก็บไว้ในแหล่งใด ที่ใด
การค้นคืนสารสนเทศ (information retrieval) กระบวนการดึงหรือค้นหาข้อมูลย้อนหลังที่มีจัดเก็บไว้ตามหัวข้อความต้องการตามความสนใจ จากเครื่องคอมพิวเตอร์โดยตรงหรือเชื่อมโยงเข้าระบบคอมพิวเตอร์
ที่ใช้โปรแกรมจัดเก็บและค้นคืนสารสนเทศ เช่น ระบบโปรแกรมการจัดการห้องสมุดอัตโนมัติ และมีโปรแกรมสืบค้นรายการสาธารณะออนไลน์ (OPAC) และทำการเชื่อมโยงสู่ระบบอินเตอร์เน็ตเพื่อการค้นหาข้อมูลจากแหล่งต่างๆ ผ่านโปรแกรมการสืบค้นค้นมูล W e b B r o w s e r และ S e a r c h E n g i n e
การเข้าถึง (access) เป็นวิธีการที่ผู้ใช้สามารถค้น ค้นหาค้นคืน และได้รับสารสนเทศที่ต้องการสารสนเทศที่เข้าถึงเป็นทรัพยากรสารสนเทศที่สถาบันบริการสารสนเทศและแหล่งต่างๆจัดไว้บริการผู้ใช้
การค้นหา (searching) เป็นการป้อนคำสั่งโดยผู้ค้นเตรียมประโยคคำค้นไว้และ ปฏิสัมพันธ์กับระบบค้นคืนและพิจารณาผลที่ได้รับซึ่งเป็นขั้นตอนในกระบวนการค้นหา
การสำรวจเลือกดู (browsing) เป็นการปฏิสัมพันธ์ในลักษณะตรวจสอบดูเอกสาร และทำการเลือกค้นหารายการสารสนเทศที่ตนสนใจหรือเห็นการดูสารสนเทศทั่วไป หรือ
ภาพรวมของรายการตามหัวข้อที่เป็นจุดหมาย
เทคโนโลยีที่เกี่ยวข้องกับการจัดเก็บและการค้นคืนสารสนเทศ
- เทคโนโลยีที่ใช้ในการบันทึก จัดเก็บและแสดงผล ได้แก่ Hardware Software
-กลยุทธ์การสืบค้น
-เทคนิคการค้นคืน
-ฐานข้อมูล และ การเลือกฐานข้อมูล
-ระบบการสื่อสาร เครือข่ายอินเตอร์เน็ต
-การประยุกต์เทคโนโลยีไฮเปอร์มีเดีย
การเตรียมการค้นคืนสารสนเทศ Online & Offline
1. เตรียมรายละเอียดข้อมูลที่ต้องการใช้หลัก 5W1H
2. พิจารณาเลือกฐานข้อมูล
- ขอบเขตเนื้อหาสาระของสารสนเทศในฐานฯ
- ระยะเวลาของสารสนเทศที่บันทึกอยู่ในฐานฯ
- ราคาค่าใช้จ่ายที่ต้องใช้ในการสืบค้นฐานฯ
- ภาษาของสารสนเทศ
- จำนวนสารสนเทศที่มีอยู่และการเพิ่มขึ้นของข้อมูล
- ลักษณะของสารสนเทศที่ให้ เป็นสาระสังเขป หรือ ข้อมูลเต็มรูป
- บริการอำนวยความสะดวกแก่ผู้ใช้ เช่น การพิมพ์ผลการสืบค้น หรือการส่งข้อมูลผ่าน email
เทคนิคการค้นคืนสารสนเทศ
1. การใช้คำสำคัญ(Words/Keywords)
2. การใช้หัวเรื่อง(Subject/Subject headings)
3. การใช้เทคนิคการตัดปลายคำ(Truncation)
4. การใช้ตรรกะแบบบูลีน(Boolean Logic)
5. การจำกัดการสืบค้น(Limit search)
อ้างอิง:
http://webstaff.kmutt.ac.th/~werapon.chi/CA301/CA301_1_2007/ca301_chapter08.pdf
การค้นคืน (Retrieval) หมายถึง การได้รับสิ่งที่ต้องการกลับคืนมา การค้นคืนสารสนเทศ (Information retrieval) จึงเป็นการกระทำใด ๆ ที่คัดเลือกสารสนเทศจากแหล่งเก็บเพื่อทำให้ได้รับสารสนเทศตามที่ต้องการ ซึ่งอาจเป็นข้อมูล หรือ รายการเอกสารซึ่งบรรจุเนื้อหาที่ต้องการ การค้นคืนสารสนเทศมีความหมายเช่นเดียวกับการค้นวรรณกรรม (Literature searching) ซึ่งหมายถึง กระบวนการค้นเอกสาร เพื่อให้ได้เอกสารที่เกี่ยวข้องกับเรื่องใดเรื่องหนึ่ง หลักการสำคัญของการค้นคืนสารสนเทศ คือ การค้นหาและนำสารสนเทศที่ตรงตามความต้องการ ส่งให้แก่ผู้ใช้อย่างรวดเร็ว ทันการ ระบบใดก็ตามที่ได้รับการออกแบบเพื่ออำนวยความสะดวกในการค้นสิ่งพิมพ์ จึงเรียกว่า ระบบค้นคืนสารสนเทศ ตัวอย่างเช่น บัตรรายการ สิ่งพิมพ์ดรรชนี เป็นต้น
ความรู้ไม่สามารถถ่ายทอดจากบุคคลหนึ่งไปสู่อีกบุคคลหนึ่งโดยตรงเสมอไป จึงต้องมีแหล่งเก็บรวบรวมความรู้ คือ ระบบสารสนเทศ ซึ่งเป็นระบบที่ทำหน้าที่รวบรวม จัดเก็บ และนำสารสนเทศไปใช้ในองค์กร ระบบทำหน้าที่เป็นช่องทาง (Channel) ของสารสนเทศ ระบบประกอบด้วยคน ครุภัณฑ์ และกระบวนการ
ความรู้ทั่วไปเกี่ยวกับการจัดเก็บและการค้นคืนสารสนเทศ
สารสนเทศ คือ ข้อมูล ข่าวสาร ความรู้ในรูปแบบต่าง ๆ ที่ได้ถูกบันทึก ประมวลผล และนำออกเผยแพร่เป็นประโยชน์ต่อส่วนบุคคลและสังคม ก่อนนำออกเผยแพร่นั้นสถาบันบริการสารสนเทศ จะมีกระบวนการในการจัดเก็บสารสนเทศ (information storage) ซึ่งเป็นกระบวนการในการคัดเลือกสารสนเทศ ทั้งจากแหล่งภายใน และภายนอกสถาบันรนำมาวิเคราะห์จัดหมวดหมู่ควบคุมโครงสร้าง จัดทำสื่อการจัดเก็บไม่ว่าจะเป็นด้วยแรงมนุษย์หรือด้วยเครื่องจักร สำหรับการค้นหาและค้นคืนสารสนเทศ (information retrieval) ซึ่งเป็นกระบวนการในการค้นสารสนเทศสำหรับผู้ใช้โดยมีเป้าหมายเพื่อชี้หรือระบุหรือดึงสารสนเทศเฉพาะที่เกี่ยวข้องกับความต้องการของผู้ใช้ออกมาจากที่จัดเก็บ เมื่อผู้ใช้ได้แหล่งสารสนเทศที่ต้องการขั้นตอนต่อไปคือ การถ่ายโอนสารสนเทศ (information transfer) หมายถึง การที่สารสนเทศที่ค้นพบ ได้รับการเปิดเผยหรือส่งต่อไปยังบุคคลอื่นที่ต้องการ
สถาบันบริการสารสนเทศมีบทบาทที่สำคัญในการเป็นตัวกลางระหว่างทรัพยากรสารสนเทศและผู้ใช้ ซึ่งสถาบันฯ จำเป็นต้องมีการจัดหาและจัดเก็บทรัพยากรสารสนเทศในรูปแบบสิ่งพิมพ์และอื่น ๆ จากแหล่งต่าง ๆ และต้องสอดคล้องตามนโยบายและเกณฑ์มาตรฐานในการจัดตั้งสถาบันฯ โดยมีการจัดหมวดหมู่และทำรายการ ตามหลักวิชาการจัดทำโครงสร้างระบบการจัดเก็บและควบคุมเพื่อการค้นหา ค้นคืน ในลักษณะบรรณานุกรม ไม่ว่าจะเป็นบัตรรายการหรือ OPAC ซึ่งสามารถให้สมาชิกใช้ประโยชน์ได้ทุกระดับ อีกทั้งยังมีการทำดรรชนี ทั้งในรูปแบบศัพท์ควบคุมและรูปแบบศัพท์อิสระ เพื่อเป็นเครื่องมือในการค้นหา ค้นคืนสารสนเทศสิ่งหนึ่งที่มักจัดทำร่วมกันกับดรรชนีคือสาระสังเขป เป็นตัวแทนของเนื้อหาสาระจากต้นฉบับ ซึ่งทั้งหมดทั้งสิ้นของกระบวนการจัดหมวดหมู่และทำรายการนี้จะจบลงด้วยการจัดทำฐานข้อมูล เพื่อให้บริการค้นคืนสารสนเทศ ตามขอบเขตหน้าที่และวัตถุประสงค์ของสถาบัน สำหรับบริการพื้นฐานก็จะมี บริการยืม-คืน บริการการอ่าน บริการตอบคำถามและช่วยค้นคว้า ฯ นอกจากนี้ยังมีบริการส่งเสริมการใช้ เช่น บริการสารสนเทศทันสมัย บริการเลือกสรรสารสนเทศเฉพาะบุคคล ฯลฯ เป็นต้น การจัดเก็บและการค้นคืนสารสนเทศ เป็นงานหลักที่เชื่อมโยงระบบบริการต่าง ๆ และระบบงานของสถาบัน ในส่วนความสำคัญต่อผู้ใช้ อาจกล่าวได้ว่า การจัดเก็บและค้นคืนสารสนเทศ ขจัดปัญหาต่าง ๆ ในการเข้าถึงสารสนเทศ เปิดโอกาสให้ผู้ใช้เข้าถึงทรัพยากรสารสนเทศทุกประเภททั้งภายในและภายนอกสถาบัน มีเครื่องมืออำนวยความสะดวกในการเข้าถึง เกิดความรวดเร็วในการเข้าถึงสารสนเทศตรงกับความต้องการเพื่อตอบสนองความต้องการในการใช้สารสนเทศในภารกิจต่าง ๆ ด้วยตนเอง
พัฒนาการของการจัดเก็บและการค้นค้นสารสนเทศ
ก่อนทศวรรษ 1960 การจัดเก็บและการค้นคืน เข้ามามีบทบาทตั้งแต่เริ่มมีการบันทึกลงกระดาษ และเมื่อมีเครื่องพิมพ์ในศตวรรษที่ 15 ทำให้หนังสือมีจำนวนมากขึ้น เป็นจุดเริ่มต้นความคิดและแนวทางการใช้เทคโนโลยีสมัยใหม่ในการแก้ไขปัญหาเกี่ยวกับการจัดเก็บและค้นคืนสารสนเทศที่ผลิตออกมามากมาย จึงส่งผลให้เกิดความคิดในการควบคุมทางบรรณานุกรม ในระยะแรกนั้นใช้ประโยชน์ได้เฉพาะกลุ่ม บัตรรายการที่จัดทำไม่สมบูรณ์แบบ ไม่ทันสมัย จนทำให้เกิดมาตรฐานในการจัดหมวดหมู่ขึ้นโดยวิเคราะห์เนื้อหา ระบบที่นิยมและรู้จักกันดีดือ DC และ LC และใช้กันมาจนถึงปัจจุบัน สำหรับการทำดรรชนีและสาระสังเขป ในยุคแรกนั้นเริ่มต้นในยุโรป จัดทำเพื่อใช้ในศาสนกิจ และพัฒนาไปศาสตร์อื่น ๆ จนในศตรวรรษที่ 20 จึงมีการสำรวจการบริการสาระสังเขปและดรรชนีของโลก มีการใช้เครื่องจักรในการให้บริการ และมาตรฐานในการจัดทำ เทคโนโลยีระยะแรกนั้น เริ่มจากการใช้เทคโนโลยีไมโครกราฟิกซึ่งเป็นเทคโนโลยีการถ่ายภาพย่อส่วนสารสนเทศจากต้นฉบับ ซึ่งมีขนาดเล็กมาก จนไม่สามารถอ่านได้ด้วยตาเปล่า และการค้นคืนสารสนเทศที่ต้องการบนไมโครฟอร์มให้ได้อย่างสะดวกและรวดเร็วด้วยเทคนิควิธีการต่าง ๆ สำหรับเทคโนโลยีในการค้นคืนสารสนเทศนั้นเริ่มต้นจากแนวคิดจากบทความของ ชื่อ “As we May Think” ซึ่งกล่าวถึงการใช้อุปกรณ์เมมเมกซ์ (Memex) ในการจัดเก็บและค้นคืนจนเกิดความพยายามวิจัยพัฒนาเทคโนโลยีด้านการจัดเก็บและค้นคืนสารสนเทศโดยคอมพิวเตอร์ ระบบแรกนั้นคือการทำดรรชนี KWIC-KWOC และต่อมาหอสมุดรัฐสภาอเมริกันได้เริ่มต้นสร้างระเบียนข้อมูล MARC โดยบรรจุรายละเอียดของบัตรรายการลงในแถบแม่เหล็ก
ตั้งแต่ทศวรรษ 1960 NASA ต้องการใช้ข้อมูลจำนวนมากจึงให้เงินสนับสนุนการวิจัยที่สามารถนำมาใช้ในการจัดเก็บและค้นคืน และการวิจัยของกลุ่มวิจัยแครนฟิลด์เป็นการพัฒนาต้นแบบระบบค้นคืนอัตโนมัติ ในช่วงนี้มีการพัฒนากลุ่มความร่วมมือในการใช้ฐานข้อมูลร่วมกัน เช่น OCLC, RLIN และช่วงทศวรรษนี้ ได้เริ่มมีบริการค้นคืนสารสนเทศเชิงพาณิชย์ และเริ่มมีการบริการออนไลน์ เช่น DIALOG, ORBIT และปลายทศวรรษ 1980 เทคโนโลยี ซีดี-รอมถูกใช้อย่างกว้างขวาง จนกระทั่งทศวรรษ 1990 มีการใช้เทคโนโลยีเว็บซึ่งให้บริการบนอินเทอร์เน็ต เป็นแหล่งให้บริการค้นคืนที่มีปริมาณมากขึ้นอย่างไม่หยุดยั้งจนถึงปัจจุบัน
http://stouis4.blogspot.com/2007/06/13703-1.html
การค้นคืนสารสนเทศ (Information Retrieval)
จันทร์เพ็ญ จุ้ยจงรักษ์*
บรรณารักษ์ ศูนย์บรรณสารและสื่อการศึกษา
มหาวิทยาลัยเทคโนโลยีสุรนารี
บทนำ
สารสนเทศ มีความสำคัญเกี่ยวข้องกับการดำรงชีวิตของมนุษย์ มนุษย์แสวงหาสารสนเทศ เพื่อตอบสนองวัตถุประสงค์ต่างๆ เช่น เพื่อการดำเนินชีวิตประจำวัน เพื่อการปฏิบัติงานตาม ภารกิจของตน เพื่อติดตามข่าวสารและพัฒนาความรู้ และเพื่อความบันเทิง เป็นต้น
ปัจจุบันหน่วยงานต่างๆ จัดให้มีระบบสารสนเทศเพื่อให้บริการสารสนเทศที่ตอบสนองความต้องการของหน่วยงาน อันจะช่วยพัฒนาประสิทธิภาพการดำเนินงานของหน่วยงาน ดังนั้น ระบบสารสนเทศที่มีประสิทธิภาพ จึงเป็นหัวใจสำคัญของหน่วยงาน ระบบสารสนเทศทำหน้าที่เกี่ยวข้องโดย ตรงกับการจัดเก็บและการค้นคืนสารสนเทศให้แก่ผู้ใช้ ประสิทธิภาพของระบบขึ้น
อยู่กับการดำเนินงานจัดเก็บและค้นคืน
ความหมายของการค้นคืนสารสนเทศ
การค้นคืนสารสนเทศมีจุดมุ่งหมายหลักเพื่อค้นคืนเอกสารในมวลทรัพยากรสารสนเทศทั้งหมดที่เข้าเรื่องหรือตรงกับความต้องการสารสนเทศของผู้ใช้ออกมา โดยมีเอกสารที่ไม่เข้าเรื่องปะปนออกมาให้น้อยที่สุดเท่าที่จะทำได้ (Van, 1976)
ความสำคัญของการค้นคืนสารสนเทศ
การค้นคืนสารสนเทศช่วยให้ผู้ใช้ได้รับสารสนเทศเฉพาะที่มีเนื้อหาหรือคุณลักษณะตามที่ต้องการจากระบบค้นคืนสารสนเทศอย่างครบถ้วน ถูกต้อง ครอบคลุม สะดวก และรวดเร็ว
กระบวนการค้นคืนสารสนเทศ
การค้นคืนสารสนเทศประกอบด้วย 2 กระบวนการหลัก คือ
1. การตั้งคําถาม (Question Asking) จะเกิดขึ้นเมื่อผู้ใชเกิดความต้องการสารสนเทศ ในเรื่องใดเรื่องหนึ่ง และต้องการค้นหาคําตอบเพื่อนํามาแก้ไขปัญหา
การวิเคราะห์ปัญหาของผู้ใช้ประกอบด้วยกระบวนการ ดังนี้
1) การรู้ปัญหาเกิดขึ้นเมื่อผู้ใช้รู้สึกขาดความรู้ในเรื่องใดเรื่องหนึ่ง
2) การรู้สึกต้องการคําตอบ เกิดขึ้นเมื่อต้องการนําคําตอบนั้นไปใช้
3) การตั้งคําถาม ได้แก่การถ่ายทอดความคิดหรือปัญหาออกมาเป็นคําพูดเป็นประโยคหรือภาษาเขียนซึ่งจะเป็นจุดเริ่มต้นของกระบวนการค้นคืนสารสนเทศ
4) การกําหนดคําถามเพื่อป้อนเข้าไปในระบบการค้นคืนสารสนเทศ
2. การหาคําตอบ (Question Answering) หรือ ทําได้ 2 วิธี คือ
1) การค้นหาคำตอบด้วยตนเอง ซึ่งผู้ใช้ต้องสามารถเข้าใจความต้องการที่แท้จริงของตนเอง
2) การค้นหาคำตอบโดยการใช้บริการจากผู้ให้บริการสารสนเทศ ซึ่งผู้ใช้บริการและผู้ให้บริการต้องมีการสื่อสารระหว่างกัน ผู้ให้บริการสารสนเทศต้องสัมภาษณ์ผู้ใช้เพื่อวิเคราะห์ความต้องการที่แท้จริงผู้ใช้บริการออกมา เพื่อคิดคำค้นและป้อนเข้าสู่ระบบการค้นคืนสารสนเทศ
ปัจจัยสำคัญที่มีผลต่อการค้นหาสารสนเทศ
ปัจจัยที่สนับสนุนการค้นหาสารสนเทศมีหลายประการ ที่จะกล่าวในที่นี้มี 3 ประการหลัก คือ
การทำความเข้าใจกับความต้องการสารสนเทศของผู้ใช้เป็นขั้นตอนแรกในการกระบวนการ
ค้นหาสารสนเทศและเป็นขั้นตอนที่มีความสำคัญยิ่ง ตามปกติผู้ใช้จะไม่แสดงความต้องการสารสนเทศออกมาอย่างชัดเจน หรือในบางครั้งผู้ใช้อาจไม่ทราบว่าตนเองต้องการอะไร ดังนั้นผู้ค้นหาสารสนเทศที่ไม่ใช้ผู้ใช้โดยตรงจำเป็นต้องหาวิธีการให้ได้มาซึ่งข้อมูลที่ชัดเจนเกี่ยวกับความต้องการที่แท้จริงของผู้ใช้ ซึ่งการสัมภาษณ์เป็นวิธีการหนึ่ง ที่จะช่วยให้ผู้ค้นหาสารสนเทศเข้าใจความต้องการสารสนเทศของผู้ใช้ได้ชัดเจนและถูกต้อง สำหรับการสัมภาษณ์ที่ดีควรครอบคลุมประเด็นต่างๆ นี้
1.1 ประเภทของสารสนเทศที่ต้องการ
ผู้ค้นต้องสัมภาษณ์ผู้ใช้ถึงประเภทสารสนเทศที่ต้องการว่าเป็นสารสนเทศที่มีราย
ละเอียดมากน้อยเพียงใดเป็นเอกสารฉบับ บทคัดย่อ หรือบรรณานุกรม และอยู่ในรูปแบบใด เช่น รายงานการวิจัย หนังสือ บทความ รูปภาพ สื่อมัลติมีเดีย หรืออื่นๆ ซึ่งช่วยให้ผู้ค้นเข้าใจความต้องการของผู้ใช้ได้ชัดเจนมากยิ่งขึ้น
1.2 ลักษณะการนำสารสนเทศไปใช้
ผู้ค้นต้องการวัตถุประสงค์ในการนำสารสนเทศไปใช้ เช่น ทำรายงาน เพื่อการทำ
วิจัย เพื่อประกอบอาชีพ เพื่อเพิ่มพูนความรู้ ฯลฯ เพราะผู้ค้นจะได้ค้นหาสารสนเทศที่ตรงกับความต้องการในการนำไปใช้มากที่สุด
1.3 ระดับความลึกและปริมาณของสารสนเทศที่ต้องการ
ช่วยให้ผู้ค้นสามารถคัดเลือกระบบการค้นหาสารสนเทศและกลยุทธ์การค้นที่
เหมาะสม รวมทั้งช่วยในการกลั่นกรองสารสนเทศที่ค้นมาได้ให้ตรงกับความต้องการมากที่สุด
1.4 วันเวลาที่ต้องการรับสารสนเทศ
การทราบวัน เวลา ที่ต้องการรับสารสนเทศจะช่วยให้ผู้ค้นทราบว่ามีเวลาในการ
ค้นหาสารสนเทศมากน้อยเพียงใด ซึ่งจะช่วยในการประมาณการค่าใช้จ่ายในการค้นได้หากการสืบค้นนั้นมีค่าใช้จ่าย
1.5 ขอบเขตของสารสนเทศที่ต้องการ
การทราบขอบเขตของสารสนเทศที่ต้องการช่วยให้ผู้ค้นสามารถคัดเลือกระบบค้น
คืนสารสนเทศที่เหมาะสม เช่น ภาษาของสารสนเทศที่ต้องการ ระยะเวลาของสารสนเทศที่ต้องการ ขอบเขตเชิงภูมิศาสตร์ และรูปแบบของสารสนเทศที่ต้องการว่าเป็นกระดาษ แฟ้มข้อมูลอิเล็กทรอนิกส์ หรือรูปแบบการรับสารสนเทศหลังจากค้นคืนแล้ว
การคัดเลือกระบบค้นคืนสารสนเทศหรือฐานข้อมูลที่สืบค้นสารสนเทศเป็นขั้นตอนที่สำคัญ
เพราะหากเลือกระบบค้นคืนสารสนเทศหรือฐานข้อมูลที่ผิดหรือไม่ตรงกับประเภทของสารสนเทศที่ต้องการจะทำให้ไม่พบสารสนเทศที่ต้องการได้ โดยเกณฑ์การคัดเลือกต่อไปนี้
ฐานข้อมูลบรรณานุกรม ฐานข้อมูลเอกสารฉบับเต็ม ฐานข้อมูลรูปภาพ เป็นต้น
เป็นปัจจุบันว่ามีการดำเนินการบ่อยครั้งหรือไม่
ในฐานข้อมูล
เช่น เขตข้อมูลใดบ้างที่สามารถใช้ค้นได้ มีสาระสังเขปหรือไม่ และมีเอกสารฉบับเต็มหรือไม่
ของสารสนเทศว่ามีวิธีการอย่างไร มีการใช้ศัพท์ควบคุมหรือไม่หรือใช้ศัพท์ไม่ควบคุม และคุณภาพของการจัดทำศัพท์ดรรชนีเป็นอย่างไร
โดยผู้ค้นต้องแจ้งให้ผู้ใช้ทราบก่อนที่จะทำการสืบค้นสารสนเทศ
เพราะฐานข้อมูลแต่ละฐานมีรูปแบบการสืบค้นที่แตกต่างกัน
น่าเชื่อถือของผู้ผลิต
เมื่อเข้าใจความต้องการที่ชัดเจนของผู้ใช้สารสนเทศแล้ว สิ่งที่ต้องดำเนินการต่อไปคือการ
กำหนดรูปแบบแนวคิดและคำค้น เพื่อโยงเข้าสู่การกำหนดกลยุทธ์การค้น ซึ่งจำเป็นต้องอาศัยเทคนิคต่างๆ เข้าช่วย โดยเทคนิคต่อไปนี้จัดเป็นปัจจัยสนับสนุนที่สำคัญประการหนึ่งในการค้นหาสารสนเทศ
แทนแนวคิดนั้น ผู้ค้นควรคำนึงถึงวิธีการจัดทำศัพท์ดรรชนีในระบบค้นคืนสารสนเทศว่าเป็นศัพท์ควบคุมหรือศัพท์ไม่ควบคุม และดำเนินการกำหนดคำค้นด้วยวิธีการเดียวกันเพื่อช่วยให้ได้ผลการค้นที่ดี
สารสนเทศส่วนใหญ่โดยเฉพาะอย่างยิ่งฐานข้อมูลเชิงพาณิชย์นิยมใช้ตรรกะบูลีนในการกำหนดความสัมพันธ์ระหว่างคำค้น การเชื่อมคำค้นด้วยตัวเชื่อมบูลีน (Boolean operator) ประเภทต่างๆ เช่น AND OR NOT
3. เทคนิคการระบุตำแหน่งของคำค้น เป็นเทคนิคที่ใช้ในการระบุระยะห่างหรือจำนวนคำที่คั่นระหว่างคำค้นตั้งแต่สองคำขึ้นไปที่อยู่ภายในประโยคเดียวกันหรือย่อหน้าเดียวกัน รวมทั้งการระบุลำดับก่อนหลังของคำค้นด้วย เทคนิคนี้ช่วยให้การค้นคืนสารสนเทศมีความยืดหยุ่นมากขึ้น ในขณะเดียวกันก็ได้ผลการค้นที่ใกล้เคียงกับความต้องการมากกว่าการใช้ AND เทคนิคนี้นิยมใช้ในการค้นคืนสารสนเทศที่เป็นภาษาอังกฤษ เนื่องจากเป็นภาษาที่มีแบบแผนการเว้นระยะระหว่างคำที่ค่อนข้างแน่นอน คำสั่งที่มักพบเห็นได้แก่ ADJ, WITH, NEAR และ SAME
4. เทคนิคการตัดคำ เป็นเทคนิคที่ใช้ในการลดคำทางไวยากรณ์ให้เหลือแต่เพียงรากศัพท์ โดยอาจตัดคำทางซ้าย หรือทางขวา หรือทั้งสองด้าน หรือตรงกลางระหว่างคำก็ได้ ทั้งนี้เพื่อให้เกิดความยืดหยุ่นในการค้นหาสารสนเทศและช่วยเพิ่มจำนวนเอกสารที่ค้นคืนได้ให้มากขึ้น ลักษณะการตัดคำขึ้นอยู่กับระบบค้นคืนสารสนเทศแต่ละระบบ ระบบส่วนใหญ่มักนิยมตัดคำทางขวาเพียงอย่างเดียว อีกประการหนึ่งสัญลักษณ์ที่แสดงการตัดคำของแต่ละระบบอาจไม่เหมือนกัน สัญลักษณ์ที่พบเห็นบ่อยได้แก่ * $ ? # และ !
5. เทคนิคการระบุเขตข้อมูล เป็นการระบุว่าจะค้นจากเขตข้อมูลใดเขตข้อมูลหนึ่งเป็นการเฉพาะ เช่น เขตข้อมูลชื่อผู้แต่ง ชื่อเรื่อง หัวเรื่อง ภาษาที่ใช้ ปีที่พิมพ์ สำนักพิมพ์ เลขสากลประจำวารสาร ทั้งนี้เพื่อให้ได้เอกสารที่เข้าเรื่องกับคำถามได้รวดเร็วกว่าวิธีการอื่นๆ และอาจลดจำนวนเอกสารที่ค้นคืนได้ให้มีปริมาณที่พอเหมาะด้วย
กลยุทธ์การค้นคืนสารสนเทศ
การวางแผนการค้นเพื่อให้ได้มาซึ่งสารสนเทศที่ต้องการการวางแผนการค้นที่ดีจะช่วยประหยัดเวลาในการค้นคืนสารสนเทศ ทําใหผู้ค้นสามารถค้นคืนสารสนเทศได้หลากหลายวิธี เพื่อให้ได้สารสนเทศที่ตรงและเกี่ยวข้องกับเรื่องที่ต้องการกลยุทธ์ในการค้นคืนสารสนเทศของผู้ค้นแต่ละคนอาจแตกต่างกันไปขึ้นอยู่กับความรู้ในเรื่องที่ค้นและประสบการณ์ในการค้นคืนสารสนเทศของผู้ค้นแต่ละคน
การสร้างกลยุทธ์ในการค้น
การสร้างกลยุทธ์ในการค้นจะเริ่มตั้งแต่การวิเคราะห์แนวคิดและความต้องการสารสนเทศ และการแปลแนวคิดที่ได้เป็นชุดคำศัพท์ จําแนกขั้นตอนได้5 ขั้น ดังนี้
1. กําหนดประเด็นของคําถาม (Finding the focus of your question)
2. วิเคราะห์คําถาม และจําแนกแนวคิดที่อยูในคําถามออกมาเป็นคําศัพท์ (Finding key concept)
3. กําหนดคําศัพท์อื่นๆ ที่ใกล์เคียงกับเรื่องที่ต้องการค้น (Finding alternative terms)
4. สร้างสูตรการค้น (Use basic search technique)
5. กําหนดลักษณะสารสนเทศที่ต้องการ (Think about sort of information)
..............................................
อ้างอิง
มหาวิทยาลัยสุโขทัยธรรมาธิราช สาขาวิชาศิลปศาสตร. (2545). ประมวลสาระชุดวิชาการจัดเก็บและการ
ค้นคืนสารสนเทศ หน่วยที่ 5-10. นนทบุรี : มหาวิทยาลัย.
นิศาชล จำนงศรี. (2546). เอกสารประกอบการสอนรายวิชา 204312 การจัดเก็บและการค้นคืนสารสนเทศ.
นครราชสีมา : มหาวิทยาลัยเทคโนโลยีสุรนารี.
Van Rijsbergen, C.J.(1979). Informaition Retrieval. 2nd ed. London : Butterworths
http://203.158.6.144/learning/Social/204312_%E0%B8%9A%E0%B8%97%E0%B8%84%E0%B8%A7%E0%B8%B2%E0%B8%A1IR.doc
การจัดเก็บสารสนเทศ : ระบบสารสนเทศปัจจุบันสามารถจัดเก็บข้อมูลสารสนเทศ ทั้งที่อยู่ในรูปของตัวเลข ตัวอักษร สัญลักษณ์ต่าง ๆ และภาพประกอบ ได้แก่ กราฟิก ภาพนิ่ง ภาพเคลื่อนไหว และเสียง ไว้ในรูปของฐานข้อมูลและ Web base รวมทั้งฐานความรู้ (Knowledge base)
ระบบจัดเก็บและค้นคืนสารสนเทศ (Information and Retrieval Sytem หรือใช้คำย่อว่า ISARS) หรือ ระบบค้นคืนสารสนเทศ (Information Retrieval System หรือ IRS )
การค้นคืน (Retrieval) หมายถึง การได้รับสิ่งที่ต้องการกลับคืนมา การค้นคืนสารสนเทศ (Information retrieval) จึงเป็นการกระทำใด ๆ ที่คัดเลือกสารสนเทศจากแหล่งเก็บเพื่อทำให้ได้รับสารสนเทศตามที่ต้องการ ซึ่งอาจเป็นข้อมูล หรือ รายการเอกสารซึ่งบรรจุเนื้อหาที่ต้องการ การค้นคืนสารสนเทศมีความหมายเช่นเดียวกับการค้นวรรณกรรม (Literature searching) ซึ่งหมายถึง กระบวนการค้นเอกสาร เพื่อให้ได้เอกสารที่เกี่ยวข้องกับเรื่องใดเรื่องหนึ่ง หลักการสำคัญของการค้นคืนสารสนเทศ คือ การค้นหาและนำสารสนเทศที่ตรงตามความต้องการ ส่งให้แก่ผู้ใช้อย่างรวดเร็ว ทันการ ระบบใดก็ตามที่ได้รับการออกแบบเพื่ออำนวยความสะดวกในการค้นสิ่งพิมพ์ จึงเรียกว่า ระบบค้นคืนสารสนเทศ ตัวอย่างเช่น บัตรรายการ สิ่งพิมพ์ดรรชนี เป็นต้น
ภาษาในระบบการจัดเก็บและค้นคืนสารสนเทศ คือ ภาษาดรรชนี(Indexing languages)
การค้นคืน วิธีการค้นหาแบ่งออกเป็น
- browsing หรือ การสำรวจเลือกดู
- searching หรือ analytical search หรือ การค้นหาด้วยคำหรือลักษณะของสารสนเทศ เช่น สี ขนาด
ความซับซ้อนของการจัดเก็บและการค้นคืนสารสนเทศ การจัดเก็บสารสนเทศ : ระบบสารสนเทศปัจจุบันสามารถจัดเก็บข้อมูลสารสนเทศ ทั้งที่อยู่ในรูปของตัวเลข ตัวอักษร สัญลักษณ์ต่าง ๆ และภาพประกอบ ได้แก่ กราฟิก ภาพนิ่ง ภาพเคลื่อนไหว และเสียง ไว้ในรูปของฐานข้อมูลและ Web base รวมทั้งฐานความรู้ (Knowledge base) ระบบจัดเก็บและค้นคืนสารสนเทศ (Information and Retrieval Sytem หรือใช้คำย่อว่า ISARS) หรือ ระบบค้นคืนสารสนเทศ (Information Retrieval System หรือ IRS ) การค้นคืน (Retrieval) หมายถึง การได้รับสิ่งที่ต้องการกลับคืนมา การค้นคืนสารสนเทศ (Information retrieval) จึงเป็นการกระทำใด ๆ ที่คัดเลือกสารสนเทศจากแหล่งเก็บเพื่อทำให้ได้รับสารสนเทศตามที่ต้องการ ซึ่งอาจเป็นข้อมูล หรือ รายการเอกสารซึ่งบรรจุเนื้อหาที่ต้องการ การค้นคืนสารสนเทศมีความหมายเช่นเดียวกับการค้นวรรณกรรม (Literature searching) ซึ่งหมายถึง กระบวนการค้นเอกสาร เพื่อให้ได้เอกสารที่เกี่ยวข้องกับเรื่องใดเรื่องหนึ่ง หลักการสำคัญของการค้นคืนสารสนเทศ คือ การค้นหาและนำสารสนเทศที่ตรงตามความต้องการ ส่งให้แก่ผู้ใช้อย่างรวดเร็ว ทันการ ระบบใดก็ตามที่ได้รับการออกแบบเพื่ออำนวยความสะดวกในการค้นสิ่งพิมพ์ จึงเรียกว่า ระบบค้นคืนสารสนเทศ ตัวอย่างเช่น บัตรรายการ สิ่งพิมพ์ดรรชนี เป็นต้น ภาษาในระบบการจัดเก็บและค้นคืนสารสนเทศ คือ ภาษาดรรชนี(Indexing languages) การค้นคืน วิธีการค้นหาแบ่งออกเป็น - browsing หรือ การสำรวจเลือกดู - searching หรือ analytical search หรือ การค้นหาด้วยคำหรือลักษณะของสารสนเทศ เช่น สี ขนาด ความซับซ้อนของการจัดเก็บและการค้นคืนสารสนเทศ http://www.stks.or.th/wiki/doku.php?id=computer:information-tech http://seashore.buu.ac.th/~50124473/245271/week01/google-week01.ppt#256,1,การค้นคืนสารสนเทศ
สารสนเทศปริมาณมาก
สารสนเทศในรูปแอนะล็อก และ ดิจิทัล
สารสนเทศต่างรูปลักษณ์หรือรูปแบบ (format) เช่น เอกสาร บทความ หนังสือ วารสาร แผ่นพับ
สารสนเทศต่างประเภท เช่น เสียง ภาพลักษณ์ ภาพกราฟิก และข้อความ
สารสนเทศปริมาณมาก
สารสนเทศในรูปแอนะล็อก และ ดิจิทัล
สารสนเทศต่างรูปลักษณ์หรือรูปแบบ (format) เช่น เอกสาร บทความ หนังสือ วารสาร แผ่นพับ
สารสนเทศต่างประเภท เช่น เสียง ภาพลักษณ์ ภาพกราฟิก และข้อความ
ความหมายของการค้นคืนสารสนเทศ
การค้นคืนสารสนเทศมีจุดมุ่งหมายหลักเพื่อค้นคืนเอกสารในมวลทรัพยากรสารสนเทศทั้งหมดที่เข้าเรื่องหรือตรงกับความต้องการสารสนเทศของผู้ใช้ออกมา โดยมีเอกสารที่ไม่เข้าเรื่องปะปนออกมาให้น้อยที่สุดเท่าที่จะทำได้ (Van, 1976)
ความสำคัญของการค้นคืนสารสนเทศ
การค้นคืนสารสนเทศช่วยให้ผู้ใช้ได้รับสารสนเทศเฉพาะที่มีเนื้อหาหรือคุณลักษณะตามที่ต้องการจากระบบค้นคืนสารสนเทศอย่างครบถ้วน ถูกต้อง ครอบคลุม สะดวก และรวดเร็ว
กระบวนการคนคืนสารสนเทศ
การคนคืนสารสนเทศประกอบดวย 2 กระบวนการหลัก คือ
1. การตั้งคําถาม (Question Asking) จะเกิดขึ้นเมื่อผูใชเกิดความตองการสารสนเทศ ในเรื่องใดเรื่องหนึ่ง และตองการคนหาคําตอบเพื่อนํามาแกไขปญหา
การวิเคราะหปญหาของผูใช้ประกอบด้วยกระบวนการ ดังนี้
1) การรูปญหา เกิดขึ้นเมื่อผูใชรูสึกขาดความรูในเรื่องใดเรื่องหนึ่ง
2) การรูสึกตองการคําตอบ เกิดขึ้นเมื่อตองการนําคําตอบนั้นไปใช้
3) การตั้งคําถาม ไดแก การถายทอดความคิด หรือปญหาออกมาเปนคําพูด
เป็นประโยคหรือภาษาเขียน ซึ่งจะเปนจุดเริ่มตนของกระบวนการคนคืนสารสนเทศ
4) การกําหนดคําถามเพื่อปอนเขาไปในระบบการคนคืนสารสนเทศ
กลยุทธการคนคืนสารสนเทศ
การวางแผนการค้นเพื่อให้ได้มาซึ่งสารสนเทศที่ตองการ การวางแผนการค้นที่ดีจะชวยประหยัดเวลาในการค้นคืนสารสนเทศ ทําใหผู้ค้นสามารถคนคืนสารสนเทศไดหลากหลายวิธี เพื่อให้ได้สารสนเทศที่ตรงและเกี่ยวข้องกับเรื่องที่ต้องการกลยุทธ์ในการค้นคืนสารสนเทศของผู้ค้นแต่ละคนอาจแตกต่างกันไปขึ้นอยู่กับความรูในเรื่องที่ค้นและประสบการณ์ในการค้นคืนสารสนเทศของผู้ค้นแต่ละคน
การสรางกลยุทธในการคน
การสร้างกลยุทธ์ในการค้นจะเริ่มตั้งแต่การวิเคราะห์แนวคิดและความต้องการสารสนเทศ และการแปลแนวคิดที่ได้เป็นชุดคำศัพท์ จําแนกขั้นตอนได 5 ขั้น ดังนี้
1. กําหนดประเด็นของคําถาม (Finding the focus of your question)
2. วิเคราะหคําถาม และจําแนกแนวคิดที่อยูในคําถามออกมาเปนคําศัพท (Finding key concept)
3. กําหนดคําศัพทอื่น ๆ ที่ใกลเคียงกับเรื่องที่ตองการคน (Finding alternative terms)
4. สร้างสูตรการคน (Use basic search technique)
5. กําหนดลักษณะสารสนเทศที่ตองการ (Think about sort of information)
มหาวิทยาลัยสุโขทัยธรรมาธิราช สาขาวิชาศิลปศาสตร. (2545). ประมวลสาระชุดวิชาการจัดเก็บและการ
ค้นคืนสารสนเทศ หน่วยที่ 5-10. นนทบุรี : มหาวิทยาลัย.
นิศาชล จำนงศรี. (2546). เอกสารประกอบการสอนรายวิชา 204312 การจัดเก็บและการค้นคืนสารสนเทศ.
นครราชสีมา : มหาวิทยาลัยเทคโนโลยีสุรนารี.
Van Rijsbergen, C.J.(1979). Informaition Retrieval. 2nd ed. London : Butterworths.
http://203.158.6.144/learning/Social/204312_%E0%B8%9A%E0%B8%97%E0%B8%84%E0%B8%A7%E0%B8%B2%E0%B8%A1IR.doc
การจัดเก็บและการค้นคืนสารนิเทศ (Information storage and retrieval) คือ ”กระบวนการทั้งการคัดเลือกควบคุมโครงสร้างสารนิเทศ การจัดหา การจัดเก็บสารนิเทศ เพื่อการเข้าถึงและกระบวนการสำคัญใดๆ ในการแสวงหาทรัพยากรสารนิเทศ ซึ่งครอบคลุมการค้นหา การดึงสารนิเทศที่เข้าเรื่อง เรื่องใดเรื่องหนึ่งโดยเฉพาะจากแหล่งต่างๆ ทั้งแหล่งจัดเก็บภายในและแหล่งภายนอก เพื่อให้ผู้ใช้ได้รับสารนิเทศหรือรายการทรัพยากรสารนิเทศ ซึ่งบรรจุเนื้อหาตรงตามต้องการ และในการบริการจะนำส่งให้ผู้ใช้อย่างรวดเร็วทันการณ์ ทั้งนี้การจัดเก็บและการค้นคืนสารนิเทศเป็นระบบที่จัดทำทั้งด้วยแรงงานคนและด้วยคอมพิวเตอร์”
การจัดเก็บข้อมูลอาจจำแนกออกได้เป็น 6 ประเด็น ดังนี้
1. ใช้ระบุการมีอยู่ของสารสนเทศที่ถูกรวบรวมไว้ในรูปแบบต่าง ๆ การระบุให้ทราบถึงที่อยู่ของสารสนเทศนั้น
2. ใช้ระบุถึงงานที่ถูกบรรจุไว้ในสารสนเทศรูปแบบต่างๆ คือ การจัดหมวดหมู่ของสารสนเทศที่ได้ถูก
3. ใช้เป็นระบบการจัดเก็บสารสนเทศ สามารถค้นคืนได้จากห้องสมุด หอจดหมายเหตุ พิพิธภัณฑ์อินเทอร์เน็ต และการจัดเก็บสารสนเทศในรูปแบบอื่นๆ
4. ใช้ในการจัดเก็บสารสนเทศที่ได้มีการรวบรวมไว้ในรูปแบบต่างๆ ตามกฎเกณฑ์มาตรฐานสำหรับใช้ในการอ้างอิงซึ่งรายการที่ถูกจัดทำขึ้นได้แก่ บรรณานุกรม ดรรชนี ระเบียนบัตรรายการ เป็นต้น
5. ใช้ในการค้นคืนโดยการค้นคืนสารสนเทศเรื่องใดเรื่องหนึ่งนั้นจะค้นคืนได้โดยใช้คำศัพท์มากกว่า 1 คำ ที่มีความหมายมากกว่า 1 ความหมายซึ่งจะครอบคลุมและนำไปสู่คำศัพท์ที่มีความหมายเหมือนกันภายในคำศัพท์เดียวกัน ซึ่งจะช่วยในการค้นคืนสารสนเทศได้อย่างรวดเร็ว
6. ใช้ในการบ่งชี้สถานที่ในการจัดเก็บสารสนเทศที่ได้มีการรวบรวมไว้ในรูปแบบต่างๆ รวมไปถึงสถานะการใช้งานต่างๆ การค้นคืน (Retrieval) หมายถึง การได้รับสิ่งที่ต้องการกลับคืนมา การค้นคืนสารสนเทศ (Information retrieval) จึงเป็นการกระทำใด ๆ ที่คัดเลือกสารสนเทศจากแหล่งเก็บเพื่อทำให้ได้รับสารสนเทศตามที่ต้องการ ซึ่งอาจเป็นข้อมูล หรือ รายการเอกสารซึ่งบรรจุเนื้อหาที่ต้องการ การค้นคืนสารสนเทศมีความหมายเช่นเดียวกับการค้นวรรณกรรม (Literature searching) ซึ่งหมายถึง กระบวนการค้นเอกสาร เพื่อให้ได้เอกสารที่เกี่ยวข้องกับเรื่องใดเรื่องหนึ่ง หลักการสำคัญของการค้นคืนสารสนเทศ คือ การค้นหาและนำสารสนเทศที่ตรงตามความต้องการ ส่งให้แก่ผู้ใช้อย่างรวดเร็ว ทันการ ระบบใดก็ตามที่ได้รับการออกแบบเพื่ออำนวยความสะดวกในการค้นสิ่งพิมพ์ จึงเรียกว่า ระบบค้นคืนสารสนเทศ ตัวอย่างเช่น บัตรรายการ สิ่งพิมพ์ดรรชนี เป็นต้น ความรู้ไม่สามารถถ่ายทอดจากบุคคลหนึ่งไปสู่อีกบุคคลหนึ่งโดยตรงเสมอไป จึงต้องมีแหล่งเก็บรวบรวมความรู้ คือ ระบบสารสนเทศ ซึ่งเป็นระบบที่ทำหน้าที่รวบรวม จัดเก็บ และนำสารสนเทศไปใช้ในองค์กร ระบบทำหน้าที่เป็นช่องทาง (Channel) ของสารสนเทศ ระบบประกอบด้วยคน ครุภัณฑ์ และกระบวนการ บ่อยครั้งที่คนมักคิดคงระบบสารสนเทศว่าประกอบด้วยระบบคอมพิวเตอร์และมีฐานข้อมูล (Databases) จัดเก็บสารสนเทศเท่านั้น โดยลืมนึกถึง คน ซึ่งทำหน้าที่รวบรวมสารสนเทศจากแหล่งต่าง ๆ และจัดเก็บไว้ในฐานข้อมูล ระบบสารสนเทศเป็นการสื่อสารในรูปแบบหนึ่ง ประกอบด้วยการส่งสาร จากแหล่งหนึ่งไปสู่แหล่งหนึ่ง ระหว่างการส่งสาร สารจะมีคุณภาพต่อผู้รับหรือไม่ ขึ้นอยู่กับว่ามีสิ่งรบกวน (Noise) มากน้อยเพียงไร ซึ่งเป็นอุปสรรคทำให้ระบบสารสนเทศ ไม่ตอบสนองความต้องการเท่าที่ควร
อ้างอิง อ้างอิง http://www.acsp.ac.th/learnsquarev/courses/19/it003.htm
http://hathairat.blog.mthai.com/2007/07/04/public-2
ทฤษฎีพื้นฐานเกี่ยวกับการจัดเก็บและการค้นคืนสารสนเทศ
ความหมายของการจัดเก็บข้อมูล
การจัดเก็บข้อมูล หมายถึง การเก็บรักษาข้อมูลเพื่อการบริหาร โดยการเก็บไว้ในรูปแบบต่างๆ ไม่ว่าจะทำด้วยมือ ซึ่งเป็นแฟ้ม เอกสารหรือ ด้วยคอมพิวเตอร์ ในรูปของแฟ้มข้อมูลในระบบแฟ้มข้อมูล พอจะแบ่งเป็น 7 ประเภท
1. แฟ้มข้อมูลหลัก เป็นเพื่อที่เก็บข้อมูลที่บรรจุข้อมูลหลักซึ่งอาจจะแยกออกเป็นแต่ละงาน
2. แฟ้มข้อมูลย่อย เป็นแฟ้มที่รวบรวมขึ้นมาใหม่ล่าสุดสำหรับการเก็บข้อมูลหลักให้เป็นปัจจุบัน
3. แฟ้มดัชนี เป็นแฟ้มเก็บดัชนีคล้ายๆกับบัตรรายการ
4. แฟ้มตารางอ้างอิง เป็นการรวบรวมข้อมูลที่ใช้อ้างอิง สำหรับตรวจสอบความถูกต้องเกี่ยวกับมาตรฐาน
5. แฟ้มข้อมูลสรุป เป็นแฟ้มของการรวบรวมข้อมูลโดยสรุปเพื่อนำเสนอรายงานต่อไป
6. แฟ้มข้อมูลเก่า เป็นแฟ้มที่ใช้สำหรับการเปรียบเทียบ
7. แฟ้มข้อมูลสำรอง ในการจัดเก็บข้อมูลโดยสรุปข้อมูลความปลอดภัย ป้องกันความสูญหายของข้อมูลในการดำเนินการจัดเก็บข้อมูลสารสนเทศ ได้แก่ การจำแนก การจัดเรียง หรือการจัดเก็บ
ที่มา : เอกสารประกอบการเรียน
http://202.129.0.133/createweb/00000//00000-645.html การจัดเก็บ - การจัดเก็บ เป็นการทำขึ้นเพื่อประโยชน์ของการใช้งานและการเข้าถึงสารสนเทศ - การจัดเก็บ มุ่งจัดโครงสร้างในทาง - กายภาพ เช่น รหัสหมวดหมู่ ดรรชนีเชื่อมโยงไปยังที่จัดเก็บสารสนเทศ (แฟ้มข้อมูล) - เนื้อหา เช่น ศัพท์ดรรชนี (คำแทนสาระ) สาระสังเขป โครงร่างเนื้อหา (สารบัญ) เป็นต้น - การจัดโครงสร้างและควบคุมทางบรรณานุกรมโดยใช้คอมพิวเตอร์ด้วยวิธีการทำรายการและข้อมูลบรรณานุกรมในลักษณะเก็บข้อมูลเข้าแฟ้มข้อมูล จัดเตรียมแฟ้มรวมไปถึงการจัดทำสื่อจัดเก็บข้อมูลลักษณะต่างๆ และฐานข้อมูลเพื่อการค้นหาและการค้นคืนสารสนเทศ ช่วยให้สารสนเทศได้รับการจัดเก็บอย่างเป็นระบบ บอกได้ว่ามีทรัพยากรอะไร เก็บไว้ในแหล่งใด ที่ใด การจัดเก็บและการค้นคืนสารสนเทศกระบวนการที่มีการคัดเลือก ควบคุมโครงสร้างสารสนเทศการจัดหา การจัดเก็บสารสนเทศเพื่อ การเข้าถึง และกระบวนการใดๆ ในการแสวงหาทรัพยากรสารสนเทศซึ่งครอบคลุม การค้นหา การสำรวจเลือกดู การดึงสารสนเทศจากแหล่งภายในและภายนอกเพื่อให้ได้ผู้ใช้ได้รับสารสนเทศตามความต้องการโดยเป็นทั้งระบบที่จัดทำด้วยแรงงานคนและด้วยคอมพิวเตอร์ การค้นคืน - การค้นคืน เป็นการค้นเพื่อให้ได้ผลการค้นตามต้องการของผู้ค้น โดยมุ่งเน้นที่ผลการค้นเป็นหลักสำคัญ - การค้น การค้นหา เป็นกระบวนการค้น เช่น การค้นจากหนังสือ การค้นจากแฟ้มเอกสาร การค้นจากฐานข้อมูลโดยอาศัยคอมพิวเตอร์เข้ามาช่วย และต้องมีชื่อผู้แต่งด้วย หรือที่มารวมถึงเอกสารอ้างอิง - ระบบจัดเก็บและค้นคืนสารสนเทศ (Information Storage and Retrieval System – ISAR system) ระบบค้นคืนสารสนเทศ (Information Retrieval System – IR system) - ระบบจัดเก็บและค้นหาสารสนเทศ ใช้น้อย ซึ่งอาจจะมาจากวรรณกรรมก็ได้ - การค้นคืนสารสนเทศ มีวิธีการค้นหาได้ 2 วิธี ซึ่งแบ่งออกเป็นลักษณะดังนี้ - browsing หรือ การสำรวจเลือกดู - searching หรือ analytical search หรือ การค้นด้วยคำหรือลักษณะของสารสนเทศ เช่น สี ขนาด - จุดประสงค์หลัก คือ ให้ค้นคืนสารสนเทศที่ “ เข้าเรื่อง” หรือ “ ตรงกับความต้องการ” ความซับซ้อนของการจัดเก็บและการค้นคืนของสารสนเทศ - ถ้าสารสนเทศมีปริมาณที่มาก ก็จะทำให้เกิดความซับซ้อนในการจัดเก็บข้อมูลได้ - ถ้าสารสนเทศอยู่ในรูปแบบของแอนะล็อก และ ดิจิทัล ก็จะทำให้เกิดความซับซ้อน - ถ้าสารสนเทศต่างรูปลักษณ์หรือต่างรูปแบบ เช่น เอกสาร บทความ หนังสือ วารสาร แผ่นพับ ก็จะทำให้เกิดความซับซ้อน - ถ้าสารสนเทศต่างประเภท เช่น เสียง ภาพลักษณ์ ภาพกราฟิก และข้อความ ก็จะทำให้เกิดความซับซ้อน ตัวแบบการค้นคืน - ตัวแบบการค้นคืน คือเป็นหลักการหรือแนวคิดในการพิจารณาการจับคู่หรือเปรียบเทียบ ระหว่างข้อคำถาม และดรรชนีแทนสารสนเทศที่สะสมไว้ ให้สามารถค้นคืนสารสนเทศที่เข้าเรื่องหรือตรงกับความต้องการของผู้ใช้ - ตัวแบบบูเลียน คือเป็นการจับคู่แบบตรงกันระ - ตัวแบบเวกเตอร์ - การแทนเอกสารและข้อคำถามในรูปแบบของเวกเตอร์ หรือคณิตศาสตร์ โดยกำหนดหาค่าน้ำหนักของคำ ด้วยความถี่ของคำที่ปรากฏในเอกสาร และคำที่ปรากฏในฐานข้อมูล หรือของมวลเอกสาร - ตัวแบบความน่าจะเป็น การเตรียมการค้นคืนสารสนเทศ 1. เตรียมรายละเอียดข้อมูลที่ต้องการใช้หลัก 5W1H 2. พิจารณาเลือกฐานข้อมูล - ขอบเขตเนื้อหาสาระของสารสนเทศในฐานฯ - ระยะเวลาของสารสนเทศที่บันทึกอยู่ในฐานฯ - ราคาค่าใช้จ่ายที่ต้องใช้ในการสืบค้นฐานฯ - ภาษาของสารสนเทศ - จำนวนสารสนเทศที่มีอยู่และการเพิ่มขึ้นของข้อมูล - ลักษณะของสารสนเทศที่ให้ เป็นสาระสังเขป หรือ ข้อมูลเต็มรูป - บริการอำนวยความสะดวกแก่ผู้ใช้ เช่น การพิมพ์ผลการสืบค้น หรือการส่งข้อมูลผ่าน email ที่มา: http://seashore.buu.ac.th/~50124473/245271/week01/google-week01.ppt#267,3,การค้นคืนและการค้น(หา) - การค้นคืนสารสนเทศ สัมมนาเข้ม ชุดวิชาการจัดเก็บและการค้นคืนสารสนเทศ, สมพร พุทธาพิทักษ์ผล, 15 กรกฎาคม 2549
การเชื่อมโยงระหว่างการจัดเก็บและการค้นคืน
การจัดเก็บสารสนเทศ
ทฤษฎีพื้นฐานเกี่ยวกับการจัดเก็บ
กาค้นคืนสารสนเทศ
หว่างศัพท์ดรรชนีและคำค้นคืน
- การจัดลำดับเอกสารในมวลของทรัพยากรสารสนเทศตามความน่าจะเป็นด้านความเข้าเรื่องของแต่ละเอกสารกับข้อคำถาม โดยเรียงลำดับจากมากไปหาน้อย
ทฤษฎีพื้นฐานเกี่ยวกับการจัดเก็บและการค้นคืนสารสนเทศ
ความหมายของการจัดเก็บข้อมูล
การจัดเก็บข้อมูล หมายถึง การเก็บรักษาข้อมูลเพื่อการบริหาร โดยการเก็บไว้ในรูปแบบต่างๆ ไม่ว่าจะทำด้วยมือ ซึ่งเป็นแฟ้ม เอกสารหรือ ด้วยคอมพิวเตอร์ ในรูปของแฟ้มข้อมูลในระบบแฟ้มข้อมูล พอจะแบ่งเป็น 7 ประเภท
1. แฟ้มข้อมูลหลัก เป็นเพื่อที่เก็บข้อมูลที่บรรจุข้อมูลหลักซึ่งอาจจะแยกออกเป็นแต่ละงาน
2. แฟ้มข้อมูลย่อย เป็นแฟ้มที่รวบรวมขึ้นมาใหม่ล่าสุดสำหรับการเก็บข้อมูลหลักให้เป็นปัจจุบัน
3. แฟ้มดัชนี เป็นแฟ้มเก็บดัชนีคล้ายๆกับบัตรรายการ
4. แฟ้มตารางอ้างอิง เป็นการรวบรวมข้อมูลที่ใช้อ้างอิง สำหรับตรวจสอบความถูกต้องเกี่ยวกับมาตรฐาน
5. แฟ้มข้อมูลสรุป เป็นแฟ้มของการรวบรวมข้อมูลโดยสรุปเพื่อนำเสนอรายงานต่อไป
6. แฟ้มข้อมูลเก่า เป็นแฟ้มที่ใช้สำหรับการเปรียบเทียบ
7. แฟ้มข้อมูลสำรอง ในการจัดเก็บข้อมูลโดยสรุปข้อมูลความปลอดภัย ป้องกันความสูญหายของข้อมูลในการดำเนินการจัดเก็บข้อมูลสารสนเทศ ได้แก่ การจำแนก การจัดเรียง หรือการจัดเก็บ
ที่มา : เอกสารประกอบการเรียน
http://202.129.0.133/createweb/00000//00000-645.html การจัดเก็บ - การจัดเก็บ เป็นการทำขึ้นเพื่อประโยชน์ของการใช้งานและการเข้าถึงสารสนเทศ - การจัดเก็บ มุ่งจัดโครงสร้างในทาง - กายภาพ เช่น รหัสหมวดหมู่ ดรรชนีเชื่อมโยงไปยังที่จัดเก็บสารสนเทศ (แฟ้มข้อมูล) - เนื้อหา เช่น ศัพท์ดรรชนี (คำแทนสาระ) สาระสังเขป โครงร่างเนื้อหา (สารบัญ) เป็นต้น - การจัดโครงสร้างและควบคุมทางบรรณานุกรมโดยใช้คอมพิวเตอร์ด้วยวิธีการทำรายการและข้อมูลบรรณานุกรมในลักษณะเก็บข้อมูลเข้าแฟ้มข้อมูล จัดเตรียมแฟ้มรวมไปถึงการจัดทำสื่อจัดเก็บข้อมูลลักษณะต่างๆ และฐานข้อมูลเพื่อการค้นหาและการค้นคืนสารสนเทศ ช่วยให้สารสนเทศได้รับการจัดเก็บอย่างเป็นระบบ บอกได้ว่ามีทรัพยากรอะไร เก็บไว้ในแหล่งใด ที่ใด การจัดเก็บและการค้นคืนสารสนเทศกระบวนการที่มีการคัดเลือก ควบคุมโครงสร้างสารสนเทศการจัดหา การจัดเก็บสารสนเทศเพื่อ การเข้าถึง และกระบวนการใดๆ ในการแสวงหาทรัพยากรสารสนเทศซึ่งครอบคลุม การค้นหา การสำรวจเลือกดู การดึงสารสนเทศจากแหล่งภายในและภายนอกเพื่อให้ได้ผู้ใช้ได้รับสารสนเทศตามความต้องการโดยเป็นทั้งระบบที่จัดทำด้วยแรงงานคนและด้วยคอมพิวเตอร์ การค้นคืน - การค้นคืน เป็นการค้นเพื่อให้ได้ผลการค้นตามต้องการของผู้ค้น โดยมุ่งเน้นที่ผลการค้นเป็นหลักสำคัญ - การค้น การค้นหา เป็นกระบวนการค้น เช่น การค้นจากหนังสือ การค้นจากแฟ้มเอกสาร การค้นจากฐานข้อมูลโดยอาศัยคอมพิวเตอร์เข้ามาช่วย และต้องมีชื่อผู้แต่งด้วย หรือที่มารวมถึงเอกสารอ้างอิง - ระบบจัดเก็บและค้นคืนสารสนเทศ (Information Storage and Retrieval System – ISAR system) ระบบค้นคืนสารสนเทศ (Information Retrieval System – IR system) - ระบบจัดเก็บและค้นหาสารสนเทศ ใช้น้อย ซึ่งอาจจะมาจากวรรณกรรมก็ได้ - การค้นคืนสารสนเทศ มีวิธีการค้นหาได้ 2 วิธี ซึ่งแบ่งออกเป็นลักษณะดังนี้ - browsing หรือ การสำรวจเลือกดู - searching หรือ analytical search หรือ การค้นด้วยคำหรือลักษณะของสารสนเทศ เช่น สี ขนาด - จุดประสงค์หลัก คือ ให้ค้นคืนสารสนเทศที่ “ เข้าเรื่อง” หรือ “ ตรงกับความต้องการ” ความซับซ้อนของการจัดเก็บและการค้นคืนของสารสนเทศ - ถ้าสารสนเทศมีปริมาณที่มาก ก็จะทำให้เกิดความซับซ้อนในการจัดเก็บข้อมูลได้ - ถ้าสารสนเทศอยู่ในรูปแบบของแอนะล็อก และ ดิจิทัล ก็จะทำให้เกิดความซับซ้อน - ถ้าสารสนเทศต่างรูปลักษณ์หรือต่างรูปแบบ เช่น เอกสาร บทความ หนังสือ วารสาร แผ่นพับ ก็จะทำให้เกิดความซับซ้อน - ถ้าสารสนเทศต่างประเภท เช่น เสียง ภาพลักษณ์ ภาพกราฟิก และข้อความ ก็จะทำให้เกิดความซับซ้อน ตัวแบบการค้นคืน - ตัวแบบการค้นคืน คือเป็นหลักการหรือแนวคิดในการพิจารณาการจับคู่หรือเปรียบเทียบ ระหว่างข้อคำถาม และดรรชนีแทนสารสนเทศที่สะสมไว้ ให้สามารถค้นคืนสารสนเทศที่เข้าเรื่องหรือตรงกับความต้องการของผู้ใช้ - ตัวแบบบูเลียน คือเป็นการจับคู่แบบตรงกันระหว่างศัพท์ดรรชนีและคำค้นคืน - ตัวแบบเวกเตอร์ - การแทนเอกสารและข้อคำถามในรูปแบบของเวกเตอร์ หรือคณิตศาสตร์ โดยกำหนดหาค่าน้ำหนักของคำ ด้วยความถี่ของคำที่ปรากฏในเอกสาร และคำที่ปรากฏในฐานข้อมูล หรือของมวลเอกสาร - ตัวแบบความน่าจะเป็น การเตรียมการค้นคืนสารสนเทศ 1. เตรียมรายละเอียดข้อมูลที่ต้องการใช้หลัก 5W1H 2. พิจารณาเลือกฐานข้อมูล - ขอบเขตเนื้อหาสาระของสารสนเทศในฐานฯ - ระยะเวลาของสารสนเทศที่บันทึกอยู่ในฐานฯ - ราคาค่าใช้จ่ายที่ต้องใช้ในการสืบค้นฐานฯ - ภาษาของสารสนเทศ - จำนวนสารสนเทศที่มีอยู่และการเพิ่มขึ้นของข้อมูล - ลักษณะของสารสนเทศที่ให้ เป็นสาระสังเขป หรือ ข้อมูลเต็มรูป - บริการอำนวยความสะดวกแก่ผู้ใช้ เช่น การพิมพ์ผลการสืบค้น หรือการส่งข้อมูลผ่าน email ที่มา: http://seashore.buu.ac.th/~50124473/245271/week01/google-week01.ppt#267,3,การค้นคืนและการค้น(หา) - การค้นคืนสารสนเทศ สัมมนาเข้ม ชุดวิชาการจัดเก็บและการค้นคืนสารสนเทศ, สมพร พุทธาพิทักษ์ผล, 15 กรกฎาคม 2549
การเชื่อมโยงระหว่างการจัดเก็บและการค้นคืน
การจัดเก็บสารสนเทศ
ทฤษฎีพื้นฐานเกี่ยวกับการจัดเก็บ
กาค้นคืนสารสนเทศ
- การจัดลำดับเอกสารในมวลของทรัพยากรสารสนเทศตามความน่าจะเป็นด้านความเข้าเรื่องของแต่ละเอกสารกับข้อคำถาม โดยเรียงลำดับจากมากไปหาน้อย
การจัดเก็บสารสนเทศ
เมื่อวิเคราะห์หมวดหมู่ได้แล้ว จะต้องนำสารสนเทศมาจัดเก็บเพื่อให้บริการ วิธีในการจัดเก็บนั้นต้องอาศัยทฤษฎีการจัดหมวดหมู่ (classification theory) เข้ามาช่วยเพื่อให้ผู้ใช้ค้นหาทรัพยากรสารสนเทศได้ง่ายขึ้น ซึ่งมีระบบการจัดหมวดหมู่ที่เป็นที่นิยมอยู่ 2 ระบบ ได้แก่ ระบบทศนิยมดิวอี้ และระบบหอสมุดรัฐสภาอเมริกัน
ระบบทศนิยมดิวอี้ (Dewey Decimal Classification) เรียกย่อๆ ว่า D.C. หรือ D.D.C เป็นระบบการจัดหมวดหมู่หนังสือในห้องสมุดที่นิยมระบบหนึ่ง คิดค้นขึ้นโดยชาวอเมริกัน เมลวิล ดิวอี้ ในขณะที่เขา กำลังเป็นผู้ช่วยบรรณารักษ์อยู่ที่วิทยาลัยแอมเฮอร์ส (Amherst College) หมวดหมู่ การจัดหมวดหมู่หนังสือตามระบบทศนิยมของดิวอี้ แบ่งหนังสือออกเป็นหมวดหมู่ต่างๆ จากหมวดหมู่ใหญ่ไปหาหมวดหมู่ย่อย ต่างๆ หมวดใหญ่ เป็นการแบ่งหมวดหมู่หนังสือครั้งที่ 1 โดยแบ่งตามประเภทของสรรพวิชาใหญ่ๆ 10 หมวด โดยใช้ตัวเลขหลักร้อยเป็นตัวบ่งชี้ เช่น การจัดหมู่หนังสือระบบหอสมุดรัฐสภาอเมริกันนี้เรียกย่อ ๆ ว่าระบบ L.C. ผู้คิดคือ ดร.เฮอร์เบิร์ต พุทนัม (Herbert Putnum) คิดขึ้นในปี ค.ศ. 1899 ขณะที่ทำหน้าที่เป็นบรรณารักษ์หอสมุดรัฐสภาอเมริกัน ซึ่งปัจจุบันเป็นห้องสมุดที่ใหญ่ที่สุดในโลก ตั้งอยู่ ณ กรุงวอชิงตัน สหรัฐอเมริกา การจัดแบ่งหมวดหมู่หนังสือมิได้อิงหลักปรัชญาใด ๆ มิได้เรียงลำดับวิทยาการ แต่กำหนดหมวดหมู่ตามหนังสือสาขาต่าง ๆ ที่มีอยู่ในหอสมุดแห่งนั้น โดยแบ่งเป็น 20 หมวดใหญ่ใช้อักษรโรมันตัวพิมพ์ใหญ่ A – Z ยกเว้น I Q W X Y ผสมกับตัวเลขอารบิค ตั้งแต่เลข 1-9999 และอาจเพิ่มจุดทศนิยมกับตัวเลขได้อีกหมวดใหญ่ทั้ง 20 หมวด 000 เบ็ตเตล็ดหรือความรู้ทั่วไป (Generalities) ,100 ปรัชญา (Philosophy) ,200 ศาสนา(Religion) ,300 สังคมศาสตร์ (Social sciences) ,400 ภาษาศาสตร์ (Language) เป็นต้น
ความหมายของการค้นคืนสารสนเทศ
การค้นคืนสารสนเทศมีจุดมุ่งหมายหลักเพื่อค้นคืนเอกสารในมวลทรัพยากรสารสนเทศทั้งหมดที่เข้าเรื่องหรือตรงกับความต้องการสารสนเทศของผู้ใช้ออกมา โดยมีเอกสารที่ไม่เข้าเรื่องปะปนออกมาให้น้อยที่สุดเท่าที่จะทำได้ (Van, 1976)
ความสำคัญของการค้นคืนสารสนเทศ
การค้นคืนสารสนเทศช่วยให้ผู้ใช้ได้รับสารสนเทศเฉพาะที่มีเนื้อหาหรือคุณลักษณะตามที่ต้องการจากระบบค้นคืนสารสนเทศอย่างครบถ้วน ถูกต้อง ครอบคลุม สะดวก และรวดเร็ว
กระบวนการคนคืนสารสนเทศ
การคนคืนสารสนเทศประกอบดวย 2 กระบวนการหลัก คือ
1. การตั้งคําถาม (Question Asking) จะเกิดขึ้นเมื่อผูใชเกิดความตองการสารสนเทศ ในเรื่องใดเรื่องหนึ่ง และตองการคนหาคําตอบเพื่อนํามาแกไขปญหา
การวิเคราะหปญหาของผูใช้ประกอบด้วยกระบวนการ ดังนี้
1) การรูปญหา เกิดขึ้นเมื่อผูใชรูสึกขาดความรูในเรื่องใดเรื่องหนึ่ง
2) การรูสึกตองการคําตอบ เกิดขึ้นเมื่อตองการนําคําตอบนั้นไปใช้
3) การตั้งคําถาม ไดแก การถายทอดความคิด หรือปญหาออกมาเปนคําพูด
เป็นประโยคหรือภาษาเขียน ซึ่งจะเปนจุดเริ่มตนของกระบวนการคนคืนสารสนเทศ
4) การกําหนดคําถามเพื่อปอนเขาไปในระบบการคนคืนสารสนเทศ
2. การหาคําตอบ (Question Answering) หรือ ทําได 2 วิธี คือ
1) การค้นหาคำตอบด้วยตนเอง ซึ่งผูใชตองสามารถเขาใจความตองการที่แทจริงของตนเอง
2) การค้นหาคำตอบโดยการใช้บริการจากผู้ให้บริการสารสนเทศ ซึ่งผู้ใช้บริการและผู้ให้บริการต้องมีการสื่อสารระหว่างกัน ผู้ให้บริการสารสนเทศต้องสัมภาษณ์ผู้ใช้เพื่อวิเคราะห์ความต้องการที่แท้จริงผู้ใช้บริการออกมา เพื่อคิดคำค้นและป้อนเข้าสู่ระบบการค้นคืนสารสนเทศ
อ้างอิง : http://www.lib.sskru.ac.th/blog/?p=24
http://library.sisat.ac.th/library/help/lc.htm
203.158.6.144/learning/Social/204312_บทความIR.doc
personal.swu.ac.th/students/.../ระบบทศนิยมดิว อี้.doc
อธิบายทฤษฎีพื้นฐานเกี่ยวกับการจัดเก็บและการค้นคืนสารสนเทศ
ระบบสารสนเทศ (Information system)
สารสนเทศ มีความสำคัญเกี่ยวข้องกับการดำรงชีวิตของมนุษย์ มนุษย์แสวงหาสารสนเทศ
เพื่อตอบสนองวัตถุประสงค์ต่างๆ เช่น เพื่อการดำเนินชีวิตประจำวัน เพื่อการปฏิบัติงานตามภารกิจ
ของตนเพื่อติดตามข่าวสารและพัฒนาความรู้ และเพื่อความบันเทิงเป็นต้น
ในการแสวงหาสารสนเทศที่ต้องการผู้แสวงหาหาสารสนเทศจากแหล่งต่างๆ เช่นแหล่งบุคคล แหล่งสถาบัน แหล่งสื่อ ต่างๆ ได้แก่ สื่อตีพิมพ์ สื่อไม่ตีพิมพ์และสื่ออิเล็กทรอนิก
อยางไรก็ตามแหล่งที่จะอำนวยความสะดวกมากที่สุด ที่ทำให้เข้าถึงสารสนเทศที่ต้องการ คือ แหล่งสารสนเทศที่เป็นทางการและเป็นระบบซึ่งทำหน้าที่จัดรวบรวมสารสนเทศและจัดเก็บ
อย่างเป็นระบบ และสามารถค้นคืนได้อย่างมีประสิทธิภาพ ได้แก่ ระบบสารสนเทศ (Information system)
ปัจจุบันหน่วยงานต่างๆจัดให้มีระบบสารสนเทศเพื่อให้บริการสารสนเทศที่ ตอบสนองความต้องการของหน่วยงาน อันจะช่วยพัฒนาประสิทธิภาพการดำเนินงานของหน่วยงาน ดังนั้น
ระบบสารสนเทศที่มีประสิทธิภาพ จึงเป็นหัวใจสำคัญของหน่วยงาน ระบบสารสนเทศทำหน้าที่เกี่ยวข้องโดย ตรงกับการจัดเก็บและการค้นคืนสารสนเทศให้แก่ผู้ใช้ ประสิทธิภาพของระบบขึ้น
อยู่กับการดำเนินงานจัดเก็บและค้นคืน
ระบบสารสนเทศบางครั้ง เรียกว่า ระบบจัดเก็บและค้นคืนสารสนเทศ (Information and
Retrieval Sytem หรือใช้คำย่อว่า ISARS) หรือ ระบบค้นคืนสารสนเทศ (Information Retrieval
System หรือ IRS )
การค้นคืน (Retrieval)
หมายถึง การได้รับสิ่งที่ต้องการกลับคืนมา การค้นคืนสารสนเทศ (Information retrieval)
จึงเป็นการกระทำใดๆที่คัดเลือกสารสนเทศจากแหล่งเก็บเพื่อทำให้ ได้รับสารสนเทศตามที่ต้องการซึ่งอาจเป็นข้อมูลหรือรายการเอกสารซึ่งบรรจุเนื้อหาที่ต้องการการค้นคืน สารสนเทศ
มีความหมายเช่นเดียวกับการค้นวรรณกรรม (Literature searching) ซึ่งหมายถึงกระบวนการค้นเอกสารเพื่อให้ได้เอกสารที่เกี่ยวข้องกับเรื่องใดเรื่องหนึ่งหลักการ สำคัญของการค้นคืน
สารสนเทศคือ การค้นหาและนำสารสนเทศที่ตรงตามความต้องการ ส่งให้แก่ผู้ใช้อย่างรวดเร็วทันการระบบใดก็ตามที่ได้รับการออกแบบเพื่ออำนวยความสะดวกในการค้นสิ่งพิมพ์จึงเรียกว่า
ระบบค้นคืนสารสนเทศ ตัวอย่างเช่น บัตรรายการ สิ่งพิมพ์ดรรชนี
ความรู้ไม่สามารถถ่ายทอดจากบุคคลหนึ่งไปสู่อีกบุคคลหนึ่งโดยตรงเสมอไปจึงต้องมี
แหล่ง เก็บรวบรวมความรู้ คือ ระบบสารสนเทศ ซึ่งเป็นระบบที่ทำหน้าที่รวบรวม จัดเก็บ และ
นำสารสนเทศไปใช้ในองค์กร ระบบทำหน้าที่เป็นช่องทาง (Channel) ของสารสนเทศ ระบบ
ประกอบด้วยคน ครุภัณฑ์ และกระบวนการ บ่อยครั้งที่คนมักคิดคงระบบสารสนเทศว่าประกอบ
ด้วยระบบคอมพิวเตอร์และมีฐานข้อมูล (Databases) จัดเก็บสารสนเทศเท่านั้น โดยลืมนึกถึง
คน ซึ่งทำหน้าที่รวบรวมสารสนเทศจากแหล่งต่าง ๆ และจัดเก็บไว้ในฐานข้อมูล
การจัดเก็บและค้นคืนสารสนเทศ
เป็นกระบวนการคัดเลือก ควบคุมโครงสร้างสารสนเทศ การจัดหา การจัดเก็บสารสนเทศเพื่อการเข้าถึง และกระบวนการสำคัญใด ๆ ในการแสวงหาทรัพยากรสารสนเทศ ซึ่งครอบคลุมการค้นหา การดึงสารสนเทศที่เข้าเรื่องเรื่องใดเรื่องหนึ่งโดยเฉพาะจากแหล่งต่าง ๆ ทั้งแหล่งจัดเก็บภายใน และแหล่งภายนอก เพื่อให้ผู้ใช้ได้รับสารสนเทศ หรือรายการทรัพยากรสารสนเทศ ซึ่งบรรจุเนื้อหาตรงตามความต้องการและในการบริการจะนำส่งให้ผู้ใช้อย่างรวดเร็วทันการณ์ ทั้งนี้การจัดเก็บและค้นคืนสารสนเทศเป็นระบบที่จัดทำทั้งด้วยแรงงานคนและด้วยคอมพิวเตอร์
การจัดเก็บและค้นคืนสารสนเทศมีความสำคัญต่อ
1. หน่วยงานบริการสารสนเทศ
1.1 เป็นตัวกลางเชื่อมโยงระหว่างผู้ผลิตสารสนเทศ แหล่งสารสนเทศ และผู้ต้องการใช้สารสนเทศ
1.2 ทำให้การถ่ายโอนและไหลเวียนของสารสนเทศเป็นไปอย่างมี ประสิทธิภาพ
1.3 เป็นงานหลักที่เชื่อมโยงกับงานบริการและเผยแพร่สารสนเทศ เพื่อ ส่งเสริมให้เกิดการใช้ สารสนเทศให้เกิดประสิทธิภาพสูงสุด
1.4 ช่วยให้ผู้ใช้ได้รับสารสนเทศที่ถูกต้อง โดยสามารถค้นคืนสารสนเทศได้ ตรงกับความต้องการและได้รับสารสนเทศทันต่อเวลา ซึ่งเป็นไป ตามนโยบายและวัตถุประสงค์ของหน่วยงานบริการสารสนเทศ
2. ผู้ใช้
2.1 เปิดโอกาสให้ผู้ใช้เข้าถึงทรัพยากรสารสนเทศทุกประเภททั้งภายในหน่วยงานบริการสารสนเทศและแหล่งทรัพยากรทั่วโลก อย่างเสรี ภายใต้ข้อกำหนดของกฎหมายในเรื่องสิทธิของการใช้สารสนเทศ
2.2 ให้ความสำคัญแก่ผู้ใช้กลุ่มต่าง ๆ โดยจัดทำเอกสารแนะนำการใช้ ฐานข้อมูลต่าง ๆ จัดเครื่องมืออำนวยความสะดวก เครื่องมือการค้นคืนที่เหมาะสม เพื่อให้ผู้ใช้ค้นคืน สารสนเทศได้ด้วยตนเอง หรือผ่านบรรณารักษ์ตอบคำถาม
อ้างอิง: http://www.slideshare.net/thai2104/chapter1-4517094
1. หน่วยงานบริการสารสนเทศ
ความสำคัญ การจัดเก็บและค้นคืนสารสนเทศต่อหน่วยงานบริการสารสนเทศ
1.1 เป็นตัวกลางเชื่อมโยงระหว่างผู้ผลิตสารสนเทศ แหล่งสารสนเทศ และผู้ต้องการใช้สารสนเทศ
1.2 ทำให้การถ่ายโอนและไหลเวียนของสารสนเทศเป็นไปอย่างมี ประสิทธิภาพ
1.3 เป็นงานหลักที่เชื่อมโยงกับงานบริการและเผยแพร่สารสนเทศ เพื่อ ส่งเสริมให้เกิดการใช้สารสนเทศให้เกิดประสิทธิภาพสูงสุด
1.4 ช่วยให้ผู้ใช้ได้รับสารสนเทศที่ถูกต้อง โดยสามารถค้นคืนสารสนเทศได้ ตรงกับความต้องการและได้รับสารสนเทศทันต่อเวลา ซึ่งเป็นไป ตามนโยบายและวัตถุประสงค์ของหน่วยงานบริการสารสนเทศ
2. ผู้ใช้
ความสำคัญ การจัดเก็บและค้นคืนสารสนเทศ
2.1 เปิดโอกาสให้ผู้ใช้เข้าถึงทรัพยากรสารสนเทศทุกประเภททั้งภายใน หน่วยงานบริการสารสนเทศและแหล่งทรัพยากรทั่วโลก อย่างเสรี ภายใต้ข้อกำหนดของกฎหมายในเรื่องสิทธิของ การใช้สารสนเทศ
2.2 ให้ความสำคัญแก่ผู้ใช้กลุ่มต่าง ๆ โดยจัดทำเอกสารแนะนำการใช้ ฐานข้อมูลต่าง ๆ จัดเครื่องมืออำนวยความสะดวก เครื่องมือการค้นคืนที่เหมาะสม เพื่อให้ผู้ใช้ค้นคืน สารสนเทศได้ด้วยตนเอง หรือผ่านบรรณารักษ์ตอบคำถาม
2.3 มีการพัฒนารูปแบบการดำเนินงานจัดเก็บและค้นคืนสารสนเทศ เพื่อให้เกิดความรวดเร็วทั้งวิธีการจัดหา จัดเก็บ และการค้น คืนสารสนเทศ เพื่อให้ผู้ใช้ได้รับประโยชน์สูงสุด
2.4 ช่วยให้ผู้ใช้ได้รับสารสนเทศที่ถูกต้องและตรงกับความต้องการเพื่อ นำไปใช้ประโยชน์ตามที่ต้องการและความสนใจ
2.5 สนับสนุนผู้ใช้ให้สามารถประเมิน แยกแยะ ทำความเข้าใจ เชื่อมโยงความคิดของสารสนเทศ เพื่อการเลือกสรร ศึกษา แสวงหา และติดตามสารสนเทศได้ด้วยตนเองเป็นผู้เรียน แบบพึ่งตนเองตลอดไป
ขอบเขต การจัดเก็บและค้นคืนสารสนเทศ มี 5 ทฤษฎีพื้นฐาน
1. ทฤษฎีพื้นฐานและการประเมินระบบจัดเก็บและค้นคืน สารสนเทศ
2. เทคโนโลยีและมาตรฐานในการจัดเก็บและค้นคืนสารสนเทศ
3. การวิเคราะห์และตัวแทนสารสนเทศ
4. ผู้ใช้ระบบค้นคืนสารสนเทศและพฤติกรรมการแสวงหา สารสนเทศ
5. การค้นคืนสารสนเทศ
ทฤษฎีพื้นฐานและการประเมินระบบจัดเก็บและค้นคืนสารสนเทศ
องค์ประกอบของการจัดเก็บและค้นคืนสารสนเทศ
ตัวแบบพื้นฐานในการจัดเก็บและค้นคืนสารสนเทศ
ระบบค้นคืนสารสนเทศ ( องค์ประกอบ หน้าที่ และระบบย่อย )
ตัวแบบพฤติกรรมสารสนเทศและแนวคิดพฤติกรรมการแสวงหาสารสนเทศ
การประเมินระบบจัดเก็บและค้นคืนสารสนเทศ ( แนวคิด ขั้นตอน )
อ้างอิง
http://www.slideshare.net/thai2104/chapter1-4517094
การจัดเก็บและการค้นคืนสารสนเทศ
สารสนเทศ คือ ข้อมูล ข่าวสาร ความรู้ในรูปแบบต่าง ๆ ที่ได้ถูกบันทึก ประมวลผล และนำออกเผยแพร่เป็นประโยชน์ต่อส่วนบุคคลและสังคม ก่อนนำออกเผยแพร่นั้นสถาบันบริการสารสนเทศ จะมีกระบวนการในการจัดเก็บสารสนเทศ (information storage) ซึ่งเป็นกระบวนการในการคัดเลือกสารสนเทศ ทั้งจากแหล่งภายใน และภายนอกสถาบันรนำมาวิเคราะห์จัดหมวดหมู่ควบคุมโครงสร้าง จัดทำสื่อการจัดเก็บไม่ว่าจะเป็นด้วยแรงมนุษย์หรือด้วยเครื่องจักร สำหรับการค้นหาและค้นคืนสารสนเทศ (information retrieval) ซึ่งเป็นกระบวนการในการค้นสารสนเทศสำหรับผู้ใช้โดยมีเป้าหมายเพื่อชี้หรือระบุหรือดึงสารสนเทศเฉพาะที่เกี่ยวข้องกับความต้องการของผู้ใช้ออกมาจากที่จัดเก็บ เมื่อผู้ใช้ได้แหล่งสารสนเทศที่ต้องการขั้นตอนต่อไปคือ การถ่ายโอนสารสนเทศ (information transfer) หมายถึง การที่สารสนเทศที่ค้นพบ ได้รับการเปิดเผยหรือส่งต่อไปยังบุคคลอื่นที่ต้องการ
สถาบันบริการสารสนเทศมีบทบาทที่สำคัญในการเป็นตัวกลางระหว่างทรัพยากรสารสนเทศและผู้ใช้ ซึ่งสถาบันฯ จำเป็นต้องมีการจัดหาและจัดเก็บทรัพยากรสารสนเทศในรูปแบบสิ่งพิมพ์และอื่น ๆ จากแหล่งต่าง ๆ และต้องสอดคล้องตามนโยบายและเกณฑ์มาตรฐานในการจัดตั้งสถาบันฯ โดยมีการจัดหมวดหมู่และทำรายการ ตามหลักวิชาการจัดทำโครงสร้างระบบการจัดเก็บและควบคุมเพื่อการค้นหา ค้นคืน ในลักษณะบรรณานุกรม ไม่ว่าจะเป็นบัตรรายการหรือ OPAC ซึ่งสามารถให้สมาชิกใช้ประโยชน์ได้ทุกระดับ อีกทั้งยังมีการทำดรรชนี ทั้งในรูปแบบศัพท์ควบคุมและรูปแบบศัพท์อิสระ เพื่อเป็นเครื่องมือในการค้นหา ค้นคืนสารสนเทศสิ่งหนึ่งที่มักจัดทำร่วมกันกับดรรชนีคือสาระสังเขป เป็นตัวแทนของเนื้อหาสาระจากต้นฉบับ ซึ่งทั้งหมดทั้งสิ้นของกระบวนการจัดหมวดหมู่และทำรายการนี้จะจบลงด้วยการจัดทำฐานข้อมูล เพื่อให้บริการค้นคืนสารสนเทศ ตามขอบเขตหน้าที่และวัตถุประสงค์ของสถาบัน สำหรับบริการพื้นฐานก็จะมี บริการยืม-คืน บริการการอ่าน บริการตอบคำถามและช่วยค้นคว้า ฯ นอกจากนี้ยังมีบริการส่งเสริมการใช้ เช่น บริการสารสนเทศทันสมัย บริการเลือกสรรสารสนเทศเฉพาะบุคคล ฯลฯ เป็นต้น การจัดเก็บและการค้นคืนสารสนเทศ เป็นงานหลักที่เชื่อมโยงระบบบริการต่าง ๆ และระบบงานของสถาบัน ในส่วนความสำคัญต่อผู้ใช้ อาจกล่าวได้ว่า การจัดเก็บและค้นคืนสารสนเทศ ขจัดปัญหาต่าง ๆ ในการเข้าถึงสารสนเทศ เปิดโอกาสให้ผู้ใช้เข้าถึงทรัพยากรสารสนเทศทุกประเภททั้งภายในและภายนอกสถาบัน มีเครื่องมืออำนวยความสะดวกในการเข้าถึง เกิดความรวดเร็วในการเข้าถึงสารสนเทศตรงกับความต้องการเพื่อตอบสนองความต้องการในการใช้สารสนเทศในภารกิจต่าง ๆ ด้วยตนเอง
พัฒนาการของการจัดเก็บและการค้นค้นสารสนเทศ
ก่อนทศวรรษ 1960 การจัดเก็บและการค้นคืน เข้ามามีบทบาทตั้งแต่เริ่มมีการบันทึกลงกระดาษ และเมื่อมีเครื่องพิมพ์ในศตวรรษที่ 15 ทำให้หนังสือมีจำนวนมากขึ้น เป็นจุดเริ่มต้นความคิดและแนวทางการใช้เทคโนโลยีสมัยใหม่ในการแก้ไขปัญหาเกี่ยวกับการจัดเก็บและค้นคืนสารสนเทศที่ผลิตออกมามากมาย จึงส่งผลให้เกิดความคิดในการควบคุมทางบรรณานุกรม ในระยะแรกนั้นใช้ประโยชน์ได้เฉพาะกลุ่ม บัตรรายการที่จัดทำไม่สมบูรณ์แบบ ไม่ทันสมัย จนทำให้เกิดมาตรฐานในการจัดหมวดหมู่ขึ้นโดยวิเคราะห์เนื้อหา ระบบที่นิยมและรู้จักกันดีดือ DC และ LC และใช้กันมาจนถึงปัจจุบัน สำหรับการทำดรรชนีและสาระสังเขป ในยุคแรกนั้นเริ่มต้นในยุโรป จัดทำเพื่อใช้ในศาสนกิจ และพัฒนาไปศาสตร์อื่น ๆ จนในศตรวรรษที่ 20 จึงมีการสำรวจการบริการสาระสังเขปและดรรชนีของโลก มีการใช้เครื่องจักรในการให้บริการ และมาตรฐานในการจัดทำ เทคโนโลยีระยะแรกนั้น เริ่มจากการใช้เทคโนโลยีไมโครกราฟิกซึ่งเป็นเทคโนโลยีการถ่ายภาพย่อส่วนสารสนเทศจากต้นฉบับ ซึ่งมีขนาดเล็กมาก จนไม่สามารถอ่านได้ด้วยตาเปล่า และการค้นคืนสารสนเทศที่ต้องการบนไมโครฟอร์มให้ได้อย่างสะดวกและรวดเร็วด้วยเทคนิควิธีการต่าง ๆ สำหรับเทคโนโลยีในการค้นคืนสารสนเทศนั้นเริ่มต้นจากแนวคิดจากบทความของ ชื่อ “As we May Think” ซึ่งกล่าวถึงการใช้อุปกรณ์เมมเมกซ์ (Memex) ในการจัดเก็บและค้นคืนจนเกิดความพยายามวิจัยพัฒนาเทคโนโลยีด้านการจัดเก็บและค้นคืนสารสนเทศโดยคอมพิวเตอร์ ระบบแรกนั้นคือการทำดรรชนี KWIC-KWOC และต่อมาหอสมุดรัฐสภาอเมริกันได้เริ่มต้นสร้างระเบียนข้อมูล MARC โดยบรรจุรายละเอียดของบัตรรายการลงในแถบแม่เหล็ก
ตั้งแต่ทศวรรษ 1960 NASA ต้องการใช้ข้อมูลจำนวนมากจึงให้เงินสนับสนุนการวิจัยที่สามารถนำมาใช้ในการจัดเก็บและค้นคืน และการวิจัยของกลุ่มวิจัยแครนฟิลด์เป็นการพัฒนาต้นแบบระบบค้นคืนอัตโนมัติ ในช่วงนี้มีการพัฒนากลุ่มความร่วมมือในการใช้ฐานข้อมูลร่วมกัน เช่น OCLC, RLIN และช่วงทศวรรษนี้ ได้เริ่มมีบริการค้นคืนสารสนเทศเชิงพาณิชย์ และเริ่มมีการบริการออนไลน์ เช่น DIALOG, ORBIT และปลายทศวรรษ 1980 เทคโนโลยี ซีดี-รอมถูกใช้อย่างกว้างขวาง จนกระทั่งทศวรรษ 1990 มีการใช้เทคโนโลยีเว็บซึ่งให้บริการบนอินเทอร์เน็ต เป็นแหล่งให้บริการค้นคืนที่มีปริมาณมากขึ้นอย่างไม่หยุดยั้งจนถึงปัจจุบัน
IR – เกี่ยวข้องกับการแสดง ,จัดเก็บ , จัดโครงสร้าง และการเข้าถึง Information item
Goal ของ IR คือ การดึงข้อมูลที่มีประโยชน์หรือที่เกี่ยวข้องให้กับ user ซึ่งสิ่งสำคัญคือการดึง info ไม่ใช่ดึง data หรือคือการดึงทุกๆ documents ที่เกี่ยวข้องกับ user query ออกมาให้หมดและดึง document ที่ไม่เกี่ยวข้องให้น้อยที่สุดเท่าที่จะเป็นไปได้
Data Retrieval – เป็นการดึงทุก object ที่ตรงกับเงื่อนไขที่ถูกกำหนดไว้อย่างชัดเจน เช่น เงื่อนไขแบบ regular expression หรือ relational algebra expression ซึ่งแม้มีเพียง error object เดียวถูกดึงขึ้นมาท่ามกลาง object อื่นๆ ที่ถูกดึงขึ้นมาก็จะหมายถึงความล้มเหลวทั้งหมด DR เป็นการแก้ปัญหาของ Database system
Information Retrieval – Object ที่ถูกดึงขึ้นมาอาจไม่ถูกต้องถึงมี error บ้างก็ไม่เป็นไร จะเกี่ยวข้องกับ Natural language text ซึ่งไม่มีโครงสร้างที่ดีสามารถตีความหมายสับสนได้ และสามารถเรียง document ที่ถูกดึงขึ้นมาตามระดับความเกี่ยวข้องกับ user query ได้
งานที่ User ระบบ Retreival ต้องเกี่ยวข้องจะมีอยู่ 2 แบบคือ Information หรือ Data Retreival และ การ Browsing (รูป 1.1 pg 4)
User ระบบ Retreival ต้องแปลความต้องการข้อมูลของตนให้เป็น query ในภาษาที่ระบบเข้าใจ ซึ่งถ้าเป็นระบบ IR ก็จะหมายความถึงการระบุกลุ่มคำที่ให้ความหมาย(semantic) ของข้อมูลที่ต้องการ ถ้าเป็น DR จะเป็นการใช้ Query Expression ในการกำหนดเงื่อนไขที่ทำให้ได้ Object ใน Set คำตอบมา ซึ่งทั้ง 2 กรณีสามารถกล่าวได้ว่า User ค้นหาข้อมูลที่ต้องการโดย Retrieval Task
Browsing – จริงๆแล้วคือกระบวนการการดึงข้อมูลแต่จะเป็นลักษณะที่วัตถุประสงค์หลักในการดึงตอนต้นไม่แน่ชัดและจุดประสงค์อาจเปลี่ยนไปได้ระหว่างที่มีการโต้ตอบ (Interaction) กับระบบ
ทั้งการ Retreival และการ Browsing ในภาษาของ WWW จะเรียกว่าการ Pulling ซึ่งก็คือการที่ User request ข้อมูลในลักษณะ Interactive นั่นเอง แต่ก็มีอีกทางเลือกหนึ่งคือการดึงข้อมูลแบบอัตโนมัติโดยใช้ software ดึงให้ User เรียกว่าการ Push ตย.เช่น User สามารถได้รับข้อมูลจากการบริการให้ข่าวสารทุกช่วงเวลาที่กำหนดเอง เช่น ต้องการทุกวัน
Document ใน Collection มักจะถูก represent ในรูปของกลุ่มของ Index terms หรือ keywords ซึ่งไม่ว่า keywords จะถูกดึงออกมาจาก text ใน document โดยตรงแบบอัตโนมัติ หรือถูกระบุโดยผู้เชี่ยวชาญก็ตามมันจะเรียกว่าเป็น logical view of the document
Computer สมัยใหม่สามารถ represent document โดยใช้ทุกๆคำใน document (Full set of word) .ในการ represent ได้ ซึ่งกรณีนี้จะกล่าวได้ว่า Retrieval System รับเอา full text logical view of the document มาใช้ แต่ถ้าเป็น collection ใหญ่ๆ (มี document จำนวนมาก) แม้กระทั่ง Computer สมัยใหม่ ก็อาจต้องลดจำนวน keyword ลง โดยการ กำจัด stopwords(article และ คำเชื่อม) , การใช้วิธี stemming (รากศัพท์) , การระบุ Noun groups (ซึ่งเป็นการกำจัด adj,adv และ verb) และอาจมีการใช้วิธี compression ด้วย ซึ่งวิธีต่างๆที่กล่าวมาเรียกว่า text operation (หรือ transformation) ซึ่ง Text Operation จะช่วยลดความซับซ้อนยุ่งยากของ document representation และเป็นการเปลี่ยน logical view จาก full text เป็น set ของ index terms (รูป1.2 pg.6)
นอกจาก full text และการระบุโดยผู้เชี่ยวชาญแล้ว Retrieval system ยังใช้วิธีจดจำโครงสร้างภายในของ document ได้ (เช่น Chapters, sections, subsections เป็นต้น) ซึ่งข้อมูลเกี่ยวกับโครงสร้างจะมีประโยชน์และจำเป็นสำหรับโมเดลการ retrieve แบบโครงสร้าง
ในการอธิบาย Retrieval Process ดูรูป1.3 แรกสุดก่อนจะเริ่มต้นกระบวนการ Retrieval (Retrieval Process) จำเป็นต้องมีการ define text database ก่อน และมักจะทำโดย manager ของ database ซึ่งต้องมีการระบุสิ่งต่างๆดังนี้ (a) document ที่จะใช้ (b) Operation อะไรที่จะทำบน text (c) text model (เช่น โครงสร้างของ text และ element อะไรที่สามารถจะดึงขึ้นมาได้)
เมื่อได้มีการกำหนดรูปแบบ Logical view of the documents แล้ว Database Manager (ใช้ DB. Manager Module) สร้าง index ของ text โดยIndex เป็นโครงสร้างข้อมูลที่สำคัญในการทำให้การค้นหา Data ปริมาณมากได้อย่างรวดเร็วซึ่งอาจมีได้หลายโครงสร้าง Index แต่อันที่นิยมใช้คือ Inverted file (ดังในรูป1.3)
เมื่อมีการทำ index บน document database แล้ว กระบวนการ Retrieval ก็จะเริ่มต้นขึ้น โดยในตอนต้น User ระบุสิ่งที่ต้องการ(User Need) ซึ่งจะถูก parsed และเปลี่ยนรูปโดย text operation เดียวกับที่ใช้กับ text ในฐานข้อมูล จากนั้นอาจมีการใช้ Query Operation ก่อน query ปกติ และต่อมาจึงจะประมวลผล query เพื่อที่จะดึง document ขึ้นมา การประมวลผล queryจะเร็วได้นั้นขึ้นกับโครงสร้าง Index ที่ถูกสร้างไว้ก่อนหน้านี้
ก่อนที่จะให้ user เห็นนั้น document ที่ถูกดึงขึ้นมาจะถูกเรียงตามระดับความเกี่ยวข้อง ซึ่ง user จะตรวจดู document ที่ถูกเรียงแล้วเหล่านี้เพื่อหาขอ้มูลที่ตนสนใจ และณ จุดนี้ user อาจจะเจาะจง document ที่สนใจให้ระบบเพื่อเริ่มต้นวงจร user feedback ซึ่งระบบจะใช้ document ที่เลือกโดย user ในการเปลี่ยน query formulation โดยหวังว่า query ใหม่นี้จะทำให้ตรงกับที่ user ต้องการมากกกว่าเดิม
ส่วนใหญ่ user มักจะไม่มีความรู้ทางด้าน text และ query operation และจะทำให้ query ที่ใส่ไม่ถูกต้อง ซึ่ง query ที่มีรูปแบบไม่ดีอาจนำไปสู่การ retrieval ที่ไม่ดี (poor retrieval) ได้
ก่อนที่จะมีการ implement ระบบ IR ควรจะมีการประเมินระบบก่อน ซึ่งรูปแบบของการประเมินจะขึ้นอยู่กับวัตถุประสงค์ของ Retrieval System รูปแบบการประเมินแบบแรก คือ function analysis เป็นการทดสอบ function ที่ควรทำได้ไปทีละ function ซึ่งการวิเคราะห์แบบนี้ควรรวม phase การวิเคราะห์ error ไปในตัวด้วย เมื่อผ่าน function analysis แล้ว ขั้นต่อไปคือการประเมิน performance ของระบบ
ตัววัดปกติที่ใช้วัด performance ระบบ คือ time และ space , response time ยิ่งน้อย space ที่ใช้ยิ่งน้อย ระบบยิ่งดี
ในระบบที่ออกแบบสำหรับ DR ,Response time และ space ที่ต้องใช้มักจะเป็นตัววัดที่นิยมใช้ในการประเมินระบบ ซึ่งกรณีนี้เราจะดู performance ของ โครงสร้าง index (เป็นส่วนที่ทำให้การค้นหาเร็วขึ้น) ,ดูการโต้ตอบกับ OS , ดู delay ในช่องการสื่อสาร และ overhead ของ software layer ต่างๆที่มี ซึ่งรูปแบบการประเมินต่างๆเหล่านี้เรารวมๆเรียกว่า performance evaluation
สำหรับระบบที่ออกแบบเป็น IR มีการสนใจตัววัดอื่นนอกจาก time และ space เนื่องจากความคลุมเครือของ User Query , document ที่ถูกดึงขึ้นมาก็ไม่ใช่สิ่งที่ต้องการที่แท้จริงและต้องเรียงลำดับตามความเกี่ยวข้องซึ่งการเรียงลำดับนี้เป็นสิ่งที่ไม่มีใน DR แต่จำเป็นใน IR ดังนั้น IR จึงต้องการการประเมินเรื่องความถูกต้องของ answer set ด้วยซึ่งการประเมินนี้เรียกว่า Retrieval performance evaluation
บทนี้จะกล่าวถึงการประเมินใน IR ซึ่งการประเมินนี้จะ based on test reference collection และ ตัววัดการประเมิน (evaluation measure) , test reference collection จะประกอบไปด้วย กลุ่มของ document , กลุ่ม Information requests ตัวอย่าง และกลุ่มของ relevant document (ระบุความ relevantโดยผู้เชี่ยวชาญ)สำหรับแต่ละ Information request ตัวอย่าง ถ้ากำหนด strategy การ retrieve S , ตัววัดการประเมินจะวัด (วัดแต่ละ Information Request ตัวอย่าง) similarity ระหว่างกลุ่มของ document ที่ดึงขึ้นมาโดย S กับ กลุ่มของ relevant document ที่ระบุโดยผู้เชี่ยวชาญ ซึ่งสามารถจะประมาณประสิทธิภาพ(goodness) ของ strategy การ retrieve S ได้
อ้างอิง : http://stouis4.blogspot.com/2007/06/13703-1.html
http://ism11nida.com/redirect.php?tid=247&goto=lastpost&styleid=27
การจัดเก็บและการค้นคืนสารสนเทศ
สารสนเทศ คือ ข้อมูล ข่าวสาร ความรู้ในรูปแบบต่าง ๆ ที่ได้ถูกบันทึก ประมวลผล และนำออกเผยแพร่เป็นประโยชน์ต่อส่วนบุคคลและสังคม ก่อนนำออกเผยแพร่นั้นสถาบันบริการสารสนเทศ จะมีกระบวนการในการจัดเก็บสารสนเทศ (information storage) ซึ่งเป็นกระบวนการในการคัดเลือกสารสนเทศ ทั้งจากแหล่งภายใน และภายนอกสถาบันรนำมาวิเคราะห์จัดหมวดหมู่ควบคุมโครงสร้าง จัดทำสื่อการจัดเก็บไม่ว่าจะเป็นด้วยแรงมนุษย์หรือด้วยเครื่องจักร สำหรับการค้นหาและค้นคืนสารสนเทศ (information retrieval) ซึ่งเป็นกระบวนการในการค้นสารสนเทศสำหรับผู้ใช้โดยมีเป้าหมายเพื่อชี้หรือระบุหรือดึงสารสนเทศเฉพาะที่เกี่ยวข้องกับความต้องการของผู้ใช้ออกมาจากที่จัดเก็บ เมื่อผู้ใช้ได้แหล่งสารสนเทศที่ต้องการขั้นตอนต่อไปคือ การถ่ายโอนสารสนเทศ (information transfer) หมายถึง การที่สารสนเทศที่ค้นพบ ได้รับการเปิดเผยหรือส่งต่อไปยังบุคคลอื่นที่ต้องการ
สถาบันบริการสารสนเทศมีบทบาทที่สำคัญในการเป็นตัวกลางระหว่างทรัพยากรสารสนเทศและผู้ใช้ ซึ่งสถาบันฯ จำเป็นต้องมีการจัดหาและจัดเก็บทรัพยากรสารสนเทศในรูปแบบสิ่งพิมพ์และอื่น ๆ จากแหล่งต่าง ๆ และต้องสอดคล้องตามนโยบายและเกณฑ์มาตรฐานในการจัดตั้งสถาบันฯ โดยมีการจัดหมวดหมู่และทำรายการ ตามหลักวิชาการจัดทำโครงสร้างระบบการจัดเก็บและควบคุมเพื่อการค้นหา ค้นคืน ในลักษณะบรรณานุกรม ไม่ว่าจะเป็นบัตรรายการหรือ OPAC ซึ่งสามารถให้สมาชิกใช้ประโยชน์ได้ทุกระดับ อีกทั้งยังมีการทำดรรชนี ทั้งในรูปแบบศัพท์ควบคุมและรูปแบบศัพท์อิสระ เพื่อเป็นเครื่องมือในการค้นหา ค้นคืนสารสนเทศสิ่งหนึ่งที่มักจัดทำร่วมกันกับดรรชนีคือสาระสังเขป เป็นตัวแทนของเนื้อหาสาระจากต้นฉบับ ซึ่งทั้งหมดทั้งสิ้นของกระบวนการจัดหมวดหมู่และทำรายการนี้จะจบลงด้วยการจัดทำฐานข้อมูล เพื่อให้บริการค้นคืนสารสนเทศ ตามขอบเขตหน้าที่และวัตถุประสงค์ของสถาบัน สำหรับบริการพื้นฐานก็จะมี บริการยืม-คืน บริการการอ่าน บริการตอบคำถามและช่วยค้นคว้า ฯ นอกจากนี้ยังมีบริการส่งเสริมการใช้ เช่น บริการสารสนเทศทันสมัย บริการเลือกสรรสารสนเทศเฉพาะบุคคล ฯลฯ เป็นต้น การจัดเก็บและการค้นคืนสารสนเทศ เป็นงานหลักที่เชื่อมโยงระบบบริการต่าง ๆ และระบบงานของสถาบัน ในส่วนความสำคัญต่อผู้ใช้ อาจกล่าวได้ว่า การจัดเก็บและค้นคืนสารสนเทศ ขจัดปัญหาต่าง ๆ ในการเข้าถึงสารสนเทศ เปิดโอกาสให้ผู้ใช้เข้าถึงทรัพยากรสารสนเทศทุกประเภททั้งภายในและภายนอกสถาบัน มีเครื่องมืออำนวยความสะดวกในการเข้าถึง เกิดความรวดเร็วในการเข้าถึงสารสนเทศตรงกับความต้องการเพื่อตอบสนองความต้องการในการใช้สารสนเทศในภารกิจต่าง ๆ ด้วยตนเอง
พัฒนาการของการจัดเก็บและการค้นค้นสารสนเทศ
ก่อนทศวรรษ 1960 การจัดเก็บและการค้นคืน เข้ามามีบทบาทตั้งแต่เริ่มมีการบันทึกลงกระดาษ และเมื่อมีเครื่องพิมพ์ในศตวรรษที่ 15 ทำให้หนังสือมีจำนวนมากขึ้น เป็นจุดเริ่มต้นความคิดและแนวทางการใช้เทคโนโลยีสมัยใหม่ในการแก้ไขปัญหาเกี่ยวกับการจัดเก็บและค้นคืนสารสนเทศที่ผลิตออกมามากมาย จึงส่งผลให้เกิดความคิดในการควบคุมทางบรรณานุกรม ในระยะแรกนั้นใช้ประโยชน์ได้เฉพาะกลุ่ม บัตรรายการที่จัดทำไม่สมบูรณ์แบบ ไม่ทันสมัย จนทำให้เกิดมาตรฐานในการจัดหมวดหมู่ขึ้นโดยวิเคราะห์เนื้อหา ระบบที่นิยมและรู้จักกันดีดือ DC และ LC และใช้กันมาจนถึงปัจจุบัน สำหรับการทำดรรชนีและสาระสังเขป ในยุคแรกนั้นเริ่มต้นในยุโรป จัดทำเพื่อใช้ในศาสนกิจ และพัฒนาไปศาสตร์อื่น ๆ จนในศตรวรรษที่ 20 จึงมีการสำรวจการบริการสาระสังเขปและดรรชนีของโลก มีการใช้เครื่องจักรในการให้บริการ และมาตรฐานในการจัดทำ เทคโนโลยีระยะแรกนั้น เริ่มจากการใช้เทคโนโลยีไมโครกราฟิกซึ่งเป็นเทคโนโลยีการถ่ายภาพย่อส่วนสารสนเทศจากต้นฉบับ ซึ่งมีขนาดเล็กมาก จนไม่สามารถอ่านได้ด้วยตาเปล่า และการค้นคืนสารสนเทศที่ต้องการบนไมโครฟอร์มให้ได้อย่างสะดวกและรวดเร็วด้วยเทคนิควิธีการต่าง ๆ สำหรับเทคโนโลยีในการค้นคืนสารสนเทศนั้นเริ่มต้นจากแนวคิดจากบทความของ ชื่อ “As we May Think” ซึ่งกล่าวถึงการใช้อุปกรณ์เมมเมกซ์ (Memex) ในการจัดเก็บและค้นคืนจนเกิดความพยายามวิจัยพัฒนาเทคโนโลยีด้านการจัดเก็บและค้นคืนสารสนเทศโดยคอมพิวเตอร์ ระบบแรกนั้นคือการทำดรรชนี KWIC-KWOC และต่อมาหอสมุดรัฐสภาอเมริกันได้เริ่มต้นสร้างระเบียนข้อมูล MARC โดยบรรจุรายละเอียดของบัตรรายการลงในแถบแม่เหล็ก
ตั้งแต่ทศวรรษ 1960 NASA ต้องการใช้ข้อมูลจำนวนมากจึงให้เงินสนับสนุนการวิจัยที่สามารถนำมาใช้ในการจัดเก็บและค้นคืน และการวิจัยของกลุ่มวิจัยแครนฟิลด์เป็นการพัฒนาต้นแบบระบบค้นคืนอัตโนมัติ ในช่วงนี้มีการพัฒนากลุ่มความร่วมมือในการใช้ฐานข้อมูลร่วมกัน เช่น OCLC, RLIN และช่วงทศวรรษนี้ ได้เริ่มมีบริการค้นคืนสารสนเทศเชิงพาณิชย์ และเริ่มมีการบริการออนไลน์ เช่น DIALOG, ORBIT และปลายทศวรรษ 1980 เทคโนโลยี ซีดี-รอมถูกใช้อย่างกว้างขวาง จนกระทั่งทศวรรษ 1990 มีการใช้เทคโนโลยีเว็บซึ่งให้บริการบนอินเทอร์เน็ต เป็นแหล่งให้บริการค้นคืนที่มีปริมาณมากขึ้นอย่างไม่หยุดยั้งจนถึงปัจจุบัน
IR – เกี่ยวข้องกับการแสดง ,จัดเก็บ , จัดโครงสร้าง และการเข้าถึง Information item
Goal ของ IR คือ การดึงข้อมูลที่มีประโยชน์หรือที่เกี่ยวข้องให้กับ user ซึ่งสิ่งสำคัญคือการดึง info ไม่ใช่ดึง data หรือคือการดึงทุกๆ documents ที่เกี่ยวข้องกับ user query ออกมาให้หมดและดึง document ที่ไม่เกี่ยวข้องให้น้อยที่สุดเท่าที่จะเป็นไปได้
Data Retrieval – เป็นการดึงทุก object ที่ตรงกับเงื่อนไขที่ถูกกำหนดไว้อย่างชัดเจน เช่น เงื่อนไขแบบ regular expression หรือ relational algebra expression ซึ่งแม้มีเพียง error object เดียวถูกดึงขึ้นมาท่ามกลาง object อื่นๆ ที่ถูกดึงขึ้นมาก็จะหมายถึงความล้มเหลวทั้งหมด DR เป็นการแก้ปัญหาของ Database system
Information Retrieval – Object ที่ถูกดึงขึ้นมาอาจไม่ถูกต้องถึงมี error บ้างก็ไม่เป็นไร จะเกี่ยวข้องกับ Natural language text ซึ่งไม่มีโครงสร้างที่ดีสามารถตีความหมายสับสนได้ และสามารถเรียง document ที่ถูกดึงขึ้นมาตามระดับความเกี่ยวข้องกับ user query ได้
งานที่ User ระบบ Retreival ต้องเกี่ยวข้องจะมีอยู่ 2 แบบคือ Information หรือ Data Retreival และ การ Browsing (รูป 1.1 pg 4)
User ระบบ Retreival ต้องแปลความต้องการข้อมูลของตนให้เป็น query ในภาษาที่ระบบเข้าใจ ซึ่งถ้าเป็นระบบ IR ก็จะหมายความถึงการระบุกลุ่มคำที่ให้ความหมาย(semantic) ของข้อมูลที่ต้องการ ถ้าเป็น DR จะเป็นการใช้ Query Expression ในการกำหนดเงื่อนไขที่ทำให้ได้ Object ใน Set คำตอบมา ซึ่งทั้ง 2 กรณีสามารถกล่าวได้ว่า User ค้นหาข้อมูลที่ต้องการโดย Retrieval Task
Browsing – จริงๆแล้วคือกระบวนการการดึงข้อมูลแต่จะเป็นลักษณะที่วัตถุประสงค์หลักในการดึงตอนต้นไม่แน่ชัดและจุดประสงค์อาจเปลี่ยนไปได้ระหว่างที่มีการโต้ตอบ (Interaction) กับระบบ
ทั้งการ Retreival และการ Browsing ในภาษาของ WWW จะเรียกว่าการ Pulling ซึ่งก็คือการที่ User request ข้อมูลในลักษณะ Interactive นั่นเอง แต่ก็มีอีกทางเลือกหนึ่งคือการดึงข้อมูลแบบอัตโนมัติโดยใช้ software ดึงให้ User เรียกว่าการ Push ตย.เช่น User สามารถได้รับข้อมูลจากการบริการให้ข่าวสารทุกช่วงเวลาที่กำหนดเอง เช่น ต้องการทุกวัน
Document ใน Collection มักจะถูก represent ในรูปของกลุ่มของ Index terms หรือ keywords ซึ่งไม่ว่า keywords จะถูกดึงออกมาจาก text ใน document โดยตรงแบบอัตโนมัติ หรือถูกระบุโดยผู้เชี่ยวชาญก็ตามมันจะเรียกว่าเป็น logical view of the document
Computer สมัยใหม่สามารถ represent document โดยใช้ทุกๆคำใน document (Full set of word) .ในการ represent ได้ ซึ่งกรณีนี้จะกล่าวได้ว่า Retrieval System รับเอา full text logical view of the document มาใช้ แต่ถ้าเป็น collection ใหญ่ๆ (มี document จำนวนมาก) แม้กระทั่ง Computer สมัยใหม่ ก็อาจต้องลดจำนวน keyword ลง โดยการ กำจัด stopwords(article และ คำเชื่อม) , การใช้วิธี stemming (รากศัพท์) , การระบุ Noun groups (ซึ่งเป็นการกำจัด adj,adv และ verb) และอาจมีการใช้วิธี compression ด้วย ซึ่งวิธีต่างๆที่กล่าวมาเรียกว่า text operation (หรือ transformation) ซึ่ง Text Operation จะช่วยลดความซับซ้อนยุ่งยากของ document representation และเป็นการเปลี่ยน logical view จาก full text เป็น set ของ index terms (รูป1.2 pg.6)
นอกจาก full text และการระบุโดยผู้เชี่ยวชาญแล้ว Retrieval system ยังใช้วิธีจดจำโครงสร้างภายในของ document ได้ (เช่น Chapters, sections, subsections เป็นต้น) ซึ่งข้อมูลเกี่ยวกับโครงสร้างจะมีประโยชน์และจำเป็นสำหรับโมเดลการ retrieve แบบโครงสร้าง
ในการอธิบาย Retrieval Process ดูรูป1.3 แรกสุดก่อนจะเริ่มต้นกระบวนการ Retrieval (Retrieval Process) จำเป็นต้องมีการ define text database ก่อน และมักจะทำโดย manager ของ database ซึ่งต้องมีการระบุสิ่งต่างๆดังนี้ (a) document ที่จะใช้ (b) Operation อะไรที่จะทำบน text (c) text model (เช่น โครงสร้างของ text และ element อะไรที่สามารถจะดึงขึ้นมาได้)
เมื่อได้มีการกำหนดรูปแบบ Logical view of the documents แล้ว Database Manager (ใช้ DB. Manager Module) สร้าง index ของ text โดยIndex เป็นโครงสร้างข้อมูลที่สำคัญในการทำให้การค้นหา Data ปริมาณมากได้อย่างรวดเร็วซึ่งอาจมีได้หลายโครงสร้าง Index แต่อันที่นิยมใช้คือ Inverted file (ดังในรูป1.3)
เมื่อมีการทำ index บน document database แล้ว กระบวนการ Retrieval ก็จะเริ่มต้นขึ้น โดยในตอนต้น User ระบุสิ่งที่ต้องการ(User Need) ซึ่งจะถูก parsed และเปลี่ยนรูปโดย text operation เดียวกับที่ใช้กับ text ในฐานข้อมูล จากนั้นอาจมีการใช้ Query Operation ก่อน query ปกติ และต่อมาจึงจะประมวลผล query เพื่อที่จะดึง document ขึ้นมา การประมวลผล queryจะเร็วได้นั้นขึ้นกับโครงสร้าง Index ที่ถูกสร้างไว้ก่อนหน้านี้
ก่อนที่จะให้ user เห็นนั้น document ที่ถูกดึงขึ้นมาจะถูกเรียงตามระดับความเกี่ยวข้อง ซึ่ง user จะตรวจดู document ที่ถูกเรียงแล้วเหล่านี้เพื่อหาขอ้มูลที่ตนสนใจ และณ จุดนี้ user อาจจะเจาะจง document ที่สนใจให้ระบบเพื่อเริ่มต้นวงจร user feedback ซึ่งระบบจะใช้ document ที่เลือกโดย user ในการเปลี่ยน query formulation โดยหวังว่า query ใหม่นี้จะทำให้ตรงกับที่ user ต้องการมากกกว่าเดิม
ส่วนใหญ่ user มักจะไม่มีความรู้ทางด้าน text และ query operation และจะทำให้ query ที่ใส่ไม่ถูกต้อง ซึ่ง query ที่มีรูปแบบไม่ดีอาจนำไปสู่การ retrieval ที่ไม่ดี (poor retrieval) ได้
ก่อนที่จะมีการ implement ระบบ IR ควรจะมีการประเมินระบบก่อน ซึ่งรูปแบบของการประเมินจะขึ้นอยู่กับวัตถุประสงค์ของ Retrieval System รูปแบบการประเมินแบบแรก คือ function analysis เป็นการทดสอบ function ที่ควรทำได้ไปทีละ function ซึ่งการวิเคราะห์แบบนี้ควรรวม phase การวิเคราะห์ error ไปในตัวด้วย เมื่อผ่าน function analysis แล้ว ขั้นต่อไปคือการประเมิน performance ของระบบ
ตัววัดปกติที่ใช้วัด performance ระบบ คือ time และ space , response time ยิ่งน้อย space ที่ใช้ยิ่งน้อย ระบบยิ่งดี
ในระบบที่ออกแบบสำหรับ DR ,Response time และ space ที่ต้องใช้มักจะเป็นตัววัดที่นิยมใช้ในการประเมินระบบ ซึ่งกรณีนี้เราจะดู performance ของ โครงสร้าง index (เป็นส่วนที่ทำให้การค้นหาเร็วขึ้น) ,ดูการโต้ตอบกับ OS , ดู delay ในช่องการสื่อสาร และ overhead ของ software layer ต่างๆที่มี ซึ่งรูปแบบการประเมินต่างๆเหล่านี้เรารวมๆเรียกว่า performance evaluation
สำหรับระบบที่ออกแบบเป็น IR มีการสนใจตัววัดอื่นนอกจาก time และ space เนื่องจากความคลุมเครือของ User Query , document ที่ถูกดึงขึ้นมาก็ไม่ใช่สิ่งที่ต้องการที่แท้จริงและต้องเรียงลำดับตามความเกี่ยวข้องซึ่งการเรียงลำดับนี้เป็นสิ่งที่ไม่มีใน DR แต่จำเป็นใน IR ดังนั้น IR จึงต้องการการประเมินเรื่องความถูกต้องของ answer set ด้วยซึ่งการประเมินนี้เรียกว่า Retrieval performance evaluation
บทนี้จะกล่าวถึงการประเมินใน IR ซึ่งการประเมินนี้จะ based on test reference collection และ ตัววัดการประเมิน (evaluation measure) , test reference collection จะประกอบไปด้วย กลุ่มของ document , กลุ่ม Information requests ตัวอย่าง และกลุ่มของ relevant document (ระบุความ relevantโดยผู้เชี่ยวชาญ)สำหรับแต่ละ Information request ตัวอย่าง ถ้ากำหนด strategy การ retrieve S , ตัววัดการประเมินจะวัด (วัดแต่ละ Information Request ตัวอย่าง) similarity ระหว่างกลุ่มของ document ที่ดึงขึ้นมาโดย S กับ กลุ่มของ relevant document ที่ระบุโดยผู้เชี่ยวชาญ ซึ่งสามารถจะประมาณประสิทธิภาพ(goodness) ของ strategy การ retrieve S ได้
อ้างอิง : http://stouis4.blogspot.com/2007/06/13703-1.html
http://ism11nida.com/redirect.php?tid=247&goto=lastpost&styleid=27
ที่มา : คณาจารย์ภาควิชาบรรณารักษศาสตร์และสารสนเทศศาสตร์ คณะมนุษยศาสตร์ มหาวิทยาลัย
ศรีนครินทรวิโรฒ.//(2548).ทักษะการรู้สารสนเทศ.//พิมพ์ครั้งแรก.//กรุงเทพฯ: ภาควิชา
บรรณารักษศาสตร์และสารสนเทศศาสตร์ คณะมนุษยศาสตร์ มหาวิทยาลัยศรีนครินทรวิโรฒ
ที่มา : คณาจารย์ภาควิชาบรรณารักษศาสตร์และสารสนเทศศาสตร์ คณะมนุษยศาสตร์ มหาวิทยาลัย
ศรีนครินทรวิโรฒ.//(2548).ทักษะการรู้สารสนเทศ.//พิมพ์ครั้งแรก.//กรุงเทพฯ: ภาควิชา
บรรณารักษศาสตร์และสารสนเทศศาสตร์ คณะมนุษยศาสตร์ มหาวิทยาลัยศรีนครินทรวิโรฒ