ข้อมูล (Data) : ฐานข้อมูลและระบบการจัดการฐานข้อมูล (Database and database management system)

1. ฐานข้อมูลและกรรมวิธีข้อมูล (Database and data process)

รูปแบบการจัดเก็บข้อมูลแต่เดิมแบบแฟ้มข้อมูล ต่อมาได้มีการจัดข้อมูลให้อยู่ในรูปฐานข้อมูล เพื่อลดปัญหาการซ้ำซ้อนของข้อมูล (Data redundancy) และความขัดแย้งกันของข้อมูล อันมีสาเหตุจากการแก้ไขข้อมูล(Modification anomaly) การเพิ่มข้อมูล (Insertion anomaly) และการลบข้อมูล (Deletion anomaly) เป็นต้น ปัญหาเหล่านี้ ทำให้การวิเคราะห์ไม่ถูกต้องและขาดประสิทธิภาพ

รูปแบบฐานข้อมูลแตกต่างรูปแบบแฟ้มข้อมูล โดยฐานข้อมูลเป็นการนำเอาข้อมูลต่างๆ ที่มีความสัมพันธ์กันซึ่งแต่เดิมจัดเก็บอยู่ในแต่ละแฟ้มข้อมูลมาจัดเก็บไว้ในที่เดียวกัน เช่น ข้อมูลอาคาร ข้อมูลแปลงที่ดิน ข้อมูลการใช้ประโยชน์ที่ดิน ข้อมูลราคาประเมินภาษี ซึ่งเป็นข้อมูลด้านการจัดเก็บภาษีในเทศบาล และมีการจัดเก็บข้อมูลไว้ในแต่ละฝ่ายที่รับผิดชอบ เมื่อนำข้อมูลที่จัดเก็บในรูปแบบแฟ้มข้อมูล มาจัดเก็บอยู่ในแหล่งเดียวกันเป็นรูปแบบของฐานข้อมูล คือ ฐานข้อมูลของเทศบาล ส่งผลให้สามารถใช้ข้อมูลร่วมกัน และสามารถแก้ไขปัญหาที่เกิดจากการใช้งานข้อมูลแบบแฟ้มข้อมูลกรณีต่างๆ ได้ ข้อมูลที่จะนำมาจัดเก็บเป็นฐานข้อมูลได้นั้นจะต้องเป็นข้อมูลที่มีความสัมพันธ์กัน และสนับสนุนการดำเนินการอย่างใดอย่างหนึ่งขององค์กร ซึ่งจะเรียกว่า ระบบฐานข้อมูล(Database system)

ภาพการจัดเก็บแบบแฟ้มข้อมูล
ภาพการจัดเก็บแบบแฟ้มข้อมูล
ภาพการจัดเก็บข้อมูลแบบฐานข้อมูล
ภาพการจัดเก็บข้อมูลแบบฐานข้อมูล

2. การจัดการแฟ้มข้อมูลและองค์ประกอบของฐานข้อมูล

ในการดำเนินการต่างๆ กับแฟ้มข้อมูลนั้น ต้องจำแนกประเภทของแฟ้มข้อมูลก่อน เพื่อกำหนดลักษณะการดำเนินการที่จะกระทำต่อแฟ้มข้อมูลนั้นได้อย่างชัดเจน ซึ่งรูปแบบของแฟ้มข้อมูลในปัจจุบันสามารถจำแนกได้ดังนี้

1) ประเภทแฟ้มข้อมูล

– แฟ้มต้นฉบับ (Master file) เป็นแฟ้มข้อมูลที่จัดเก็บข้อมูลที่มักจะไม่มีการเปลี่ยนแปลงหรือมีสภาพค่อนข้างคงที่ เช่น แฟ้มข้อมูลประวัติบุคคล จะประกอบด้วยข้อมูลต่างๆ เช่น หมายเลขบัตรประจำตัวประชาชนชื่อ-สกุล ที่อยู่ ซึ่งการปรับปรุงแก้ไขข้อมูลในแฟ้มต้นฉบับเพื่อให้ทันสมัยนั้น สามารถทำได้ 3 รูปแบบด้วยกัน คือการเพิ่ม การลบออก และการแก้ไข

– แฟ้มดำเนินการ (Transaction file) เป็นแฟ้มข้อมูลที่จัดเก็บข้อมูลการดำเนินธุรกรรมประจำวันที่มีการเคลื่อนไหวอยู่เสมอ เช่น การเปลี่ยนแปลงของข้อมูลเงินฝากของบุคคลต่างๆ ในแต่ละวัน

– แฟ้มเอกสาร (Document file) เป็นแฟ้มข้อมูลเอกสารหรือแฟ้มข้อมูลรายงานต่างๆ ที่เคยผ่านกระบวนการพิมพ์ด้วยโปรแกรมมาก่อน และทำการจัดเก็บในรูปของไฟล์เอกสารด้วยการสำเนาเก็บไว้ในคอมพิวเตอร์เมื่อต้องการใช้งานก็สามารถเรียกขึ้นมาใช้งานได้อย่างวดเร็ว เพราะไม่ต้องผ่านโปรแกรมเพื่อประมวลผลเป็นรายงานอีก

– แฟ้มเอกสารสำคัญ (Archival file) เป็นแฟ้มข้อมูลที่บรรจุไปด้วยแฟ้มต้นฉบับ และแฟ้มดำเนินการซึ่งประกอบด้วยบันทึกประวัติการลบหรือเคลื่อนย้ายจากสื่ออุปกรณ์แบบออนไลน์ (Online storage) ไปจัดเก็บไว้ในสื่ออุปกรณ์ที่เป็นแบบออฟไลน์ (Offline storage) แฟ้มเอกสารสำคัญเป็นแฟ้มข้อมูลที่อาจจำเป็นต้องจัดเก็บไว้ตามระเบียบหรือข้อกำหนดต่างๆ ของหน่วยงานเพื่อใช้ในการตรวจสอบทั้งในปัจจุบันและอนาคต

– แฟ้มสำหรับค้นหา (Table look-up file) เป็นแฟ้มข้อมูลหรือตารางที่ใช้สำหรับการอ้างอิง เพื่อใช้ร่วมงานกันโดยข้อมูลต่างๆ ที่จัดเก็บลงในแฟ้มข้อมูลนี้ค่อนข้างคงที่หรือมักไม่ค่อยเปลี่ยนแปลงใดๆ เช่น ตารางรหัสไปรษณีย์ ตารางรหัสจังหวัด เป็นต้น

– แฟ้มตรวจสอบ (Audit file) เป็นแฟ้มข้อมูลพิเศษชนิดหนึ่งที่จัดเก็บบันทึกที่ถูกปรับปรุงให้ทันสมัยลงในแฟ้มข้อมูลต่างๆ โดยเฉพาะอย่างยิ่ง ในแฟ้มต้นฉบับ และแฟ้มดำเนินการ ซึ่งจะใช้ร่วมกันกับแฟ้มเอกสารสำคัญในการกู้คืนข้อมูลที่สูญหาย แฟ้มข้อมูลประเภทนี้มักจะถูกกำหนดไว้ในระบบฐานข้อมูลเพื่อให้สามารถกู้คืนระบบในกรณีที่ข้อมูลเกิดความเสียหายในระหว่างการประมวลผล

– ในการจัดการแฟ้มข้อมูลต่างๆ ให้อยู่ในรูปแบบของฐานข้อมูลนั้นจะต้องมีการจัดเตรียมองค์ประกอบด้านต่างๆ เพื่อที่จะให้ฐานข้อมูลที่ทำการสร้างขึ้นมานั้นสามารถตอบสนองต่อความต้องการหรือสามารถดำเนินการได้ตามวัตถุประสงค์ของหน่วยงานได้อย่างมีประสิทธิภาพ ตลอดจนสามารถดูแลควบคุมการใช้งานแฟ้มข้อมูลประเภทต่างๆ ให้เป็นไปตามความเหมาะสมและนโยบายในการใช้ข้อมูลของหน่วยงานอย่างเคร่งครัด

2) องค์ประกอบของฐานข้อมูล จากที่ทราบแล้วว่า ฐานข้อมูลเป็นวิธีการที่จะเก็บข้อมูลที่สัมพันธ์กันไว้ในแหล่งเดียวกัน และรวบรวมข้อมูลที่ไม่ซ้ำซ้อนและสามารถใช้ข้อมูลร่วมกันได้อย่างเป็นระบบ เพื่อให้สะดวกต่อการเรียกใช้ สามารถแก้ไขได้ง่าย สำหรับผู้ใช้จำนวนมาก และสามารถป้องกันไม่ให้ผู้ไม่มีสิทธิ์เข้าถึงข้อมูลได้ ซึ่งในการจัดทำฐานข้อมูลเพื่อใช้ภายในองค์กรหรือหน่วยงานใดๆ ก็ตามจะต้องมีการจัดเตรียมองค์ประกอบต่างๆ เพื่อที่จะให้ฐานข้อมูลที่จัดทำขึ้นให้เป็นระบบฐานข้อมูลที่สามารถใช้ประโยชน์ได้อย่างมีประสิทธิภาพ โดยสามารถจำแนกองค์ประกอบที่สำคัญของระบบฐานข้อมูลที่สำคัญได้ดังนี้

– ข้อมูล ข้อมูลแต่ละส่วนจะต้องสามารถนำมาใช้ประโยชน์ประกอบกันได้ (Data integrated)ซึ่งข้อมูลที่จะนำมาใช้ในระบบฐานข้อมูลได้นั้นจะต้องมีคุณสมบัติที่พึงประสงค์ ได้แก่

  • มีความถูกต้อง และอยู่บนพื้นฐานของความเป็นจริง เช่น ในกรณีที่มีการจัดทำข้อมูลเกี่ยวกับการจัดเก็บภาษีโรงเรือนในพื้นที่ จะปรากฏข้อมูลของโรงเรือนชำระภาษีแล้วโดยกำหนดเป็น Y กับโรงเรือนที่ยังไม่ได้ชำระภาษีโดยกำหนดเป็น N เป็นต้น
  • ข้อมูลจะต้องไม่มีความซ้ำซ้อนกัน เช่น ต้องไม่มีการเก็บข้อมูลชุดเดียวกันอยู่ใน 2 แฟ้มข้อมูลหรือมากกว่า ซึ่งจะก่อให้เกิดความขัดแย้งของข้อมูลตามมาในภายหลัง
  • ข้อมูลในฐานข้อมูลจะต้องมีการใช้งานร่วมกัน (Data sharing) จากผู้ใช้หลายๆ คนได้

– คอมพิวเตอร์ฮาร์ดแวร์ (Computer hardware) เป็นอุปกรณ์ที่มีส่วนเกี่ยวข้องกับระบบฐานข้อมูลโดยสามารถจำแนกได้ 3 ประเภท ได้แก่

  • หน่วยประมวลผลและหน่วยความจำหลัก ทำหน้าที่ในการนำข้อมูลจากฐานข้อมูลขึ้นมาประมวลผลตามคำสั่งที่กำหนด ดังนั้นสิ่งที่จำเป็นต้องคำนึงถึงในส่วนนี้คือ ความเร็วในการประมวลผล และขนาดของหน่วยความจำหลักของเครื่องคอมพิวเตอร์ที่นำมาใช้ในการประมวลผลร่วมกับฐานข้อมูล
  • หน่วยความจำสำรอง ทำหน้าที่ในการจัดเก็บข้อมูลของฐานข้อมูล ดังนั้นสิ่งที่ต้องคำนึงถึงในอุปกรณ์ส่วนนี้จึงได้แก่ ปริมาณความจุของหน่วยความจำสำรองที่นำมาใช้ในการบันทึกข้อมูลของฐานข้อมูลนั้น
  • อุปกรณ์การเชื่อมต่อเครือข่าย ทำหน้าที่ในการส่งผ่านข้อมูลระหว่างเครื่องที่ทำงานอยู่ภายใต้ระบบฐานข้อมูลเดียวกัน ดังนั้นสิ่งจำเป็นที่จะต้องคำนึงถึงสำหรับอุปกรณ์ส่วนนี้คือ อัตราความเร็วในการส่งผ่านข้อมูลระหว่างเครื่องคอมพิวเตอร์

– คอมพิวเตอร์ซอฟต์แวร์ (Computer software) ซอฟต์แวร์ที่มีบทบาทสำคัญในระบบฐานข้อมูลซึ่งทำหน้าที่ในการจัดการระบบฐานข้อมูล ได้แก่ DBMS (Database Management System) มีหน้าที่ในการจัดการละควบคุมความถูกต้อง ความซ้ำซ้อน และความสัมพันธ์ระหว่างข้อมูลต่างๆ ภายในฐานข้อมูล ส่งผลให้ผู้ใช้สามารถที่จะเรียกใช้ข้อมูลจากฐานข้อมูลได้โดยไม่จำเป็นที่จะต้องทราบถึงโครงสร้างทางกายภาพของข้อมูล เนื่องจากในซอฟต์แวร์ DBMS จะมีส่วนของภาษาสำหรับการสืบค้นข้อมูล (Query language) ซึ่งเป็นภาษาที่ประกอบด้วยคำสั่งต่างๆ ที่ใช้ในการจัดการ และเรียกใช้ข้อมูลจากฐานข้อมูล ซึ่งสามารถนำไปใช้ร่วมกับภาษาคอมพิวเตอร์อื่นๆ เพื่อพัฒนาเป็นโปรแกรมที่ใช้สำหรับเรียกใช้ข้อมูลจากฐานข้อมูลมาประมวลผลได้

– ผู้ใช้ระบบฐานข้อมูล (User) ผู้ที่เรียกใช้ข้อมูลจากระบบฐานข้อมูลมาใช้งาน สามารถแบ่งออกเป็นระดับต่างๆ ได้ดังนี้

  • นักเขียนโปรแกรมประยุกต์ (Application programmer) ได้แก่ ผู้ที่ทำหน้าที่พัฒนาโปรแกรมเพื่อเรียกใช้ข้อมูลจากระบบฐานข้อมูลมาประมวลผล โดยโปรแกรมที่พัฒนาขึ้นส่วนใหญ่ มักจะใช้ร่วมกับคำสั่งประเภทData Manipulation Language (DML) ของภาษาสำหรับการสืบค้นข้อมูล
  • ผู้ใช้งานทั่วไป (End user) แบ่งออกเป็น 2 ระดับ คือ

* Naive user ได้แก่ ผู้ใช้ที่เรียกใช้ข้อมูลจากฐานข้อมูลโดยอาศัยโปรแกรมที่พัฒนาขึ้น

* Sophisticated user ได้แก่ ผู้ที่เรียกใช้ข้อมูลจากฐานข้อมูลด้วยประโยคคำสั่งของภาษาสำหรับการสืบค้นข้อมูล ซึ่งซอฟต์แวร์ด้านฐานข้อมูลโดยทั่วไปจะอนุญาตให้ผู้ใช้งานสามารถใช้งานประโยคคำสั่งของภาษาสำหรับการสืบค้นข้อมูลเพื่อเรียกใช้ข้อมูลจากฐานข้อมูลได้โดยตรง

  • ผู้กำกับดูแลฐานข้อมูล (Database Administrator : DBA) ได้แก่ ผู้บริหารที่ทำหน้าที่ควบคุมและตัดสินใจในการกำหนดโครงสร้างของฐานข้อมูล ชนิดของข้อมูล วิธีการจัดเก็บข้อมูล รูปแบบในการเรียกใช้ข้อมูลความปลอดภัยของข้อมูล และกฎระเบียบที่ใช้ในการควบคุมความถูกต้องของข้อมูลภายในฐานข้อมูล โดยอาศัยคำสั่งประเภท Data Definition Language (DDL) ซึ่งเป็นอีกส่วนหนึ่งของประโยคคำสั่งของภาษาสำหรับการสืบค้นข้อมูล

3. สถาปัตยกรรมระบบฐานข้อมูล สถาปัตยกรรมของระบบฐานข้อมูล

เป็นการอธิบายถึงรูปแบบและโครงสร้างของข้อมูลภายในระบบฐานข้อมูลโดยทั่วไปในระดับแนวความคิด โดยไม่ขึ้นอยู่กับโครงสร้างของระบบฐานข้อมูลนั้นๆ สำหรับสถาปัตยกรรมของระบบฐานข้อมูลที่นิยมใช้ ได้แก่ ANSI/ SPARC (American National Standards Institute/System Requirements Committee) กำหนดขึ้นโดย Study on database management system ซึ่งได้แบ่งสถาปัตยกรรมออกเป็น 3 ระดับ ดังนี้

1) สถาปัตยกรรมในระดับภายนอก (External level) เป็นการกำหนดรูปแบบการใช้งานจากภายนอกซึ่งสามารถเปลี่ยนแปลงได้ตามมุมมองของผู้ใช้งานฐานข้อมูล ซึ่งในส่วนนี้จะไม่ใช่รูปร่างและส่วนโครงสร้างของข้อมูลที่แท้จริง เพียงแต่จะถูกกำหนดให้ผู้ใช้สามารถใช้ข้อมูลในมุมมองต่างๆ ได้โดยการอาศัยภาษาคอมพิวเตอร์ในการเรียกใช้ข้อมูลนั้นๆ ขึ้นมาแสดงผลระเบียน (Record) ที่อยู่ในสถาปัตยกรรมนี้เรียกว่า ระเบียนภายนอก (External record) เนื่องจากไม่ใช่ระเบียนที่แท้จริงที่เก็บอยู่ในฐานข้อมูล แต่จะเป็นระเบียนที่มีรูปแบบตามที่ผู้ใช้แต่ละคนกำหนด เช่น ผู้ใช้ที่ใช้คำสั่ง Data Manipulation Language (DML) เพื่อเรียกใช้ข้อมูลสามารถกำหนดลำดับของเขตข้อมูล (Field) ในการแสดงผลได้ตามที่ตนต้องการ โดยไม่จำเป็นต้องเป็นไปตามลำดับจริงในฐานข้อมูล เป็นต้น และจากระเบียนในระดับนี้ เป็นระเบียนภายนอก จึงส่งผลให้โครงสร้างของข้อมูลในระดับภายนอก (External schema) นี้ไม่ใช่โครงสร้างของข้อมูลที่แท้จริงด้วยเช่นเดียวกัน เนื่องจากโครงสร้างที่กำหนดไว้เมื่อตอนสร้างฐานข้อมูลด้วยกลุ่มคำสั่ง DDL จะไม่ใช่โครงสร้างของข้อมูลที่แท้จริงที่จัดเก็บอยู่ในฐานข้อมูล

2) สถาปัตยกรรมในระดับแนวคิด (Conceptual level) เป็นระดับสถาปัตยกรรมทางด้านฐานข้อมูลที่กล่าวถึงโครงสร้างฐานข้อมูลในระดับแนวคิด ซึ่งเป็นภาพของโครงสร้างข้อมูลที่ใช้แทนโครงสร้างทางกายภาพของข้อมูลที่แท้จริงในฐานข้อมูล เพื่อให้ง่ายต่อการอธิบายถึงโครงสร้างของข้อมูลต่างๆ ที่เก็บอยู่ในฐานข้อมูลนั้นๆ ดังนั้นภาพของระเบียนที่เห็นในสถาปัตยกรรมระดับนี้ จะเรียกว่า ระเบียนระดับแนวคิด (Conceptual record) ซึ่งไม่จำเป็นที่จะต้องมีโครงสร้างเช่นเดียวกันกับโครงสร้างของระเบียนภายนอก และโครงสร้างทางกายภาพของระเบียนที่เก็บอยู่จริง ในการนำเสนอโครงสร้างของข้อมูลระเบียนระดับแนวคิดที่เรียกว่าโครงสร้างระดับแนวคิด (Conceptual schema) จะต้องใช้ภาษาสำหรับการนำเสนอที่มีคุณสมบัติของ Data independence กล่าวคือ ต้องไม่มีการนำเสนอที่ขึ้นอยู่กับโครงสร้างทางกายภาพในการจัดลำดับที่ของเขตข้อมูล โครงสร้างของดัชนี (Index) หรืออื่นๆ แต่ต้องมุ่งเน้นที่จะนำเสนอเฉพาะโครงสร้างข้อมูลโดยทั่วไปของข้อมูลในฐานข้อมูล และถ้าโครงสร้างระดับแนวคิด มีคุณสมบัติแบบ Data independence แล้ว จะส่งผลให้โครงสร้างภายนอก มีคุณสมบัติ Data independence ตามไปด้วย เนื่องจากโครงสร้างภายนอกกำหนดขึ้นจากโครงสร้างระดับแนวคิด

3) สถาปัตยกรรมระดับภายใน (Internal level) เป็นระดับสถาปัตยกรรมที่กล่าวถึงโครงสร้างข้อมูลของระเบียนในระดับที่ใกล้เคียงกับโครงสร้างข้อมูลจริงของระเบียนที่จัดเก็บไว้ในหน่วยความจำสำรองมากที่สุด ระเบียนของสถาปัตยกรรมระดับนี้จะเรียกว่า ระเบียนภายใน (Internal record) ส่วนโครงสร้างข้อมูลของระเบียนของสถาปัตยกรรมระดับนี้จะเรียกว่า โครงสร้างภายใน (Internal schema) ซึ่งโครงสร้างข้อมูลในระดับนี้ยังอยู่ในระดับที่เหนือกว่าโครงสร้างข้อมูลในระดับกายภาพ กล่าวคือ โครงสร้างระเบียนภายใน จะเป็นเพียงการนำเสนอโครงสร้างข้อมูลที่กล่าวถึงเนื้อที่ที่ใช้ในการจัดเก็บ ลำดับที่ ประเภทข้อมูล ดัชนีที่ใช้ และอื่นๆ ซึ่งจะใช้เป็นข้อมูลที่นำไปใช้กำหนดโครงสร้างทางกายภาพที่แท้จริง ที่ใช้ในการจัดเก็บข้อมูลในหน่วยความจำสำรอง

ภาพแสดงสถาปัตยกรรมฐานข้อมูล ที่มา: http://ksi.cpsc.ucalgary.ca/KAW/KAW96/laresgoiti/k02.gif
ภาพแสดงสถาปัตยกรรมฐานข้อมูล
ที่มา: http://ksi.cpsc.ucalgary.ca/KAW/KAW96/laresgoiti/k02.gif

4. แบบจำลองข้อมูล (Data model) จากสถาปัตยกรรมของฐานข้อมูลในระดับต่างๆ ดังที่ได้กล่าวมาแล้ว เป็นการกำหนดระดับการจัดทำฐานข้อมูลในระดับต่างๆ ซึ่งสิ่งที่จะสามารถถ่ายทอดรูปแบบของสถาปัตยกรรมให้เป็นรูปธรรมมากขึ้นก็คือ การจัดทำแบบจำลองข้อมูล ซึ่งเป็นสิ่งที่สามารถอธิบายถึงรายละเอียดต่างๆของการออกแบบฐานข้อมูลสำหรับการปฏิบัติงานจริง รวมทั้งสามารถอธิบายถึงโครงสร้างข้อมูลแบบต่างๆ ได้อย่างชัดเจน แบบจำลองของข้อมูลเป็นแบบจำลองที่ใช้ในการอธิบายถึงโครงสร้าง และความสัมพันธ์ระหว่างข้อมูลภายในฐานข้อมูลจากรูปแบบที่เป็นแนวคิดซึ่งยากแก่การทำความเข้าใจให้อยู่ในรูปแบบที่สามารถเข้าใจและจับต้องได้ง่ายขึ้นสามารถจำแนกประเภทของแบบจำลองข้อมูลได้ 2 ประเภท ดังนี้

1) แบบจำลองแนวคิด (Conceptual model) เป็นแบบจำลองที่นำไปใช้ในการออกแบบฐานข้อมูลเพื่อต้องการอธิบายให้เห็นว่า ภายในฐานข้อมูลจะประกอบด้วยข้อมูลอะไรบ้าง แต่ละข้อมูลมีความสัมพันธ์กันอย่างไร ดังนั้นแบบจำลองในกลุ่มนี้จึงประกอบสัญลักษณ์ที่ใช้แทนตัวข้อมูล คุณสมบัติข้อมูลและความสัมพันธ์ต่างๆ สำหรับตัวอย่างฐานข้อมูลประเภทนี้ได้แก่ Entity-Relationship model (E-R model) และ Object-oriented model

2) แบบจำลองนำไปปฏิบัติ (Implementation model) เป็นแบบจำลองที่ถูกนำมาใช้อธิบายถึงโครงสร้างของฐานข้อมูลแต่ละประเภทที่ถูกคิดค้นขึ้น ได้แก่ แบบจำลองลำดับขั้น (Hierarchical model) แบบจำลองฐานข้อมูลโครงข่าย (Network database model) และแบบจำลองฐานข้อมูลเชิงสัมพันธ์ (Relational database model)

5. ประเภทความสัมพันธ์ของข้อมูล ในการที่จะทำความเข้าใจเกี่ยวกับแบบจำลองข้อมูลประเภทต่างๆ จำเป็นต้องมีความเข้าใจเกี่ยวกับความสัมพันธ์ในฐานข้อมูลเสียก่อน เนื่องจากความสัมพันธ์ระหว่างข้อมูลต่างๆ ที่จัดเก็บอยู่ในฐานข้อมูล จัดเป็นส่วนที่สำคัญที่มีผลต่อโครงสร้างฐานข้อมูล และใช้เป็นส่วนที่ใช้แบ่งฐานข้อมูลออกเป็นฐานข้อมูลประเภทต่างๆ

1) ความสัมพันธ์แบบหนึ่งต่อหนึ่ง (One-to-One) เป็นความสัมพันธ์ที่มีลักษณะไม่ซับซ้อน กล่าวคือ 1 ระเบียน ในตารางหนึ่งจะมีความสัมพันธ์กับอีกระเบียน 1 ในอีกตารางหนึ่งเท่านั้น ไม่สามารถมีเกิน 1 ได้ เช่น ตารางเลขที่เอกสารสิทธิที่ดิน กับตารางขนาดแปลงที่ดิน

ภาพแสดงความสัมพันธ์แบบหนึ่งต่อหนึ่ง
ภาพแสดงความสัมพันธ์แบบหนึ่งต่อหนึ่ง

ในความเป็นจริงเราสามารถที่จะจัดทำให้ตารางดังภาพ เป็นตารางเดียวกันได้ แต่ในบางกรณีอาจจะมีความจำเป็นต้องจัดทำข้อมูลแยกออกจากกันโดยอาศัยความสัมพันธ์แบบหนึ่งต่อหนึ่งเข้ามาเป็นตัวเชื่อมความสัมพันธ์ เนื่องมาจากสาเหตุบางประการ เช่น ปริมาณของข้อมูล ความเร็วในการเข้าถึงข้อมูล เป็นต้น

2) ความสัมพันธ์แบบหนึ่งต่อกลุ่ม (One-to-Many) เป็นลักษณะความสัมพันธ์ที่ระเบียนในตารางหนึ่งมีความสัมพันธ์กับระเบียนในอีกตารางหนึ่งตั้งแต่ 2 ระเบียนขึ้นไป ยกตัวอย่างเช่น บุคคลหนึ่งคนสามารถครอบครองที่ดินได้หลายแปลง ซึ่งอาจจำแนกตารางออกเป็นตารางหมายเลขเอกสารสิทธิและตารางรายชื่อผู้ครอบครองเอกสารสิทธิ

ภาพแสดงความสัมพันธ์แบบหนึ่งต่อกลุ่ม
ภาพแสดงความสัมพันธ์แบบหนึ่งต่อกลุ่ม

3) ความสัมพันธ์แบบกลุ่มต่อกลุ่ม (Many-to-Many) เป็นความสัมพันธ์ที่มีลักษณะคือ ระเบียนในตารางหนึ่งมีความสัมพันธ์กับระเบียนในอีกตารางหนึ่งตั้งแต่ 2 ระเบียนขึ้นไป และในขณะเดียวกันระเบียนในตารางที่สองก็จะมีความสัมพันธ์กับระเบียนในตารางที่หนึ่งตั้งแต่ 2 ระเบียนขึ้นไปเช่นเดียวกัน

ภาพแสดงความสัมพันธ์แบบกลุ่มต่อกลุ่ม
ภาพแสดงความสัมพันธ์แบบกลุ่มต่อกลุ่ม

จากตัวอย่างภาพจะเห็นได้ว่าเอกสารสิทธิหมายเลขที่ 456 และ 458 มีความสัมพันธ์แบบกลุ่มต่อกลุ่มกับตารางรายชื่อผู้ครอบครองเอกสารสิทธิซึ่งได้แก่ นายศิลา ดวงทิพย์ และนายองอาจ ศรีเพ็ชร ซึ่งในขณะเดียวกันในตารางรายชื่อผู้ครอบครองเอกสารสิทธิ นายองอาจ ศรีเพ็ชร และนายอนุกูล ศรีสะอาด ก็มีความสัมพันธ์กับตารางข้อมูลเอกสารสิทธิในแปลงที่ดิน 456 และ 458

6. แบบจำลองฐานข้อมูล (Database model)

1) แบบจำลองฐานข้อมูลแบบลำดับขั้น (Hierarchical database model) เป็นแบบจำลองฐานข้อมูลที่ถูกคิดค้นโดยบริษัท North American Rockwell ตามแนวคิดการจัดเก็บข้อมูลของโปรแกรม Generalized Update Access Method (GUAM) ที่มีการนำข้อมูลในแต่ละส่วน (Part) มารวมกันเป็นกลุ่ม (Component) และทำการรวมข้อมูลกลุ่มแต่ละกลุ่มทั้งหมดเป็นกลุ่มใหญ่ (Final component) นำมาใช้ในการลดความซ้ำซ้อนของข้อมูล (Data redundancy) โดยมีโครงสร้างอยู่ในรูปแบบของต้นไม้ (Tree structure) ในลักษณะ Upside-Down tree ที่จัดเก็บข้อมูล ในรูปของเซกเมนต์ (Segment) ซึ่งเทียบเท่ากับระเบียนในระบบแฟ้มข้อมูล

ภาพแสดงแบบจำลองฐานข้อมูลแบบลำดับขั้น
ภาพแสดงแบบจำลองฐานข้อมูลแบบลำดับขั้น

จากภาพจะพบว่า “จังหวัด” ทำหน้าที่เป็น Root segment โดยมี “อำเภอ 1” “อำเภอ 2” และ “อำเภอ 3” เป็นข้อมูลภายในของจังหวัดซึ่งอยู่ในระดับที่เรียกว่า Level 1 segment และจากระดับ Level 1 segment สามารถที่จะมีข้อมูลอื่นๆ ประกอบภายในได้อีกโดยจะถูกกำหนดให้เป็นระดับต่างๆ ต่อไป การใช้แบบจำลองฐานข้อมูลประเภทนี้ในทางปฏิบัติอาจจะพบทั้งข้อดีและข้อเสีย ซึ่งสามารถจำแนกได้ดังต่อไปนี้

ข้อดีของแบบจำลองฐานข้อมูลแบบลำดับขั้น

– สามารถกำหนดกฎที่ใช้ควบคุมความถูกต้องให้กับข้อมูล (Data integrity) ภายในฐานข้อมูลได้ง่ายเนื่องจากกฎเกณฑ์ที่กำหนดให้แก่ Root segment สามารถที่จะถ่ายทอดไปยัง Level segment ในระดับต่างๆ ได้โดยตรง

– มีโครงสร้างที่เหมาะต่อข้อมูลที่มีความสัมพันธ์แบบหนึ่งต่อกลุ่ม

– สามารถทำความเข้าใจเกี่ยวกับความสัมพันธ์ข้อมูลภายในได้ง่าย

– การออกแบบฐานข้อมูลไม่มีความซับซ้อน

ข้อเสียของแบบจำลองฐานข้อมูลแบบลำดับขั้น

– ผู้ใช้ฐานข้อมูลจะต้องทราบถึงโครงสร้างทางกายภาพของข้อมูลที่จัดเก็บอยู่ในฐานข้อมูลจึงจะสามารถเรียกใช้ข้อมูลจากฐานข้อมูลได้

– โครงสร้างของฐานข้อมูลไม่สามารถรองรับข้อมูลที่มีความสัมพันธ์ในแบบกลุ่มต่อกลุ่มได้ อันเนื่องมาจากลักษณะของแบบจำลองประเภทนี้ที่มีการแบ่งข้อมูลออกเป็นระดับ (Level) และมีการกระจายออกเป็นระดับต่างๆ ภายในได้อีก ทำให้ความสัมพันธ์ที่เกิดขึ้นไม่สามารถสร้างความสัมพันธ์ข้าม Root ของตัวเองได้

– การเปลี่ยนแปลงโครงสร้างกระทำได้ยาก เนื่องจากโครงสร้างลักษณะนี้มีความยืดหยุ่นค่อนข้างน้อยเช่น การลบ หรือเพิ่มจำนวนข้อมูลเข้าไป ไม่ว่าจะในระดับใดก็จะส่งผลกระทบต่อข้อมูลในส่วนอื่นๆ ตามไปด้วย

– การพัฒนาโปรแกรมเพื่อเรียกใช้ข้อมูลจากฐานข้อมูลกระทำได้ยาก เนื่องจากต้องทราบถึงโครงสร้างข้อมูลทั้งหมดเสียก่อน

– ไม่มีการกำหนดรูปแบบที่เป็นมาตรฐานให้กับโครงสร้างฐานข้อมูล จึงส่งผลให้การโอนถ่ายข้อมูลระหว่างหน่วยงานหรือระหว่างซอฟต์แวร์ที่ต่างกันกระทำได้ยาก

2) แบบจำลองฐานข้อมูลแบบเครือข่าย (Network database model) เป็นแบบจำลองของฐานข้อมูลที่อธิบายถึงฐานข้อมูล ที่มีโครงสร้างของข้อมูลที่จำแนกตามความสัมพันธ์ของข้อมูล ที่ได้รับการพัฒนามาจากฐานข้อมูลแบบลำดับขั้น โดยมีจุดมุ่งหมายเพื่อกำหนดให้เป็นรูปแบบของโครงสร้างข้อมูลที่เป็นมาตรฐาน รวมทั้งมุ่งหวังให้เป็นฐานข้อมูลที่สามารถรองรับข้อมูลที่มีความสัมพันธ์แบบกลุ่มต่อกลุ่มในปี ค.ศ. 1970 กลุ่มผู้พัฒนาภาษา COBOL ที่มีชื่อว่า Conference On Data System Language (CODASYL) ได้จัดตั้งทีมที่ชื่อว่า Database Task Group (DBTG) ขึ้นเพื่อร่วมกันกำหนดมาตรฐานเพื่อใช้ในการสร้าง และจัดการกับข้อมูลภายในฐานข้อมูล โดยกำหนดมาตรฐานหลักๆ ไว้ 3 ประการดังนี้

– มาตรฐานการกำหนดโครงสร้างให้ฐานข้อมูล ซึ่งต่อมาได้กลายเป็นมาตรฐานของกลุ่มคำสั่ง DDL

– มาตรฐานในการเรียกใช้ข้อมูลจากฐานข้อมูลร่วมกับคำสั่งของภาษาคอมพิวเตอร์ที่ใช้ในการพัฒนาโปรแกรม

– มาตรฐานการจัดการข้อมูลภายในฐานข้อมูล ซึ่งต่อมาได้กลายเป็นมาตรฐานของกลุ่มคำสั่ง DML

ภาพแสดงแบบจำลองฐานข้อมูลแบบเครือข่าย
ภาพแสดงแบบจำลองฐานข้อมูลแบบเครือข่าย

ข้อดีของแบบจำลองฐานข้อมูลแบบเครือข่าย

– สามารถรองรับข้อมูลที่มีความสัมพันธ์แบบกลุ่มต่อกลุ่มได้

– ความซ้ำซ้อนของข้อมูลน้อยกว่าแบบจำลองฐานข้อมูลแบบลำดับขั้น

– สามารถเชื่อมโยงความสัมพันธ์ข้อมูลแบบไปกลับได้

– มีความยืดหยุ่นในการเข้าถึงข้อมูลดีกว่าแบบจำลองฐานข้อมูลแบบลำดับขั้น

ข้อเสียของแบบจำลองฐานข้อมูลแบบเครือข่าย

– เนื่องจากสามารถเข้าถึงข้อมูลได้โดยตรงทำให้การรักษาความปลอดภัยให้แก่ข้อมูลกระทำได้ยาก

– การออกแบบฐานข้อมูลกระทำได้ยาก เนื่องจากต้องกำหนดความสัมพันธ์ของข้อมูลให้ครอบคลุมทุกข้อมูล

– การเปลี่ยนแปลงโครงสร้างของข้อมูลกระทำได้ยาก เนื่องจากต้องคำนึงถึงความสัมพันธ์ของข้อมูลแต่ละประเภทให้ครบถ้วน

3) แบบจำลองฐานข้อมูลเชิงสัมพันธ์ (Relational database model) ฐานข้อมูลประเภทนี้จะมีโครงสร้างที่จัดออกเป็นหน่วยย่อยต่างๆ ในรูปแบบของตารางโดยจะประกอบไปด้วยชุดของแถว (Row) และชุดสดมภ์ (Column) ข้อมูลที่จัดเก็บอยู่ในแต่ละตารางจะเป็นเอกเทศ แต่สามารถนำมาสร้างความสัมพันธ์กันได้โดยอาศัยคีย์ (Key) เป็นตัวกำหนดความสัมพันธ์ ซึ่งประกอบไปด้วยคีย์ต่างๆ ดังนี้

– คีย์หลัก (Primary key) คือ คอลัมน์ที่มีค่าภายในระเบียนแต่ละระเบียนไม่ซ้ำกันในตารางใดๆ ซึ่งสามารถใช้คอลัมน์ที่เป็นคีย์หลักนี้เป็นตัวแทนของตารางแต่ละตารางในการเชื่อมโยงความสัมพันธ์กันระหว่างตารางได้

– คีย์คู่แข่ง (Candidate key) เป็นข้อมูลในคอลัมน์ใดหรือหลายคอลัมน์ที่เมื่อนำมารวมกันแล้วจะมีคุณสมบัติเป็นคีย์หลัก แต่ไม่ใช้ในการจัดทำเป็นคีย์หลัก เช่น คอลัมน์รหัสจังหวัดเป็นคีย์หลัก ส่วนคอลัมน์รายชื่อจังหวัดก็มีข้อมูลที่ไม่ซ้ำกันเหมือนกับรหัสจังหวัดแต่ไม่ได้นำมาใช้เป็นคีย์หลักเพื่อใช้สร้างความสัมพันธ์ระหว่างตารางจึงเป็นคีย์คู่แข่งแทน

– คีย์นอก (Foreign key) ประกอบด้วยข้อมูลลักษณะประจำหรือกลุ่มของข้อมูลลักษณะประจำในตารางหนึ่งที่มีคุณสมบัติเป็นคีย์หลัก และไปปรากฏในอีกความสัมพันธ์หนึ่ง ซึ่งคีย์นอกจัดเป็นคีย์ที่สำคัญมากในฐานข้อมูลเชิงสัมพันธ์เพราะว่าเป็นตัวที่ใช้ในการเชื่อมความสัมพันธ์ระหว่างตาราง

– คีย์สำรอง (Secondary key) ก็คือคีย์คู่แข่งที่ไม่ได้ถูกเลือกให้เป็นคีย์หลัก กล่าวคือ คีย์สำรองนี้เมื่อนำไปใช้ในการค้นหาข้อมูลจากความสัมพันธ์จะได้มากกว่าหนึ่งระเบียน เพราะว่าคีย์สำรองนั้นไม่มีความเป็นเอกลักษณ์โดยสามารถเรียกคีย์สำรองนี้อีกชื่อหนึ่งว่า Alternate key

ภาพแสดงแบบจำลองฐานข้อมูลเชิงสัมพันธ์
ภาพแสดงแบบจำลองฐานข้อมูลเชิงสัมพันธ์

7. ระบบการจัดการฐานข้อมูล (Database Management System : DBMS) คือโปรแกรมที่ทำหน้าที่เป็นตัวกลางในการติดต่อระหว่างผู้ใช้กับฐานข้อมูล เพื่อจัดการ ควบคุมความถูกต้อง ความซ้ำซ้อน และความสัมพันธ์ระหว่างข้อมูลต่างๆ ภายในฐานข้อมูล ในการติดต่อกับฐานข้อมูลทั้งที่ใช้คำสั่งในกลุ่มของ DML หรือ DDL แม้กระทั่งโดยใช้โปรแกรมต่างๆ ทุกคำสั่งที่ใช้กระทำกับตัวข้อมูลจะถูกโปรแกรม DBMS นำมาแปลเป็นการกระทำ (Operation) เพื่อนำไปกระทำกับข้อมูลที่ถูกเรียกใช้ภายในฐานข้อมูลก่อนเสมอ ซึ่งภายใน DBMS ก็จะมีส่วนการทำงานด้านต่างๆ ซึ่งเป็นองค์ประกอบภายในดังต่อไปนี้

1) Database manager เป็นส่วนที่ทำหน้าที่กำหนดการกระทำต่างๆ ให้กับ File manager ซึ่งทำหน้าที่ในการบริหารและจัดการกับข้อมูลที่จัดเก็บอยู่ในฐานข้อมูลในระดับกายภาพ เพื่อไปกระทำกับข้อมูลที่อยู่ในฐานข้อมูล

2) Query processor เป็นส่วนที่ทำหน้าที่ในการแปลงประโยคคำสั่งในการสืบค้นข้อมูลในฐานข้อมูลให้อยู่ในรูปแบบที่ Database manager สามารถเข้าใจและนำไปประมวลผลได้

3) Structure Query Language (SQL) เป็นภาษาที่รูปแบบเป็นภาษาอังกฤษ ง่ายต่อการเรียนรู้และการเขียนโปรแกรม ซึ่งเป็นภาษาที่มีอยู่ใน DBMS หลายตัว มีความสามารถใช้นิยามโครงสร้างตารางภายในฐานข้อมูลการจัดการข้อมูล รวมไปถึงการควบคุมสิทธิการใช้งานฐานข้อมูล SQL จะประกอบด้วยภาษา 3 รูปแบบด้วยกัน แต่ละแบบก็จะมีหน้าที่เฉพาะแตกต่างกันไป

– DDL เป็นภาษาที่ใช้นิยามโครงสร้างของฐานข้อมูล เพื่อทำการสร้าง เปลี่ยนแปลง หรือยกเลิกโครงสร้างของฐานข้อมูลตามที่ได้ออกแบบไว้ ซึ่งโครงสร้างของฐานข้อมูลนี้สามารถเรียกได้อีกอย่างว่า เค้าร่าง (Schema) ดังนั้น DDL จึงเป็นภาษาที่ใช้ในการสร้างเค้าร่างนั่นเอง ตัวอย่างเช่น จะกำหนดว่าฐานข้อมูลที่สร้างมีชื่อว่าอะไร มีโครงสร้างที่ประกอบด้วยตารางที่ชื่ออะไรบ้าง แต่ละตารางประกอบด้วยเขตข้อมูลใดบ้าง เขตข้อมูลแต่ละตัวมีประเภทของข้อมูลเป็นอะไร มีความกว้างของข้อมูลเท่าใด แต่ละตารางมีการให้ดัชนี ช่วยในการค้นหาข้อมูลหรือไม่ ถ้ามีจะใช้เขตข้อมูลใดบ้างที่เป็นคีย์ เป็นต้น

– DML องค์ประกอบของภาษาในรูปแบบที่ 2 ของภาษา SQL ซึ่ง DML เป็นภาษาที่ใช้จัดการข้อมูลภายในตารางของฐานข้อมูล เช่น คำสั่งการเรียกค้นระเบียนข้อมูล (SELECT) คำสั่งการเพิ่มระเบียนข้อมูล (INSERT) คำสั่งการเปลี่ยนแปลงระเบียนข้อมูล (UPDATE) และคำสั่งลบระเบียนข้อมูล (DELETE) เป็นต้น

– ภาษาสำหรับการควบคุมข้อมูล (Data Control Language : DCL) เป็นส่วนของภาษาที่ใช้ควบคุมความถูกต้องของข้อมูล และควบคุมความปลอดภัยของข้อมูล ทำการป้องกันการเกิดเหตุการณ์ที่ผู้ใช้งานหลายคนเรียกใช้ข้อมูลพร้อมกัน โดยจะทำหน้าที่ควบคุมความถูกต้องของการใช้ข้อมูลและทำการลำดับการใช้ข้อมูลของผู้ใช้งานแต่ละคน และตรวจสอบสิทธิในการใช้ข้อมูลนั้นๆ เช่น GRANT คือ การให้สิทธิในการเข้าถึงข้อมูล REVOKE คือการยกเลิกสิทธิในการเข้าถึงข้อมูล เป็นต้น

4) Application programs objected code เป็นส่วนที่ทำหน้าที่ในการแปลงคำสั่งต่างๆ ของโปรแกรมรวมทั้งคำสั่งในกลุ่ม SQL ให้อยู่ในรูปของ Object code ที่จะส่งต่อไปให้ Database manager เพื่อกระทำกับฐานข้อมูล

ภาพแสดงโครงสร้างของระบบการจัดการฐานข้อมูล (DBMS) ที่มา : http://www.cs.uwyo.edu/~yu/DBMS/images/db.jpg
ภาพแสดงโครงสร้างของระบบการจัดการฐานข้อมูล (DBMS)
ที่มา : http://www.cs.uwyo.edu/~yu/DBMS/images/db.jpg

8. การออกแบบฐานข้อมูล (Database design) ในการดำเนินการด้านข้อมูลให้มีประสิทธิภาพนั้นจำเป็นที่จะต้องมีระบบฐานข้อมูลที่ดีเพื่อที่จะสามารถทำให้การจัดการข้อมูลในด้านต่างๆ เกิดประสิทธิภาพสูงสุดซึ่งส่วนสำคัญที่เป็นหัวใจสำคัญในการที่จะทำระบบฐานข้อมูลที่ถูกจัดสร้างขึ้นมีประสิทธิภาพมาก หรือน้อยเพียงใดก็ตามนั้นต้องมาจาก “การออกแบบฐานข้อมูล” ซึ่งในการออกแบบฐานข้อมูลที่ดีสามารถสรุปเป็นแนวทางได้ดังนี้

1) Database Initial คือ ขั้นตอนที่ผู้พัฒนาระบบฐานข้อมูลต้องวิเคราะห์ความต้องการต่างๆ ของผู้ใช้เพื่อกำหนดจุดมุ่งหมาย ปัญหา ขอบเขต และกฎระเบียบต่างๆ ของระบบฐานข้อมูลเพื่อใช้เป็นแนวทางในการออกแบบฐานข้อมูลในขั้นตอนต่อไป

2) Database design คือ ขั้นตอนที่นำเอารายละเอียดต่างๆ ที่ได้ทำการศึกษาและวิเคราะห์ความต้องการในขั้นตอนที่ 1 มากำหนดเป็นแนวทางในการออกแบบฐานข้อมูลขึ้นมาใช้งาน ซึ่งจะแบ่งการออกแบบฐานข้อมูลออกเป็น 3 ระดับ ดังนี้

– การออกแบบฐานข้อมูลระดับแนวคิด (Conceptual database design) เป็นระดับที่อธิบายถึงข้อมูลและความสัมพันธ์กันของข้อมูลในระบบที่เราวิเคราะห์มา โดยกำหนดจากความต้องการของผู้ใช้ ว่าต้องมีข้อมูลอะไรบ้าง และข้อมูลแต่ละตัวมีความสัมพันธ์กันอย่างไร และมีข้อจำกัดอะไรบ้าง โดยสิ่งที่กำหนดออกมาจากองค์ประกอบต่างๆ นั้นจะนำมาสร้างเป็นเค้าร่างของฐานข้อมูล

– การออกแบบฐานข้อมูลในระดับตรรกะ (Logical database design) การออกแบบฐานข้อมูลในระดับนี้จะอาศัยเค้าร่าง ที่ได้จากการออกแบบในระดับแนวคิดมาปรับปรุงให้มีโครงสร้างที่เป็นไปตามโครงสร้างข้อมูลของฐานข้อมูลที่จะนำมาใช้งาน แล้วนำโครงสร้างนั้นมาอิงกับแบบจำลองข้อมูล เพื่อแปลงเป็นตาราง (Relational data model) หรือความสัมพันธ์ตามแนวคิดของแบบจำลองข้อมูล จากนั้นต้องมีการปรับปรุงโครงสร้างของฐานข้อมูลให้มีความซ้ำซ้อนกันน้อยที่สุด

– การออกแบบฐานข้อมูลในระดับกายภาพ (Physical database design) การออกแบบฐานข้อมูลในระดับนี้จะเป็นการออกแบบฐานข้อมูลในระดับสุดท้าย ในขั้นตอนนี้จะเป็นการปรับปรุงเค้าร่าง ที่ได้จากการออกแบบฐานข้อมูลในระดับตรรกะเช่นเดียวกัน แต่ในระดับนี้จะเป็นการปรับปรุงเพื่อให้โครงร่างที่ได้ออกแบบมาให้เป็นไปตามโครงสร้างของโปรแกรมด้านฐานข้อมูลที่จะใช้งานจริง

3) Implementation and loading คือ ขั้นตอนที่นำเอาเค้าร่างต่างๆ ของระบบฐานข้อมูลที่ได้ออกแบบไว้มาสร้างเป็นตัวฐานข้อมูลที่จะใช้เก็บข้อมูลจริง รวมทั้งแปลงข้อมูลของระบบงานเดิม ให้สามารถนำมาใช้งานในระบบฐานข้อมูลที่พัฒนาขึ้นใหม่ได้

4) Testing and evaluation คือ ขั้นตอนของการทดสอบระบบฐานข้อมูลที่ได้พัฒนาขึ้น เพื่อหาข้อผิดพลาดต่างๆ รวมถึงทำการประเมินความสามารถของระบบฐานข้อมูล เพื่อนำไปใช้เป็นแนวทางในการปรับปรุงให้ระบบฐานข้อมูลที่พัฒนาขึ้นสามารถรองรับความต้องการของผู้ใช้ในด้านต่างๆ ได้อย่างถูกต้องและครบถ้วน

5) Operation คือ ขั้นตอนในการนำเอาระบบฐานข้อมูลที่พัฒนาขึ้นไปใช้งานจริง

6) Maintenance and evolution คือ ขั้นตอนที่เกิดขึ้นระหว่างการใช้งานระบบฐานข้อมูลจริง เพื่อบำรุงรักษาให้ระบบฐานข้อมูลทำงานได้อย่างมีประสิทธิภาพ รวมทั้งเป็นขั้นตอนของการแก้ไขและปรับปรุงระบบฐานข้อมูลในกรณีที่มีการเพิ่ม หรือเปลี่ยนแปลงความต้องการของผู้ใช้ที่อาจจะส่งผลกระทบต่อระบบฐานข้อมูล

 

9. ฐานข้อมูลระบบสารสนเทศทางภูมิศาสตร์ (Geographic Information System Database)

1) ข้อมูลระบบสารสนเทศทางภูมิศาสตร์ มีองค์ประกอบหลัก 3 ส่วน ได้แก่ ข้อมูลเชิงพื้นที่ ข้อมูลลักษณะประจำ และช่วงเวลา (Temporal) โดยสามารถแสดงความสัมพันธ์ระหว่างองค์ประกอบของข้อมูลภูมิศาสตร์ด้วยแผนภูมิ Geographical Data Matrix

ภาพแสดงความสัมพันธ์ระหว่างองค์ประกอบข้อมูลภูมิศาสตร์ ที่มา : ดัดแปลงจาก ศรีสอาด ตั้งประเสริฐ (2541)
ภาพแสดงความสัมพันธ์ระหว่างองค์ประกอบข้อมูลภูมิศาสตร์
ที่มา : ดัดแปลงจาก ศรีสอาด ตั้งประเสริฐ (2541)

จากข้อมูลที่มีความสัมพันธ์กันดังกล่าวข้างต้น ได้ถูกนำมาใช้งานในระบบสารสนเทศทางภูมิศาสตร์โดยมีการแบ่งประเภทของข้อมูลดังต่อไปนี้

– ข้อมูลเชิงพื้นที่ คือ ข้อมูลที่แสดงถึงลักษณะทางด้านกายภาพของสิ่งต่างๆ ที่ปรากฏอยู่บนพื้นผิวโลกโดยสามารถถ่ายทอดออกมาในรูปแบบการแสดงผลบนแผนที่ได้ในลักษณะของสัญลักษณ์อันประกอบด้วย จุด เส้น และพื้นที่ ข้อมูลเชิงพื้นที่ดังกล่าวต้องสามารถอ้างอิงกับพิกัดทางภูมิศาสตร์ได้ ลักษณะของข้อมูลเชิงพื้นที่ในระบบสารสนเทศภูมิศาสตร์ยังสามารถจำแนกออกได้ดังต่อไปนี้

• แรสเตอร์ (Raster) ข้อมูลแบบแรสเตอร์มีโครงสร้างเป็นช่องสี่เหลี่ยม เรียกว่า จุดภาพ หรือกริดเซลล์ (Grid cell) เรียงต่อเนื่องกันในแนวราบและแนวดิ่ง (ภาพที่ 4.19) ในแต่ละจุดภาพสามารถเก็บค่าได้ 1 ค่าโครงสร้างข้อมูลแบบแรสเตอร์สามารถจัดเก็บข้อมูลเชิงพื้นที่โดยการแทนค่าข้อมูลจากพื้นที่จริงลงในจุดภาพซึ่งมีตำแหน่งตามแนวแกน X และ Y ตรงกัน ค่าที่เก็บในแต่ละจุดภาพสามารถเป็นได้ทั้งข้อมูลลักษณะสัมพันธ์ หรือรหัสที่ใช้อ้างอิงถึงข้อมูลลักษณะสัมพันธ์ที่เก็บอยู่ในฐานข้อมูลก็ได้

ภาพแสดงลักษณะของข้อมูลแบบแรสเตอร์
ภาพแสดงลักษณะของข้อมูลแบบแรสเตอร์
  • เวกเตอร์ (Vector) คือ ข้อมูลที่สร้างขึ้นโดยอ้างอิงกับข้อมูลแรสเตอร์เพื่อใช้เป็นตัวแทนของสิ่งที่ปรากฏอยู่บนพื้นที่จริงโดยจะแสดงในรูปแบบของจุด เส้น และพื้นที่ (ภาพที่ 4.20) ซึ่งในทางคณิตศาสตร์คุณสมบัติของเวกเตอร์ต้องประกอบด้วย จุดเริ่มต้น ขนาด และทิศทาง

จุด เป็นหน่วยย่อยที่สุดของเวกเตอร์ ซึ่งมีจุดเริ่มต้น โดยขนาดและทิศทางมีค่า 0 จุดเป็นเพียงตำแหน่งซึ่งไม่สามารถวัดพื้นที่ได้

เส้น ประกอบด้วยเวกเตอร์ซึ่งมีลักษณะเป็นเส้นตรงเรียงต่อเนื่องกันเป็นลำดับเส้นมีเพียง 1 มิติ คือ มีความยาว แต่ไม่มีความกว้าง

พื้นที่ ประกอบด้วยเวกเตอร์ที่เรียงต่อเนื่องกันเป็นอนุกรม ซึ่งมีลักษณะเป็นเส้นปิด ดังนั้น ข้อมูลประเภทอาณาบริเวณจึงสามารถวัดพื้นที่ได้

ภาพแสดงการใช้เวกเตอร์เป็นตัวแทนข้อมูลในพื้นที่
ภาพแสดงการใช้เวกเตอร์เป็นตัวแทนข้อมูลในพื้นที่

– ข้อมูลลักษณะประจำ คือ ข้อมูลที่เกี่ยวกับลักษณะหรือคุณลักษณะเฉพาะของข้อมูลเชิงพื้นที่ในแต่ละช่วงเวลา ซึ่งได้มาจากเอกสารหลักฐานที่ได้ถูกบันทึกไว้ของผู้ใช้ข้อมูล หรือได้มาจากแบบฟอร์ม ตาราง รายงานหรือจากการวัดค่าของข้อมูลเชิงพื้นที่นั้นๆ ข้อมูลลักษณะประจำนี้จะมีลักษณะเป็นข้อความ (Character) หรือเป็นตัวเลขซึ่งโดยทั่วไปข้อมูลลักษณะประจำในระบบสารสนเทศทางภูมิศาสตร์จะถูกจัดเก็บในรูปแบบของตาราง และมีแบบจำลองข้อมูลเป็นแบบข้อมูลเชิงสัมพันธ์

ภาพแสดงรายละเอียดข้อมูลในระบบสารสนเทศภูมิศาสตร์
ภาพแสดงรายละเอียดข้อมูลในระบบสารสนเทศภูมิศาสตร์

10. ความสัมพันธ์ของข้อมูลในระบบสารสนเทศภูมิศาสตร์ จากที่ทราบแล้วว่าข้อมูลในระบบสารสนเทศทางภูมิศาสตร์แบ่งออกเป็นข้อมูลเชิงพื้นที่และข้อมูลลักษณะประจำ ซึ่งข้อมูลทั้งสองประเภทนี้จะเกี่ยวเนื่องสัมพันธ์กัน โดยข้อมูลลักษณะประจำจะบ่งบอกถึงลักษณะเฉพาะตัวของข้อมูลเชิงพื้นที่แต่ละชนิด ณ ช่วงเวลาใดเวลาหนึ่ง ซึ่งจากความสัมพันธ์ดังกล่าวนี้จะช่วยให้สามารถทำความเข้าใจสภาพพื้นที่ได้อย่างชัดเจน ช่วยให้สามารถทำการวิเคราะห์พื้นที่ในด้านต่างๆ ได้อย่างรวดเร็วและมีประสิทธิภาพมากขึ้น สามารถอธิบายความสัมพันธ์ของข้อมูลได้ดังต่อไปนี้

1) ความสัมพันธ์ในข้อมูลแบบแรสเตอร์ เป็นความสัมพันธ์ที่เกิดขึ้นระหว่างข้อมูลที่เป็นโครงสร้างของข้อมูลซึ่งได้แก่ กริดเซลล์ กับข้อมูลตัวเลขที่บรรจุอยู่ในกริดเซลล์ ซึ่งทำให้สามารถแปลความหมายข้อมูลจากแรสเตอร์ได้โดยอาศัยการเรียงตัวกันของกริดเซลล์ที่มีค่าตัวเลขเป็นค่าเดียวกัน

ภาพแสดงความสัมพันธ์ระหว่างข้อมูลแรสเตอร์กับข้อมูลลักษณะประจำ ที่มา : ดัดแปลงจาก สิริพร กมลธรรม (2549)
ภาพแสดงความสัมพันธ์ระหว่างข้อมูลแรสเตอร์กับข้อมูลลักษณะประจำ
ที่มา : ดัดแปลงจาก สิริพร กมลธรรม (2549)

2) ความสัมพันธ์ในข้อมูลแบบเวกเตอร์ เนื่องจากข้อมูลแบบเวกเตอร์นี้เป็นข้อมูลที่สร้างขึ้นโดยใช้หลักการทางคณิตศาสตร์ ดังนั้นข้อมูลลักษณะประจำที่มีความสัมพันธ์กับข้อมูลเวกเตอร์นั้นนอกจากจะเป็นข้อมูลคำบรรยายโดยทั่วไป เช่น ชื่อสถานที่ จำนวนประชากร ระดับความสูง ประเภทการใช้ที่ดิน เป็นต้น ในข้อมูลแบบเวกเตอร์ยังมีข้อมูลลักษณะประจำที่ระบุถึงการอ้างอิงระหว่างข้อมูลเวกเตอร์ด้วยกันหรือบอกถึงตำแหน่งเริ่มต้นของข้อมูลอีกด้วยซึ่งเรียกว่า ทอพอโลยี

– ทอพอโลยีของจุด (Point topology) เป็นข้อมูลลักษณะประจำของค่าตำแหน่งที่เกิดข้อมูลจุดซึ่งระบบในรูปแบบของคู่พิกัด X,Y

ภาพแสดงทอพอโลยีของข้อมูลแบบจุด
ภาพแสดงทอพอโลยีของข้อมูลแบบจุด

– ทอพอโลยีของเส้น (Line topology) จะเป็นข้อมูลลักษณะประจำที่อ้างอิงถึงพื้นที่ทางด้านซ้าย (Left polygon) และพื้นที่ทางด้านขวา (Right polygon) ของข้อมูลเส้นที่ถูกสร้างขึ้น โดยการอ่านค่าทอพอโลยีของข้อมูลเส้น จะอ่านจากด้านบนลงด้านล่าง หรือจากด้านซ้ายไปทางด้านขวา

ภาพแสดงทอพอโลยีของข้อมูลแบบเส้น
ภาพแสดงทอพอโลยีของข้อมูลแบบเส้น

– ทอพอโลยีของพื้นที่ (Polygon topology) จะเป็นข้อมูลลักษณะประจำของการสร้างข้อมูลแบบพื้นที่โดยระบุว่าพื้นที่ที่ถูกสร้างขึ้นนั้นประกอบด้วยข้อมูลเส้นใดๆ บ้าง

ภาพแสดงทอพอโลยีของข้อมูลพื้นที่
ภาพแสดงทอพอโลยีของข้อมูลพื้นที่

 

ที่มา : ตำราเทคโนโลยีอวกาศและภูมิสารสนเทศศาสตร์