ระบบสารสนเทศภูมิศาสตร์ใช้ในการวิเคราะห์ปัญหาตั้งแต่ระดับง่ายไปถึงยาก ซึ่งโดยทั่วไปเป็นการแสดงผลระหว่างความสัมพันธ์ของTopology กับข้อมูลลักษณะประจำ โดยไม่ต้องผ่านขั้นตอนการทำงานที่ยุ่งยาก เช่น การระบุลักษณะประจำของกราฟิก การวัดระยะทาง การคำนวณพื้นที่ เป็นต้น หรือแม้กระทั่งการวิเคราะห์ที่มีความซับซ้อนมากขึ้น การค้นหาผลการซ้อนทับปัจจัย การวิเคราะห์เส้นทางเข้าถึงที่ใกล้ที่สุด การประเมินค่าใช้จ่ายในการเดินทาง การวิเคราะห์พื้นที่เหมาะสมในการสร้างสิ่งปลูกสร้าง หรือการพยากรณ์แนวโน้มความเปลี่ยนแปลง เป็นต้น
ต้องการทราบขนาดพื้นที่ของอาคารกาญจนาภิเษก มหาวิทยาลัยขอนแก่น โดยมีชั้นข้อมูลที่แสดงลักษณะการใช้ประโยชน์ที่ดินในมหาวิทยาลัยขอนแก่นอยู่แล้วสามารถสอบถามข้อมูลได้อย่างง่ายดังนี้


รูปแบบการทำงานข้างต้น ผู้ใช้งานจะเป็นฝ่ายตั้งคำถามและเลือกใช้ความสามารถในการทำงานของระบบสารสนเทศภูมิศาสตร์ ในการเข้าถึงกระทั่งตอบคำถามที่ได้ตั้งไว้ ทั้งนี้ฟังก์ชันการทำงานหลักของระบบสารสนเทศภูมิศาสตร์ สามารถแบ่งออกตามลักษณะการทำงานได้ 4 กลุ่มหลัก คือ การค้นข้อมูลเชิงพื้นที่ (Spatial search) การซ้อนทับเชิงพื้นที่ (Spatial overlay) การสร้างแนวกันชน (Buffer operation) และการประมาณค่าเชิงพื้นที่ (Spatial interpretation) โดยในแต่ละฟังก์ชัน สามารถจำแนกลักษณะการทำงานที่มีความคล้ายคลึงกันออกไปได้อีกมากมายดังรายละเอียดต่อไปนี้
1. การค้นข้อมูลเชิงพื้นที่
การค้นข้อมูลเชิงพื้นที่ถือเป็นพื้นฐานของการวิเคราะห์ข้อมูลเชิงพื้นที่ ซึ่งนักวิเคราะห์จะต้องการทราบข้อมูลต่างๆ เพื่อใช้ในการประกอบการตัดสินใจ ไม่ว่าจะเป็นการสอบถามเพื่อทราบรายละเอียดเกี่ยวกับตำแหน่งพิกัดทางภูมิศาสตร์ การสอบถามโดยการตั้งเงื่อนไข (Condition) แนวโน้มการเปลี่ยนแปลง (Trends) รูปแบบการเปลี่ยนแปลง (Pattern) การประกอบแบบจำลอง (Modeling) ทั้งนี้การค้นข้อมูลเชิงพื้นที่ แบ่งออกเป็นการค้นหาจากข้อมูลลักษณะประจำ การค้นหาจากข้อมูลเชิงพื้นที่โดยตรง และการวิเคราะห์เชิงบูรณาการข้อมูลเชิงพื้นที่ร่วมกับข้อมูลลักษณะประจำ (Integrated analysis of the spatial and non-spatial data)
1) การค้นหาจากข้อมูลลักษณะประจำ
เป็นการค้นหาโดยตั้งคำถามให้ระบบช่วยสอบถาม (Query) ซึ่งอาจเป็นคำถามอย่างง่าย โดยระบุสิ่งที่ต้องการถามจากลักษณะที่ผู้ศึกษาทราบ เช่น ต้องการทราบสถานที่ตั้งของมหาวิทยาลัยขอนแก่นจากชั้นข้อมูลจุดที่ตั้งสถานศึกษาในจังหวัดขอนแก่น เป็นต้น แสดงลักษณะการตั้งคำถามอย่างง่ายดังภาพที่ 4.36 ผลที่ได้จะถูกแสดงให้เด่นชัดในกราฟิกหรือแผนที่ ทำให้ผู้สอบถามสามารถทราบข้อมูลที่ต้องการค้นคืน รวมถึงตำแหน่งที่ตั้งตามระบบพิกัดการค้นหาอาจเพียงต้องการทราบข้อมูลรายละเอียดของสิ่งที่ถาม หรือเพื่อแก้ไข ปรับข้อมูลให้เป็นปัจจุบัน แต่อย่างไร ก็ตามมีบางครั้งที่ผู้ศึกษาไม่ทราบค่าของข้อมูลที่ต้องการโดยตรง หรือภายในชั้นข้อมูลมิได้มีค่าที่แสดงลักษณะที่ต้องการโดยตรง ผู้ศึกษาจำเป็นต้องสร้างคำสืบค้นที่ทำให้เข้าถึงสิ่งที่ต้องการโดยทางอ้อม โดยกำหนดจากคุณลักษณะอื่นๆ เท่าที่ทราบ ลักษณะของคำถามดังกล่าวอาจใช้สมการทางคณิตศาสตร์ หรือตรรกศาสตร์แบบบูล (Boolean logic) เพื่อเป็นตัวช่วยระบุสิ่งที่ต้องการให้ตรงเป้าหมาย แสดงตัวอย่างการสืบค้นดังภาพ ซึ่งต้องการหาอำเภอที่มีความหนาแน่นของประชากรมากกว่า 200 คน/ตารางกิโลเมตร และมีพื้นที่มากกว่า 900 ตารางกิโลเมตร และจำนวนหมู่บ้านในอำเภอดังกล่าว

ต้องการทราบอำเภอในภาคตะวันออกเฉียงเหนือที่มีความหนาแน่นของประชากรในพื้นที่ มากกว่า 200 คน/ตารางกิโลเมตรและมีขนาดพื้นที่อำเภอมากกว่า 900 ตารางกิโลเมตร โดยต้องการทราบจำนวนหมู่บ้านทั้งหมดในอำเภอดังกล่าวด้วย

การค้นหาและวิเคราะห์ข้อมูลในระบบสารสนเทศ นิยมใช้ภาษาสอบถามเชิงโครงสร้าง (Standard Query Language : SQL) ซึ่งประกอบด้วย ตัวดำเนินการคำนวณ (Arithmetic operator) ตัวดำเนินการสัมพันธ์ (Relational operator) และตัวดำเนินการตรรกะแบบบูล (Boolean logical operator) โดยลักษณะของตัวดำเนินการแต่ละประเภทแสดงดังต่อไปนี้
ตัวดำเนินการ |
สัญลักษณ์ที่ใช้ |
คณิตศาสตร์ | บวก (+) ลบ (-) คูณ (×) หาร (/) |
สัมพันธ์ | = ≥ ≤ > < |
ตรรกะแบบกูล | OR AND XOR NOT |

ตัวดำเนินการแบบบูล ได้แก่ AND OR NOT และ XOR ซึ่งเป็นตัวดำเนินการที่ยอมรับกันอย่างกว้างขวาง เพื่อแสดงเงื่อนไขเชิงตรรกะ เพื่อให้ได้ผลลัพธ์ตามเป้าหมาย ซึ่งประกอบด้วยข้อมูลนำเข้าและข้อมูลผลลัพธ์
OR หมายถึง การยูเนียน (Union) ข้อมูลนำเข้า
AND หมายถึง การอินเตอร์เซกชัน (Intersection) ของข้อมูลนำเข้า ดังภาพที่ 4.38ข
XOR หมายถึง ผลลัพธ์อันเกิดจากข้อมูลนำเข้า ในส่วนที่ไม่เกิดการอินเตอร์เซกชัน
NOT หมายถึง ผลลัพธ์อันเกิดจากส่วนใดส่วนหนึ่งของข้อมูลนำเข้าที่ไม่ตัดกัน ซึ่งจะขึ้นกับการกำหนดลำดับ
นอกจากการใช้คำสั่งสืบค้นแล้วในกรณีที่ไม่สามารถระบุลักษณะของข้อมูลที่ต้องการสืบค้นได้อาจจำเป็นต้องใช้เทคนิคบางประการเข้าช่วยในการค้นหา ดังเช่น ตัวอย่างในภาพ ซึ่งแสดงการจัดเรียงลำดับ (Sorting) พื้นที่จังหวัดในภาคตะวันออกเฉียงเหนือจากน้อยไปมาก การเรียงเลขใหม่ (Renumbering) หรือการจัดกลุ่มย่อยใหม่ (Subseting) โดยการเลือกใช้วิธีการใดก็ขึ้นกับความเหมาะสมและความต้องการ เนื่องจากค่าในเขตข้อมูลของข้อมูลลักษณะประจำจะมีรูปแบบที่แตกต่างกันออกไป ทำให้ไม่สามารถเลือกใช้คำถามที่เหมือนกันในการเข้าถึงได้โดยลักษณะของข้อมูลสามารถแบ่งออกเป็น 4 ระดับ (Four levels of measurement) อ้างอิงตาม Steven (1946)


ตารางแสดงลักษณะของข้อมูล
2) การค้นหาจากข้อมูลเชิงพื้นที่
เป็นการค้นหาข้อมูลโดยเลือกจากส่วนที่เป็นข้อมูลกราฟิก เพื่อแสดงข้อมูลรายละเอียดของสิ่งที่ต้องการทราบ วิธีการค้นหาลักษณะนี้มีหลายรูปแบบ เช่น การเลือกดูเฉพาะตำแหน่งที่สนใจ การเลือกโดยอาศัยชั้นข้อมูลอื่น (Select by theme/ Select by location) การสร้างความเชื่อมโยงหลายมิติ (Hyperlink) เป็นต้น

ข้อสังเกต ความแตกต่างของการเลือกใช้วิธี ค้นหาด้วย Select by theme กับ Select by attribute คือ
Select by location ใช้เมื่อ: ทราบตำแหน่ง> ไม่ทราบข้อมูล
Select by attribute ใช้เมื่อ: ทราบข้อมูลชื่อหรือรหัส > ไม่ทราบตำแหน่ง
ในกรณีที่ต้องการทราบลักษณะประจำของหมู่บ้าน ให้เลือกตำแหน่งหมู่บ้านแล้วแสดงข้อมูลลักษณะประจำของหมู่บ้าน
ในกรณีที่ต้องการทราบลักษณะประจำอื่นๆ ที่เกี่ยวข้องให้เลือกตำแหน่งหมู่บ้านแล้วแสดงลักษณะประจำของหมู่บ้าน แล้วเชื่อมโยงไปยังข้อมูลอื่นๆ ที่เกี่ยวข้องกับหมู่บ้านนั้นซึ่งเป็นการเชื่อมโยงข้อมูลหลายมิติ
ในกรณีที่ต้องการทราบหมู่บ้านที่ไม่มีขอบเขตจังหวัด ให้เลือกพื้นที่จังหวัดแล้วแสดงขอบเขตจังหวัดที่ต้องการ แล้วนำขอบเขตของจังหวัดนั้นมาเลือกหมู่บ้านที่อยู่ในจังหวัดนั้น
3) การค้นหาจากข้อมูลเชิงพื้นที่ร่วมกับข้อมูลลักษณะประจำ
เป็นการใช้งานที่ใกล้เคียงกับลักษณะความเป็นจริง ที่บางครั้งอาศัยการสอบถามจากข้อมูลเชิงพื้นที่หรือลักษณะประจำอย่างเดียวยังไม่เพียงพอ จึงต้องบูรณาการระหว่างข้อมูลเชิงพื้นที่และข้อมูลลักษณะประจำร่วมกันวิธีการดังกล่าวจะมีความยืดหยุ่นในการเข้าถึงข้อมูลที่ต้องการได้ดียิ่งขึ้น
2. การซ้อนทับเชิงพื้นที่
การวิเคราะห์ข้อมูลเชิงพื้นที่ส่วนใหญ่ ผู้ศึกษาจำเป็นต้องวิเคราะห์ความสัมพันธ์ระหว่างปัจจัยมากกว่า 1 ปัจจัย วิธีการที่นิยมใช้ตอบโจทย์ปัญหาเชิงพื้นที่ลักษณะดังกล่าว คือ “การซ้อนทับชั้นข้อมูล” ซึ่งเป็นการกระทำระหว่างชั้นข้อมูลมากกว่าหรือเท่ากับ 2 ชั้นข้อมูลขึ้นไป ตามเงื่อนไขที่ได้จากการวิเคราะห์ซึ่งอาจจะเป็นแบบคณิตศาสตร์หรือตรรกศาสตร์ เพื่อได้มาซึ่งผลลัพธ์ที่ต้องการบนพื้นที่ใดพื้นที่หนึ่ง แต่ละชั้นข้อมูลจำเป็นต้องมีระบบพิกัดตรงกันผลจากการซ้อนทับจะได้ชั้นข้อมูลใหม่ที่สามารถตอบโจทย์ที่ผู้ศึกษาต้องการ
การซ้อนทับชั้นข้อมูลสามารถจำแนกเป็นการซ้อนทับที่กระทำกับข้อมูลประเภทเวกเตอร์ ประกอบด้วยการซ้อนทับแบบยูเนียน แบบอินเตอร์เซกชัน แบบเอกลักษณ์ (Identity) แบบผนวก (Append) การซ้อนทับเพื่อปรับให้เป็นปัจจุบัน (Update) การตัดข้อมูล (Clip) และการลบข้อมูล (Erase) ในขณะที่ข้อมูลประเภทแรสเตอร์ก็สามารถดำเนินการซ้อนทับได้เช่นเดียวกัน โดยมีลักษณะการดำเนินการที่แตกต่างกัน แต่ให้ผลการซ้อนทับที่มีความหมายลักษณะเดียวกัน เช่น การซ้อนทับที่มีน้ำหนักแต่ละชั้นข้อมูลต่างกัน (Weighted overlay) และผลรวมของน้ำหนัก (Weighted sum) เป็นต้น ในที่นี้จึงได้แสดงรายละเอียดการซ้อนทับแยกตามชนิดของข้อมูลเวกเตอร์ และแรสเตอร์ตามลำดับ
1) การซ้อนทับชั้นข้อมูลประเภทเวกเตอร์ (Vector overlay) องค์ประกอบที่สำคัญในการซ้อนทับชั้นข้อมูลเวกเตอร์ ประกอบด้วยชั้นข้อมูลปฐมภูมิ (Primary layer) ชั้นข้อมูลที่ใช้ปฏิบัติการ (Operation layer) และผลที่ได้จากการซ้อนทับ (Result layer) สำหรับลักษณะของการซ้อนทับ ชั้นข้อมูลนำเข้าจะถูกแบ่งออกเป็นส่วนตามจุดที่ตัดกับชั้นข้อมูลที่ใช้ซ้อนทับ เกิดเป็นพื้นที่ใหม่ (New area) และแสดงในชั้นข้อมูลผลลัพธ์ อย่างไรก็ตามสามารถซ้อนทับชั้นข้อมูลที่มีลักษณะเป็น เส้น และจุด ได้เช่นเดียวกัน หากข้อมูลนำเข้ามีลักษณะเป็นเส้น ตำแหน่งของเส้นที่ตัดกับชั้นข้อมูลซ้อนทับจะกลายเป็นชิ้นส่วนของเส้นใหม่ที่ถูกแสดงไว้ในชั้นข้อมูลผลลัพธ์ เช่นเดียวกับชั้นข้อมูลนำเข้าที่มีลักษณะเป็นจุด ต่ำแหน่งของจุดที่ปรากฏอยู่ในชั้นข้อมูลที่ใช้ซ้อนทับจะถูกแสดงเป็นจุดที่มีความหมายใหม่ในชั้นข้อมูลผลลัพธ์ ผลจากการซ้อนทับ ข้อมูลลักษณะประจำที่สร้างขึ้นมาใหม่จะแสดงค่าทั้งส่วนที่เป็นค่าของชั้นข้อมูลนำเข้าและชั้นข้อมูลซ้อนทับไว้คู่กัน
ตาราง แสดงลักษณะการซ้อนทับชั้นข้อมูล ประเภทจุด เส้น และอาณาบริเวณ
การซ้อนทับข้อมูลประเภทเวกเตอร์มีด้วยกันหลายวิธีดังที่ได้กล่าวถึงบ้างแล้วในขั้นต้น แต่ละวิธีถูกสร้างเพื่อให้ผลการวิเคราะห์ที่แตกต่างกันออกไป ดังนั้นจึงได้อธิบายรายละเอียดของแต่ละวิธีพอสังเขปดังต่อไปนี้
– การซ้อนทับแบบยูเนียน
การซ้อนทับด้วยวิธียูเนียนเป็นการกระทำระหว่างชั้นข้อมูลนำเข้าสองชั้นข้อมูล ผลลัพธ์ที่ได้จะรวมคุณลักษณะทั้งหมดของชั้นข้อมูลนำเข้าทั้งสองไว้ด้วยกันทั้งในส่วนที่เป็นกราฟิก และข้อมูลลักษณะประจำบริเวณที่เกิดจากการตัดกันของข้อมูลจะถูกแสดงเป็นพื้นที่ใหม่พร้อมๆ กับการสร้างค่ารหัสตัวแทนขึ้นใหม่ การซ้อนทับแบบยูเนียนนี้จะใช้กับชั้นข้อมูลที่เป็นอาณาบริเวณเท่านั้น ทั้งนี้การเลือกชั้นข้อมูลนำเข้าหรือชั้นข้อมูล ที่ใช้ซ้อนทับสามารถสลับกันได้โดยไม่มีผลต่อผลลัพธ์

– การซ้อนทับแบบอินเตอร์เซกชัน
เป็นการซ้อนทับระหว่างชั้นข้อมูลสองชั้นข้อมูล ผลที่ได้จะแสดงเพียงรายละเอียดของส่วนที่ตัดกัน (ซ้อนทับ) ระหว่างชั้นข้อมูลนำเข้า และชั้นข้อมูลซ้อนทับ การเลือกชั้นข้อมูลนำเข้าหรือชั้นข้อมูลที่ใช้ซ้อนทับสามารถสลับกันได้โดยไม่มีผลต่อผลลัพธ์

– การซ้อนทับแบบเอกลักษณ์
เป็นฟังก์ชันการซ้อนทับที่ยังคงรักษาคุณลักษณะของชั้นข้อมูลนำเข้าไว้ แต่จะดึงเอาเอกลักษณ์ของชั้นข้อมูลที่นำมาซ้อนทับในบริเวณที่ทับกับชั้นข้อมูลนำเข้ามาแสดงในชั้นข้อมูลผลลัพธ์ด้วย ดังนั้นการเลือกลำดับข้อมูลนำเข้าและชั้นข้อมูลที่นำมาซ้อนทับจึงมีความสำคัญ เนื่องจากจะให้ผลลัพธ์ที่แตกต่างกัน แสดงลักษณะการซ้อนทับดังภาพ จะเห็นได้ว่าในภาพ (ก) จะยังคงรักษาชั้นข้อมูลปฐมภูมิทั้งหมดไว้ คือยังคงมีพื้นที่ (1 2 และ 3) เนื่องจากชั้นข้อมูลปฐมภูมิมีขนาดใหญ่กว่าชั้นข้อมูลปฏิบัติการ ส่วนในภาพ (ข) ยังคงพื้นที่ข้อมูลชั้นปฐมภูมิเช่นกันแต่ชั้นข้อมูลปฏิบัติการในส่วนที่ล้ำออกไปจากชั้นข้อมูลปฐมภูมิจะถูกลบออก


– การซ้อนทับเพื่อปรับให้เป็นปัจจุบัน
เป็นการปรับแก้ข้อมูลพื้นที่บางส่วนโดยการแทนที่พื้นที่ในชั้นข้อมูลปฐมภูมิด้วยชั้นข้อมูลปฏิบัติการชั้นข้อมูลผลลัพธ์ที่ได้จะมีเฉพาะเขตค่าข้อมูลของชั้นข้อมูลปฐมภูมิปรากฏอยู่เท่านั้น ซึ่งในบริเวณพื้นที่ที่เป็นชั้นข้อมูลปฏิบัติการจะถูกแทนที่ด้วยค่าว่าง (Blank) สำหรับข้อมูลอักษร (String) หรือค่า 0 สำหรับข้อมูลเชิงตัวเลข (Numeric) พร้อมคำนวณพื้นที่และเส้นรอบรูปใหม่เพื่อปรับปรุงฐานข้อมูลแผนที่ผลลัพธ์ นิยมใช้การซ้อนทับลักษณะนี้เพื่อปรับปรุง แผนที่ให้ทันสมัยได้มีการจัดเก็บเพิ่มเติมเฉพาะส่วน โดยลบข้อมูลเก่าออกแล้วแทนที่ด้วยข้อมูลใหม่ ดังภาพ (ก) แสดงการแทนที่ชั้นข้อมูลปฐมภูมิซึ่งเป็นค่าตัวเลขด้วยชั้นข้อมูลปฏิบัติการ ผลที่ได้จะแสดงรูปร่างพื้นที่ใหม่โดยส่วนที่เป็นบริเวณชั้นข้อมูลปฏิบัติการแสดงค่าเป็น 0 ส่วนภาพ (ข) แสดงการแทนที่ชั้นข้อมูลปฐมภูมิซึ่งเป็นค่าตัวอักษรด้วยชั้นข้อมูลปฏิบัติการ ผลที่ได้จะแสดงรูปร่างพื้นที่ใหม่โดยส่วนที่เป็นบริเวณชั้นข้อมูลปฏิบัติการแสดงค่าเป็นค่าว่าง


– การลบข้อมูล
เป็นการซ้อนทับที่กระทำเพื่อลบส่วนของข้อมูลโดยอาศัยชั้นข้อมูลปฏิบัติการเพื่อเป็นกรอบการลบบริเวณที่ถูกลบค่าออกคือตำแหน่งที่มีพื้นที่ซ้อนทับกันอยู่ภายในชั้นข้อมูลที่นำมาปฏิบัติการ การลบข้อมูลลักษณะนี้สามารถกระทำได้กับข้อมูลที่เป็นอาณาบริเวณ จุด และเส้น ดังแสดงในภาพ

– การตัดข้อมูล
เป็นการซ้อนทับชั้นข้อมูลเพื่อลบส่วนของพื้นที่จากชั้นข้อมูลนำเข้าที่อยู่นอกเขตพื้นที่ของชั้นข้อมูลที่ต้องการนำมาซ้อนทับเพื่อตัดบางส่วนของชั้นข้อมูลนำเข้า สำหรับข้อมูลลักษณะประจำที่แสดงในผลลัพธ์จะแสดงเพียงค่าจากชั้นข้อมูลนำเข้าเท่านั้น ดังนั้นการให้ลำดับชั้นข้อมูลนำเข้ากับชั้นข้อมูลซ้อนทับจึงเป็นสิ่งที่ต้องคำนึงถึงก่อนการวิเคราะห์ สำหรับการตัดสามารถกระทำได้ทั้งข้อมูลที่เป็นอาณาบริเวณ จุด และเส้น ดังแสดงในตัวอย่างภาพ

– การรวมข้อมูลเข้าด้วยกัน
ใช้ในการรวมข้อมูลระหว่าง 2 ชั้นข้อมูล ที่มีระบบพิกัดเดียวกัน มีความต่อเนื่องกัน และค่าคุณลักษณะของข้อมูลในข้อมูลลักษณะประจำเหมือนกัน สามารถใช้คำสั่งการรวมข้อมูลได้ทั้งกับชั้นข้อมูลที่เป็นอาณาบริเวณ จุด และเส้น ผลลัพธ์ที่ได้ข้อมูลในลักษณะกราฟิก และตารางจะถูกรวมเข้าด้วยกันโดยมีลักษณะต่อเนื่องกันเหมือนข้อมูลนำเข้า แสดงการเชื่อมต่อแผนที่ดังภาพ

– การผนวกชั้นข้อมูล
การผนวกข้อมูลเป็นการดำเนินการเพื่อเชื่อมต่อชุดของชั้นข้อมูลประเภทอาณาบริเวณ จุด เส้น ตาราง รวมทั้งข้อมูลประเภทแรสเตอร์ เข้าไปยังชั้นข้อมูลอาณาบริเวณ จุด เส้น ตาราง หรือข้อมูลแรสเตอร์ที่มีอยู่แล้วแสดงดังภาพ

ปัญหาที่เกิดจากการซ้อนทับชั้นข้อมูลประเภทเวกเตอร์
แม้การซ้อนทับชั้นข้อมูลประเภทเวกเตอร์จะช่วยให้ได้ผลการวิเคราะห์ตามความต้องการ แต่บางครั้งผลที่ได้จากการซ้อนทับอาจยังไม่สมบูรณ์เพียงพอสำหรับการนำไปใช้โดยตรง ทำให้ต้องมีการปรับปรุงข้อมูลให้อยู่ในรูปแบบที่เหมาะสมที่สุดก่อน ซึ่งปัญหาที่มักเกิดกับชั้นข้อมูลผลลัพธ์ ดังเช่น การเกิดกาบ (Sliver) หรือการที่ผลจากการซ้อนทับเกิดเป็นพื้นที่ หรือส่วนของเส้นจำนวนมากเกินไปจนทำให้การแสดงผล และการคำนวณต้องเสียเวลามาก ดังนั้นในที่นี้จึงได้แสดงรายละเอียดของปัญหาที่เกิดจากการซ้อนทับดังนี้
ก. การเกิดกาบ : เป็นพื้นที่ขนาดเล็ก (Tiny polygons) จำนวนมากที่เกิดขึ้นจากการซ้อนทับชั้นข้อมูลอาณาบริเวณ ที่ควรจะเป็นเส้นเดียวกันแต่มีการล้ำกัน ซึ่งอาจจะเกิดจากการมีข้อมูลประเภทเดียวกันมาจากการนำเข้าหรือแหล่งที่ต่างกัน โดยเฉพาะบริเวณแนวขอบส่วนที่ตัดกันของพื้นที่ พื้นที่เล็กๆ ที่เกิดขึ้นโดยไม่ต้องการเหล่านี้เป็นสิ่งที่คอยรบกวนการวิเคราะห์ และอาจทำให้ผลการวิเคราะห์ผิดพลาดได้

จากภาพ หากพิจารณาชั้นข้อมูลนำเข้าและชั้นข้อมูลที่นำมาซ้อนทับเพียงอย่างใดอย่างหนึ่งอาจดูคล้ายว่าชั้นข้อมูลมีขอบเขตพื้นที่ที่เหมือนกัน (เท่ากัน) แต่เมื่อทำการซ้อนทับกันแล้วกลับพบว่ามีส่วนที่ซ้อนเหลื่อมปรากฏในชั้นข้อมูลผลลัพธ์ แสดงว่าชั้นข้อมูลมีขอบเขตพื้นที่แตกต่างกัน ปัญหาดังกล่าวอาจเกิดจากความแตกต่างของขนาด หรือตำแหน่งของชั้นข้อมูลที่เลื่อนต่างกันเล็กน้อย การเกิดกาบค่อนข้างเป็นปัญหาสำหรับการศึกษาความเปลี่ยนแปลงของพื้นที่ เนื่องจากผู้ศึกษาจำเป็นต้องวิเคราะห์ให้ได้ว่าพื้นที่ขนาดเล็กที่ปรากฏ เป็นผลมาจากการเปลี่ยนแปลงของพื้นที่จริง หรือว่าเป็นเพียงกาบที่มาจากความแตกต่างกันของข้อมูล
ข้อสังเกตในการพิจารณาลักษณะของกาบ
– โดยทั่วไปกาบที่เกิดขึ้นจะมีขนาดเล็ก
– รูปร่างยาว และเรียวบาง
– มีจำนวนมาก และส่วนใหญ่เป็นเส้น 2 เส้นขนานกัน
– มักพบบริเวณขอบที่ตัดกันของชั้นข้อมูล

การแก้ปัญหาสามารถกระทำได้หลายวิธีการ ซึ่งอาจเป็นการปรับปรุงชั้นข้อมูลนำเข้าก่อนการซ้อนทับให้มีขอบเขต หรือพิกัดที่ถูกต้องเป็นระบบเดียวกันเสียก่อน หรือปรับปรุงข้อมูลที่ได้จากการซ้อนทับด้วยการใช้คำสั่งกำจัด(Eliminate) เพื่อลบพื้นที่ที่เป็นกาบออกไป หรือในกรณีที่เกิดกาบไม่มากนักอาจใช้วิธีเลือก (Select) และทำการรวมเขตข้อมูลด้วยคำสั่งสลาย (Dissolve) หากพบว่าพื้นที่กาบนั้นสามารถจัดกลุ่มเข้าเป็นหมวดพื้นที่ใดของชั้นข้อมูลผลลัพธ์ได้

จากภาพแสดงให้เห็นว่าชั้นข้อมูลที่เกิดจากกระบวนการซ้อนทับทำให้เกิดกาบจำนวนมากที่ผู้ศึกษาไม่ต้องการ โดยขนาดกาบที่ถูกตรวจสอบทั้งหมดมีขนาดพื้นที่น้อยกว่าหรือเท่ากับ 3 ตารางกิโลเมตร ดังนั้นจึงทำการกำจัดพื้นที่ที่มีขนาดน้อยกว่าหรือเท่ากับ 3 ตารางกิโลเมตร
ข. การมีพื้นที่ย่อยจำนวนมากเกินไป : ผลจากการซ้อนทับชั้นข้อมูลที่มีพื้นที่ย่อยจำนวนมากเข้าด้วยกันทำให้ได้ผลลัพธ์ที่มีจำนวนพื้นที่ย่อยๆ เพิ่มมากขึ้น จนบางครั้งทำให้การแสดงผลต้องใช้เวลาดำเนินการนาน และการประมวลผลร่วมกับชั้นข้อมูลอื่นมีความซับซ้อนขึ้น ปัญหาดังกล่าวเราสามารถแก้ไขได้ด้วยการจัดจำแนกข้อมูลใหม่(Reclassify) และทำการสลายพื้นที่ย่อยที่มีจำนวนมากเพื่อรวมกลุ่มข้อมูล หรือข้อมูลลักษณะประจำที่ถูกจัดให้เป็นกลุ่มเดียวกัน

จากภาพชั้นข้อมูลนำเข้า และชั้นข้อมูลซ้อนทับ ต่างมีพื้นที่ย่อยจำนวนมากเมื่อทำการซ้อนทับชั้นข้อมูลทั้งสองด้วยวิธีการยูเนียนทำให้ชั้นข้อมูลผลลัพธ์เกิดมีพื้นที่ย่อยมากขึ้น
ทำการจัดกลุ่มค่าข้อมูลผลลัพธ์ให้อยู่ในกลุ่มเดียวกัน และสลายค่าผลการจัดกลุ่มผลที่ได้คือชั้นข้อมูลใหม่ที่สดงรูปแบบของผลการศึกษาตามต้องการ
2) การซ้อนทับชั้นข้อมูลประเภทแรสเตอร์
เป็นที่ทราบกันดีแล้วว่าลักษณะของข้อมูลที่ปรากฏอยู่ในระบบสารสนเทศภูมิศาสตร์นั้น ประกอบด้วยข้อมูลประเภทเวกเตอร์ และแรสเตอร์ ซึ่งในบางกรณีการเลือกใช้ข้อมูลประเภทแรสเตอร์จะมีความเหมาะสมมากกว่าเนื่องจากสามารถให้ผลการวิเคราะห์ที่รวดเร็วกว่าข้อมูลเวกเตอร์ และจากข้อจำกัดของข้อมูลเวกเตอร์ คือ เมื่อซ้อนทับชั้นข้อมูลที่มากกว่า 2 ชั้น (โดยเฉพาะชั้นข้อมูลที่มีความซับซ้อนมาก) การประมวลผลด้วยคอมพิวเตอร์จะสิ้นเปลืองเวลานาน และต้องผ่านการปรับปรุงข้อมูลหลายครั้งกว่าจะได้ผลการศึกษาที่ต้องการ ในขณะที่ข้อมูลประเภทแรสเตอร์ การวิเคราะห์ในลักษณะของการซ้อนทับสามารถกระทำได้อย่างรวดเร็ว อีกทั้งสามารถทำได้พร้อมกันหลายชั้นข้อมูลในเวลาเดียวกัน ข้อสังเกตในการซ้อนทับข้อมูลแรสเตอร์คือ “ชั้นข้อมูลที่นำมาซ้อนทับกันต้องอ้างอิงระบบพิกัดเดียวกันและมีขนาดจุดภาพเท่ากัน” จึงจะได้ผลการซ้อนทับที่มีความเหมาะสม อย่างไรก็ตามการเลือกใช้งานข้อมูลประเภทใดขึ้นกับความสะดวกของงานและรูปแบบข้อมูลที่มีการจัดเก็บอยู่ ซึ่งระบบสารสนเทศทางภูมิศาสตร์ได้พัฒนาให้สามารถแปลงข้อมูลกลับไป-กลับมา ระหว่างข้อมูลเวกเตอร์ และแรสเตอร์ได้ ดังแสดงในภาพ

ในการซ้อนทับชั้นข้อมูลประเภทแรสเตอร์นั้นค่าในจุดภาพ หรือตารางกริดของแต่ละชั้นข้อมูล จะถูกรวมเข้าด้วยกัน (Combine) โดยอาศัยตัวดำเนินการแบบเลขคณิต (Arithmetic) หรือตรรกะแบบบูล (Boolean) ในการสร้างค่าใหม่ให้แก่ชั้นข้อมูลแผนที่ผสม (Composite map) เนื่องจากค่าข้อมูลที่ถูกแสดงในจุดภาพเป็นค่าตัวเลข ดังนั้น จึงสามารถวิเคราะห์ด้วยฟังก์ชันพีชคณิตที่มีความซับซ้อนได้ เรียกลักษณะการใช้ฟังก์ชันพีชคณิตในการซ้อนทับนี้ว่า“พีชคณิตสำหรับแผนที่ (Map algebra)”
การซ้อนทับข้อมูลแรสเตอร์แบ่งออกเป็นหลายวิธีการ เช่น การซ้อนทับแบบเซลล์แรสเตอร์ (Raster cell overlay) แบบคูณและค่าสูงสุด-ต่ำสุด (Multiplication and maximum-minimum) แบบกำหนดน้ำหนัก (Overlay using weights) แบบเมทริกซ์ (Matrix recode overlay) แบบรหัส (Overlay codes) ดังรายละเอียดต่อไปนี้
– การซ้อนทับแบบเซลล์แรสเตอร์
เป็นการซ้อนทับโดยอาศัยตัวดำเนินการเชิงคณิตศาสตร์ในลักษณะที่เรียกว่าพีชคณิตแผนที่ซึ่งโดยทั่วไปประกอบด้วย การบวก (+) ลบ (-) คูณ (×) หาร (÷) และอื่นๆ

– แบบคูณและค่าสูงสุด-ต่ำสุด
เป็นการซ้อนทับชั้นข้อมูลโดยใช้ฟังก์ชันค่าการคูณ และการเลือกแทนค่าด้วยค่าสูงสุด หรือต่ำสุดในการแสดงผล

– แบบกำหนดน้ำหนักเป็นการให้ค่านัยสำคัญกับชั้นข้อมูลบางชั้น หรือบางลักษณะ (Features) เช่น เมื่อพบว่าชั้นข้อมูลหนึ่งมีความสำคัญมากกว่าอีกชั้นข้อมูล เป็นต้น ระดับความสำคัญในที่นี้ คือ การให้ค่าน้ำหนักแก่ชั้นข้อมูลหรือค่าในจุดภาพให้มีค่าเพิ่มขึ้นเป็นการเพิ่มค่าน้ำหนักให้แก่ปัจจัยที่ผู้ศึกษาให้ความสำคัญเป็นพิเศษ ข้อมูลนำเข้า ได้แก่ ความลาดชัน การใช้ที่ดินและป่าไม้ น้ำหนักใช้เป็นตัวคูณคือ 1 1 และ 2 ตามลำดับ เมื่อได้ชั้นข้อมูลที่กำหนดน้ำหนักแล้วจึงรวมค่าของจุดภาพเข้าด้วยกันเป็นผลลัพธ์การซ้อนทับ

– การซ้อนทับแบบเมทริกซ์
เป็นการซ้อนทับชั้นข้อมูลแรสเตอร์โดยอาศัยตารางเมทริกซ์กำหนดค่ารหัสสำหรับการแทนค่าผลลัพธ์ซึ่งก่อนการซ้อนทับข้อมูลแต่ละชั้นผู้ศึกษาจำเป็นต้องจัดกลุ่มข้อมูลแต่ละชั้นใหม่ก่อน ส่วนใหญ่นิยมแบ่งค่าระดับตามความเหมาะสม เช่น การแบ่งระดับที่ดินเหมาะสมกับการเพาะปลูก กำหนดค่าระดับเหมาะสมมาก (1) เหมาะสมปานกลาง (2) และเหมาะสมน้อย (3) เป็นต้น เมื่อจำแนกระดับความเหมาะสมของข้อมูลแต่ละชั้นพร้อมแล้ว จึงทำการกำหนดค่าในตารางแม่แบบเพื่อใช้ระบุค่าที่ใช้เป็นผลลัพธ์ ทั้งนี้เมทริกซ์ที่ใช้อาจกำหนดได้หลายรูปแบบ เช่น เมทริกซ์ที่มาจากการบวก ลบ คูณ และหาร ค่าระดับความเหมาะสม เมทริกซ์มาจากการเลือกค่าสูงสุด-ต่ำสุด และเมทริกซ์ที่มาจากการเลือกเฉพาะที่ (Selective) ซึ่งเมทริกซ์ประเภทนี้ต้องถูกกำหนดขึ้นจากผู้ที่มีความเชี่ยวชาญ เป็นต้น ดังแสดงตัวอย่างการซ้อนทับด้วยวิธีการซ้อนทับแบบเมทริกซ์

– การซ้อนทับแบบกำหนดน้ำหนักเป็นการซ้อนทับโดยกำหนดค่าอิทธิพลที่มีต่อปัจจัยแต่ละชั้นแผนที่ เนื่องจากแต่ละปัจจัยมีอิทธิพลต่อผลลัพธ์ไม่เท่ากัน การวิเคราะห์ลักษณะดังกล่าวนี้จัดว่าเป็นการซ้อนทับโดยให้ค่าน้ำหนักแก่ปัจจัยประเภทหนึ่ง แต่จะแตกต่างกันตรงค่าน้ำหนักที่ใช้ถูกแบ่งตามสัดส่วนของอิทธิพลเป็นค่าร้อยละ แนวคิดของการวิเคราะห์แสดงดังภาพ

จากภาพ ค่าจุดภาพของชั้นข้อมูล ผลลัพธ์เกิดจากการบวกค่าปัจจัยที่ถูกให้ค่าน้ำหนัก ทั้งนี้การกำหนดค่าอิทธิพลให้แก่ชั้นข้อมูลในการศึกษาต่างๆ จำเป็นต้องอาศัยข้อมูลที่ได้จากการค้นคว้าความสัมพันธ์ของปัจจัยที่จะมีผลต่องานวิจัยแต่ละประเภท เนื่องจากแต่ละการศึกษาค่าปัจจัยเดียวกันอาจมีน้ำหนักของอิทธิพลต่องานแตกต่างกัน จำเป็นต้องมีหลักการที่เหมาะสมสำหรับการกำหนดค่า
การสร้างแนวกันชน
หลักการวิเคราะห์ข้อมูลเชิงพื้นที่อีกประเภทที่นิยมใช้กันมากเช่นกัน คือ ฟังก์ชันการหาพื้นที่ใกล้เคียง (ใกล้ชิด) ของวัตถุ ซึ่งจัดอยู่ในกลุ่ม “ฟังก์ชันความใกล้เคียง (Neighborhood function)” ประเภทหนึ่ง ฟังก์ชันดังกล่าวนอกจากใช้ตอบคำถามว่าตำแหน่งไหนอยู่ที่ใดแล้ว ยังตอบได้ว่ามีสิ่งใดอยู่ใกล้กับวัตถุเป้าหมายอีกด้วย วิธีการของฟังก์ชันความใกล้เคียง ประกอบไปด้วย การคำนวณค่าที่อยู่ใกล้เคียง (Proximity computation) การคำนวณพื้นที่ส่วนที่ขยายออก (Spread computation) และการคำนวณเพื่อค้นหา (Seek computation) ในที่นี้จะกล่าวถึงเฉพาะวิธีการคำนวณค่าที่อยู่ใกล้เคียง สำหรับวิธีการคำนวณค่าที่อยู่ใกล้เคียงที่รู้จักกันดีคือการสร้างพื้นที่กันชน ซึ่งเป็นการสร้างพื้นที่ล้อมรอบตัวแทนข้อมูลเชิงพื้นที่ (จุด เส้น และอาณาบริเวณ) ด้วยระยะห่างตามที่กำหนด ผลที่ได้คือชั้นข้อมูลใหม่ที่แสดงระยะห่างออกจากลักษณะที่ระบุ นอกจากนั้นเรายังใช้พื้นที่กันชนเพื่อควบคุมความเสียดทานบนพื้นผิว (Friction surface) ภูมิประเทศ (Topography) ตัวกั้น (Barrier) และอื่นๆ ได้อีกด้วย การสร้างแนวกันชนสามารถกระทำได้กับข้อมูลที่เป็นเวกเตอร์ และแรสเตอร์ โดยมีลักษณะของพื้นที่แนวกันชนที่แตกต่างกันออกไป 3 รูปแบบ ดังต่อไปนี้
1) พื้นที่กันชนตามระยะทางที่กำหนด (At a specified distance หรือ Arbitrary buffer)
เป็นการกำหนดค่าคงที่สำหรับการสร้างระยะกันชน พื้นที่กันชนที่ถูกสร้างจะมีระยะทางออกจากวัตถุเป้าหมายเท่ากันในทุกทิศทาง โดยวัตถุที่เป็นอาณาบริเวณสามารถเลือกสร้างระยะกันชนเข้ามาในพื้นที่ (Set back) หรือออกจากพื้นที่ก็ได้ การสร้างแนวกันชนประเภทนี้นิยมใช้เพื่อกำหนดเขตควบคุมการระบาด หรือการสร้างรัศมีพื้นที่ออกจากเขตโรงงานอุตสาหกรรม

2) พื้นที่กันชนแปรผัน (At distance from an attribute field หรือ Variable buffer)
เป็นการสร้างระยะกันชนออกจากวัตถุเป้าหมาย โดยอาศัยค่าที่ระบุไว้ในเขตค่าซึ่งภายในชั้นข้อมูลเดียวกันผู้ศึกษาอาจต้องการให้มีระยะกันชนออกจากวัตถุเป้าหมายขนาดไม่เท่ากัน ยกตัวอย่างเช่น ในกรณีการแสดงพื้นที่เสี่ยงต่อเจือปนสารพิษ แต่ละจุดที่เป็นแหล่งกำเนิดมลพิษอาจมีระดับความเข้มข้นของสารที่กระจายออกมาไม่เท่ากัน ดังนั้นการแสดงระยะป้องกันจากแต่ละแหล่งกำเนิดจึงมีขนาดที่ไม่เท่ากัน

3) พื้นที่กันชนแบบวงแหวน (Multiple rings or Doughnut buffer)
เป็นการสร้างระยะกันชนออกจากวัตถุเป้าหมายหลายระดับในเวลาเดียวกัน ลักษณะของแนวกันชนประเภทนี้นิยมใช้เพื่อทดสอบระยะที่เหมาะสมของข้อมูลก่อนดำเนินการวิเคราะห์พื้นที่จริง

นอกเหนือจากลักษณะพื้นที่กันชน 3 ลักษณะที่กล่าวมานี้แล้ว ยังมีวิธีสร้างพื้นที่กันชนที่แตกต่างออกไปอีก อาทิเช่น วิธีการทำพื้นที่กันชนตามสาเหตุของปัญหา (A causative buffer) ซึ่งเป็นแนวกันชนที่สร้างขึ้นโดยอาศัยความรู้พื้นฐานของผู้ศึกษาที่มีต่อวัตถุเป้าหมาย ยกตัวอย่างเช่น การแสดงแนวเขตการกระจายของมลภาวะทางอากาศจากโรงงานอุตสาหกรรม ซึ่งทิศทางการเคลื่อนที่ของสารพิษขึ้นกับปัจจัยลม และความเข้มข้นของสารพิษ จึงมีรูปแบบการกระจายตัวออกจากแหล่งกำเนิดไม่เท่ากันในทุกทิศทาง ดังนั้นการแสดงพื้นที่กระจายสารพิษจึงต้องคำนึงถึงปัจจัยทิศทางลมร่วมด้วย ทำให้แนวกันชนที่สร้างมีรูปร่างไม่สมมาตร
วิธีแนวกันชนวัดได้ (Measurable buffer) สร้างระยะกันชนโดยอาศัยลักษณะปรากฏการณ์จริงที่วัดได้ระยะกันชนที่สร้างจึงสมเหตุสมผลมากกว่าการกำหนดระยะคงที่เพียงอย่างเดียว ตัวอย่างเช่น กรณีต้องการวิเคราะห์ความสัมพันธ์เชิงพื้นที่ระหว่างปริมาณสารพิษที่ปนเปื้อนในแม่น้ำโดยเฉพาะการปนเปื้อนในบริเวณริมฝั่ง เนื่องจากเราทราบว่าต้นไม้มีความสามารถในการกรองสารพิษได้ และการกรองสารพิษจะดียิ่งขึ้นหากมีต้นไม้ในพื้นที่มาก ดังนั้นจึงได้ตรวจวัดความหนาแน่นของพืชพรรณที่มีอยู่รอบแหล่งน้ำแล้วแบ่งระดับความหนาแน่นออกเป็นกลุ่ม ความแตกต่างของกลุ่มความหนาแน่นจะเป็นเสมือนแนวที่กั้นระหว่างพื้นที่เพื่อแบ่งระดับการวิเคราะห์ให้สอดคล้องกับสภาพปรากฏการณ์จริง
- การประมาณค่าในช่วงเชิงพื้นที่ (Spatial interpolation)
เป็นการพยากรณ์แนวโน้มความเปลี่ยนแปลงที่ยังไม่เกิดขึ้น ในที่นี้รวมไปถึงการประมาณค่าข้อมูลที่ขาดหายไป (มีข้อมูลไม่เพียงพอ) การประมาณค่าดังกล่าวนอกจากใช้เพื่อวิเคราะห์หาค่าที่สูญหายไปแล้ว ยังใช้เพื่อจำลองความสัมพันธ์ระหว่างข้อมูล จึงพบว่ามีการใช้วิธีประมาณค่ากับข้อมูลหลายประเภท ดังตัวอย่างต่อไปนี้
– ลักษณะภูมิประเทศ เช่น แบบจำลองความสูงเชิงพื้นที่ ความลาดชัน และทิศทางความลาดชัน
– ด้านประชากร เช่น แนวโน้มการกระจายตัวของประชากร
– ด้านเศรษฐกิจ เช่น การพยากรณ์ทิศทางการลงทุนในอนาคต
– ข้อมูลภูมิอากาศ เช่น การกระจายตัวของฝน อุณหภูมิ และความชื้นสัมพัทธ์ เป็นต้น
แม้จะมีการประยุกต์ใช้วิธีประมาณค่าเชิงพื้นที่เพื่อประโยชน์ที่แตกต่างกันออกไป แต่โดยทั่วไปวิธีการดังกล่าวมีความหมายและแนวคิดที่คล้ายคลึงกันในการวิเคราะห์ อธิบายความหมายของการประมาณค่าเชิงพื้นที่ได้ว่า
การประมาณค่าเชิงพื้นที่ คือ “วิธีการทำนายค่าของพื้นที่ในตำแหน่งที่ข้อมูลมีไม่เพียงพอ โดยใช้ค่าข้อมูลที่อยู่ข้างเคียง” ความถูกต้องของการประมาณค่าขึ้นอยู่กับจำนวนและการกระจายตัวของเซลล์ที่ทราบค่ารวมทั้งสมการหรือฟังก์ชันทางคณิตศาสตร์ที่นำมาใช้ อย่างไรก็ตามการประมาณค่าโดยทั่วไปมีหลักในการดำเนินการที่คล้ายคลึงกันคือ จะอนุมานว่า “จุดที่อยู่ใกล้กันทางพื้นที่มักมีค่าคุณสมบัติที่สนใจคล้ายคลึงกันมากกว่าจุดที่อยู่ไกลออกไป”

การแสดงลักษณะของพื้นผิวจากการประมาณค่าโดยทั่วไปนิยมแสดง 3 ลักษณะ คือ
– เส้นชั้นความสูง (Contour or Isoline)
– โครงข่ายสามเหลี่ยมไม่สม่ำเสมอ (Triangulated Irregular Network : TIN)
– แบบจำลองความสูงเชิงตัวเลข (Digital Elevation Model: DEM)
ในบางครั้งมีการเรียกลักษณะพื้นผิวเหล่านี้โดยรวมว่า “แบบจำลองลักษณะภูมิประเทศเชิงตัวเลข (Digital Terrain Model : DTM)” อธิบายความแตกต่างของพื้นผิวแต่ละชนิดดังต่อไปนี้
เส้นชั้นความสูง : เป็นเส้นที่ลากผ่านจุดที่มีระดับความสูงเท่ากันช่วงความสูงของพื้นที่ที่แตกต่างกันจึงถูกแสดงด้วยเส้นหลายเส้น ทั่วไปนิยมใช้วิธีการนี้ทำข้อมูลแผนที่ระดับความสูงและการแสดงค่าทางอุตุนิยมวิทยา เช่น อุณหภูมิ ความชื้นสัมพัทธ์ หรือปริมาณน้ำฝน เป็นต้น
TIN : เป็นโครงสร้างข้อมูลเวกเตอร์ที่เกิดจากการแสดงลักษณะพื้นผิวด้วยรูปสามเหลี่ยมหลายรูปซึ่งมีด้านประชิดกัน (ไม่มีการซ้อนทับ) และใช้จุดยอดร่วมกันเรียงต่อเนื่องกันไป โดยที่แต่ละจุดยอดมีค่า (x,y,z) จัดเก็บไว้ จุดยอดของสามเหลี่ยมเหล่านี้จะกระจายตัวไม่สม่ำเสมอ พื้นที่ที่มีความแตกต่างของค่า Z มากๆ จุดจะอยู่ใกล้กัน แต่พื้นที่ที่มีค่า Z ไม่แตกต่างกัน จุดจะอยู่ห่างกัน นิยมใช้พื้นผิว TIN แสดงลักษณะภูมิประเทศ และวิเคราะห์ความลาดชัน ทิศลาดเขา และปริมาตร (Volume)
DEM : มีลักษณะเป็นตารางกริดที่มีขนาดเท่ากันเรียงตัวต่อเนื่องครอบคลุมทั้งพื้นที่ ค่าประจำกริดคือ ค่า Z ดังนั้นค่า Z ในพื้นที่จึงมีการกระจายตัวอย่างสม่ำเสมอ
* หมายเหตุ กระบวนการประมาณค่าคุณสมบัติในจุดที่ไม่ถูกสุ่มตัวอย่าง ภายในบริเวณที่มีจุดสำรวจครอบคลุมอยู่เรียกว่า “การประมาณค่าในช่วง (Interpolation)” การประมาณค่าของคุณสมบัติตรงจุดตำแหน่งที่อยู่นอกพื้นที่ที่มีการสำรวจเรียกว่า “การประมาณค่านอกช่วง (Extrapolation)”
1) วิธีการประมาณค่าในช่วง มี 2 ประเภท คือ การประมาณค่าในช่วงแบบไม่ต่อเนื่อง (Discrete interpolation) และการประมาณค่าในช่วงแบบต่อเนื่อง (Continuous interpolation)
– การประมาณค่าในช่วงแบบไม่ต่อเนื่อง
เป็นการประมาณค่าในช่วงโดยเขียนแทนด้วยเส้นแนวเขต มีลักษณะคล้ายกับการแสดงแผนที่โคโรเพลท ข้อมูลที่อยู่ในแนวเขตเดียวกันจะมีค่าเท่ากันเมื่อนำไปสร้างเป็นแบบจำลองจะแสดงให้เห็นเป็นขั้นบันไดวิธีการประมาณค่าแบบไม่ต่อเนื่อง เช่น การใช้วิธีรูปหลายเหลี่ยมทิสเสน (Thiessen polygon)
- วิธีรูปหลายเหลี่ยมทิสเสน บางครั้งอาจเรียกว่าแผนภาพรูปหลายเหลี่ยมโวโรนอย (Voronoi diagram) หรือช่องกริดดิลิกเก็ต (Dirichlet diagram) เป็นการสร้างอาณาบริเวณขึ้นรอบจุดค่าตัวอย่างแต่ละจุดเพื่อแสดงเขตที่ค่าจุดนั้นมีอิทธิพลถึง กล่าวคือทุกตำแหน่งที่อยู่ในเขตพื้นที่จะมีค่าใกล้เคียงกับค่าจุดตัวอย่างที่เป็นตัวแทนการประมาณค่าพื้นที่นั้น มากกว่าจุดที่อยู่นอกเขตพื้นที่ออกไป วิธีการประมาณค่าแบบนี้นิยมใช้กับการวิเคราะห์ข้อมูลภูมิอากาศ อาทิเช่น ปริมาณน้ำฝน จากสถานีที่มีการกระจายตัวอยู่อย่างไม่สม่ำเสมอ นอกจากนั้นยังสามารถใช้แสดงเขตพื้นที่การค้า โรงงานอุตสาหกรรม และอื่นๆ
จากภาพ ขั้นตอนที่ 1 สร้างโครงข่ายสามเหลี่ยมจากสถานที่อยู่ใกล้เคียงกัน โดยให้ขอบเขตของรูปหลายเหลี่ยมมีระยะห่างจากจุดที่อยู่ใกล้ที่สุดเท่าๆ กัน ขั้นตอนที่ 2 ลากเส้นตั้งฉากแบ่งครึ่งแต่ละด้านของสามเหลี่ยมเกิดเป็นเขตพื้นที่ซึ่งสามารถใช้ประเมินข้อมูลพื้นที่ที่ไม่มีการบันทึกข้อมูลได้

ข้อจำกัด
- ขนาดและรูปร่างของเขตพื้นที่จะขึ้นกับการกระจายของจุด ดังนั้นบริเวณที่มีจุดตัวอย่างมากจะมีขนาดพื้นที่เล็กแต่จะมีพื้นที่กว้างเมื่อจุดกระจายตัวห่างกัน
- พื้นที่จากการประมาณแต่ละเขตได้จากค่าข้อมูลเพียงค่าเดียว
- พื้นผิวที่ได้จากการประมาณมีค่าไม่ต่อเนื่องกัน (Discrete surface)
– การประมาณค่าในช่วงแบบต่อเนื่อง
เป็นวิธีการประมาณค่าในช่วงที่ผนวกเอาแนวคิดการเปลี่ยนแปลงอย่างค่อยเป็นค่อยไปของพื้นที่กล่าวคือวิธีการประมาณค่าในช่วงแบบต่อเนื่องสามารถนิยามด้วยพื้นผิวเชิงคณิตศาสตร์เพื่อให้ได้พื้นผิวที่มีความต่อเนื่องกัน (Continuous surface) สามารถแบ่งออกเป็น ประมาณค่าในช่วงจากข้อมูลวงกว้าง หรือทั้งหมด (Global/Whole interpolation) และการประมาณค่าในช่วงข้อมูลเฉพาะที่ (Local interpolation)
ตารางแสดงลักษณะ การประมาณค่าแบบข้อมูลวงกว้าง และแบบช่วงข้อมูลเฉพาะที่
วิธีการประมาณค่าในช่วงประเภทต่างๆ แสดงดังรายละเอียดต่อไปนี้
- การวิเคราะห์พื้นผิวแนวโน้ม
เป็นวิธีการประมาณค่าในช่วงที่ง่ายที่สุด ใช้แสดงความแปรผันของข้อมูลอย่างกว้างๆ โดยอาศัยสมการถดถอยเชิงพหุนามมีแนวคิด คือ การปรับเส้นหรือพื้นผิวพหุนามให้สอดคล้องกับจุดข้อมูล คล้ายการทาบแผ่นกระดาษให้อยู่ในแนวที่ผ่านจุดข้อมูลทุกจุด (การ Fitting)

เส้นถดถอยจะถูกลากในแนวที่ผลรวมของกำลังสอง Σ(Zi-Zi)2 มีค่าน้อยที่สุด ดังภาพด้านซ้ายเส้นประสีดำเปรียบเสมือนแผ่นกระดาษราบที่วางตัวผ่านจุดที่เหมาะสมที่สุดของชุดข้อมูลดังนั้นค่าที่ได้จากการประมาณจะมีค่ามากกว่าหรือน้อยกว่าความเป็นจริง
จากภาพหากสามารถปรับเส้นตรงที่ลากผ่านจุดข้อมูลให้มีความโค้งตามแนวค่าข้อมูลได้ก็จะทำให้แสดงความถูกต้องของผลการประมาณได้มากขึ้น อย่างไรก็ตามเราสามารถใช้สมการพหุนามอันดับที่สูงขึ้นสำหรับการเขียนกราฟที่เข้ากับการกระจายข้อมูลที่ไม่เป็นเส้นตรง

การวิเคราะห์พื้นผิวแนวโน้มจะใช้สำหรับ
– แสดงการเปลี่ยนแปลงพื้นผิวจากบริเวณที่สนใจสู่บริเวณอื่น ดังเช่น ลักษณะการกระจายตัวของสารมลภาวะจากปล่องควันในโรงงานอุตสาหกรรม
– ใช้พิจารณาเพื่อลดผลกระทบของแนวโน้มวงกว้าง (Global trend) ก่อนทำการประมาณค่าจริง
- อนุกรมฟูเรียร์
เป็นการบรรยายความแปรผันของพื้นที่ใน 1 หรือ 2 มิติ โดยจำลองความแปรผันที่สังเกตด้วยการใช้คลื่นไซน์ และโคไซน์เชิงเส้นตรงร่วมกัน อนุกรมฟูเรียร์มิติเดียวถูกใช้วิเคราะห์อนุกรมเวลา และศึกษาการเปลี่ยนแปลงด้านภูมิอากาศบางประการ ส่วนอนุกรมฟูเรียร์สองมิติได้รับการพิสูจน์ว่ามีประโยชน์สำหรับการศึกษาธรณีวิทยาชั้นตะกอน อย่างไรก็ตามพบว่าลักษณะพื้นผิวส่วนใหญ่ของโลกมีความซับซ้อนเกินกว่าจะแสดงความแปรผันอย่างสม่ำเสมอได้ ยกเว้นความแปรผันที่เกิดจากการกระทำของมนุษย์ ดังนั้นจึงไม่ค่อยนิยมใช้วิธีการอนุกรมฟูเรียร์ในการประมาณค่า

- วิธีค่าเฉลี่ยเคลื่อนที่
เป็นการประมาณค่าโดยใช้หลักการที่ว่า “ค่าสังเกตของตำแหน่งที่อยู่ใกล้กันย่อมมีแนวโน้มของค่าใกล้เคียงกันมากกว่าตำแหน่งที่อยู่ไกลกันออกไป” พื้นผิวที่ได้จากการประมาณค่าจะขึ้นกับฟังก์ชันหรือตัวแปรเสริม (Parameter) ของฟังก์ชันที่ใช้และโดเมนที่จุดข้อมูลตัวอย่างถูกดึงมา วิธีการค่าเฉลี่ยเคลื่อนที่เป็นกลวิธีเพื่อทำให้พื้นผิวเรียบ ซึ่งค่าต่ำสุด-สูงสุดบนผิวหน้าที่ได้จากการประมาณค่าจะมีค่าไม่เกินค่า Z-value ของข้อมูลที่นำมาประมาณค่าถือเป็นการประมาณค่าที่มีความแม่นตรง (Exact interpolators)
การคำนวณค่า ณ ตำแหน่งที่ต้องการจึงต้องคำนึงถึงตำแหน่งของข้อมูล โดยให้น้ำหนักของข้อมูลตำแหน่งที่อยู่ใกล้มากกกว่าตำแหน่งที่อยู่ไกลออกไป วิธีการคำนวณค่าน้ำหนักสามารถกระทำได้ 2 วิธี คือ การคำนวณค่าระยะทางกลับโดยน้ำหนัก (Inverse Distance Weighting : IDW) และวิธีการลดลงเชิงเส้น (Linear decrease)
ค่าระยะทางกลับโดยน้ำหนัก
อนุมานว่าตำแหน่งที่ต้องการประมาณค่าจะได้รับอิทธิพลจากข้อมูลที่อยู่ใกล้ (Local influence) มากกว่าค่าที่อยู่ไกลออกไป มีรูปสมการทั่วไป ดังต่อไปนี้
Ẑ(s0) คือ ค่าที่ ณ ตำแหน่งที่ต้องการทำนาย
N คือ จำนวนจุดตัวอย่างที่อยู่รอบตำแหน่งที่ต้องการทำนายค่า
λ คือ น้ำหนักที่กำหนดให้กับค่าที่วัด
Z(si) คือ ค่าสังเกตุที่ตำแหน่ง si
เราสามารถควบคุมจุดที่มีนัยสำคัญต่อการประมาณค่าโดยการกำหนดค่ายกกำลัง (Power) ซึ่งการกำหนดค่าเลขยกกำลังสูงๆ จะเป็นการเน้นย้ำให้เลือกใช้ค่าที่อยู่ใกล้จุดมากที่สุด ส่งผลให้พื้นผิวจากการประมาณมีความเรียบน้อยลง (Less smooth) ต่างจากการกำหนดค่ายกกำลังน้อยๆ ที่ให้พื้นผิวจากการประมาณเรียบมากกว่า
หมายเหตุ
– วิธี IDW จะทำงานได้ดีที่สุดหากข้อมูลมีการกระจายตัวหนาแน่น
– การประมาณค่าจะไม่คำนึงถึงแนวโน้ม (Trend) หรืออิทธิพลของปัจจัยอื่นที่มีต่อข้อมูล
– จะไม่มีค่าที่ประมาณได้มากกว่า หรือน้อยกว่าข้อมูลตั้งต้น
– สามารถลดปัญหาการเลือกจำนวนจุดประมาณค่าด้วยการกำหนด จำนวนของจุด (Number of points) และรัศมีพื้นที่ (Sample size radius)
– สามารถป้องกันผลการประมาณค่าเกินขอบเขตที่ต้องการด้วยการกำหนดตัวกั้นของการประมาณค่าในช่วง (Interpolation barrier)
- ฟังก์ชันกระดูกงู
ฟังก์ชันนี้เป็นลักษณะของการประมาณค่าต่อกันเป็นช่วงที่สามารถปรับให้สอดคล้องกับจุดข้อมูลจำนวนไม่มากได้ คล้ายกับการตรึงแผ่นยาง (Rubber sheet) ผ่านจุดข้อมูลที่ทราบค่า ผลที่เกิดจากการตรึงค่าดังกล่าวทำให้ได้ค่าจากการประมาณสูง-ต่ำเกินกว่าค่าตั้งต้น แต่จะต้องผ่านจุดที่เป็นค่าตั้งต้น ด้วยเหตุนี้จึงนิยมใช้ฟังก์ชันกระดูกงูเพื่อประมาณค่าต่ำสุด และสูงสุดที่เกินจากความเป็นจริง เช่น การค้นหาสายแร่ เป็นต้น
ฟังก์ชันกระดูกงูสามารถแบ่งออกเป็น 2 ชนิด คือ Tension และ Regularized พื้นผิวที่ได้จากการใช้ฟังก์ชันกระดูกงูชนิด Tension ค่อนข้างเรียบกว่าชนิด Regularized อาจกล่าวได้ว่าการประมาณค่าด้วยฟังก์ชันกระดูกงูชนิด Tension จะมีความยืดหยุ่นของพื้นผิวที่ได้น้อยกว่า ทั้งนี้ข้อดีของวิธีฟังก์ชันกระดูกงู คือ สามารถประมาณค่าออกนอกช่วงค่าข้อมูลที่มีอยู่ได้




ข้อจำกัด
– หากจุดตัวอย่างอยู่ใกล้กัน และมีความแตกต่างของค่ามากผลการประมาณค่าจะให้ผลลัพธ์ที่ไม่ดีนัก
– ปรากฏการณ์ที่เป็นสาเหตุให้ค่าพื้นผิวจากการคำนวณเปลี่ยนอย่างรวดเร็ว เช่น ลักษณะของหน้าผา หรือบริเวณแนวรอยเลื่อนของพื้นผิว จะไม่สามารถแสดงผลได้ดีเท่าที่ควร
- คริกิง (Kriging)
เป็นตัวประมาณค่าที่ให้ค่าการประมาณที่ค่อนข้างแม่นยำ ผลการประมาณที่ดีที่สุดจะมีค่าตรงกับข้อมูลตั้งต้น วิธีการคริกิงมีความคล้ายคลึงกับวิธีส่วนกลับระยะทางตรงที่เป็นการประมาณค่าด้วยเทคนิคค่าเฉลี่ยถ่วงน้ำหนัก (Weight average technique) จากจุดข้อมูลที่อยู่รอบตำแหน่งที่ต้องการทำนายค่า แต่จะมีสมการคำนวณที่อ้างเหตุผลทางคณิตศาสตร์มากกว่า วิธีคริกิงอาศัยการวัดระยะห่างของจุดข้อมูลทุกคู่ (Pairs of sample point) เพื่อแสดงความสัมพันธ์ระหว่างกันเชิงพื้นที่ (Spatial autocorrelation) โดยใช้แบบจำลองเซมิแวริโอแกรม (Semivariogram)


เนื่องจากการประมาณค่าคริกิงใช้หลักการเดียวกับการประมาณค่าวิธีอื่นๆ คือ สิ่งที่อยู่ใกล้กันจะมีความคล้ายคลึงกันมากกว่าสิ่งที่อยู่ห่างออกไป ดังนั้นเมื่อคู่ระยะห่างของข้อมูลถูกแสดงในเซมิเวริโอแกรม(จุดสีแดง 1 จุด แทนระยะทางระหว่างจุดข้อมูล 1 คู่) ดังนั้นจึงพบว่าจุดที่อยู่ใกล้กัน (ระยะห่างตามแกน X น้อย) ค่าความแปรปรวนที่แสดงในเซมิเวริโอแกรม (แกน Y) จะมีค่าน้อย โดยทั่วไปเมื่อแสดงกราฟเซมิเวริโอแกรมแล้วผู้วิเคราะห์จะพิจารณาองค์ประกอบดังต่อไปนี้
Sill คือ ค่าเซมิเวริโอแกรมสูงสุดที่ไม่เปลี่ยนแปลงอีกแม้ระยะทางเพิ่มขึ้น แสดงว่าความสัมพันธ์ระหว่างข้อมูล ณ ตำแหน่งนี้เป็นต้นไป ค่าความแปรปรวนของความแตกต่างทุกค่าไม่แปรผันตามระยะทางระหว่างจุดข้อมูล
Nugget คือ ค่าเซมิเวริโอแกรมที่ระยะทาง 0 (เป็นค่าที่แสดง Independent error ของชุดข้อมูล)
Range คือ ระยะทางตามแนวแกน X จากตำแหน่งที่มีค่าเซมิเวริโอแกรมต่ำสุดกระทั่งมีค่าสูงสุด (ตำแหน่ง Sill) ดังนั้นช่วงระยะ Range จะแสดงให้ทราบว่าช่วงระยะห่างเท่าใดของจุดข้อมูลที่ค่าความแตกต่างของจุดข้อมูลขึ้นกับระยะทาง

ที่มา : Using ArcGIS Geostatistical Analyst (ESRI, 2001)
การทำนายค่าด้วยวิธีคริกิงถูกนำไปใช้กับงานหลายสาขา อาทิเช่น ด้านวิทยาศาสตร์สุขภาพ ด้านธรณีเคมี (Geochemistry) ด้านอุตุนิยมวิทยา และแบบจำลองสารมลภาวะในอากาศ เป็นต้น วิธีคริกิงที่นิยมใช้กันอย่างแพร่หลาย ประกอบไปด้วย Ordinary kriging และ Universal kriging โดย
Ordinary kriging : ทำการประมาณค่าโดยสมมติว่าชุดข้อมูลปราศจากอิทธิพลของ Trend
Universal kriging : ทำการประมาณค่าโดยสมมติว่าชุดข้อมูลมี Trend อยู่

หมายเหตุ
– พื้นผิวที่ถูกประมาณจากวิธีคริกิงอาจมีค่าสูงหรือต่ำกว่าค่าเริ่มก็ได้
– การประมาณค่าด้วยวิธีคริกิงจะให้ผลที่เหมาะสมก็ต่อเมื่อข้อมูลที่นำมาใช้ถูกสุ่มมาด้วยกระบวนการเฟ้นสุ่ม (A stationary stochastic process) และข้อมูลมีการกระจายตัวอย่างปกติ(Normal distribution)
– หากข้อมูลไม่ได้มีการกระจายตัวอย่างปกติ และผลการวิเคราะห์เซมิเวริโอแกรมแล้วแสดงการกระจายข้อมูลไม่ดีพอ ไม่ควรเลือกประมาณค่าด้วยวิธีคริกิง
– ข้อดีของวิธีคริกิง คือ เป็นวิธีที่สามารถแสดงค่าความคลาดเคลื่อนจากการทำนายค่าได้ ในขณะที่วิธีอื่นไม่สามารถทำได้
จากวิธีการประมาณค่าที่ได้กล่าวถึงข้างต้นเปรียบเทียบความแตกต่างของพื้นผิวที่ประมาณค่าได้จากวิธีสามเหลี่ยมทิสเสน TIN ส่วนกลับระยะทาง ฟังก์ชันกระดูกงู และคริกิง ที่ได้จากชุดข้อมูลจุดตัวอย่างเดียวกันดังภาพ

ที่มา : ภาพจากเว็บไซต์ http://skagit.meas.ncsu.edu/
กราฟแสดงลักษณะความแตกต่างของพื้นผิวที่ได้จากตัวประมาณค่าท้องถิ่น (Local interpolator) ประเภท IDW Spline และ Kriging จะพบว่าวิธี IDW ค่าที่ได้จะไม่เกินกว่าค่าตั้งต้นในการประมาณ เป็นวิธีการที่เหมาะกับการประมาณปรากฏการณ์ที่มีการกระจายตัวของค่าข้อมูลขึ้นกับระยะทาง ส่วนวิธี Spline ผลจากการประมาณจะได้พื้นผิวเรียบโค้ง ซึ่งอาจได้ค่าสูงหรือต่ำเกินกว่าค่าเริ่มต้น แต่การประมาณพื้นผิวจะต้องผ่านจุดทุกจุดของค่าเริ่มต้น ในขณะที่วิธี Kriging เป็นวิธีประมาณค่าที่ซับซ้อนมาก พื้นผิวที่ได้จากการประมาณค่าอาจมีค่าสูงหรือต่ำกว่าค่าจริงแต่จะให้ค่าที่
วิธี |
ลักษณะแบบจำลอง | ผลลัพธ์ที่ได้ | ระยะเวลาคำนวณ | ลักษณะประมาณค่า | ข้อดี |
ข้อเสีย |
Globalpolynomial | แบบจำลองเชิงกำหนด | พื้นผิวจากการ | เร็ว | Inexact | ตัวแปรเสริมน้อย | ไม่สามารถประเมินผลการทำนาย และค่าคลาดเคลื่อน ได้ และบางครั้งได้ค่าเกินความเป็นจริง |
Localpolynomial | แบบจำลองเชิงกำหนด | พื้นผิวจากการ | ปานกลาง | Inexact | ตัวแปรเสริมมาก | ไม่สามารถประเมินผลการทำนายและค่าคลาดเคลื่อนได้ |
IDW | แบบจำลองเชิงกำหนด | พื้นผิวจากการ | เร็ว | Exact | ตัวแปรเสริมน้อย | ไม่สามารถประเมินผลการทำนายและค่าคลาดเคลื่อนได้และอาจพบปัญหาฟองกลม(Bulls eyes) รอบจุดตัวอย่าง |
Spline | แบบจำลองเชิงกำหนด | พื้นผิวจากการ | ปานกลาง | Inexact | ยืดหยุ่น | ไม่สามารถประเมินผลการทำนายและค่าคลาดเคลื่อนได้ |
Kriging | เฟ้นสุ่ม(Stochastic) | -พื้นผิวจากการทำนาย- แสดงค่าผิดพลาด
– แสดงค่าความ น่าจะเป็น |
ปานกลางถึงช้า | Exact/Inexact | ยืด ห ยุ่ น สูงสามารถประเมินค่าสหสัมพันธ์
ของจุดข้อมูล, ค่าคลาดเคลื่อน ของปัจจัย และ ผลการประมาณ ค่าได้ |
ต้องผ่านการวิเคราะห์หลายขั้นตอนและข้อมูลต้องมีการแจกแจงแบบปกติ |
ที่มา : ตำราเทคโนโลยีอวกาศและภูมิสารสนเทศศาสตร์