การวิเคราะห์ข้อมูลเชิงพื้นที่ : ฟังก์ชันของการวิเคราะห์ข้อมูลเชิงพื้นที่

ระบบสารสนเทศภูมิศาสตร์ใช้ในการวิเคราะห์ปัญหาตั้งแต่ระดับง่ายไปถึงยาก ซึ่งโดยทั่วไปเป็นการแสดงผลระหว่างความสัมพันธ์ของTopology กับข้อมูลลักษณะประจำ โดยไม่ต้องผ่านขั้นตอนการทำงานที่ยุ่งยาก เช่น การระบุลักษณะประจำของกราฟิก การวัดระยะทาง การคำนวณพื้นที่ เป็นต้น หรือแม้กระทั่งการวิเคราะห์ที่มีความซับซ้อนมากขึ้น การค้นหาผลการซ้อนทับปัจจัย การวิเคราะห์เส้นทางเข้าถึงที่ใกล้ที่สุด การประเมินค่าใช้จ่ายในการเดินทาง การวิเคราะห์พื้นที่เหมาะสมในการสร้างสิ่งปลูกสร้าง หรือการพยากรณ์แนวโน้มความเปลี่ยนแปลง เป็นต้น

ต้องการทราบขนาดพื้นที่ของอาคารกาญจนาภิเษก มหาวิทยาลัยขอนแก่น โดยมีชั้นข้อมูลที่แสดงลักษณะการใช้ประโยชน์ที่ดินในมหาวิทยาลัยขอนแก่นอยู่แล้วสามารถสอบถามข้อมูลได้อย่างง่ายดังนี้

ภาพแสดงลักษณะการวิเคราะห์ข้อมูลอย่างง่ายด้วยระบบสารสนเทศภูมิศาสตร์
ภาพแสดงลักษณะการวิเคราะห์ข้อมูลอย่างง่ายด้วยระบบสารสนเทศภูมิศาสตร์
ภาพแสดงลักษณะการวิเคราะห์ข้อมูลอย่างง่ายด้วยระบบสารสนเทศภูมิศาสตร์
ภาพแสดงลักษณะการวิเคราะห์ข้อมูลอย่างง่ายด้วยระบบสารสนเทศภูมิศาสตร์

รูปแบบการทำงานข้างต้น ผู้ใช้งานจะเป็นฝ่ายตั้งคำถามและเลือกใช้ความสามารถในการทำงานของระบบสารสนเทศภูมิศาสตร์ ในการเข้าถึงกระทั่งตอบคำถามที่ได้ตั้งไว้ ทั้งนี้ฟังก์ชันการทำงานหลักของระบบสารสนเทศภูมิศาสตร์ สามารถแบ่งออกตามลักษณะการทำงานได้ 4 กลุ่มหลัก คือ การค้นข้อมูลเชิงพื้นที่ (Spatial search) การซ้อนทับเชิงพื้นที่ (Spatial overlay) การสร้างแนวกันชน (Buffer operation) และการประมาณค่าเชิงพื้นที่ (Spatial interpretation) โดยในแต่ละฟังก์ชัน สามารถจำแนกลักษณะการทำงานที่มีความคล้ายคลึงกันออกไปได้อีกมากมายดังรายละเอียดต่อไปนี้

1. การค้นข้อมูลเชิงพื้นที่

การค้นข้อมูลเชิงพื้นที่ถือเป็นพื้นฐานของการวิเคราะห์ข้อมูลเชิงพื้นที่ ซึ่งนักวิเคราะห์จะต้องการทราบข้อมูลต่างๆ เพื่อใช้ในการประกอบการตัดสินใจ ไม่ว่าจะเป็นการสอบถามเพื่อทราบรายละเอียดเกี่ยวกับตำแหน่งพิกัดทางภูมิศาสตร์ การสอบถามโดยการตั้งเงื่อนไข (Condition) แนวโน้มการเปลี่ยนแปลง (Trends) รูปแบบการเปลี่ยนแปลง (Pattern) การประกอบแบบจำลอง (Modeling) ทั้งนี้การค้นข้อมูลเชิงพื้นที่ แบ่งออกเป็นการค้นหาจากข้อมูลลักษณะประจำ การค้นหาจากข้อมูลเชิงพื้นที่โดยตรง และการวิเคราะห์เชิงบูรณาการข้อมูลเชิงพื้นที่ร่วมกับข้อมูลลักษณะประจำ (Integrated analysis of the spatial and non-spatial data)

1) การค้นหาจากข้อมูลลักษณะประจำ

เป็นการค้นหาโดยตั้งคำถามให้ระบบช่วยสอบถาม (Query) ซึ่งอาจเป็นคำถามอย่างง่าย โดยระบุสิ่งที่ต้องการถามจากลักษณะที่ผู้ศึกษาทราบ เช่น ต้องการทราบสถานที่ตั้งของมหาวิทยาลัยขอนแก่นจากชั้นข้อมูลจุดที่ตั้งสถานศึกษาในจังหวัดขอนแก่น เป็นต้น แสดงลักษณะการตั้งคำถามอย่างง่ายดังภาพที่ 4.36 ผลที่ได้จะถูกแสดงให้เด่นชัดในกราฟิกหรือแผนที่ ทำให้ผู้สอบถามสามารถทราบข้อมูลที่ต้องการค้นคืน รวมถึงตำแหน่งที่ตั้งตามระบบพิกัดการค้นหาอาจเพียงต้องการทราบข้อมูลรายละเอียดของสิ่งที่ถาม หรือเพื่อแก้ไข ปรับข้อมูลให้เป็นปัจจุบัน แต่อย่างไร ก็ตามมีบางครั้งที่ผู้ศึกษาไม่ทราบค่าของข้อมูลที่ต้องการโดยตรง หรือภายในชั้นข้อมูลมิได้มีค่าที่แสดงลักษณะที่ต้องการโดยตรง ผู้ศึกษาจำเป็นต้องสร้างคำสืบค้นที่ทำให้เข้าถึงสิ่งที่ต้องการโดยทางอ้อม โดยกำหนดจากคุณลักษณะอื่นๆ เท่าที่ทราบ ลักษณะของคำถามดังกล่าวอาจใช้สมการทางคณิตศาสตร์ หรือตรรกศาสตร์แบบบูล (Boolean logic) เพื่อเป็นตัวช่วยระบุสิ่งที่ต้องการให้ตรงเป้าหมาย แสดงตัวอย่างการสืบค้นดังภาพ ซึ่งต้องการหาอำเภอที่มีความหนาแน่นของประชากรมากกว่า 200 คน/ตารางกิโลเมตร และมีพื้นที่มากกว่า 900 ตารางกิโลเมตร และจำนวนหมู่บ้านในอำเภอดังกล่าว

ภาพแสดงการค้นหาจากข้อมูลลักษณะประจำ
ภาพแสดงการค้นหาจากข้อมูลลักษณะประจำ

ต้องการทราบอำเภอในภาคตะวันออกเฉียงเหนือที่มีความหนาแน่นของประชากรในพื้นที่ มากกว่า 200 คน/ตารางกิโลเมตรและมีขนาดพื้นที่อำเภอมากกว่า 900 ตารางกิโลเมตร โดยต้องการทราบจำนวนหมู่บ้านทั้งหมดในอำเภอดังกล่าวด้วย

ภาพแสดงลักษณะการค้นหาข้อมูลที่ซับซ้อนมากขึ้น
ภาพแสดงลักษณะการค้นหาข้อมูลที่ซับซ้อนมากขึ้น

การค้นหาและวิเคราะห์ข้อมูลในระบบสารสนเทศ นิยมใช้ภาษาสอบถามเชิงโครงสร้าง (Standard Query Language : SQL) ซึ่งประกอบด้วย ตัวดำเนินการคำนวณ (Arithmetic operator) ตัวดำเนินการสัมพันธ์ (Relational operator) และตัวดำเนินการตรรกะแบบบูล (Boolean logical operator) โดยลักษณะของตัวดำเนินการแต่ละประเภทแสดงดังต่อไปนี้

ตัวดำเนินการ

สัญลักษณ์ที่ใช้

คณิตศาสตร์ บวก (+) ลบ (-) คูณ (×) หาร (/)
สัมพันธ์ = ≥ ≤ > <
ตรรกะแบบกูล OR AND XOR NOT
ภาพแสดงความหมายของตัวดำเนินการ Boolean
ภาพแสดงความหมายของตัวดำเนินการ Boolean

ตัวดำเนินการแบบบูล ได้แก่ AND OR NOT และ XOR ซึ่งเป็นตัวดำเนินการที่ยอมรับกันอย่างกว้างขวาง เพื่อแสดงเงื่อนไขเชิงตรรกะ เพื่อให้ได้ผลลัพธ์ตามเป้าหมาย ซึ่งประกอบด้วยข้อมูลนำเข้าและข้อมูลผลลัพธ์

OR หมายถึง การยูเนียน (Union) ข้อมูลนำเข้า

AND หมายถึง การอินเตอร์เซกชัน (Intersection) ของข้อมูลนำเข้า ดังภาพที่ 4.38ข

XOR หมายถึง ผลลัพธ์อันเกิดจากข้อมูลนำเข้า ในส่วนที่ไม่เกิดการอินเตอร์เซกชัน

NOT หมายถึง ผลลัพธ์อันเกิดจากส่วนใดส่วนหนึ่งของข้อมูลนำเข้าที่ไม่ตัดกัน ซึ่งจะขึ้นกับการกำหนดลำดับ

นอกจากการใช้คำสั่งสืบค้นแล้วในกรณีที่ไม่สามารถระบุลักษณะของข้อมูลที่ต้องการสืบค้นได้อาจจำเป็นต้องใช้เทคนิคบางประการเข้าช่วยในการค้นหา ดังเช่น ตัวอย่างในภาพ ซึ่งแสดงการจัดเรียงลำดับ (Sorting) พื้นที่จังหวัดในภาคตะวันออกเฉียงเหนือจากน้อยไปมาก การเรียงเลขใหม่ (Renumbering) หรือการจัดกลุ่มย่อยใหม่ (Subseting) โดยการเลือกใช้วิธีการใดก็ขึ้นกับความเหมาะสมและความต้องการ เนื่องจากค่าในเขตข้อมูลของข้อมูลลักษณะประจำจะมีรูปแบบที่แตกต่างกันออกไป ทำให้ไม่สามารถเลือกใช้คำถามที่เหมือนกันในการเข้าถึงได้โดยลักษณะของข้อมูลสามารถแบ่งออกเป็น 4 ระดับ (Four levels of measurement) อ้างอิงตาม Steven (1946)

ก่อนจัดเรียงอันดับค่าพื้นที่ (Field HECTARES)
ก่อนจัดเรียงอันดับค่าพื้นที่ (Field HECTARES)
หลังจัดเรียงอันดับค่าพื้นที่(Field HECTARES)
หลังจัดเรียงอันดับค่าพื้นที่(Field HECTARES)

ตารางแสดงลักษณะของข้อมูล

22_0122_02

2) การค้นหาจากข้อมูลเชิงพื้นที่

เป็นการค้นหาข้อมูลโดยเลือกจากส่วนที่เป็นข้อมูลกราฟิก เพื่อแสดงข้อมูลรายละเอียดของสิ่งที่ต้องการทราบ วิธีการค้นหาลักษณะนี้มีหลายรูปแบบ เช่น การเลือกดูเฉพาะตำแหน่งที่สนใจ การเลือกโดยอาศัยชั้นข้อมูลอื่น (Select by theme/ Select by location) การสร้างความเชื่อมโยงหลายมิติ (Hyperlink) เป็นต้น

ภาพแสดงการค้นหาข้อมูลเชิงพื้นที่ลักษณะต่างๆ
ภาพแสดงการค้นหาข้อมูลเชิงพื้นที่ลักษณะต่างๆ

ข้อสังเกต ความแตกต่างของการเลือกใช้วิธี ค้นหาด้วย Select by theme กับ Select by attribute คือ

Select by location ใช้เมื่อ: ทราบตำแหน่ง> ไม่ทราบข้อมูล

Select by attribute ใช้เมื่อ: ทราบข้อมูลชื่อหรือรหัส > ไม่ทราบตำแหน่ง

 

ในกรณีที่ต้องการทราบลักษณะประจำของหมู่บ้าน ให้เลือกตำแหน่งหมู่บ้านแล้วแสดงข้อมูลลักษณะประจำของหมู่บ้าน

ในกรณีที่ต้องการทราบลักษณะประจำอื่นๆ ที่เกี่ยวข้องให้เลือกตำแหน่งหมู่บ้านแล้วแสดงลักษณะประจำของหมู่บ้าน แล้วเชื่อมโยงไปยังข้อมูลอื่นๆ ที่เกี่ยวข้องกับหมู่บ้านนั้นซึ่งเป็นการเชื่อมโยงข้อมูลหลายมิติ

ในกรณีที่ต้องการทราบหมู่บ้านที่ไม่มีขอบเขตจังหวัด ให้เลือกพื้นที่จังหวัดแล้วแสดงขอบเขตจังหวัดที่ต้องการ แล้วนำขอบเขตของจังหวัดนั้นมาเลือกหมู่บ้านที่อยู่ในจังหวัดนั้น

3) การค้นหาจากข้อมูลเชิงพื้นที่ร่วมกับข้อมูลลักษณะประจำ

เป็นการใช้งานที่ใกล้เคียงกับลักษณะความเป็นจริง ที่บางครั้งอาศัยการสอบถามจากข้อมูลเชิงพื้นที่หรือลักษณะประจำอย่างเดียวยังไม่เพียงพอ จึงต้องบูรณาการระหว่างข้อมูลเชิงพื้นที่และข้อมูลลักษณะประจำร่วมกันวิธีการดังกล่าวจะมีความยืดหยุ่นในการเข้าถึงข้อมูลที่ต้องการได้ดียิ่งขึ้น

 2. การซ้อนทับเชิงพื้นที่

การวิเคราะห์ข้อมูลเชิงพื้นที่ส่วนใหญ่ ผู้ศึกษาจำเป็นต้องวิเคราะห์ความสัมพันธ์ระหว่างปัจจัยมากกว่า 1 ปัจจัย วิธีการที่นิยมใช้ตอบโจทย์ปัญหาเชิงพื้นที่ลักษณะดังกล่าว คือ “การซ้อนทับชั้นข้อมูล” ซึ่งเป็นการกระทำระหว่างชั้นข้อมูลมากกว่าหรือเท่ากับ 2 ชั้นข้อมูลขึ้นไป ตามเงื่อนไขที่ได้จากการวิเคราะห์ซึ่งอาจจะเป็นแบบคณิตศาสตร์หรือตรรกศาสตร์ เพื่อได้มาซึ่งผลลัพธ์ที่ต้องการบนพื้นที่ใดพื้นที่หนึ่ง แต่ละชั้นข้อมูลจำเป็นต้องมีระบบพิกัดตรงกันผลจากการซ้อนทับจะได้ชั้นข้อมูลใหม่ที่สามารถตอบโจทย์ที่ผู้ศึกษาต้องการ

การซ้อนทับชั้นข้อมูลสามารถจำแนกเป็นการซ้อนทับที่กระทำกับข้อมูลประเภทเวกเตอร์ ประกอบด้วยการซ้อนทับแบบยูเนียน แบบอินเตอร์เซกชัน แบบเอกลักษณ์ (Identity) แบบผนวก (Append) การซ้อนทับเพื่อปรับให้เป็นปัจจุบัน (Update) การตัดข้อมูล (Clip) และการลบข้อมูล (Erase) ในขณะที่ข้อมูลประเภทแรสเตอร์ก็สามารถดำเนินการซ้อนทับได้เช่นเดียวกัน โดยมีลักษณะการดำเนินการที่แตกต่างกัน แต่ให้ผลการซ้อนทับที่มีความหมายลักษณะเดียวกัน เช่น การซ้อนทับที่มีน้ำหนักแต่ละชั้นข้อมูลต่างกัน (Weighted overlay) และผลรวมของน้ำหนัก (Weighted sum) เป็นต้น ในที่นี้จึงได้แสดงรายละเอียดการซ้อนทับแยกตามชนิดของข้อมูลเวกเตอร์ และแรสเตอร์ตามลำดับ

1) การซ้อนทับชั้นข้อมูลประเภทเวกเตอร์ (Vector overlay) องค์ประกอบที่สำคัญในการซ้อนทับชั้นข้อมูลเวกเตอร์ ประกอบด้วยชั้นข้อมูลปฐมภูมิ (Primary layer) ชั้นข้อมูลที่ใช้ปฏิบัติการ (Operation layer) และผลที่ได้จากการซ้อนทับ (Result layer) สำหรับลักษณะของการซ้อนทับ ชั้นข้อมูลนำเข้าจะถูกแบ่งออกเป็นส่วนตามจุดที่ตัดกับชั้นข้อมูลที่ใช้ซ้อนทับ เกิดเป็นพื้นที่ใหม่ (New area) และแสดงในชั้นข้อมูลผลลัพธ์ อย่างไรก็ตามสามารถซ้อนทับชั้นข้อมูลที่มีลักษณะเป็น เส้น และจุด ได้เช่นเดียวกัน หากข้อมูลนำเข้ามีลักษณะเป็นเส้น ตำแหน่งของเส้นที่ตัดกับชั้นข้อมูลซ้อนทับจะกลายเป็นชิ้นส่วนของเส้นใหม่ที่ถูกแสดงไว้ในชั้นข้อมูลผลลัพธ์ เช่นเดียวกับชั้นข้อมูลนำเข้าที่มีลักษณะเป็นจุด ต่ำแหน่งของจุดที่ปรากฏอยู่ในชั้นข้อมูลที่ใช้ซ้อนทับจะถูกแสดงเป็นจุดที่มีความหมายใหม่ในชั้นข้อมูลผลลัพธ์ ผลจากการซ้อนทับ ข้อมูลลักษณะประจำที่สร้างขึ้นมาใหม่จะแสดงค่าทั้งส่วนที่เป็นค่าของชั้นข้อมูลนำเข้าและชั้นข้อมูลซ้อนทับไว้คู่กัน

ตาราง แสดงลักษณะการซ้อนทับชั้นข้อมูล ประเภทจุด เส้น และอาณาบริเวณ

23_

การซ้อนทับข้อมูลประเภทเวกเตอร์มีด้วยกันหลายวิธีดังที่ได้กล่าวถึงบ้างแล้วในขั้นต้น แต่ละวิธีถูกสร้างเพื่อให้ผลการวิเคราะห์ที่แตกต่างกันออกไป ดังนั้นจึงได้อธิบายรายละเอียดของแต่ละวิธีพอสังเขปดังต่อไปนี้

– การซ้อนทับแบบยูเนียน

การซ้อนทับด้วยวิธียูเนียนเป็นการกระทำระหว่างชั้นข้อมูลนำเข้าสองชั้นข้อมูล ผลลัพธ์ที่ได้จะรวมคุณลักษณะทั้งหมดของชั้นข้อมูลนำเข้าทั้งสองไว้ด้วยกันทั้งในส่วนที่เป็นกราฟิก และข้อมูลลักษณะประจำบริเวณที่เกิดจากการตัดกันของข้อมูลจะถูกแสดงเป็นพื้นที่ใหม่พร้อมๆ กับการสร้างค่ารหัสตัวแทนขึ้นใหม่ การซ้อนทับแบบยูเนียนนี้จะใช้กับชั้นข้อมูลที่เป็นอาณาบริเวณเท่านั้น ทั้งนี้การเลือกชั้นข้อมูลนำเข้าหรือชั้นข้อมูล ที่ใช้ซ้อนทับสามารถสลับกันได้โดยไม่มีผลต่อผลลัพธ์

ภาพแสดงแนวคิดการซ้อนทับแบบยูเนียน
ภาพแสดงแนวคิดการซ้อนทับแบบยูเนียน

– การซ้อนทับแบบอินเตอร์เซกชัน

เป็นการซ้อนทับระหว่างชั้นข้อมูลสองชั้นข้อมูล ผลที่ได้จะแสดงเพียงรายละเอียดของส่วนที่ตัดกัน (ซ้อนทับ) ระหว่างชั้นข้อมูลนำเข้า และชั้นข้อมูลซ้อนทับ การเลือกชั้นข้อมูลนำเข้าหรือชั้นข้อมูลที่ใช้ซ้อนทับสามารถสลับกันได้โดยไม่มีผลต่อผลลัพธ์

ภาพแสดงแนวคิดการซ้อนทับแบบอินเตอร์เซกชัน
ภาพแสดงแนวคิดการซ้อนทับแบบอินเตอร์เซกชัน

– การซ้อนทับแบบเอกลักษณ์

เป็นฟังก์ชันการซ้อนทับที่ยังคงรักษาคุณลักษณะของชั้นข้อมูลนำเข้าไว้ แต่จะดึงเอาเอกลักษณ์ของชั้นข้อมูลที่นำมาซ้อนทับในบริเวณที่ทับกับชั้นข้อมูลนำเข้ามาแสดงในชั้นข้อมูลผลลัพธ์ด้วย ดังนั้นการเลือกลำดับข้อมูลนำเข้าและชั้นข้อมูลที่นำมาซ้อนทับจึงมีความสำคัญ เนื่องจากจะให้ผลลัพธ์ที่แตกต่างกัน แสดงลักษณะการซ้อนทับดังภาพ จะเห็นได้ว่าในภาพ (ก) จะยังคงรักษาชั้นข้อมูลปฐมภูมิทั้งหมดไว้ คือยังคงมีพื้นที่ (1 2 และ 3) เนื่องจากชั้นข้อมูลปฐมภูมิมีขนาดใหญ่กว่าชั้นข้อมูลปฏิบัติการ ส่วนในภาพ (ข) ยังคงพื้นที่ข้อมูลชั้นปฐมภูมิเช่นกันแต่ชั้นข้อมูลปฏิบัติการในส่วนที่ล้ำออกไปจากชั้นข้อมูลปฐมภูมิจะถูกลบออก

 

ภาพแสดงแนวคิดของการซ้อนทับแบบเอกลักษณ์
ภาพแสดงแนวคิดของการซ้อนทับแบบเอกลักษณ์
ภาพแสดงแนวคิดของการซ้อนทับแบบเอกลักษณ์
ภาพแสดงแนวคิดของการซ้อนทับแบบเอกลักษณ์

– การซ้อนทับเพื่อปรับให้เป็นปัจจุบัน

เป็นการปรับแก้ข้อมูลพื้นที่บางส่วนโดยการแทนที่พื้นที่ในชั้นข้อมูลปฐมภูมิด้วยชั้นข้อมูลปฏิบัติการชั้นข้อมูลผลลัพธ์ที่ได้จะมีเฉพาะเขตค่าข้อมูลของชั้นข้อมูลปฐมภูมิปรากฏอยู่เท่านั้น ซึ่งในบริเวณพื้นที่ที่เป็นชั้นข้อมูลปฏิบัติการจะถูกแทนที่ด้วยค่าว่าง (Blank) สำหรับข้อมูลอักษร (String) หรือค่า 0 สำหรับข้อมูลเชิงตัวเลข (Numeric) พร้อมคำนวณพื้นที่และเส้นรอบรูปใหม่เพื่อปรับปรุงฐานข้อมูลแผนที่ผลลัพธ์ นิยมใช้การซ้อนทับลักษณะนี้เพื่อปรับปรุง แผนที่ให้ทันสมัยได้มีการจัดเก็บเพิ่มเติมเฉพาะส่วน โดยลบข้อมูลเก่าออกแล้วแทนที่ด้วยข้อมูลใหม่ ดังภาพ (ก) แสดงการแทนที่ชั้นข้อมูลปฐมภูมิซึ่งเป็นค่าตัวเลขด้วยชั้นข้อมูลปฏิบัติการ ผลที่ได้จะแสดงรูปร่างพื้นที่ใหม่โดยส่วนที่เป็นบริเวณชั้นข้อมูลปฏิบัติการแสดงค่าเป็น 0 ส่วนภาพ (ข) แสดงการแทนที่ชั้นข้อมูลปฐมภูมิซึ่งเป็นค่าตัวอักษรด้วยชั้นข้อมูลปฏิบัติการ ผลที่ได้จะแสดงรูปร่างพื้นที่ใหม่โดยส่วนที่เป็นบริเวณชั้นข้อมูลปฏิบัติการแสดงค่าเป็นค่าว่าง

ภาพแสดงแนวคิดของการซ้อนทับเพื่อปรับให้เป็นปัจจุบัน
ภาพแสดงแนวคิดของการซ้อนทับเพื่อปรับให้เป็นปัจจุบัน
ภาพแสดงแนวคิดของการซ้อนทับเพื่อปรับให้เป็นปัจจุบัน
ภาพแสดงแนวคิดของการซ้อนทับเพื่อปรับให้เป็นปัจจุบัน

– การลบข้อมูล

เป็นการซ้อนทับที่กระทำเพื่อลบส่วนของข้อมูลโดยอาศัยชั้นข้อมูลปฏิบัติการเพื่อเป็นกรอบการลบบริเวณที่ถูกลบค่าออกคือตำแหน่งที่มีพื้นที่ซ้อนทับกันอยู่ภายในชั้นข้อมูลที่นำมาปฏิบัติการ การลบข้อมูลลักษณะนี้สามารถกระทำได้กับข้อมูลที่เป็นอาณาบริเวณ จุด และเส้น ดังแสดงในภาพ

ภาพแสดงแนวคิดของการซ้อนทับแบบลบข้อมูล

1(403)
ภาพแสดงแนวคิดของการซ้อนทับแบบลบข้อมูล

– การตัดข้อมูล

เป็นการซ้อนทับชั้นข้อมูลเพื่อลบส่วนของพื้นที่จากชั้นข้อมูลนำเข้าที่อยู่นอกเขตพื้นที่ของชั้นข้อมูลที่ต้องการนำมาซ้อนทับเพื่อตัดบางส่วนของชั้นข้อมูลนำเข้า สำหรับข้อมูลลักษณะประจำที่แสดงในผลลัพธ์จะแสดงเพียงค่าจากชั้นข้อมูลนำเข้าเท่านั้น ดังนั้นการให้ลำดับชั้นข้อมูลนำเข้ากับชั้นข้อมูลซ้อนทับจึงเป็นสิ่งที่ต้องคำนึงถึงก่อนการวิเคราะห์ สำหรับการตัดสามารถกระทำได้ทั้งข้อมูลที่เป็นอาณาบริเวณ จุด และเส้น ดังแสดงในตัวอย่างภาพ

ภาพแสดงแนวคิดของการซ้อนทับเพื่อตัดข้อมูล
ภาพแสดงแนวคิดของการซ้อนทับเพื่อตัดข้อมูล

– การรวมข้อมูลเข้าด้วยกัน

ใช้ในการรวมข้อมูลระหว่าง 2 ชั้นข้อมูล ที่มีระบบพิกัดเดียวกัน มีความต่อเนื่องกัน และค่าคุณลักษณะของข้อมูลในข้อมูลลักษณะประจำเหมือนกัน สามารถใช้คำสั่งการรวมข้อมูลได้ทั้งกับชั้นข้อมูลที่เป็นอาณาบริเวณ จุด และเส้น ผลลัพธ์ที่ได้ข้อมูลในลักษณะกราฟิก และตารางจะถูกรวมเข้าด้วยกันโดยมีลักษณะต่อเนื่องกันเหมือนข้อมูลนำเข้า แสดงการเชื่อมต่อแผนที่ดังภาพ

ภาพแสดงแนวคิดการซ้อนทับเพื่อรวมข้อมูลเข้าด้วยกัน
ภาพแสดงแนวคิดการซ้อนทับเพื่อรวมข้อมูลเข้าด้วยกัน

– การผนวกชั้นข้อมูล

การผนวกข้อมูลเป็นการดำเนินการเพื่อเชื่อมต่อชุดของชั้นข้อมูลประเภทอาณาบริเวณ จุด เส้น ตาราง รวมทั้งข้อมูลประเภทแรสเตอร์ เข้าไปยังชั้นข้อมูลอาณาบริเวณ จุด เส้น ตาราง หรือข้อมูลแรสเตอร์ที่มีอยู่แล้วแสดงดังภาพ

ภาพแสดงแนวคิดการซ้อนทับเพื่อผนวกชั้นข้อมูล
ภาพแสดงแนวคิดการซ้อนทับเพื่อผนวกชั้นข้อมูล

ปัญหาที่เกิดจากการซ้อนทับชั้นข้อมูลประเภทเวกเตอร์

แม้การซ้อนทับชั้นข้อมูลประเภทเวกเตอร์จะช่วยให้ได้ผลการวิเคราะห์ตามความต้องการ แต่บางครั้งผลที่ได้จากการซ้อนทับอาจยังไม่สมบูรณ์เพียงพอสำหรับการนำไปใช้โดยตรง ทำให้ต้องมีการปรับปรุงข้อมูลให้อยู่ในรูปแบบที่เหมาะสมที่สุดก่อน ซึ่งปัญหาที่มักเกิดกับชั้นข้อมูลผลลัพธ์ ดังเช่น การเกิดกาบ (Sliver) หรือการที่ผลจากการซ้อนทับเกิดเป็นพื้นที่ หรือส่วนของเส้นจำนวนมากเกินไปจนทำให้การแสดงผล และการคำนวณต้องเสียเวลามาก ดังนั้นในที่นี้จึงได้แสดงรายละเอียดของปัญหาที่เกิดจากการซ้อนทับดังนี้

ก. การเกิดกาบ : เป็นพื้นที่ขนาดเล็ก (Tiny polygons) จำนวนมากที่เกิดขึ้นจากการซ้อนทับชั้นข้อมูลอาณาบริเวณ ที่ควรจะเป็นเส้นเดียวกันแต่มีการล้ำกัน ซึ่งอาจจะเกิดจากการมีข้อมูลประเภทเดียวกันมาจากการนำเข้าหรือแหล่งที่ต่างกัน โดยเฉพาะบริเวณแนวขอบส่วนที่ตัดกันของพื้นที่ พื้นที่เล็กๆ ที่เกิดขึ้นโดยไม่ต้องการเหล่านี้เป็นสิ่งที่คอยรบกวนการวิเคราะห์ และอาจทำให้ผลการวิเคราะห์ผิดพลาดได้

ภาพแสดงลักษณะการเกิดกาบ
ภาพแสดงลักษณะการเกิดกาบ

จากภาพ หากพิจารณาชั้นข้อมูลนำเข้าและชั้นข้อมูลที่นำมาซ้อนทับเพียงอย่างใดอย่างหนึ่งอาจดูคล้ายว่าชั้นข้อมูลมีขอบเขตพื้นที่ที่เหมือนกัน (เท่ากัน) แต่เมื่อทำการซ้อนทับกันแล้วกลับพบว่ามีส่วนที่ซ้อนเหลื่อมปรากฏในชั้นข้อมูลผลลัพธ์ แสดงว่าชั้นข้อมูลมีขอบเขตพื้นที่แตกต่างกัน ปัญหาดังกล่าวอาจเกิดจากความแตกต่างของขนาด หรือตำแหน่งของชั้นข้อมูลที่เลื่อนต่างกันเล็กน้อย การเกิดกาบค่อนข้างเป็นปัญหาสำหรับการศึกษาความเปลี่ยนแปลงของพื้นที่ เนื่องจากผู้ศึกษาจำเป็นต้องวิเคราะห์ให้ได้ว่าพื้นที่ขนาดเล็กที่ปรากฏ เป็นผลมาจากการเปลี่ยนแปลงของพื้นที่จริง หรือว่าเป็นเพียงกาบที่มาจากความแตกต่างกันของข้อมูล

ข้อสังเกตในการพิจารณาลักษณะของกาบ

– โดยทั่วไปกาบที่เกิดขึ้นจะมีขนาดเล็ก

– รูปร่างยาว และเรียวบาง

– มีจำนวนมาก และส่วนใหญ่เป็นเส้น 2 เส้นขนานกัน

– มักพบบริเวณขอบที่ตัดกันของชั้นข้อมูล

ภาพแสดงลักษณะกาบ
ภาพแสดงลักษณะกาบ

การแก้ปัญหาสามารถกระทำได้หลายวิธีการ ซึ่งอาจเป็นการปรับปรุงชั้นข้อมูลนำเข้าก่อนการซ้อนทับให้มีขอบเขต หรือพิกัดที่ถูกต้องเป็นระบบเดียวกันเสียก่อน หรือปรับปรุงข้อมูลที่ได้จากการซ้อนทับด้วยการใช้คำสั่งกำจัด(Eliminate) เพื่อลบพื้นที่ที่เป็นกาบออกไป หรือในกรณีที่เกิดกาบไม่มากนักอาจใช้วิธีเลือก (Select) และทำการรวมเขตข้อมูลด้วยคำสั่งสลาย (Dissolve) หากพบว่าพื้นที่กาบนั้นสามารถจัดกลุ่มเข้าเป็นหมวดพื้นที่ใดของชั้นข้อมูลผลลัพธ์ได้

ภาพแสดงการกำจัดกาบ
ภาพแสดงการกำจัดกาบ

จากภาพแสดงให้เห็นว่าชั้นข้อมูลที่เกิดจากกระบวนการซ้อนทับทำให้เกิดกาบจำนวนมากที่ผู้ศึกษาไม่ต้องการ โดยขนาดกาบที่ถูกตรวจสอบทั้งหมดมีขนาดพื้นที่น้อยกว่าหรือเท่ากับ 3 ตารางกิโลเมตร ดังนั้นจึงทำการกำจัดพื้นที่ที่มีขนาดน้อยกว่าหรือเท่ากับ 3 ตารางกิโลเมตร

ข. การมีพื้นที่ย่อยจำนวนมากเกินไป : ผลจากการซ้อนทับชั้นข้อมูลที่มีพื้นที่ย่อยจำนวนมากเข้าด้วยกันทำให้ได้ผลลัพธ์ที่มีจำนวนพื้นที่ย่อยๆ เพิ่มมากขึ้น จนบางครั้งทำให้การแสดงผลต้องใช้เวลาดำเนินการนาน และการประมวลผลร่วมกับชั้นข้อมูลอื่นมีความซับซ้อนขึ้น ปัญหาดังกล่าวเราสามารถแก้ไขได้ด้วยการจัดจำแนกข้อมูลใหม่(Reclassify) และทำการสลายพื้นที่ย่อยที่มีจำนวนมากเพื่อรวมกลุ่มข้อมูล หรือข้อมูลลักษณะประจำที่ถูกจัดให้เป็นกลุ่มเดียวกัน

ภาพแสดงการแก้ปัญหาจำนวนพื้นที่ย่อยมากเกินไปด้วยการจัดจำแนกข้อมูลใหม่ และสลาย
ภาพแสดงการแก้ปัญหาจำนวนพื้นที่ย่อยมากเกินไปด้วยการจัดจำแนกข้อมูลใหม่ และสลาย

จากภาพชั้นข้อมูลนำเข้า และชั้นข้อมูลซ้อนทับ ต่างมีพื้นที่ย่อยจำนวนมากเมื่อทำการซ้อนทับชั้นข้อมูลทั้งสองด้วยวิธีการยูเนียนทำให้ชั้นข้อมูลผลลัพธ์เกิดมีพื้นที่ย่อยมากขึ้น

ทำการจัดกลุ่มค่าข้อมูลผลลัพธ์ให้อยู่ในกลุ่มเดียวกัน และสลายค่าผลการจัดกลุ่มผลที่ได้คือชั้นข้อมูลใหม่ที่สดงรูปแบบของผลการศึกษาตามต้องการ

 2) การซ้อนทับชั้นข้อมูลประเภทแรสเตอร์

เป็นที่ทราบกันดีแล้วว่าลักษณะของข้อมูลที่ปรากฏอยู่ในระบบสารสนเทศภูมิศาสตร์นั้น ประกอบด้วยข้อมูลประเภทเวกเตอร์ และแรสเตอร์ ซึ่งในบางกรณีการเลือกใช้ข้อมูลประเภทแรสเตอร์จะมีความเหมาะสมมากกว่าเนื่องจากสามารถให้ผลการวิเคราะห์ที่รวดเร็วกว่าข้อมูลเวกเตอร์ และจากข้อจำกัดของข้อมูลเวกเตอร์ คือ เมื่อซ้อนทับชั้นข้อมูลที่มากกว่า 2 ชั้น (โดยเฉพาะชั้นข้อมูลที่มีความซับซ้อนมาก) การประมวลผลด้วยคอมพิวเตอร์จะสิ้นเปลืองเวลานาน และต้องผ่านการปรับปรุงข้อมูลหลายครั้งกว่าจะได้ผลการศึกษาที่ต้องการ ในขณะที่ข้อมูลประเภทแรสเตอร์ การวิเคราะห์ในลักษณะของการซ้อนทับสามารถกระทำได้อย่างรวดเร็ว อีกทั้งสามารถทำได้พร้อมกันหลายชั้นข้อมูลในเวลาเดียวกัน ข้อสังเกตในการซ้อนทับข้อมูลแรสเตอร์คือ “ชั้นข้อมูลที่นำมาซ้อนทับกันต้องอ้างอิงระบบพิกัดเดียวกันและมีขนาดจุดภาพเท่ากัน” จึงจะได้ผลการซ้อนทับที่มีความเหมาะสม อย่างไรก็ตามการเลือกใช้งานข้อมูลประเภทใดขึ้นกับความสะดวกของงานและรูปแบบข้อมูลที่มีการจัดเก็บอยู่ ซึ่งระบบสารสนเทศทางภูมิศาสตร์ได้พัฒนาให้สามารถแปลงข้อมูลกลับไป-กลับมา ระหว่างข้อมูลเวกเตอร์ และแรสเตอร์ได้ ดังแสดงในภาพ

1(415)

ภาพรูปแบบข้อมูลเวกเตอร์ และแรสเตอร์
ภาพรูปแบบข้อมูลเวกเตอร์ และแรสเตอร์

ในการซ้อนทับชั้นข้อมูลประเภทแรสเตอร์นั้นค่าในจุดภาพ หรือตารางกริดของแต่ละชั้นข้อมูล จะถูกรวมเข้าด้วยกัน (Combine) โดยอาศัยตัวดำเนินการแบบเลขคณิต (Arithmetic) หรือตรรกะแบบบูล (Boolean) ในการสร้างค่าใหม่ให้แก่ชั้นข้อมูลแผนที่ผสม (Composite map) เนื่องจากค่าข้อมูลที่ถูกแสดงในจุดภาพเป็นค่าตัวเลข ดังนั้น จึงสามารถวิเคราะห์ด้วยฟังก์ชันพีชคณิตที่มีความซับซ้อนได้ เรียกลักษณะการใช้ฟังก์ชันพีชคณิตในการซ้อนทับนี้ว่า“พีชคณิตสำหรับแผนที่ (Map algebra)”

การซ้อนทับข้อมูลแรสเตอร์แบ่งออกเป็นหลายวิธีการ เช่น การซ้อนทับแบบเซลล์แรสเตอร์ (Raster cell overlay) แบบคูณและค่าสูงสุด-ต่ำสุด (Multiplication and maximum-minimum) แบบกำหนดน้ำหนัก (Overlay using weights) แบบเมทริกซ์ (Matrix recode overlay) แบบรหัส (Overlay codes) ดังรายละเอียดต่อไปนี้

– การซ้อนทับแบบเซลล์แรสเตอร์

เป็นการซ้อนทับโดยอาศัยตัวดำเนินการเชิงคณิตศาสตร์ในลักษณะที่เรียกว่าพีชคณิตแผนที่ซึ่งโดยทั่วไปประกอบด้วย การบวก (+) ลบ (-) คูณ (×) หาร (÷) และอื่นๆ

ภาพแสดงแนวคิดการซ้อนทับชั้นข้อมูลแรสเตอร์แบบเซลล์แรสเตอร์
ภาพแสดงแนวคิดการซ้อนทับชั้นข้อมูลแรสเตอร์แบบเซลล์แรสเตอร์

– แบบคูณและค่าสูงสุด-ต่ำสุด

เป็นการซ้อนทับชั้นข้อมูลโดยใช้ฟังก์ชันค่าการคูณ และการเลือกแทนค่าด้วยค่าสูงสุด หรือต่ำสุดในการแสดงผล

1(419)

ภาพแสดงแนวคิดการซ้อนทับชั้นข้อมูลแรสเตอร์แบบค่าสูงสุด-ต่ำสุด และการคูณ
ภาพแสดงแนวคิดการซ้อนทับชั้นข้อมูลแรสเตอร์แบบค่าสูงสุด-ต่ำสุด และการคูณ

– แบบกำหนดน้ำหนักเป็นการให้ค่านัยสำคัญกับชั้นข้อมูลบางชั้น หรือบางลักษณะ (Features) เช่น เมื่อพบว่าชั้นข้อมูลหนึ่งมีความสำคัญมากกว่าอีกชั้นข้อมูล เป็นต้น ระดับความสำคัญในที่นี้ คือ การให้ค่าน้ำหนักแก่ชั้นข้อมูลหรือค่าในจุดภาพให้มีค่าเพิ่มขึ้นเป็นการเพิ่มค่าน้ำหนักให้แก่ปัจจัยที่ผู้ศึกษาให้ความสำคัญเป็นพิเศษ ข้อมูลนำเข้า ได้แก่ ความลาดชัน การใช้ที่ดินและป่าไม้ น้ำหนักใช้เป็นตัวคูณคือ 1 1 และ 2 ตามลำดับ เมื่อได้ชั้นข้อมูลที่กำหนดน้ำหนักแล้วจึงรวมค่าของจุดภาพเข้าด้วยกันเป็นผลลัพธ์การซ้อนทับ

ภาพแสดงแนวคิดการซ้อนทับชั้นข้อมูลแรสเตอร์แบบกำหนดน้ำหนัก
ภาพแสดงแนวคิดการซ้อนทับชั้นข้อมูลแรสเตอร์แบบกำหนดน้ำหนัก

– การซ้อนทับแบบเมทริกซ์

เป็นการซ้อนทับชั้นข้อมูลแรสเตอร์โดยอาศัยตารางเมทริกซ์กำหนดค่ารหัสสำหรับการแทนค่าผลลัพธ์ซึ่งก่อนการซ้อนทับข้อมูลแต่ละชั้นผู้ศึกษาจำเป็นต้องจัดกลุ่มข้อมูลแต่ละชั้นใหม่ก่อน ส่วนใหญ่นิยมแบ่งค่าระดับตามความเหมาะสม เช่น การแบ่งระดับที่ดินเหมาะสมกับการเพาะปลูก กำหนดค่าระดับเหมาะสมมาก (1) เหมาะสมปานกลาง (2) และเหมาะสมน้อย (3) เป็นต้น เมื่อจำแนกระดับความเหมาะสมของข้อมูลแต่ละชั้นพร้อมแล้ว จึงทำการกำหนดค่าในตารางแม่แบบเพื่อใช้ระบุค่าที่ใช้เป็นผลลัพธ์ ทั้งนี้เมทริกซ์ที่ใช้อาจกำหนดได้หลายรูปแบบ เช่น เมทริกซ์ที่มาจากการบวก ลบ คูณ และหาร ค่าระดับความเหมาะสม เมทริกซ์มาจากการเลือกค่าสูงสุด-ต่ำสุด และเมทริกซ์ที่มาจากการเลือกเฉพาะที่ (Selective) ซึ่งเมทริกซ์ประเภทนี้ต้องถูกกำหนดขึ้นจากผู้ที่มีความเชี่ยวชาญ เป็นต้น ดังแสดงตัวอย่างการซ้อนทับด้วยวิธีการซ้อนทับแบบเมทริกซ์

1(423)

ภาพแสดงแนวคิดการซ้อนทับชั้นข้อมูลแรสเตอร์ แบบเมทริกซ์
ภาพแสดงแนวคิดการซ้อนทับชั้นข้อมูลแรสเตอร์ แบบเมทริกซ์

– การซ้อนทับแบบกำหนดน้ำหนักเป็นการซ้อนทับโดยกำหนดค่าอิทธิพลที่มีต่อปัจจัยแต่ละชั้นแผนที่ เนื่องจากแต่ละปัจจัยมีอิทธิพลต่อผลลัพธ์ไม่เท่ากัน การวิเคราะห์ลักษณะดังกล่าวนี้จัดว่าเป็นการซ้อนทับโดยให้ค่าน้ำหนักแก่ปัจจัยประเภทหนึ่ง แต่จะแตกต่างกันตรงค่าน้ำหนักที่ใช้ถูกแบ่งตามสัดส่วนของอิทธิพลเป็นค่าร้อยละ แนวคิดของการวิเคราะห์แสดงดังภาพ

ภาพแสดงแนวคิดการซ้อนทับชั้นข้อมูลแรสเตอร์แบบกำหนดค่าน้ำหนัก
ภาพแสดงแนวคิดการซ้อนทับชั้นข้อมูลแรสเตอร์แบบกำหนดค่าน้ำหนัก

จากภาพ ค่าจุดภาพของชั้นข้อมูล ผลลัพธ์เกิดจากการบวกค่าปัจจัยที่ถูกให้ค่าน้ำหนัก ทั้งนี้การกำหนดค่าอิทธิพลให้แก่ชั้นข้อมูลในการศึกษาต่างๆ จำเป็นต้องอาศัยข้อมูลที่ได้จากการค้นคว้าความสัมพันธ์ของปัจจัยที่จะมีผลต่องานวิจัยแต่ละประเภท เนื่องจากแต่ละการศึกษาค่าปัจจัยเดียวกันอาจมีน้ำหนักของอิทธิพลต่องานแตกต่างกัน จำเป็นต้องมีหลักการที่เหมาะสมสำหรับการกำหนดค่า

การสร้างแนวกันชน

หลักการวิเคราะห์ข้อมูลเชิงพื้นที่อีกประเภทที่นิยมใช้กันมากเช่นกัน คือ ฟังก์ชันการหาพื้นที่ใกล้เคียง (ใกล้ชิด) ของวัตถุ ซึ่งจัดอยู่ในกลุ่ม “ฟังก์ชันความใกล้เคียง (Neighborhood function)” ประเภทหนึ่ง ฟังก์ชันดังกล่าวนอกจากใช้ตอบคำถามว่าตำแหน่งไหนอยู่ที่ใดแล้ว ยังตอบได้ว่ามีสิ่งใดอยู่ใกล้กับวัตถุเป้าหมายอีกด้วย วิธีการของฟังก์ชันความใกล้เคียง ประกอบไปด้วย การคำนวณค่าที่อยู่ใกล้เคียง (Proximity computation) การคำนวณพื้นที่ส่วนที่ขยายออก (Spread computation) และการคำนวณเพื่อค้นหา (Seek computation) ในที่นี้จะกล่าวถึงเฉพาะวิธีการคำนวณค่าที่อยู่ใกล้เคียง สำหรับวิธีการคำนวณค่าที่อยู่ใกล้เคียงที่รู้จักกันดีคือการสร้างพื้นที่กันชน ซึ่งเป็นการสร้างพื้นที่ล้อมรอบตัวแทนข้อมูลเชิงพื้นที่ (จุด เส้น และอาณาบริเวณ) ด้วยระยะห่างตามที่กำหนด ผลที่ได้คือชั้นข้อมูลใหม่ที่แสดงระยะห่างออกจากลักษณะที่ระบุ นอกจากนั้นเรายังใช้พื้นที่กันชนเพื่อควบคุมความเสียดทานบนพื้นผิว (Friction surface) ภูมิประเทศ (Topography) ตัวกั้น (Barrier) และอื่นๆ ได้อีกด้วย การสร้างแนวกันชนสามารถกระทำได้กับข้อมูลที่เป็นเวกเตอร์ และแรสเตอร์ โดยมีลักษณะของพื้นที่แนวกันชนที่แตกต่างกันออกไป 3 รูปแบบ ดังต่อไปนี้

1) พื้นที่กันชนตามระยะทางที่กำหนด (At a specified distance หรือ Arbitrary buffer)

เป็นการกำหนดค่าคงที่สำหรับการสร้างระยะกันชน พื้นที่กันชนที่ถูกสร้างจะมีระยะทางออกจากวัตถุเป้าหมายเท่ากันในทุกทิศทาง โดยวัตถุที่เป็นอาณาบริเวณสามารถเลือกสร้างระยะกันชนเข้ามาในพื้นที่ (Set back) หรือออกจากพื้นที่ก็ได้ การสร้างแนวกันชนประเภทนี้นิยมใช้เพื่อกำหนดเขตควบคุมการระบาด หรือการสร้างรัศมีพื้นที่ออกจากเขตโรงงานอุตสาหกรรม

ภาพแสดงระยะกันชนตามระยะทางที่กำหนด
ภาพแสดงระยะกันชนตามระยะทางที่กำหนด

2) พื้นที่กันชนแปรผัน (At distance from an attribute field หรือ Variable buffer)

เป็นการสร้างระยะกันชนออกจากวัตถุเป้าหมาย โดยอาศัยค่าที่ระบุไว้ในเขตค่าซึ่งภายในชั้นข้อมูลเดียวกันผู้ศึกษาอาจต้องการให้มีระยะกันชนออกจากวัตถุเป้าหมายขนาดไม่เท่ากัน ยกตัวอย่างเช่น ในกรณีการแสดงพื้นที่เสี่ยงต่อเจือปนสารพิษ แต่ละจุดที่เป็นแหล่งกำเนิดมลพิษอาจมีระดับความเข้มข้นของสารที่กระจายออกมาไม่เท่ากัน ดังนั้นการแสดงระยะป้องกันจากแต่ละแหล่งกำเนิดจึงมีขนาดที่ไม่เท่ากัน

ภาพแสดงระยะกันชนโดยกำหนดระยะทางจากค่าในเขตค่าของข้อมูล
ภาพแสดงระยะกันชนโดยกำหนดระยะทางจากค่าในเขตค่าของข้อมูล

3) พื้นที่กันชนแบบวงแหวน (Multiple rings or Doughnut buffer)

เป็นการสร้างระยะกันชนออกจากวัตถุเป้าหมายหลายระดับในเวลาเดียวกัน ลักษณะของแนวกันชนประเภทนี้นิยมใช้เพื่อทดสอบระยะที่เหมาะสมของข้อมูลก่อนดำเนินการวิเคราะห์พื้นที่จริง

ภาพแสดงการสร้างระยะกันชนแบบวงแหวน
ภาพแสดงการสร้างระยะกันชนแบบวงแหวน

 

นอกเหนือจากลักษณะพื้นที่กันชน 3 ลักษณะที่กล่าวมานี้แล้ว ยังมีวิธีสร้างพื้นที่กันชนที่แตกต่างออกไปอีก อาทิเช่น วิธีการทำพื้นที่กันชนตามสาเหตุของปัญหา (A causative buffer) ซึ่งเป็นแนวกันชนที่สร้างขึ้นโดยอาศัยความรู้พื้นฐานของผู้ศึกษาที่มีต่อวัตถุเป้าหมาย ยกตัวอย่างเช่น การแสดงแนวเขตการกระจายของมลภาวะทางอากาศจากโรงงานอุตสาหกรรม ซึ่งทิศทางการเคลื่อนที่ของสารพิษขึ้นกับปัจจัยลม และความเข้มข้นของสารพิษ จึงมีรูปแบบการกระจายตัวออกจากแหล่งกำเนิดไม่เท่ากันในทุกทิศทาง ดังนั้นการแสดงพื้นที่กระจายสารพิษจึงต้องคำนึงถึงปัจจัยทิศทางลมร่วมด้วย ทำให้แนวกันชนที่สร้างมีรูปร่างไม่สมมาตร

วิธีแนวกันชนวัดได้ (Measurable buffer) สร้างระยะกันชนโดยอาศัยลักษณะปรากฏการณ์จริงที่วัดได้ระยะกันชนที่สร้างจึงสมเหตุสมผลมากกว่าการกำหนดระยะคงที่เพียงอย่างเดียว ตัวอย่างเช่น กรณีต้องการวิเคราะห์ความสัมพันธ์เชิงพื้นที่ระหว่างปริมาณสารพิษที่ปนเปื้อนในแม่น้ำโดยเฉพาะการปนเปื้อนในบริเวณริมฝั่ง เนื่องจากเราทราบว่าต้นไม้มีความสามารถในการกรองสารพิษได้ และการกรองสารพิษจะดียิ่งขึ้นหากมีต้นไม้ในพื้นที่มาก ดังนั้นจึงได้ตรวจวัดความหนาแน่นของพืชพรรณที่มีอยู่รอบแหล่งน้ำแล้วแบ่งระดับความหนาแน่นออกเป็นกลุ่ม ความแตกต่างของกลุ่มความหนาแน่นจะเป็นเสมือนแนวที่กั้นระหว่างพื้นที่เพื่อแบ่งระดับการวิเคราะห์ให้สอดคล้องกับสภาพปรากฏการณ์จริง

  1. การประมาณค่าในช่วงเชิงพื้นที่ (Spatial interpolation)

เป็นการพยากรณ์แนวโน้มความเปลี่ยนแปลงที่ยังไม่เกิดขึ้น ในที่นี้รวมไปถึงการประมาณค่าข้อมูลที่ขาดหายไป (มีข้อมูลไม่เพียงพอ) การประมาณค่าดังกล่าวนอกจากใช้เพื่อวิเคราะห์หาค่าที่สูญหายไปแล้ว ยังใช้เพื่อจำลองความสัมพันธ์ระหว่างข้อมูล จึงพบว่ามีการใช้วิธีประมาณค่ากับข้อมูลหลายประเภท ดังตัวอย่างต่อไปนี้

– ลักษณะภูมิประเทศ เช่น แบบจำลองความสูงเชิงพื้นที่ ความลาดชัน และทิศทางความลาดชัน

– ด้านประชากร เช่น แนวโน้มการกระจายตัวของประชากร

– ด้านเศรษฐกิจ เช่น การพยากรณ์ทิศทางการลงทุนในอนาคต

– ข้อมูลภูมิอากาศ เช่น การกระจายตัวของฝน อุณหภูมิ และความชื้นสัมพัทธ์ เป็นต้น

แม้จะมีการประยุกต์ใช้วิธีประมาณค่าเชิงพื้นที่เพื่อประโยชน์ที่แตกต่างกันออกไป แต่โดยทั่วไปวิธีการดังกล่าวมีความหมายและแนวคิดที่คล้ายคลึงกันในการวิเคราะห์ อธิบายความหมายของการประมาณค่าเชิงพื้นที่ได้ว่า

การประมาณค่าเชิงพื้นที่ คือ “วิธีการทำนายค่าของพื้นที่ในตำแหน่งที่ข้อมูลมีไม่เพียงพอ โดยใช้ค่าข้อมูลที่อยู่ข้างเคียง” ความถูกต้องของการประมาณค่าขึ้นอยู่กับจำนวนและการกระจายตัวของเซลล์ที่ทราบค่ารวมทั้งสมการหรือฟังก์ชันทางคณิตศาสตร์ที่นำมาใช้ อย่างไรก็ตามการประมาณค่าโดยทั่วไปมีหลักในการดำเนินการที่คล้ายคลึงกันคือ จะอนุมานว่า “จุดที่อยู่ใกล้กันทางพื้นที่มักมีค่าคุณสมบัติที่สนใจคล้ายคลึงกันมากกว่าจุดที่อยู่ไกลออกไป”

ภาพการกระจายตัวของข้อมูลลักษณะต่างๆ
ภาพการกระจายตัวของข้อมูลลักษณะต่างๆ

การแสดงลักษณะของพื้นผิวจากการประมาณค่าโดยทั่วไปนิยมแสดง 3 ลักษณะ คือ

– เส้นชั้นความสูง (Contour or Isoline)

– โครงข่ายสามเหลี่ยมไม่สม่ำเสมอ (Triangulated Irregular Network : TIN)

– แบบจำลองความสูงเชิงตัวเลข (Digital Elevation Model: DEM)

ในบางครั้งมีการเรียกลักษณะพื้นผิวเหล่านี้โดยรวมว่า “แบบจำลองลักษณะภูมิประเทศเชิงตัวเลข (Digital Terrain Model : DTM)” อธิบายความแตกต่างของพื้นผิวแต่ละชนิดดังต่อไปนี้

 เส้นชั้นความสูง : เป็นเส้นที่ลากผ่านจุดที่มีระดับความสูงเท่ากันช่วงความสูงของพื้นที่ที่แตกต่างกันจึงถูกแสดงด้วยเส้นหลายเส้น ทั่วไปนิยมใช้วิธีการนี้ทำข้อมูลแผนที่ระดับความสูงและการแสดงค่าทางอุตุนิยมวิทยา เช่น อุณหภูมิ ความชื้นสัมพัทธ์ หรือปริมาณน้ำฝน เป็นต้น

006

TIN : เป็นโครงสร้างข้อมูลเวกเตอร์ที่เกิดจากการแสดงลักษณะพื้นผิวด้วยรูปสามเหลี่ยมหลายรูปซึ่งมีด้านประชิดกัน (ไม่มีการซ้อนทับ) และใช้จุดยอดร่วมกันเรียงต่อเนื่องกันไป โดยที่แต่ละจุดยอดมีค่า (x,y,z) จัดเก็บไว้ จุดยอดของสามเหลี่ยมเหล่านี้จะกระจายตัวไม่สม่ำเสมอ พื้นที่ที่มีความแตกต่างของค่า Z มากๆ จุดจะอยู่ใกล้กัน แต่พื้นที่ที่มีค่า Z ไม่แตกต่างกัน จุดจะอยู่ห่างกัน นิยมใช้พื้นผิว TIN แสดงลักษณะภูมิประเทศ และวิเคราะห์ความลาดชัน ทิศลาดเขา และปริมาตร (Volume)007

DEM : มีลักษณะเป็นตารางกริดที่มีขนาดเท่ากันเรียงตัวต่อเนื่องครอบคลุมทั้งพื้นที่ ค่าประจำกริดคือ ค่า Z ดังนั้นค่า Z ในพื้นที่จึงมีการกระจายตัวอย่างสม่ำเสมอ

008

* หมายเหตุ กระบวนการประมาณค่าคุณสมบัติในจุดที่ไม่ถูกสุ่มตัวอย่าง ภายในบริเวณที่มีจุดสำรวจครอบคลุมอยู่เรียกว่า “การประมาณค่าในช่วง (Interpolation)” การประมาณค่าของคุณสมบัติตรงจุดตำแหน่งที่อยู่นอกพื้นที่ที่มีการสำรวจเรียกว่า “การประมาณค่านอกช่วง (Extrapolation)”

1) วิธีการประมาณค่าในช่วง มี 2 ประเภท คือ การประมาณค่าในช่วงแบบไม่ต่อเนื่อง (Discrete interpolation) และการประมาณค่าในช่วงแบบต่อเนื่อง (Continuous interpolation)

– การประมาณค่าในช่วงแบบไม่ต่อเนื่อง

เป็นการประมาณค่าในช่วงโดยเขียนแทนด้วยเส้นแนวเขต มีลักษณะคล้ายกับการแสดงแผนที่โคโรเพลท ข้อมูลที่อยู่ในแนวเขตเดียวกันจะมีค่าเท่ากันเมื่อนำไปสร้างเป็นแบบจำลองจะแสดงให้เห็นเป็นขั้นบันไดวิธีการประมาณค่าแบบไม่ต่อเนื่อง เช่น การใช้วิธีรูปหลายเหลี่ยมทิสเสน (Thiessen polygon)

  • วิธีรูปหลายเหลี่ยมทิสเสน บางครั้งอาจเรียกว่าแผนภาพรูปหลายเหลี่ยมโวโรนอย (Voronoi diagram) หรือช่องกริดดิลิกเก็ต (Dirichlet diagram) เป็นการสร้างอาณาบริเวณขึ้นรอบจุดค่าตัวอย่างแต่ละจุดเพื่อแสดงเขตที่ค่าจุดนั้นมีอิทธิพลถึง กล่าวคือทุกตำแหน่งที่อยู่ในเขตพื้นที่จะมีค่าใกล้เคียงกับค่าจุดตัวอย่างที่เป็นตัวแทนการประมาณค่าพื้นที่นั้น มากกว่าจุดที่อยู่นอกเขตพื้นที่ออกไป วิธีการประมาณค่าแบบนี้นิยมใช้กับการวิเคราะห์ข้อมูลภูมิอากาศ อาทิเช่น ปริมาณน้ำฝน จากสถานีที่มีการกระจายตัวอยู่อย่างไม่สม่ำเสมอ นอกจากนั้นยังสามารถใช้แสดงเขตพื้นที่การค้า โรงงานอุตสาหกรรม และอื่นๆ

จากภาพ ขั้นตอนที่ 1 สร้างโครงข่ายสามเหลี่ยมจากสถานที่อยู่ใกล้เคียงกัน โดยให้ขอบเขตของรูปหลายเหลี่ยมมีระยะห่างจากจุดที่อยู่ใกล้ที่สุดเท่าๆ กัน ขั้นตอนที่ 2 ลากเส้นตั้งฉากแบ่งครึ่งแต่ละด้านของสามเหลี่ยมเกิดเป็นเขตพื้นที่ซึ่งสามารถใช้ประเมินข้อมูลพื้นที่ที่ไม่มีการบันทึกข้อมูลได้

ภาพการประมาณค่าในช่วงเชิงพื้นที่ด้วยวิธีรูปหลายเหลี่ยมทิสเสน
ภาพการประมาณค่าในช่วงเชิงพื้นที่ด้วยวิธีรูปหลายเหลี่ยมทิสเสน

ข้อจำกัด

  1. ขนาดและรูปร่างของเขตพื้นที่จะขึ้นกับการกระจายของจุด ดังนั้นบริเวณที่มีจุดตัวอย่างมากจะมีขนาดพื้นที่เล็กแต่จะมีพื้นที่กว้างเมื่อจุดกระจายตัวห่างกัน
  2. พื้นที่จากการประมาณแต่ละเขตได้จากค่าข้อมูลเพียงค่าเดียว
  3. พื้นผิวที่ได้จากการประมาณมีค่าไม่ต่อเนื่องกัน (Discrete surface)

– การประมาณค่าในช่วงแบบต่อเนื่อง

เป็นวิธีการประมาณค่าในช่วงที่ผนวกเอาแนวคิดการเปลี่ยนแปลงอย่างค่อยเป็นค่อยไปของพื้นที่กล่าวคือวิธีการประมาณค่าในช่วงแบบต่อเนื่องสามารถนิยามด้วยพื้นผิวเชิงคณิตศาสตร์เพื่อให้ได้พื้นผิวที่มีความต่อเนื่องกัน (Continuous surface) สามารถแบ่งออกเป็น ประมาณค่าในช่วงจากข้อมูลวงกว้าง หรือทั้งหมด (Global/Whole interpolation) และการประมาณค่าในช่วงข้อมูลเฉพาะที่ (Local interpolation)

ตารางแสดงลักษณะ การประมาณค่าแบบข้อมูลวงกว้าง และแบบช่วงข้อมูลเฉพาะที่

24

วิธีการประมาณค่าในช่วงประเภทต่างๆ แสดงดังรายละเอียดต่อไปนี้

  • การวิเคราะห์พื้นผิวแนวโน้ม

เป็นวิธีการประมาณค่าในช่วงที่ง่ายที่สุด ใช้แสดงความแปรผันของข้อมูลอย่างกว้างๆ โดยอาศัยสมการถดถอยเชิงพหุนามมีแนวคิด คือ การปรับเส้นหรือพื้นผิวพหุนามให้สอดคล้องกับจุดข้อมูล คล้ายการทาบแผ่นกระดาษให้อยู่ในแนวที่ผ่านจุดข้อมูลทุกจุด (การ Fitting)

ภาพแสดงแนวคิดการวิเคราะห์พื้นผิวแนวโน้ม
ภาพแสดงแนวคิดการวิเคราะห์พื้นผิวแนวโน้ม

เส้นถดถอยจะถูกลากในแนวที่ผลรวมของกำลังสอง Σ(Zi-Zi)2 มีค่าน้อยที่สุด ดังภาพด้านซ้ายเส้นประสีดำเปรียบเสมือนแผ่นกระดาษราบที่วางตัวผ่านจุดที่เหมาะสมที่สุดของชุดข้อมูลดังนั้นค่าที่ได้จากการประมาณจะมีค่ามากกว่าหรือน้อยกว่าความเป็นจริง

จากภาพหากสามารถปรับเส้นตรงที่ลากผ่านจุดข้อมูลให้มีความโค้งตามแนวค่าข้อมูลได้ก็จะทำให้แสดงความถูกต้องของผลการประมาณได้มากขึ้น อย่างไรก็ตามเราสามารถใช้สมการพหุนามอันดับที่สูงขึ้นสำหรับการเขียนกราฟที่เข้ากับการกระจายข้อมูลที่ไม่เป็นเส้นตรง

ภาพแสดงลักษณะพื้นผิวที่ได้จากการประมาณพหุนามระดับต่างๆ
ภาพแสดงลักษณะพื้นผิวที่ได้จากการประมาณพหุนามระดับต่างๆ

การวิเคราะห์พื้นผิวแนวโน้มจะใช้สำหรับ

– แสดงการเปลี่ยนแปลงพื้นผิวจากบริเวณที่สนใจสู่บริเวณอื่น ดังเช่น ลักษณะการกระจายตัวของสารมลภาวะจากปล่องควันในโรงงานอุตสาหกรรม

– ใช้พิจารณาเพื่อลดผลกระทบของแนวโน้มวงกว้าง (Global trend) ก่อนทำการประมาณค่าจริง

  • อนุกรมฟูเรียร์

เป็นการบรรยายความแปรผันของพื้นที่ใน 1 หรือ 2 มิติ โดยจำลองความแปรผันที่สังเกตด้วยการใช้คลื่นไซน์ และโคไซน์เชิงเส้นตรงร่วมกัน อนุกรมฟูเรียร์มิติเดียวถูกใช้วิเคราะห์อนุกรมเวลา และศึกษาการเปลี่ยนแปลงด้านภูมิอากาศบางประการ ส่วนอนุกรมฟูเรียร์สองมิติได้รับการพิสูจน์ว่ามีประโยชน์สำหรับการศึกษาธรณีวิทยาชั้นตะกอน อย่างไรก็ตามพบว่าลักษณะพื้นผิวส่วนใหญ่ของโลกมีความซับซ้อนเกินกว่าจะแสดงความแปรผันอย่างสม่ำเสมอได้ ยกเว้นความแปรผันที่เกิดจากการกระทำของมนุษย์ ดังนั้นจึงไม่ค่อยนิยมใช้วิธีการอนุกรมฟูเรียร์ในการประมาณค่า

ภาพแสดงตัวอย่างลักษณะของอนุกรมฟูเรียร์
ภาพแสดงตัวอย่างลักษณะของอนุกรมฟูเรียร์
  • วิธีค่าเฉลี่ยเคลื่อนที่

เป็นการประมาณค่าโดยใช้หลักการที่ว่า “ค่าสังเกตของตำแหน่งที่อยู่ใกล้กันย่อมมีแนวโน้มของค่าใกล้เคียงกันมากกว่าตำแหน่งที่อยู่ไกลกันออกไป” พื้นผิวที่ได้จากการประมาณค่าจะขึ้นกับฟังก์ชันหรือตัวแปรเสริม (Parameter) ของฟังก์ชันที่ใช้และโดเมนที่จุดข้อมูลตัวอย่างถูกดึงมา วิธีการค่าเฉลี่ยเคลื่อนที่เป็นกลวิธีเพื่อทำให้พื้นผิวเรียบ ซึ่งค่าต่ำสุด-สูงสุดบนผิวหน้าที่ได้จากการประมาณค่าจะมีค่าไม่เกินค่า Z-value ของข้อมูลที่นำมาประมาณค่าถือเป็นการประมาณค่าที่มีความแม่นตรง (Exact interpolators)

การคำนวณค่า ณ ตำแหน่งที่ต้องการจึงต้องคำนึงถึงตำแหน่งของข้อมูล โดยให้น้ำหนักของข้อมูลตำแหน่งที่อยู่ใกล้มากกกว่าตำแหน่งที่อยู่ไกลออกไป วิธีการคำนวณค่าน้ำหนักสามารถกระทำได้ 2 วิธี คือ การคำนวณค่าระยะทางกลับโดยน้ำหนัก (Inverse Distance Weighting : IDW) และวิธีการลดลงเชิงเส้น (Linear decrease)

 

ค่าระยะทางกลับโดยน้ำหนัก

อนุมานว่าตำแหน่งที่ต้องการประมาณค่าจะได้รับอิทธิพลจากข้อมูลที่อยู่ใกล้ (Local influence) มากกว่าค่าที่อยู่ไกลออกไป มีรูปสมการทั่วไป ดังต่อไปนี้

010

Ẑ(s0) คือ ค่าที่ ณ ตำแหน่งที่ต้องการทำนาย

N คือ จำนวนจุดตัวอย่างที่อยู่รอบตำแหน่งที่ต้องการทำนายค่า

λ คือ น้ำหนักที่กำหนดให้กับค่าที่วัด

Z(si) คือ ค่าสังเกตุที่ตำแหน่ง si

 

เราสามารถควบคุมจุดที่มีนัยสำคัญต่อการประมาณค่าโดยการกำหนดค่ายกกำลัง (Power) ซึ่งการกำหนดค่าเลขยกกำลังสูงๆ จะเป็นการเน้นย้ำให้เลือกใช้ค่าที่อยู่ใกล้จุดมากที่สุด ส่งผลให้พื้นผิวจากการประมาณมีความเรียบน้อยลง (Less smooth) ต่างจากการกำหนดค่ายกกำลังน้อยๆ ที่ให้พื้นผิวจากการประมาณเรียบมากกว่า

หมายเหตุ

– วิธี IDW จะทำงานได้ดีที่สุดหากข้อมูลมีการกระจายตัวหนาแน่น

– การประมาณค่าจะไม่คำนึงถึงแนวโน้ม (Trend) หรืออิทธิพลของปัจจัยอื่นที่มีต่อข้อมูล

– จะไม่มีค่าที่ประมาณได้มากกว่า หรือน้อยกว่าข้อมูลตั้งต้น

– สามารถลดปัญหาการเลือกจำนวนจุดประมาณค่าด้วยการกำหนด จำนวนของจุด (Number of points) และรัศมีพื้นที่ (Sample size radius)

– สามารถป้องกันผลการประมาณค่าเกินขอบเขตที่ต้องการด้วยการกำหนดตัวกั้นของการประมาณค่าในช่วง (Interpolation barrier)

009

  • ฟังก์ชันกระดูกงู

ฟังก์ชันนี้เป็นลักษณะของการประมาณค่าต่อกันเป็นช่วงที่สามารถปรับให้สอดคล้องกับจุดข้อมูลจำนวนไม่มากได้ คล้ายกับการตรึงแผ่นยาง (Rubber sheet) ผ่านจุดข้อมูลที่ทราบค่า ผลที่เกิดจากการตรึงค่าดังกล่าวทำให้ได้ค่าจากการประมาณสูง-ต่ำเกินกว่าค่าตั้งต้น แต่จะต้องผ่านจุดที่เป็นค่าตั้งต้น ด้วยเหตุนี้จึงนิยมใช้ฟังก์ชันกระดูกงูเพื่อประมาณค่าต่ำสุด และสูงสุดที่เกินจากความเป็นจริง เช่น การค้นหาสายแร่ เป็นต้น

ฟังก์ชันกระดูกงูสามารถแบ่งออกเป็น 2 ชนิด คือ Tension และ Regularized พื้นผิวที่ได้จากการใช้ฟังก์ชันกระดูกงูชนิด Tension ค่อนข้างเรียบกว่าชนิด Regularized อาจกล่าวได้ว่าการประมาณค่าด้วยฟังก์ชันกระดูกงูชนิด Tension จะมีความยืดหยุ่นของพื้นผิวที่ได้น้อยกว่า ทั้งนี้ข้อดีของวิธีฟังก์ชันกระดูกงู คือ สามารถประมาณค่าออกนอกช่วงค่าข้อมูลที่มีอยู่ได้

010

ภาพแนวคิดการประมาณค่าด้วยวิธีฟังก์ชันกระดูกงู
ภาพแนวคิดการประมาณค่าด้วยวิธีฟังก์ชันกระดูกงู
ภาพตัวอย่างพื้นผิวที่ถูกประมาณด้วย Spline (Regularized) มุมมอง 2 มิติ
ภาพตัวอย่างพื้นผิวที่ถูกประมาณด้วย Spline (Regularized) มุมมอง 2 มิติ
ภาพตัวอย่างพื้นผิวที่ถูกประมาณด้วย Spline (Tension) มุมมอง 3 มิติ
ภาพตัวอย่างพื้นผิวที่ถูกประมาณด้วย Spline (Tension) มุมมอง 3 มิติ
ภาพตัวอย่างพื้นผิวที่ถูกประมาณด้วย Spline (Tension) มุมมอง 2 มิติ
ภาพตัวอย่างพื้นผิวที่ถูกประมาณด้วย Spline (Tension) มุมมอง 2 มิติ

ข้อจำกัด

– หากจุดตัวอย่างอยู่ใกล้กัน และมีความแตกต่างของค่ามากผลการประมาณค่าจะให้ผลลัพธ์ที่ไม่ดีนัก

– ปรากฏการณ์ที่เป็นสาเหตุให้ค่าพื้นผิวจากการคำนวณเปลี่ยนอย่างรวดเร็ว เช่น ลักษณะของหน้าผา หรือบริเวณแนวรอยเลื่อนของพื้นผิว จะไม่สามารถแสดงผลได้ดีเท่าที่ควร

  • คริกิง (Kriging)

เป็นตัวประมาณค่าที่ให้ค่าการประมาณที่ค่อนข้างแม่นยำ ผลการประมาณที่ดีที่สุดจะมีค่าตรงกับข้อมูลตั้งต้น วิธีการคริกิงมีความคล้ายคลึงกับวิธีส่วนกลับระยะทางตรงที่เป็นการประมาณค่าด้วยเทคนิคค่าเฉลี่ยถ่วงน้ำหนัก (Weight average technique) จากจุดข้อมูลที่อยู่รอบตำแหน่งที่ต้องการทำนายค่า แต่จะมีสมการคำนวณที่อ้างเหตุผลทางคณิตศาสตร์มากกว่า วิธีคริกิงอาศัยการวัดระยะห่างของจุดข้อมูลทุกคู่ (Pairs of sample point) เพื่อแสดงความสัมพันธ์ระหว่างกันเชิงพื้นที่ (Spatial autocorrelation) โดยใช้แบบจำลองเซมิแวริโอแกรม (Semivariogram)

1(457)

ภาพแนวคิดการประมาณค่าคริกิง
ภาพแนวคิดการประมาณค่าคริกิง

1(459)

ภาพลักษณะการเปรียบเทียบคู่ข้อมูลในการประมาณค่าด้วยเซมิเวริโอแกรม
ภาพลักษณะการเปรียบเทียบคู่ข้อมูลในการประมาณค่าด้วยเซมิเวริโอแกรม

เนื่องจากการประมาณค่าคริกิงใช้หลักการเดียวกับการประมาณค่าวิธีอื่นๆ คือ สิ่งที่อยู่ใกล้กันจะมีความคล้ายคลึงกันมากกว่าสิ่งที่อยู่ห่างออกไป ดังนั้นเมื่อคู่ระยะห่างของข้อมูลถูกแสดงในเซมิเวริโอแกรม(จุดสีแดง 1 จุด แทนระยะทางระหว่างจุดข้อมูล 1 คู่) ดังนั้นจึงพบว่าจุดที่อยู่ใกล้กัน (ระยะห่างตามแกน X น้อย) ค่าความแปรปรวนที่แสดงในเซมิเวริโอแกรม (แกน Y) จะมีค่าน้อย โดยทั่วไปเมื่อแสดงกราฟเซมิเวริโอแกรมแล้วผู้วิเคราะห์จะพิจารณาองค์ประกอบดังต่อไปนี้

Sill คือ ค่าเซมิเวริโอแกรมสูงสุดที่ไม่เปลี่ยนแปลงอีกแม้ระยะทางเพิ่มขึ้น แสดงว่าความสัมพันธ์ระหว่างข้อมูล ณ ตำแหน่งนี้เป็นต้นไป ค่าความแปรปรวนของความแตกต่างทุกค่าไม่แปรผันตามระยะทางระหว่างจุดข้อมูล

Nugget คือ ค่าเซมิเวริโอแกรมที่ระยะทาง 0 (เป็นค่าที่แสดง Independent error ของชุดข้อมูล)

Range คือ ระยะทางตามแนวแกน X จากตำแหน่งที่มีค่าเซมิเวริโอแกรมต่ำสุดกระทั่งมีค่าสูงสุด (ตำแหน่ง Sill) ดังนั้นช่วงระยะ Range จะแสดงให้ทราบว่าช่วงระยะห่างเท่าใดของจุดข้อมูลที่ค่าความแตกต่างของจุดข้อมูลขึ้นกับระยะทาง

ภาพแนวคิดการประมาณค่าคริกิง
ภาพแนวคิดการประมาณค่าคริกิง
ที่มา : Using ArcGIS Geostatistical Analyst (ESRI, 2001)

การทำนายค่าด้วยวิธีคริกิงถูกนำไปใช้กับงานหลายสาขา อาทิเช่น ด้านวิทยาศาสตร์สุขภาพ ด้านธรณีเคมี (Geochemistry) ด้านอุตุนิยมวิทยา และแบบจำลองสารมลภาวะในอากาศ เป็นต้น วิธีคริกิงที่นิยมใช้กันอย่างแพร่หลาย ประกอบไปด้วย Ordinary kriging และ Universal kriging โดย

Ordinary kriging : ทำการประมาณค่าโดยสมมติว่าชุดข้อมูลปราศจากอิทธิพลของ Trend

Universal kriging : ทำการประมาณค่าโดยสมมติว่าชุดข้อมูลมี Trend อยู่

ภาพแสดงลักษณะพื้นผิวที่ได้จากการประมาณค่าด้วยวิธีคริกิง
ภาพแสดงลักษณะพื้นผิวที่ได้จากการประมาณค่าด้วยวิธีคริกิง

หมายเหตุ

– พื้นผิวที่ถูกประมาณจากวิธีคริกิงอาจมีค่าสูงหรือต่ำกว่าค่าเริ่มก็ได้

– การประมาณค่าด้วยวิธีคริกิงจะให้ผลที่เหมาะสมก็ต่อเมื่อข้อมูลที่นำมาใช้ถูกสุ่มมาด้วยกระบวนการเฟ้นสุ่ม (A stationary stochastic process) และข้อมูลมีการกระจายตัวอย่างปกติ(Normal distribution)

– หากข้อมูลไม่ได้มีการกระจายตัวอย่างปกติ และผลการวิเคราะห์เซมิเวริโอแกรมแล้วแสดงการกระจายข้อมูลไม่ดีพอ ไม่ควรเลือกประมาณค่าด้วยวิธีคริกิง

– ข้อดีของวิธีคริกิง คือ เป็นวิธีที่สามารถแสดงค่าความคลาดเคลื่อนจากการทำนายค่าได้ ในขณะที่วิธีอื่นไม่สามารถทำได้

จากวิธีการประมาณค่าที่ได้กล่าวถึงข้างต้นเปรียบเทียบความแตกต่างของพื้นผิวที่ประมาณค่าได้จากวิธีสามเหลี่ยมทิสเสน TIN ส่วนกลับระยะทาง ฟังก์ชันกระดูกงู และคริกิง ที่ได้จากชุดข้อมูลจุดตัวอย่างเดียวกันดังภาพ

ภาพแสดงการเปรียบเทียบลักษณะพื้นผิวจากการประมาณค่าด้วยวิธีต่างๆ ที่มา : ภาพจากเว็บไซต์ http://skagit.meas.ncsu.edu/
ภาพแสดงการเปรียบเทียบลักษณะพื้นผิวจากการประมาณค่าด้วยวิธีต่างๆ
ที่มา : ภาพจากเว็บไซต์ http://skagit.meas.ncsu.edu/

1(467)

กราฟแสดงลักษณะความแตกต่างของพื้นผิวที่ได้จากตัวประมาณค่าท้องถิ่น (Local interpolator) ประเภท IDW Spline และ Kriging จะพบว่าวิธี IDW ค่าที่ได้จะไม่เกินกว่าค่าตั้งต้นในการประมาณ เป็นวิธีการที่เหมาะกับการประมาณปรากฏการณ์ที่มีการกระจายตัวของค่าข้อมูลขึ้นกับระยะทาง ส่วนวิธี Spline ผลจากการประมาณจะได้พื้นผิวเรียบโค้ง ซึ่งอาจได้ค่าสูงหรือต่ำเกินกว่าค่าเริ่มต้น แต่การประมาณพื้นผิวจะต้องผ่านจุดทุกจุดของค่าเริ่มต้น ในขณะที่วิธี Kriging เป็นวิธีประมาณค่าที่ซับซ้อนมาก พื้นผิวที่ได้จากการประมาณค่าอาจมีค่าสูงหรือต่ำกว่าค่าจริงแต่จะให้ค่าที่

วิธี

ลักษณะแบบจำลอง ผลลัพธ์ที่ได้ ระยะเวลาคำนวณ ลักษณะประมาณค่า ข้อดี

ข้อเสีย

Globalpolynomial แบบจำลองเชิงกำหนด พื้นผิวจากการ เร็ว Inexact ตัวแปรเสริมน้อย ไม่สามารถประเมินผลการทำนาย และค่าคลาดเคลื่อน ได้ และบางครั้งได้ค่าเกินความเป็นจริง
Localpolynomial แบบจำลองเชิงกำหนด พื้นผิวจากการ ปานกลาง Inexact ตัวแปรเสริมมาก ไม่สามารถประเมินผลการทำนายและค่าคลาดเคลื่อนได้
IDW แบบจำลองเชิงกำหนด พื้นผิวจากการ เร็ว Exact ตัวแปรเสริมน้อย ไม่สามารถประเมินผลการทำนายและค่าคลาดเคลื่อนได้และอาจพบปัญหาฟองกลม(Bulls eyes) รอบจุดตัวอย่าง
Spline แบบจำลองเชิงกำหนด พื้นผิวจากการ ปานกลาง Inexact ยืดหยุ่น ไม่สามารถประเมินผลการทำนายและค่าคลาดเคลื่อนได้
Kriging เฟ้นสุ่ม(Stochastic) -พื้นผิวจากการทำนาย- แสดงค่าผิดพลาด

– แสดงค่าความ

น่าจะเป็น

ปานกลางถึงช้า Exact/Inexact ยืด ห ยุ่ น สูงสามารถประเมินค่าสหสัมพันธ์

ของจุดข้อมูล,

ค่าคลาดเคลื่อน

ของปัจจัย และ

ผลการประมาณ

ค่าได้

ต้องผ่านการวิเคราะห์หลายขั้นตอนและข้อมูลต้องมีการแจกแจงแบบปกติ

 

ที่มา : ตำราเทคโนโลยีอวกาศและภูมิสารสนเทศศาสตร์