Page 45 - รายงานการประยุกต์ใช้ฐานข้อมูลการสำรวจระยะไกลจากซอฟต์แวร์รหัสเปิดและคลาวด์คอมพิวติงเพื่องานพัฒนาที่ดิน Utilization of Remote Sensing Database derived from Open-source software and Cloud computing platform for Land Development
P. 45
ห้องสมุดกรมพัฒนาที่ดิน
37
ต าแหน่งของจุดศูนย์กลางของการจัดกลุ่มในพื้นที่ของข้อมูล จากจุดศูนย์กลางจะมีการค านวณระยะทาง
จากจุดข้อมูลต่าง ๆ มายังจุดศูนย์กลางโดยจะก าหนดให้ข้อมูลถูกจัดกลุ่มอยู่กับจุดศูนย์กลางที่มีระยะทาง
ใกล้ที่สุดเท่านั้นโดยค านวณระยะทางนั้นทั้งหมดของข้อมูลแต่ละจุดมายังจุดศูนย์กลางแล้วเก็บค่าไว้
เปลี่ยนจุดศูนย์กลางและท าซ้ าจนกระทั้งได้ระยะทางรวมน้อยที่สุด algorithm จะสุ่มวางเมื่อพบว่าไม่
สามารถพัฒนาการจัดกลุ่มให้ได้ดีมากกว่านี้แล้ว algorithm จะหยุดวนลูปทันที ดังนั้นแต่ละครั้งที่สร้าง
clustering model แม้ว่าให้จ านวนชุดเท่าเดิมแต่ผลที่ได้อาจจะไม่เหมือนเดิม K-mean เป็นหนึ่งใน
อัลกอริธึมการเรียนรู้แบบไม่มีผู้ดูแลที่ง่ายที่สุดที่ใช้แก้ปัญหาที่รู้จักกันดี ปัญหาการรวมกลุ่ม ขั้นตอนนี้
เป็นไปตามวิธีที่ง่ายและสะดวกในการจ าแนกชุดข้อมูลที่ก าหนดผ่านคลัสเตอร์จ านวนหนึ่ง (สมมติ k คลัส
เตอร์) แก้ไขล าดับความส าคัญ แนวคิดหลักคือการก าหนด k centroids หนึ่งตัวส าหรับแต่ละคลัสเตอร์
เซนทรอยด์เหล่านี้ควรวางอย่างมีไหวพริบเพราะสถานที่ต่างกันท าให้เกิดผลลัพธ์ที่แตกต่างกัน ดังนั้น
ทางเลือกที่ดีกว่าคือวางไว้เท่าๆ อาจอยู่ห่างไกลกัน ขั้นตอนต่อไปคือการใช้แต่ละจุดที่เป็นของข้อมูลที่
ก าหนดตั้งค่าและเชื่อมโยงกับเซนทรอยด์ที่ใกล้ที่สุด เมื่อไม่มีประเด็นใดค้างอยู่ แสดงว่าขั้นตอนแรกเสร็จ
สิ้นและจัดกลุ่มก่อนก าหนด ณ จุดนี้ เราจ าเป็นต้องค านวณ k centroid ใหม่อีกครั้งเป็น barycenters
ของคลัสเตอร์ที่เกิดจากขั้นตอนที่แล้ว หลังจากที่เรามีเซนทรอยด์ใหม่ k เหล่านี้แล้วต้องท าการเชื่อมโยง
ใหม่ระหว่างจุดชุดข้อมูลเดียวกันและเซนทรอยด์ใหม่ที่ใกล้ที่สุด สร้างลูปแล้ว จากผลของลูปนี้ เราอาจ
สังเกตเห็นว่า k centroids เปลี่ยนไปสถานที่ทีละขั้นตอนจนกว่าจะไม่มีการเปลี่ยนแปลงอีก กล่าวอีกนัย
หนึ่งว่าเซนทรอยด์ไม่เคลื่อนไหวใดๆ
2) การจ าแนกประเภทที่ไม่มีผู้ดูแลแบบ ISODATA
เทคนิคการจ าแนกประเภทที่ไม่มีผู้ดูแลแบบ ISODATA เป็นการวิเคราะห์ข้อมูล
การจัดระเบียบตนเองแบบวนซ้ า สดงถึงความครอบคลุมชุดขั้นตอนวิธีฮิวริสติกที่รวมอยู่ในอัลกอริทึมการ
จัดหมวดหมู่แบบวนซ้ าหลายขั้นตอนที่รวมอยู่ในอัลกอริทึมเป็นผลมาจากประสบการณ์ที่สั่งสมมา การ
ทดลองอัลกอริทึม ISODATA เป็นการดัดแปลงอัลกอริทึมการจัดกลุ่มค่า k-mean ซึ่งรวมถึง การรวมคลัส
เตอร์หากระยะห่างของคลัสเตอร์ในพื้นที่คุณลักษณะหลายสเปกตรัมต่ ากว่าผู้ใช้เกณฑ์ที่ก าหนดและ กฎ
ส าหรับการแบ่งคลัสเตอร์เดียวออกเป็นสองคลัสเตอร์ ISODATA เป็นแบบวนซ้ า เนื่องจากท าให้การ
ส่งผ่านข้อมูลระยะไกลเป็นจ านวนมาก ชุดข้อมูลจนกว่าจะได้ผลลัพธ์ที่ระบุ แทนที่จะผ่านเพียงสองครั้ง
ISODATA ไม่จัดสรรเวกเตอร์ค่าเฉลี่ยเริ่มต้นตามการวิเคราะห์พิกเซลในครั้งแรก บรรทัดข้อมูลในแบบที่
อัลกอริทึมของ two-pass chain ท า ค่อนข้างเป็นการมอบหมายโดยพลการเริ่มต้นของกลุ่ม Cmax
ทั้งหมดเกิดขึ้นตามเวกเตอร์ n มิติที่วิ่งระหว่างเฉพาะเจาะจงมากจุดในพื้นที่คุณลักษณะ พื้นที่ในพื้นที่
คุณลักษณะถูกก าหนดโดยใช้ค่าเฉลี่ยและมาตรฐานความเบี่ยงเบนของแต่ละวงในการวิเคราะห์ วิธีการ
เพาะ Cmax ดั้งเดิมนี้โดยอัตโนมัติเวกเตอร์ท าให้แน่ใจว่าข้อมูลสองสามบรรทัดแรกไม่มีอคติต่อการ
สร้างคลัสเตอร์ISODATA มีการจัดระเบียบตัวเองเนื่องจากต้องใช้ข้อมูลของมนุษย์ค่อนข้างน้อย ISODATA
ทั่วไปโดยปกติอัลกอริทึมต้องการให้นักวิเคราะห์ระบุเกณฑ์ต่อไปนี้: