Page 51 - รายงานการประยุกต์ใช้ฐานข้อมูลการสำรวจระยะไกลจากซอฟต์แวร์รหัสเปิดและคลาวด์คอมพิวติงเพื่องานพัฒนาที่ดิน Utilization of Remote Sensing Database derived from Open-source software and Cloud computing platform for Land Development
P. 51

ห้องสมุดกรมพัฒนาที่ดิน


                                                                                                           43







                       ถัดไปจะถูกก าหนดในแต่ละโหนดกลาง แสดงการใช้ค่าการสะท้อนแสงเป็นอินพุตเพื่อค้นหาคลาสสมมุติที่
                       เกี่ยวข้อง (เช่น ระหว่าง “1” และ “7”) เพื่อสร้างแผนผังการตัดสินใจแบบล าดับชั้น ตัวอย่างเช่น
                       ลักษณะของการตัดสินใจที่ใช้เป็นฐานและล าดับที่แถบสเปกตรัมถูกเลือกจะส่งผลต่อผลลัพธ์ของการ
                       จ าแนกประเภท ดังนั้นการค้นหาการก าหนดค่าที่เหมาะสมของต้นไม้ที่จะใช้ส าหรับการจ าแนกจึงมีความ

                       จ าเป็นอย่างยิ่ง1) การท าเหมืองข้อมูลส าหรับการเรียนรู้ของเครื่องจักร (ภาพที่ )
                              การท าเหมืองข้อมูล (data mining)  คือกระบวนการที่กระท ากับ ข้อมูลจ านวนมากเพื่อค้นหา
                       รูปแบบและความสัมพันธ์ที่ซ่อน อยู่ในชุดข้อมูลนั้น ในปัจจุบันการท าเหมืองข้อมูลได้ถูกน าไปประยุกต์ใช้
                       ในงานหลายประเภท (Vamanan and Ramar, 2011) ทั้งในด้านธุรกิจที่ช่วยใน การตัดสินใจของ

                       ผู้บริหาร ในด้านวิทยาศาสตร์และการแพทย์ รวมทั้งในด้านเศรษฐกิจและสังคม การท าเหมืองข้อมูล
                       เปรียบเสมือนวิวัฒนาการหนึ่งใน การจัดเก็บและตีความหมายข้อมูล จากเดิมที่มีการจัดเก็บ ข้อมูลอย่าง
                       ง่ายๆ มาสู่การจัดเก็บในรูปฐานข้อมูลที่สามารถ ดึงข้อมูลสารสนเทศมาใช้จนถึงการท าเหมืองข้อมูลที่
                       สามารถค้นพบความรู้ที่ซ่อนอยู่ในข้อมูล ซึ่งจุดประสงค์ของ การท าเหมืองข้อมูลสามารถใช้ค้นข้อมูลส าคัญ

                       ที่ปะปนกับ ข้อมูลอื่นๆ ในฐานข้อมูลที่ไม่ใช่แค่การสุ่มหา เรียกว่า KDD (Knowledge Discovery in
                       Database) หรือการค้นหาข้อมูลด้วยความรู้ มีด้วยกัน 5 รูปแบบ คือ 1) การค้นหากฎความสัมพันธ์ 2)
                       การจ าแนกประเภทและการพยากรณ์ 3) การจัดกลุ่มข้อมูล 4) การหาค่าผิดปกติที่เกิดขึ้น 5) การ

                       วิเคราะห์แนวโน้ม ซึ่งในงานวิจัยนี้ได้ใช้เทคนิคการจ าแนกประเภทและการพยากรณ์ ซึ่งเป็นเทคนิคหนึ่งที่
                       ส าคัญของการสืบค้นความรู้บนฐานข้อมูลขนาดใหญ่จุดประสงค์ คือการสร้างตัวแบบการแยกคุณลักษณะ
                       (Attribute) หนึ่งโดยขึ้นกับคุณลักษณะอื่น ตัวแบบที่ได้จากการจ าแนกประเภทข้อมูลจะท าให
                       สามารถพจิารณาคลาสในข้อมูล ที่ยัง ไม่ได้แบ่งกลุ่มในอนาคตได้ โดยงานวิจัยฉบับนี้เลือกใช้เทคนิคต้นไม้
                       ตัดสินใจ (branch) แสดงถึงค่าที่เป็นไปได้ของคุณลักษณะที่ถูกเลือกทดสอบ และใบ (leaf) ซึ่งเป็นสิ่งที่อยู่

                       ล่างสุดของต้นไม้ตัดสินใจแสดงถึงกลุ่มของข้อมูล (class) ก็คือผลลัพธ์ที่ได้จากการท านาย โหนดที่อยู่
                       บนสุดของต้นไม้เรียกว่าโหนดราก(root node) โครงสร้างของต้นไม้ตัดสินใจแสดงดังภาพที่ 25
   46   47   48   49   50   51   52   53   54   55   56