6 การนำเสนอด้วยแผนภาพการกระจาย การนำเสนอด้วยแผนภาพการกระจาย สามารถสร้างแผนภาพการกระจายระหว่างคะแนนวิชาวิทยาการคำนวณและวิทยาศาสตร์ เพื่อให้เห็นความสามารถทางวิทยาการคำนวณและวิทยาศาสตร์ของนักเรียนแต่ละคน จากตัวอย่างโปรแกรมต่อไปนี้ มีขั้นตอนดังนี้ 2. 1 เข้าเว็บไซต์ คลิกที่เครื่องหมาย + ที่มุมขวาบน เลือกภาษาที่เรากำลังเรียน นั่นคือ " Python" import pandas as pd import as plt ad_csv('', delimiter=', ', names=['ID', 'Gender', 'CsScore', 'Height']) ad_csv('', delimiter=', ') (sciData, left_on='ID', right_on='เลขประจำตัว', how='inner') print(newData) tter(newData. CsScore, 1) ('Computing Science score') ('Science score') for i in range(0, 20): (newData. CsScore[i], 1[i], [i]) ('Computing Science score & Science score relationship') () อ้างอิง: สถาบันส่งเสริมการสอนวิทยาศาสตร์และเทคโนโลยี, "เทคโนโลยี(วิทยาการคำนวณ)", โรงพิมพ์แห่งจุฬาลงกรณ์มหาวิทยาลัย, ศูนย์หนังสือแห่งจุฬาลงกรณ์มหาวิทยาลัย, 2562 หน้า 18
หนวดแมว(whisker) คือ ความยาวจากขอบล่างไปยังค่าน้อยสุดหรือความยาว จากขอบบนไปยังค่ามากสุด การแปลความหมายของแผนภาพกล่อง แบ่งการแปลความหมายของข้อมูลจากแผนภาพกล่องเป็น 3 กรณี คือ 1. ถ้ามัธยฐานอยู่กลางกล่องแสดงว่าข้อมูลมีการแจกแจงปรกติ 2. ถ้าข้อมูลอยู่ใกล้ขอบบน ( Q3) ของกล่องแสดงว่าข้อมูลมีการแจกแจงเบ้ซ้าย หรือการแจกแจงเบ้ลบ 3.
3. 1 เข้าเว็บไซต์ คลิกที่เครื่องหมาย + ที่มุมขวาบน เลือกภาษาที่เรากำลังเรียน นั่นคือ "Python" 2. 2 พิมพ์ชื่องานตามต้องการ แล้วคลิกที่ปุ่ม "Create repl" 2. 3 พิมพ์คำสั่งตามด้านล่างนี้ เสร็จแล้วคลิกที่ปุ่ม "Run" แล้วรอสักครู่ import pandas as pd ad_csv('', delimiter=', ') print(sdata) 2. 4 เมื่อ Run เสร็จแล้ว จะเห็นว่าโปรแกรมไม่สามารถรันได้ เนื่องจากโปรแกรมหาไฟล์ไม่พบ ให้เราทำการแดรกเมาส์ลากไฟล์ ไปใส่ในโปรแกรม แล้วกดปุ่ม "Run" อีกครั้ง จะเห็นว่าโปรแกรมแสดงผลไฟล์ของเราได้แล้ว นอกจากนี้ ในการแสดงข้อมูลใน DataFrame ออกทางจอภาพ สามารถใช้ฟังก์ชัน print() แสดงผลลัพธ์ในรูปแบบต่างๆ ได้ โดยสามารถทดลอง Run คำสั่งต่างๆ ตามตัวอย่าง แล้วทำความเข้าใจ พร้อมอธิบายการทำงานของการใช้คำสั่งแต่ละแบบได้ print(sdata) #แสดงข้อมูลทั้งหมดใน DataFrame print((2)) #แสดงข้อมูล 2 แถวแรก (2 บรรทัดบนสุด) print((2)) #แสดงข้อมูล 2 แถวสุดท้าย (2 บรรทัดล่างสุด) 2. 4 การนับจำนวนข้อมูลแต่ละคอลัมน์ใน DataFrame ข้อมูลใน DataFrame ที่รับมาจากไฟล์ CSV นั้น สามารถนำไปประมวลผลตามที่ต้องการ เพื่อให้ได้ผลลัพธ์ทางสถิติที่เป็นประโยชน์ เช่น ค่าเฉลี่ย ค่าสูงสุด ค่าต่ำสุด จำนวนข้อมูล เป็นต้น การนับจำนวนข้อมูลแต่ละคอลัมน์ใน DataFrame ทำได้โดยใช้ฟังก์ชัน count() ดังนี้ import pandas as pd ad_csv('', delimiter=', ') print(()) การนับจำนวนข้อมูลเพียงคอลัมน์เดียวจาก DataFrame สามารถใช้คำสั่งในรูปแบบต่อไปนี้ import pandas as pd ad_csv('', delimiter=', ') print(sdata['เลขประจำตัว']()) 2.
ต้องการแสดงถึงขนาดที่ต่างกัน หรือ จัดลำดับ แผนภูมิแท่ง (Bar Chart) เป็น แผนภาพที่ง่ายสุด ที่สามารถใช้เปรียบเทียบข้อมูลในแต่ละหมวดหมู่ สามารถแสดงถึงลำดับและขนาดได้ชัดเจน โดยแกนควรจะเริ่มต้นที่เลขศูนย์เพื่อให้ความสูงของแท่งแสดงถึงปริมาณที่ต้องการจะนำเสนอ ไม่ควรย่นกราฟ แผนภูมิรูปภาพ (Pictogram) ในบางกรณี แผนภูมิรูปภาพอาจจะเป็นทางเลือกที่สวยและเข้าใจง่าย ควรใช้สำหรับกรณีที่นำเสนอเป็นจำนวนเต็มที่ไม่เยอะมากเท่านั้น (อย่าไปตัดแขนคนเพื่อแสดงเลขทศนิยม! ) โดยทั้งสองแบบอาจจะใช้สีในกรณีที่ต้องการแบ่งหมวดหมู่ ขนาดที่แตกต่างกันจะทำให้เห็นได้ชัดเจนว่าปริมาณในข้อมูลกลุ่มไหนมีขนาดใหญ่ที่สุด 2.
หาค่าเฉลี่ยเลขคณิต จากสูตร = = = 19. 83 2. หาส่วนเบี่ยงเบนมาตรฐาน จากสูตร = = = 8. 79 ส่่วนเบี่ยงเบนมาตรฐาน คือ 8. 79 * หมายเหตุ* ความแปรปรวน หาได้จาก (S. D) 2 ส่วนเบี่ยงเบนควอไทล์( Quartile deviation; Q. ) ส่วนเบี่ยงเบนควอไทล์ คือ ค่าที่ใช้วัดการกระจายที่หาได้จากครึ่งหนึ่ง ของความแตกต่างระหว่างควอไทล์ที่ 3 (Q3) และ ควอไทล์ที่ 1 (Q1) ส่วนเบี่ยงเบนควอไทล์ (Q. ) = Q3 - Q2 2 ตัวอย่าง จงหาส่วนเบี่ยงเบนควอไทล์ (Q. ) จากข้อมูล 10, 5, 4, 9, 12, 17, 7 วิธีทำ เรียงข้อมูลจากน้อยไปมาก ได้ดังนี้ 4, 5, 7, 9, 10, 12, 15 หาตำแหน่ง Q3 = 3 (7+1) = 3 (8) = 6 4 4 Q3 = 12 หาตำแหน่ง Q1 = 1 (7+1) = 1 (8) = 2 4 4 Q1 = 5 เพราะฉะนั้น (Q. ) = 12-5 = 3. 5 2 ตัวอย่างที่ จงหาส่วนเบี่ยงเบนควอไทล์จากตารางแจกแจงความถี่ต่อไปน้ี้ คะแนน 50-54 55-59 60-64 65-69 70-74 75-79 ความถี่ 10 20 11 12 21 6 วิธีทำ จะได้ Q1 = 57 Q2 = 71. 2 ดังนั้น ส่วนเบี่ยงเบนควอไทล์ (Q. ) = Q3 - Q1 = 71. 2 - 57 2 2 = 7. 10 ตัวอย่างที่ จงหาส่วนเบี่ยงเบนควอไทล์จากตารางแจกแจงความถี่แสดงผลผลิตเฉลี่ยต่อไร่ของถั่ว เหลืองจาก47 จงัหวดัของประเทศไทย มีดังนี้ ผลผลิตถั่วเหลืองเฉลี่ยต่อไร่ (กิโลกรัม) ความถี่ ความถี่สะสม 120-138 3 3 139-157 1 4 158-176 6 10 177-195 8 18 196-214 19 37 215-233 2 39 234-252 7 46 253-271 1 47 วิธีทำ จะได้ Q1 = 180.