วิธีกำลังสองน้อยที่สุดอนุญาต วิธีกำลังสองน้อยที่สุดใน Excel การวิเคราะห์การถดถอย กรณีพิเศษบางประการของการใช้ MNC ในทางปฏิบัติ

17.03.2022

ซึ่งพบการประยุกต์อย่างกว้างขวางที่สุดในสาขาวิทยาศาสตร์และกิจกรรมภาคปฏิบัติต่างๆ นี่อาจจะเป็นฟิสิกส์ เคมี ชีววิทยา เศรษฐศาสตร์ สังคมวิทยา จิตวิทยา และอื่นๆ อีกมากมาย ตามความประสงค์ของโชคชะตาฉันมักจะต้องรับมือกับเศรษฐกิจดังนั้นวันนี้ฉันจะจัดทริปให้คุณไปยังประเทศที่น่าอัศจรรย์ที่เรียกว่า เศรษฐมิติ=) ...จะไม่อยากได้ได้ยังไง! ที่นั่นดีมาก คุณแค่ต้องตัดสินใจ! ...แต่สิ่งที่คุณอาจต้องการอย่างแน่นอนคือการเรียนรู้วิธีการแก้ปัญหา วิธีกำลังสองน้อยที่สุด. และโดยเฉพาะอย่างยิ่งผู้อ่านที่ขยันจะได้เรียนรู้ที่จะแก้ปัญหาเหล่านี้ไม่เพียง แต่ถูกต้อง แต่ยังเร็วมาก ;-) แต่ก่อนอื่น คำแถลงทั่วไปของปัญหา+ ตัวอย่างประกอบ:

ให้เราศึกษาตัวบ่งชี้ในสาขาวิชาเฉพาะที่มีการแสดงออกเชิงปริมาณ ในขณะเดียวกัน ก็มีเหตุผลทุกประการที่ทำให้เชื่อได้ว่าตัวบ่งชี้นั้นขึ้นอยู่กับตัวบ่งชี้นั้น สมมติฐานนี้สามารถเป็นได้ทั้งสมมติฐานทางวิทยาศาสตร์หรือตามสามัญสำนึกขั้นพื้นฐาน อย่างไรก็ตาม ทิ้งวิทยาศาสตร์ไปซะ แล้วมาสำรวจเรื่องน่ารับประทานอื่นๆ กันดีกว่า เช่น ร้านขายของชำ มาแสดงโดย:

– พื้นที่ค้าปลีกของร้านขายของชำ ตร.ม.
– มูลค่าการซื้อขายประจำปีของร้านขายของชำ, ล้านรูเบิล

เป็นที่ชัดเจนอย่างยิ่งว่ายิ่งพื้นที่ร้านค้ามีขนาดใหญ่ขึ้น ในกรณีส่วนใหญ่มูลค่าการซื้อขายก็จะมากขึ้นตามไปด้วย

สมมติว่าหลังจากดำเนินการสังเกต/ทดลอง/คำนวณ/เต้นรำด้วยแทมโบรีน เราก็มีข้อมูลตัวเลขพร้อมใช้:

สำหรับร้านขายของชำ ฉันคิดว่าทุกอย่างชัดเจน: - นี่คือพื้นที่ของร้านที่ 1 - มูลค่าการซื้อขายประจำปี - พื้นที่ของร้านที่ 2 - มูลค่าการซื้อขายประจำปี ฯลฯ อย่างไรก็ตาม การเข้าถึงสื่อลับนั้นไม่จำเป็นเลย - การประเมินมูลค่าการค้าที่แม่นยำอย่างเป็นธรรมสามารถทำได้โดยใช้ สถิติทางคณิตศาสตร์. อย่างไรก็ตาม อย่าเพิ่งวอกแวก หลักสูตรจารกรรมเชิงพาณิชย์ได้รับค่าตอบแทนแล้ว =)

ข้อมูลแบบตารางสามารถเขียนในรูปแบบของจุดและแสดงในรูปแบบที่คุ้นเคยได้ ระบบคาร์ทีเซียน .

มาตอบคำถามสำคัญกัน: การศึกษาเชิงคุณภาพต้องใช้คะแนนกี่คะแนน?

ใหญ่กว่าดีกว่า. ชุดขั้นต่ำที่ยอมรับได้ประกอบด้วย 5-6 คะแนน นอกจากนี้ เมื่อข้อมูลมีน้อย ผลลัพธ์ที่ "ผิดปกติ" ก็ไม่สามารถรวมไว้ในตัวอย่างได้ ตัวอย่างเช่น ร้านค้าชั้นนำขนาดเล็กสามารถรับคำสั่งซื้อที่มีขนาดมากกว่า "เพื่อนร่วมงาน" ดังนั้นจึงบิดเบือนรูปแบบทั่วไปที่คุณต้องค้นหา!

พูดง่ายๆ ก็คือ เราต้องเลือกฟังก์ชัน กำหนดการซึ่งผ่านไปใกล้จุดมากที่สุด . ฟังก์ชันนี้เรียกว่า โดยประมาณ (การประมาณ - การประมาณ)หรือ ฟังก์ชันทางทฤษฎี . โดยทั่วไปแล้ว "คู่แข่ง" ที่ชัดเจนจะปรากฏขึ้นที่นี่ทันที - พหุนามระดับสูงซึ่งกราฟจะผ่านจุดทั้งหมด แต่ตัวเลือกนี้ซับซ้อนและมักจะไม่ถูกต้อง (เนื่องจากกราฟจะ “วนซ้ำ” ตลอดเวลาและสะท้อนแนวโน้มหลักได้ไม่ดี).

ดังนั้นฟังก์ชันที่ต้องการจะต้องค่อนข้างเรียบง่ายและในขณะเดียวกันก็สะท้อนถึงการพึ่งพาอย่างเพียงพอ ดังที่คุณอาจเดาได้ มีการเรียกวิธีหนึ่งในการค้นหาฟังก์ชันดังกล่าว วิธีกำลังสองน้อยที่สุด. ก่อนอื่นเรามาดูสาระสำคัญของมันในแง่ทั่วไปกันก่อน ให้ฟังก์ชันบางอย่างแสดงข้อมูลการทดลองโดยประมาณ:

จะประเมินความถูกต้องของการประมาณนี้ได้อย่างไร? ให้เราคำนวณความแตกต่าง (ส่วนเบี่ยงเบน) ระหว่างค่าการทดลองและค่าฟังก์ชันด้วย (เราศึกษาการวาดภาพ). ความคิดแรกที่เข้ามาในใจคือการประมาณว่าผลรวมจะมีขนาดใหญ่เพียงใด แต่ปัญหาคือความแตกต่างอาจเป็นลบได้ (ตัวอย่างเช่น, ) และการเบี่ยงเบนจากผลรวมดังกล่าวจะหักล้างกัน ดังนั้นในการประมาณความแม่นยำของการประมาณจึงขอผลรวม โมดูลการเบี่ยงเบน:

หรือยุบ: (เผื่อใครไม่รู้: – นี่คือไอคอนผลรวม และ – ตัวแปร “ตัวนับ” เสริม ซึ่งรับค่าตั้งแต่ 1 ถึง ).

โดยการประมาณคะแนนการทดลองที่มีฟังก์ชันต่างกัน เราจะได้ค่าที่แตกต่างกัน และแน่นอนว่าเมื่อผลรวมน้อยกว่า ฟังก์ชันนั้นก็จะแม่นยำมากขึ้น

มีวิธีการดังกล่าวอยู่และเรียกว่า วิธีโมดูลัสน้อยที่สุด. อย่างไรก็ตามในทางปฏิบัติก็มีแพร่หลายมากขึ้น วิธีกำลังสองน้อยที่สุดซึ่งค่าลบที่เป็นไปได้ไม่ได้ถูกกำจัดโดยโมดูล แต่โดยการยกกำลังสองส่วนเบี่ยงเบน:

หลังจากนั้นความพยายามมุ่งเป้าไปที่การเลือกฟังก์ชันดังกล่าวซึ่งผลรวมของการเบี่ยงเบนกำลังสอง มีขนาดเล็กที่สุดเท่าที่จะเป็นไปได้ ที่จริงแล้วนี่คือที่มาของชื่อของวิธีการ

และตอนนี้เรากลับมาที่จุดสำคัญอื่น: ตามที่ระบุไว้ข้างต้นฟังก์ชั่นที่เลือกควรจะค่อนข้างง่าย - แต่ก็มีฟังก์ชั่นดังกล่าวมากมายเช่นกัน: เชิงเส้น , ไฮเปอร์โบลิก, เอ็กซ์โปเนนเชียล, ลอการิทึม, กำลังสอง ฯลฯ และแน่นอนว่า ณ ที่นี้ ฉันต้องการ "ลดขอบเขตของกิจกรรม" ทันที ฉันควรเลือกฟังก์ชันประเภทใดเพื่อการวิจัย? เทคนิคดั้งเดิมแต่มีประสิทธิภาพ:

– วิธีที่ง่ายที่สุดคือการพรรณนาจุดต่างๆ บนภาพวาดและวิเคราะห์ตำแหน่งของพวกเขา หากมีแนวโน้มที่จะวิ่งเป็นเส้นตรง คุณก็ควรมองหา สมการของเส้น ด้วยค่าที่เหมาะสมที่สุดและ กล่าวอีกนัยหนึ่ง ภารกิจคือการหาค่าสัมประสิทธิ์ดังกล่าวเพื่อให้ผลรวมของการเบี่ยงเบนกำลังสองมีค่าน้อยที่สุด

หากจุดต่างๆ อยู่ เช่น ตามแนว อติพจน์เห็นได้ชัดว่าฟังก์ชันเชิงเส้นจะให้การประมาณที่ไม่ดี ในกรณีนี้ เรากำลังมองหาค่าสัมประสิทธิ์ที่ "เหมาะสม" ที่สุดสำหรับสมการไฮเปอร์โบลา – พวกที่ให้ผลรวมกำลังสองขั้นต่ำ .

โปรดทราบว่าในทั้งสองกรณีเรากำลังพูดถึง ฟังก์ชันของตัวแปรสองตัวซึ่งมีข้อโต้แย้งอยู่ ค้นหาพารามิเตอร์การพึ่งพา:

และโดยพื้นฐานแล้ว เราจำเป็นต้องแก้ปัญหามาตรฐาน - หา ฟังก์ชันขั้นต่ำของตัวแปรสองตัว.

ลองจำตัวอย่างของเรา: สมมติว่าจุด "ร้านค้า" มักจะอยู่ในแนวเส้นตรงและมีเหตุผลทุกประการที่เชื่อได้ว่า การพึ่งพาเชิงเส้นมูลค่าการซื้อขายจากพื้นที่ค้าปลีก ลองหาค่าสัมประสิทธิ์ "a" และ "be" ดังกล่าวซึ่งผลรวมของการเบี่ยงเบนกำลังสอง มีขนาดเล็กที่สุด ทุกอย่างเป็นไปตามปกติ - ก่อนอื่น อนุพันธ์ย่อยอันดับ 1. ตาม กฎความเป็นเส้นตรงคุณสามารถแยกความแตกต่างได้ภายใต้ไอคอนผลรวม:

หากคุณต้องการใช้ข้อมูลนี้สำหรับเรียงความหรือภาคเรียน ฉันจะขอบคุณมากสำหรับลิงก์ในรายการแหล่งข้อมูล คุณจะพบการคำนวณโดยละเอียดดังกล่าวได้ในไม่กี่แห่ง:

มาสร้างระบบมาตรฐานกัน:

เราลดแต่ละสมการลง "สอง" และนอกจากนี้ "แยก" ผลรวม:

บันทึก : วิเคราะห์อย่างอิสระว่าเหตุใดจึงนำ "a" และ "be" ออกไปนอกเหนือจากไอคอนผลรวม อย่างไรก็ตาม อย่างเป็นทางการสามารถทำได้ด้วยผลรวม

มาเขียนระบบใหม่ในรูปแบบ "นำไปใช้":

หลังจากนั้นอัลกอริทึมในการแก้ปัญหาของเราก็เริ่มปรากฏ:

เรารู้พิกัดของจุดต่างๆ ไหม? พวกเรารู้. จำนวนเงิน เราจะหามันเจอไหม? อย่างง่ายดาย. มาทำให้ง่ายที่สุดกันดีกว่า ระบบสมการเชิงเส้นสองสมการในสองไม่ทราบ(“ก” และ “เป็น”) เราแก้ระบบ เช่น วิธีการของแครมเมอร์ซึ่งเป็นผลมาจากการที่เราได้จุดที่อยู่นิ่ง กำลังตรวจสอบ สภาพที่เพียงพอสำหรับสุดขั้วเราสามารถตรวจสอบได้ว่า ณ จุดนี้ฟังก์ชัน ถึงอย่างแน่นอน ขั้นต่ำ. การตรวจสอบเกี่ยวข้องกับการคำนวณเพิ่มเติม ดังนั้นเราจะละทิ้งการตรวจสอบไว้เบื้องหลัง (หากจำเป็นสามารถดูเฟรมที่หายไปได้). เราได้ข้อสรุปสุดท้าย:

การทำงาน วิธีที่ดีที่สุด (อย่างน้อยเมื่อเปรียบเทียบกับฟังก์ชันเชิงเส้นอื่นๆ)นำจุดทดลองเข้ามาใกล้ยิ่งขึ้น . หากพูดโดยคร่าวๆ กราฟของมันจะผ่านไปใกล้จุดเหล่านี้มากที่สุด ในประเพณี เศรษฐมิติฟังก์ชันการประมาณผลลัพธ์จะเรียกอีกอย่างว่า สมการถดถอยเชิงเส้นคู่ .

ปัญหาที่อยู่ระหว่างการพิจารณามีความสำคัญอย่างยิ่งในทางปฏิบัติ ในสถานการณ์ตัวอย่างของเรา สมการ ช่วยให้คุณสามารถคาดการณ์มูลค่าการซื้อขายได้ ("อิเกรก")ร้านค้าจะมีค่าพื้นที่ขายอย่างน้อยหนึ่งค่า (ความหมายอย่างใดอย่างหนึ่งของ “x”). ใช่ ผลการพยากรณ์จะเป็นเพียงการคาดการณ์เท่านั้น แต่ในหลายกรณีกลับกลายเป็นว่าค่อนข้างแม่นยำ

ฉันจะวิเคราะห์ปัญหาเดียวด้วยตัวเลข "จริง" เนื่องจากไม่มีปัญหาในนั้น - การคำนวณทั้งหมดอยู่ในระดับหลักสูตรของโรงเรียนชั้นประถมศึกษาปีที่ 7-8 ในกรณี 95 เปอร์เซ็นต์ คุณจะถูกขอให้ค้นหาฟังก์ชันเชิงเส้น แต่ในตอนท้ายของบทความ ผมจะแสดงให้เห็นว่าการค้นหาสมการของไฮเปอร์โบลา เลขชี้กำลัง และฟังก์ชันอื่นๆ ที่เหมาะสมที่สุดนั้นไม่ใช่เรื่องยากอีกต่อไป

ในความเป็นจริงสิ่งที่เหลืออยู่คือการแจกจ่ายสารพัดที่สัญญาไว้ - เพื่อให้คุณสามารถเรียนรู้ที่จะแก้ไขตัวอย่างดังกล่าวไม่เพียง แต่แม่นยำ แต่ยังรวดเร็วอีกด้วย เราศึกษามาตรฐานอย่างรอบคอบ:

งาน

จากการศึกษาความสัมพันธ์ระหว่างตัวชี้วัด 2 ตัว พบว่าได้ตัวเลขคู่ดังนี้

ใช้วิธีกำลังสองน้อยที่สุด หาฟังก์ชันเชิงเส้นที่ประมาณค่าเชิงประจักษ์ได้ดีที่สุด (มีประสบการณ์)ข้อมูล. เขียนแบบเพื่อสร้างจุดทดลองและกราฟของฟังก์ชันการประมาณในระบบพิกัดสี่เหลี่ยมคาร์ทีเซียน . ค้นหาผลรวมของการเบี่ยงเบนกำลังสองระหว่างค่าเชิงประจักษ์และค่าทางทฤษฎี ค้นหาว่าคุณสมบัติจะดีกว่านี้หรือไม่ (จากมุมมองของวิธีกำลังสองน้อยที่สุด)นำจุดทดลองเข้ามาใกล้ยิ่งขึ้น

โปรดทราบว่าความหมาย "x" เป็นไปตามธรรมชาติและนี่มีความหมายที่มีความหมายซึ่งฉันจะพูดถึงในภายหลัง แต่แน่นอนว่าพวกมันสามารถเป็นเศษส่วนได้เช่นกัน นอกจากนี้ขึ้นอยู่กับเนื้อหาของงานเฉพาะทั้งค่า "X" และ "เกม" อาจเป็นค่าลบทั้งหมดหรือบางส่วนก็ได้ เราได้รับภารกิจที่ "ไร้หน้า" และเราเริ่มต้นมันได้ สารละลาย:

เราค้นหาค่าสัมประสิทธิ์ของฟังก์ชันที่เหมาะสมที่สุดเป็นวิธีแก้ปัญหาของระบบ:

เพื่อวัตถุประสงค์ในการบันทึกที่มีขนาดกะทัดรัดมากขึ้น สามารถละเว้นตัวแปร "ตัวนับ" ได้ เนื่องจากเป็นที่แน่ชัดแล้วว่าการรวมจะดำเนินการตั้งแต่ 1 ถึง

สะดวกกว่าในการคำนวณจำนวนเงินที่ต้องการในรูปแบบตาราง:

การคำนวณสามารถทำได้ด้วยไมโครเครื่องคิดเลข แต่ควรใช้ Excel ดีกว่ามาก - ทั้งเร็วกว่าและไม่มีข้อผิดพลาด ดูวิดีโอสั้น ๆ:

ดังนั้นเราจึงได้สิ่งต่อไปนี้ ระบบ:

ที่นี่คุณสามารถคูณสมการที่สองด้วย 3 และ ลบอันที่ 2 จากเทอมของสมการที่ 1 ทีละเทอม. แต่นี่คือโชค - ในทางปฏิบัติ ระบบมักไม่ใช่ของขวัญ และในกรณีเช่นนี้จะช่วยประหยัดได้ วิธีการของแครมเมอร์:
ซึ่งหมายความว่าระบบมีวิธีแก้ปัญหาเฉพาะตัว

มาตรวจสอบกัน ฉันเข้าใจว่าคุณไม่ต้องการ แต่ทำไมต้องข้ามข้อผิดพลาดโดยที่ไม่ควรพลาดอย่างแน่นอน ให้เราแทนที่คำตอบที่พบทางด้านซ้ายของแต่ละสมการของระบบ:

จะได้ทางด้านขวาของสมการที่สอดคล้องกัน ซึ่งหมายความว่าระบบได้รับการแก้ไขอย่างถูกต้อง

ดังนั้นฟังก์ชันการประมาณที่ต้องการ: – จาก ฟังก์ชันเชิงเส้นทั้งหมดเธอคือผู้ที่ประมาณข้อมูลการทดลองได้ดีที่สุด

ไม่เหมือน ตรง การพึ่งพาการหมุนเวียนของร้านค้าในพื้นที่ การพึ่งพาที่พบคือ ย้อนกลับ (หลักการ “ยิ่งมาก ยิ่งน้อย”)และความจริงเรื่องนี้ก็ถูกเปิดเผยทันทีในแง่ลบ ความลาดชัน. การทำงาน บอกเราว่าเมื่อเพิ่มตัวบ่งชี้บางตัวขึ้น 1 หน่วย ค่าของตัวบ่งชี้ตามจะลดลง เฉลี่ยเพิ่มขึ้น 0.65 หน่วย อย่างที่พวกเขาพูดกันว่ายิ่งราคาบัควีทสูงเท่าไหร่ก็ยิ่งขายได้น้อยลงเท่านั้น

ในการพล็อตกราฟของฟังก์ชันการประมาณ เราจะพบค่าสองค่า:

และดำเนินการวาดภาพ:

เส้นตรงที่สร้างขึ้นเรียกว่า เส้นแนวโน้ม (กล่าวคือ เส้นแนวโน้มเชิงเส้น กล่าวคือ ในกรณีทั่วไป แนวโน้มไม่จำเป็นต้องเป็นเส้นตรง). ใครๆ ก็คุ้นเคยกับสำนวนที่ว่า “เป็นกระแส” และผมคิดว่าคำนี้ไม่ต้องการความคิดเห็นเพิ่มเติม

ลองคำนวณผลรวมของการเบี่ยงเบนกำลังสองกัน ระหว่างค่าเชิงประจักษ์และค่าทางทฤษฎี ในเชิงเรขาคณิต นี่คือผลรวมของกำลังสองของความยาวของส่วน "ราสเบอร์รี่" (สองอันมีขนาดเล็กมากจนมองไม่เห็นด้วยซ้ำ).

สรุปการคำนวณในตาราง:

อีกครั้ง สามารถทำได้ด้วยตนเอง ในกรณีนี้ ฉันจะยกตัวอย่างสำหรับประเด็นที่ 1:

แต่จะมีประสิทธิภาพมากกว่ามากหากทำด้วยวิธีที่ทราบอยู่แล้ว:

เราทำซ้ำอีกครั้ง: ความหมายของผลลัพธ์ที่ได้รับคืออะไร?จาก ฟังก์ชันเชิงเส้นทั้งหมดฟังก์ชัน y ตัวบ่งชี้นั้นเล็กที่สุดนั่นคือในตระกูลมันเป็นค่าประมาณที่ดีที่สุด และที่นี่ คำถามสุดท้ายของปัญหาไม่ใช่เรื่องบังเอิญ: จะเกิดอะไรขึ้นถ้าฟังก์ชันเอ็กซ์โปเนนเชียลที่เสนอมา จะดีกว่าไหมถ้านำจุดทดลองเข้ามาใกล้มากขึ้น?

มาหาผลรวมของการเบี่ยงเบนกำลังสองที่สอดคล้องกัน - เพื่อแยกแยะฉันจะเขียนแทนด้วยตัวอักษร "เอปไซลอน" เทคนิคเหมือนกันทุกประการ:

และอีกครั้ง ในกรณีนี้ การคำนวณสำหรับจุดที่ 1:

ใน Excel เราใช้ฟังก์ชันมาตรฐาน ประสบการณ์ (ไวยากรณ์สามารถพบได้ในวิธีใช้ Excel).

บทสรุป: ซึ่งหมายความว่าฟังก์ชันเลขชี้กำลังประมาณจุดทดลองที่แย่กว่าเส้นตรง .

แต่ที่นี่ควรสังเกตว่า "แย่กว่า" คือ ยังไม่ได้หมายความว่า, เกิดอะไรขึ้น. ตอนนี้ ฉันได้สร้างกราฟของฟังก์ชันเอ็กซ์โปเนนเชียลแล้ว และกราฟยังส่งผ่านใกล้กับจุดต่างๆ ด้วย - มากเสียจนหากไม่มีการวิจัยเชิงวิเคราะห์ก็ยากที่จะบอกว่าฟังก์ชันใดแม่นยำกว่า

นี่เป็นการสรุปวิธีแก้ปัญหาและฉันกลับไปสู่คำถามเกี่ยวกับคุณค่าตามธรรมชาติของการโต้แย้ง ในการศึกษาต่างๆ โดยทั่วไปแล้ว "X" ตามธรรมชาติทางเศรษฐกิจหรือสังคมวิทยาจะใช้เพื่อนับเดือน ปี หรือช่วงเวลาอื่นๆ ที่เท่ากัน ลองพิจารณาปัญหาต่อไปนี้เป็นตัวอย่าง

ตัวอย่าง.

ข้อมูลการทดลองเกี่ยวกับค่าของตัวแปร เอ็กซ์และ ที่จะได้รับในตาราง

จากการจัดตำแหน่ง ทำให้ได้ฟังก์ชันมา

โดยใช้ วิธีกำลังสองน้อยที่สุดประมาณข้อมูลเหล่านี้ด้วยการพึ่งพาเชิงเส้น y=ขวาน+ข(ค้นหาพารามิเตอร์ กและ ข). ค้นหาว่าบรรทัดใดในสองบรรทัดที่ดีกว่า (ในแง่ของวิธีกำลังสองน้อยที่สุด) เพื่อจัดแนวข้อมูลการทดลอง วาดรูป.

สาระสำคัญของวิธีกำลังสองน้อยที่สุด (LSM)

ภารกิจคือการหาค่าสัมประสิทธิ์การพึ่งพาเชิงเส้นซึ่งเป็นฟังก์ชันของตัวแปรสองตัว กและ ข ใช้ค่าที่น้อยที่สุด นั่นคือให้ กและ ขผลรวมของการเบี่ยงเบนกำลังสองของข้อมูลการทดลองจากเส้นตรงที่พบจะน้อยที่สุด นี่คือจุดรวมของวิธีกำลังสองน้อยที่สุด

ดังนั้น การแก้ปัญหาตัวอย่างจึงต้องหาจุดสิ้นสุดของฟังก์ชันของตัวแปรสองตัว

สูตรการหาค่าสัมประสิทธิ์

ระบบสมการสองสมการที่ไม่ทราบค่าสองตัวจะถูกรวบรวมและแก้ไข การค้นหาอนุพันธ์ย่อยของฟังก์ชันเทียบกับตัวแปร กและ ข, เราเปรียบอนุพันธ์เหล่านี้ให้เป็นศูนย์

เราแก้ระบบสมการผลลัพธ์โดยใช้วิธีใดก็ได้ (เช่น โดยวิธีทดแทนหรือ ) และรับสูตรในการหาสัมประสิทธิ์โดยใช้วิธีกำลังสองน้อยที่สุด (LSM)

ที่ให้ไว้ กและ ขการทำงาน ใช้ค่าที่น้อยที่สุด มีการให้หลักฐานข้อเท็จจริงนี้

นั่นคือวิธีทั้งหมดของกำลังสองน้อยที่สุด สูตรการหาพารามิเตอร์ กมีผลรวม , , และพารามิเตอร์ n- จำนวนข้อมูลการทดลอง เราขอแนะนำให้คำนวณค่าของจำนวนเงินเหล่านี้แยกกัน ค่าสัมประสิทธิ์ ขพบได้หลังการคำนวณ ก.

ถึงเวลาจำตัวอย่างดั้งเดิมแล้ว

สารละลาย.

ในตัวอย่างของเรา n=5. เรากรอกตารางเพื่อความสะดวกในการคำนวณจำนวนเงินที่รวมอยู่ในสูตรของค่าสัมประสิทธิ์ที่ต้องการ

ค่าในแถวที่สี่ของตารางได้มาจากการคูณค่าของแถวที่ 2 ด้วยค่าของแถวที่ 3 สำหรับแต่ละตัวเลข ฉัน.

ค่าในแถวที่ห้าของตารางได้มาจากการยกกำลังสองค่าในแถวที่ 2 สำหรับแต่ละตัวเลข ฉัน.

ค่าในคอลัมน์สุดท้ายของตารางคือผลรวมของค่าระหว่างแถว

เราใช้สูตรวิธีกำลังสองน้อยที่สุดเพื่อหาค่าสัมประสิทธิ์ กและ ข. เราแทนที่ค่าที่เกี่ยวข้องจากคอลัมน์สุดท้ายของตารางลงไป:

เพราะฉะนั้น, y = 0.165x+2.184- เส้นตรงโดยประมาณที่ต้องการ

มันยังคงค้นหาว่าบรรทัดไหน y = 0.165x+2.184หรือ ประมาณข้อมูลเดิมได้ดีขึ้น กล่าวคือ ประมาณการโดยใช้วิธีกำลังสองน้อยที่สุด

การประมาณค่าความผิดพลาดของวิธีกำลังสองน้อยที่สุด

ในการทำเช่นนี้ คุณต้องคำนวณผลรวมของการเบี่ยงเบนกำลังสองของข้อมูลต้นฉบับจากเส้นเหล่านี้ และ ค่าที่น้อยกว่าจะสัมพันธ์กับเส้นที่ประมาณข้อมูลต้นฉบับได้ดีกว่าในแง่ของวิธีกำลังสองน้อยที่สุด

ตั้งแต่นั้นมาตรง y = 0.165x+2.184ใกล้เคียงกับข้อมูลเดิมดีกว่า

ภาพประกอบกราฟิกของวิธีกำลังสองน้อยที่สุด (LS)

ทุกอย่างมองเห็นได้ชัดเจนบนกราฟ เส้นสีแดงคือเส้นตรงที่พบ y = 0.165x+2.184, เส้นสีน้ำเงินคือ จุดสีชมพูคือข้อมูลต้นฉบับ

เหตุใดจึงจำเป็น ทำไมต้องประมาณทั้งหมดนี้

โดยส่วนตัวฉันใช้มันเพื่อแก้ปัญหาการปรับข้อมูลให้เรียบ การแก้ไข และการประมาณค่า (ในตัวอย่างดั้งเดิม พวกเขาอาจถูกขอให้ค้นหาค่าของค่าที่สังเกตได้ ยที่ x=3หรือเมื่อใด x=6โดยใช้วิธีกำลังสองน้อยที่สุด) แต่เราจะพูดถึงเรื่องนี้เพิ่มเติมในส่วนอื่นของเว็บไซต์ในภายหลัง

การพิสูจน์.

ดังนั้นเมื่อพบแล้ว กและ ขฟังก์ชันใช้ค่าที่น้อยที่สุด ซึ่ง ณ จุดนี้เมทริกซ์ของรูปแบบกำลังสองของดิฟเฟอเรนเชียลลำดับที่สองจำเป็นสำหรับฟังก์ชันนี้ เป็นบวกแน่นอน มาแสดงกันเถอะ

ส่วนต่างลำดับที่สองมีรูปแบบ:

นั่นคือ

ดังนั้นเมทริกซ์ของรูปแบบกำลังสองจึงมีรูปแบบ

และค่าขององค์ประกอบไม่ได้ขึ้นอยู่กับ กและ ข.

ให้เราแสดงว่าเมทริกซ์เป็นบวกแน่นอน เมื่อต้องการทำเช่นนี้ ผู้เยาว์เชิงมุมจะต้องเป็นบวก

ผู้เยาว์เชิงมุมของลำดับแรก . ความไม่เท่าเทียมกันเข้มงวดเพราะคะแนนไม่ตรงกัน ต่อไปนี้เราจะบอกเป็นนัยนี้

ผู้เยาว์เชิงมุมอันดับที่สอง

มาพิสูจน์กัน โดยวิธีการอุปนัยทางคณิตศาสตร์

บทสรุป: พบค่า กและ ขสอดคล้องกับค่าที่น้อยที่สุดของฟังก์ชัน ดังนั้นจึงเป็นพารามิเตอร์ที่จำเป็นสำหรับวิธีกำลังสองน้อยที่สุด

วิธีกำลังสองน้อยที่สุด

ในบทเรียนสุดท้ายของหัวข้อนี้ เราจะมาทำความรู้จักกับแอปพลิเคชันที่มีชื่อเสียงที่สุด เอฟเอ็นพีซึ่งพบการใช้งานที่กว้างขวางที่สุดในสาขาวิทยาศาสตร์และกิจกรรมภาคปฏิบัติที่หลากหลาย นี่อาจจะเป็นฟิสิกส์ เคมี ชีววิทยา เศรษฐศาสตร์ สังคมวิทยา จิตวิทยา และอื่นๆ อีกมากมาย ตามความประสงค์ของโชคชะตาฉันมักจะต้องรับมือกับเศรษฐกิจดังนั้นวันนี้ฉันจะจัดทริปให้คุณไปยังประเทศที่น่าอัศจรรย์ที่เรียกว่า เศรษฐมิติ=) ...จะไม่อยากได้ได้ยังไง! ที่นั่นดีมาก คุณแค่ต้องตัดสินใจ! ...แต่สิ่งที่คุณอาจต้องการอย่างแน่นอนคือการเรียนรู้วิธีการแก้ปัญหา วิธีกำลังสองน้อยที่สุด. และโดยเฉพาะอย่างยิ่งผู้อ่านที่ขยันจะได้เรียนรู้ที่จะแก้ปัญหาเหล่านี้ไม่เพียง แต่ถูกต้อง แต่ยังเร็วมาก ;-) แต่ก่อนอื่น คำแถลงทั่วไปของปัญหา+ ตัวอย่างประกอบ:

มาตอบคำถามสำคัญกัน: การศึกษาเชิงคุณภาพต้องใช้คะแนนกี่คะแนน?

พูดง่ายๆ ก็คือ เราต้องเลือกฟังก์ชัน กำหนดการซึ่งผ่านไปใกล้จุดมากที่สุด . ฟังก์ชันนี้เรียกว่า โดยประมาณ (การประมาณ - การประมาณ)หรือ ฟังก์ชันทางทฤษฎี . โดยทั่วไปแล้ว "คู่แข่ง" ที่ชัดเจนจะปรากฏขึ้นที่นี่ทันที - พหุนามระดับสูงซึ่งกราฟจะผ่านจุดทั้งหมด แต่ตัวเลือกนี้ซับซ้อนและมักจะไม่ถูกต้อง (เนื่องจากกราฟจะ “วนซ้ำ” ตลอดเวลาและสะท้อนแนวโน้มหลักได้ไม่ดี).

ดังนั้นฟังก์ชันที่ต้องการจะต้องค่อนข้างเรียบง่ายและในขณะเดียวกันก็สะท้อนถึงการพึ่งพาอย่างเพียงพอ ดังที่คุณอาจเดาได้ มีการเรียกวิธีหนึ่งในการค้นหาฟังก์ชันดังกล่าว วิธีกำลังสองน้อยที่สุด. ก่อนอื่นเรามาดูสาระสำคัญของมันในแง่ทั่วไปกันก่อน ให้ฟังก์ชันบางอย่างแสดงข้อมูลการทดลองโดยประมาณ:

จะประเมินความถูกต้องของการประมาณนี้ได้อย่างไร? ให้เราคำนวณความแตกต่าง (ส่วนเบี่ยงเบน) ระหว่างค่าการทดลองและค่าฟังก์ชันด้วย (เราศึกษาการวาดภาพ). ความคิดแรกที่เข้ามาในใจคือการประมาณว่าผลรวมจะมีขนาดใหญ่เพียงใด แต่ปัญหาคือความแตกต่างอาจเป็นลบได้ (ตัวอย่างเช่น, ) และการเบี่ยงเบนจากผลรวมดังกล่าวจะหักล้างกัน ดังนั้นในการประมาณความแม่นยำของการประมาณจึงขอผลรวม โมดูลการเบี่ยงเบน:

หรือยุบ: (เผื่อใครไม่ทราบ: คือไอคอนผลรวม และ – ตัวแปรเสริม "ตัวนับ" ซึ่งรับค่าตั้งแต่ 1 ถึง ) .

และตอนนี้เรากลับมาที่จุดสำคัญอื่น: ตามที่ระบุไว้ข้างต้นฟังก์ชั่นที่เลือกควรจะค่อนข้างง่าย - แต่ก็มีฟังก์ชั่นดังกล่าวมากมายเช่นกัน: เชิงเส้น , ไฮเปอร์โบลิก , เอ็กซ์โปเนนเชียล , ลอการิทึม , กำลังสอง ฯลฯ และแน่นอนว่า ณ ที่นี้ ฉันต้องการ "ลดขอบเขตของกิจกรรม" ทันที ฉันควรเลือกฟังก์ชันประเภทใดเพื่อการวิจัย? เทคนิคดั้งเดิมแต่มีประสิทธิภาพ:

มาสร้างระบบมาตรฐานกัน:

เราลดแต่ละสมการลง "สอง" และนอกจากนี้ "แยก" ผลรวม:

บันทึก : วิเคราะห์อย่างอิสระว่าเหตุใดจึงนำ "a" และ "be" ออกไปนอกเหนือจากไอคอนผลรวม อย่างไรก็ตาม อย่างเป็นทางการสามารถทำได้ด้วยผลรวม

เรารู้พิกัดของจุดต่างๆ ไหม? พวกเรารู้. จำนวนเงิน เราจะหามันเจอไหม? อย่างง่ายดาย. มาทำให้ง่ายที่สุดกันดีกว่า ระบบสมการเชิงเส้นสองสมการในสองไม่ทราบ(“ก” และ “เป็น”) เราแก้ระบบ เช่น วิธีการของแครมเมอร์ซึ่งเป็นผลมาจากการที่เราได้จุดที่อยู่นิ่ง กำลังตรวจสอบ สภาพที่เพียงพอสำหรับสุดขั้วเราสามารถตรวจสอบได้ว่า ณ จุดนี้ฟังก์ชัน ถึงอย่างแน่นอน ขั้นต่ำ. การตรวจสอบเกี่ยวข้องกับการคำนวณเพิ่มเติม ดังนั้นเราจะละทิ้งการตรวจสอบไว้เบื้องหลัง (หากจำเป็นสามารถดูเฟรมที่หายไปได้ที่นี่ ) . เราได้ข้อสรุปสุดท้าย:

การทำงาน วิธีที่ดีที่สุด (อย่างน้อยเมื่อเปรียบเทียบกับฟังก์ชันเชิงเส้นอื่นๆ)นำจุดทดลองเข้ามาใกล้ยิ่งขึ้น . หากพูดโดยคร่าวๆ กราฟของมันจะผ่านไปใกล้จุดเหล่านี้มากที่สุด ในประเพณี เศรษฐมิติฟังก์ชันการประมาณผลลัพธ์จะเรียกอีกอย่างว่า สมการถดถอยเชิงเส้นคู่ .

งาน

ดังนั้นเราจึงได้สิ่งต่อไปนี้ ระบบ:

ไม่เหมือน ตรง การพึ่งพาการหมุนเวียนของร้านค้าในพื้นที่ การพึ่งพาที่พบคือ ย้อนกลับ (หลักการ “ยิ่งมาก ยิ่งน้อย”)และความจริงเรื่องนี้ก็ถูกเปิดเผยทันทีในแง่ลบ ความลาดชัน. การทำงาน บอกเราว่าเมื่อเพิ่มตัวบ่งชี้บางตัวขึ้น 1 หน่วย ค่าของตัวบ่งชี้ตามจะลดลง เฉลี่ยเพิ่มขึ้น 0.65 หน่วย อย่างที่พวกเขาพูดกันว่ายิ่งราคาบัควีทสูงเท่าไหร่ก็ยิ่งขายได้น้อยลงเท่านั้น

ในการพล็อตกราฟของฟังก์ชันการประมาณ เราจะพบค่าสองค่า:

และดำเนินการวาดภาพ:

เส้นตรงที่สร้างขึ้นเรียกว่า เส้นแนวโน้ม (กล่าวคือ เส้นแนวโน้มเชิงเส้น กล่าวคือ ในกรณีทั่วไป แนวโน้มไม่จำเป็นต้องเป็นเส้นตรง). ใครๆ ก็คุ้นเคยกับสำนวนที่ว่า “เป็นกระแส” และผมคิดว่าคำนี้ไม่ต้องการความคิดเห็นเพิ่มเติม

นี่เป็นการสรุปวิธีแก้ปัญหาและฉันกลับไปสู่คำถามเกี่ยวกับคุณค่าตามธรรมชาติของการโต้แย้ง ในการศึกษาต่างๆ โดยทั่วไปแล้ว "X" ตามธรรมชาติทางเศรษฐกิจหรือสังคมวิทยาจะใช้เพื่อนับเดือน ปี หรือช่วงเวลาอื่นๆ ที่เท่ากัน พิจารณาตัวอย่างปัญหาต่อไปนี้:

ข้อมูลต่อไปนี้มีอยู่ในมูลค่าการขายปลีกของร้านค้าในช่วงครึ่งปีแรก:

ใช้การจัดตำแหน่งเส้นตรงเชิงวิเคราะห์ เพื่อกำหนดปริมาณการซื้อขายในเดือนกรกฎาคม.

ใช่ ไม่มีปัญหา: เรานับเดือน 1, 2, 3, 4, 5, 6 และใช้อัลกอริทึมปกติซึ่งเป็นผลมาจากการที่เราได้สมการ - สิ่งเดียวคือเมื่อถึงเวลาพวกเขามักจะใช้ ตัวอักษร “เต้” (แม้ว่าจะไม่สำคัญก็ตาม). จากสมการพบว่ามูลค่าการซื้อขายในช่วงครึ่งปีแรกเพิ่มขึ้นเฉลี่ย 27.74 หน่วย ต่อเดือน. มาดูพยากรณ์เดือนกรกฎาคมกันดีกว่า (เดือนที่ 7): เด

และมีงานเช่นนี้มากมายนับไม่ถ้วน ผู้ที่ต้องการสามารถใช้บริการเพิ่มเติม ได้แก่ ของฉัน เครื่องคิดเลขเอ็กเซล (เวอร์ชั่นสาธิต), ที่ แก้ปัญหาที่วิเคราะห์ได้เกือบจะในทันที!มีโปรแกรมเวอร์ชั่นใช้งานได้แล้ว ในการแลกเปลี่ยนหรือสำหรับ ค่าธรรมเนียมสัญลักษณ์.

ในตอนท้ายของบทเรียน ข้อมูลโดยย่อเกี่ยวกับการค้นหาการพึ่งพาประเภทอื่นๆ จริงๆ แล้ว ไม่มีอะไรจะบอกมากนัก เนื่องจากแนวทางพื้นฐานและอัลกอริธึมการแก้ปัญหายังคงเหมือนเดิม

สมมติว่าการจัดเรียงจุดทดลองมีลักษณะคล้ายไฮเปอร์โบลา จากนั้น เพื่อหาค่าสัมประสิทธิ์ของไฮเปอร์โบลาที่ดีที่สุด คุณต้องหาค่าต่ำสุดของฟังก์ชัน ซึ่งใครๆ ก็สามารถคำนวณแบบละเอียดและได้ระบบที่คล้ายกัน:

จากมุมมองทางเทคนิคที่เป็นทางการ ได้มาจากระบบ "เชิงเส้น" (ขอแสดงด้วยเครื่องหมายดอกจัน)แทนที่ "x" ด้วย . แล้วจำนวนเงินล่ะ? คำนวณหลังจากนั้นถึงค่าสัมประสิทธิ์ที่เหมาะสมที่สุด "a" และ "be" ใกล้แค่เอื้อม.

หากมีเหตุผลให้เชื่อทุกประเด็นว่า ตั้งอยู่ตามเส้นโค้งลอการิทึมจากนั้นเพื่อค้นหาค่าที่เหมาะสมเราจะพบค่าต่ำสุดของฟังก์ชัน . อย่างเป็นทางการในระบบ (*) จะต้องถูกแทนที่ด้วย:

เมื่อทำการคำนวณใน Excel ให้ใช้ฟังก์ชัน แอลเอ็น. ฉันยอมรับว่าการสร้างเครื่องคิดเลขสำหรับแต่ละกรณีที่อยู่ระหว่างการพิจารณานั้นไม่ใช่เรื่องยากสำหรับฉัน แต่จะดีกว่าถ้าคุณ "ตั้งโปรแกรม" การคำนวณด้วยตัวเอง วิดีโอบทเรียนเพื่อช่วย

ด้วยการพึ่งพาแบบเอ็กซ์โปเนนเชียล สถานการณ์จึงซับซ้อนขึ้นเล็กน้อย เพื่อลดเรื่องให้กลายเป็นตัวพิมพ์เชิงเส้น เราจะนำฟังก์ชันลอการิทึมมาใช้ คุณสมบัติของลอการิทึม:

ตอนนี้เมื่อเปรียบเทียบฟังก์ชันผลลัพธ์กับฟังก์ชันเชิงเส้น เราได้ข้อสรุปว่าในระบบ (*) จะต้องถูกแทนที่ด้วย และ – โดย เพื่อความสะดวก เรามาแสดงว่า:

โปรดทราบว่าระบบได้รับการแก้ไขด้วยความเคารพ และ ดังนั้น หลังจากค้นหารากแล้ว คุณต้องไม่ลืมที่จะค้นหาค่าสัมประสิทธิ์ของตัวเอง

เพื่อนำจุดทดลองเข้ามาใกล้ยิ่งขึ้น พาราโบลาที่เหมาะสมที่สุด , ควรจะพบ ฟังก์ชันขั้นต่ำของสามตัวแปร . หลังจากดำเนินการตามมาตรฐานแล้ว เราจะได้ "การทำงาน" ดังต่อไปนี้ ระบบ:

ใช่ แน่นอนว่ามีจำนวนมากกว่านี้ แต่ไม่มีปัญหาใด ๆ เลยเมื่อใช้แอปพลิเคชันที่คุณชื่นชอบ และสุดท้าย ฉันจะบอกวิธีตรวจสอบอย่างรวดเร็วโดยใช้ Excel และสร้างเส้นแนวโน้มที่ต้องการ: สร้างพล็อตกระจาย เลือกจุดใดก็ได้ด้วยเมาส์ และคลิกขวาเลือกตัวเลือก "เพิ่มเส้นแนวโน้ม". จากนั้นเลือกประเภทแผนภูมิและบนแท็บ "ตัวเลือก"เปิดใช้งานตัวเลือก "แสดงสมการบนแผนภาพ". ตกลง

เช่นเคย ฉันอยากจะจบบทความด้วยวลีที่สวยงาม และเกือบจะพิมพ์ว่า “อยู่ในเทรนด์!” แต่เขาเปลี่ยนใจทันเวลา และไม่ใช่เพราะมันเป็นแบบเหมารวม ฉันไม่รู้ว่าจะเป็นยังไงสำหรับใคร แต่ฉันไม่อยากตามเทรนด์อเมริกาที่ได้รับการเลื่อนตำแหน่งและโดยเฉพาะยุโรป =) ดังนั้นฉันอยากให้คุณแต่ละคนยึดมั่นในแนวทางของตัวเอง!

http://www.grandars.ru/student/vysshaya-matematika/metod-naimenshih-kvadratov.html

วิธีกำลังสองน้อยที่สุดเป็นวิธีหนึ่งที่ใช้กันทั่วไปและพัฒนามากที่สุดเนื่องจาก ความเรียบง่ายและประสิทธิภาพของวิธีการประมาณค่าพารามิเตอร์ของตัวแบบเศรษฐมิติเชิงเส้น. ในเวลาเดียวกันเมื่อใช้งานควรปฏิบัติตามข้อควรระวังเนื่องจากแบบจำลองที่สร้างขึ้นโดยใช้อาจไม่เป็นไปตามข้อกำหนดหลายประการสำหรับคุณภาพของพารามิเตอร์และด้วยเหตุนี้จึงไม่สะท้อนถึงรูปแบบของการพัฒนากระบวนการ "ดี" เพียงพอ.

ให้เราพิจารณาขั้นตอนการประมาณค่าพารามิเตอร์ของแบบจำลองเศรษฐมิติเชิงเส้นโดยใช้วิธีกำลังสองน้อยที่สุดโดยละเอียดยิ่งขึ้น โดยทั่วไปแบบจำลองดังกล่าวสามารถแสดงได้ด้วยสมการ (1.2):

y t = a 0 + a 1 x 1t +...+ a n x nt + ε t

ข้อมูลเริ่มต้นเมื่อประมาณค่าพารามิเตอร์ a 0 , 1 ,..., n คือเวกเตอร์ของค่าของตัวแปรตาม ย= (y 1 , y 2 , ... , y T)" และเมทริกซ์ของค่าของตัวแปรอิสระ

โดยคอลัมน์แรกประกอบด้วยคอลัมน์ที่สอดคล้องกับค่าสัมประสิทธิ์แบบจำลอง

วิธีกำลังสองน้อยที่สุดได้รับชื่อตามหลักการพื้นฐานที่ค่าประมาณพารามิเตอร์ที่ได้รับตามเกณฑ์จะต้องเป็นไปตาม: ผลรวมของกำลังสองของข้อผิดพลาดของโมเดลควรมีค่าน้อยที่สุด

ตัวอย่างการแก้ปัญหาโดยใช้วิธีกำลังสองน้อยที่สุด

ตัวอย่างที่ 2.1องค์กรการค้ามีเครือข่ายร้านค้า 12 แห่งข้อมูลเกี่ยวกับกิจกรรมที่แสดงไว้ในตาราง 2.1.

ฝ่ายบริหารขององค์กรต้องการทราบว่าขนาดของรายได้ต่อปีนั้นขึ้นอยู่กับพื้นที่ค้าปลีกของร้านค้าอย่างไร

ตารางที่ 2.1

เลขที่ร้าน	มูลค่าการซื้อขายประจำปีล้านรูเบิล	พื้นที่ค้าปลีก พันตรม
	19,76	0,24
	38,09	0,31
	40,95	0,55
	41,08	0,48
	56,29	0,78
	68,51	0,98
	75,01	0,94
	89,05	1,21
	91,13	1,29
	91,26	1,12
	99,84	1,29
	108,55	1,49

คำตอบของกำลังสองน้อยที่สุดให้เราแสดงมูลค่าการซื้อขายประจำปีของร้านค้านั้นล้านรูเบิล - พื้นที่ค้าปลีกของร้าน พัน ตร.ม.

รูปที่.2.1. Scatterplot สำหรับตัวอย่าง 2.1

เพื่อกำหนดรูปแบบของความสัมพันธ์เชิงฟังก์ชันระหว่างตัวแปรและเราจะสร้างแผนภาพกระจาย (รูปที่ 2.1)

จากแผนภาพกระจาย เราสามารถสรุปได้ว่ามูลค่าการซื้อขายต่อปีจะขึ้นอยู่กับพื้นที่ค้าปลีกในเชิงบวก (เช่น y จะเพิ่มขึ้นตามการเพิ่มขึ้น ) รูปแบบการเชื่อมต่อการทำงานที่เหมาะสมที่สุดคือ เชิงเส้น.

ข้อมูลสำหรับการคำนวณเพิ่มเติมแสดงไว้ในตาราง 2.2. เมื่อใช้วิธีกำลังสองน้อยที่สุด เราจะประมาณค่าพารามิเตอร์ของแบบจำลองเศรษฐมิติแบบปัจจัยเดียวเชิงเส้น

ตารางที่ 2.2

ที	ใช่	x 1 ตัน	ใช่ 2	x 1t 2	x 1t ปี

	19,76	0,24	390,4576	0,0576	4,7424
	38,09	0,31	1450,8481	0,0961	11,8079
	40,95	0,55	1676,9025	0,3025	22,5225
	41,08	0,48	1687,5664	0,2304	19,7184
	56,29	0,78	3168,5641	0,6084	43,9062
	68,51	0,98	4693,6201	0,9604	67,1398
	75,01	0,94	5626,5001	0,8836	70,5094
	89,05	1,21	7929,9025	1,4641	107,7505
	91,13	1,29	8304,6769	1,6641	117,5577
	91,26	1,12	8328,3876	1,2544	102,2112
	99,84	1,29	9968,0256	1,6641	128,7936
	108,55	1,49	11783,1025	2,2201	161,7395
ส	819,52	10,68	65008,554	11,4058	858,3991
เฉลี่ย	68,29	0,89

ดังนั้น,

ดังนั้นด้วยพื้นที่ค้าปลีกเพิ่มขึ้น 1,000 ตารางเมตร สิ่งอื่น ๆ ที่เท่าเทียมกัน มูลค่าการซื้อขายเฉลี่ยต่อปีเพิ่มขึ้น 67.8871 ล้านรูเบิล

ตัวอย่างที่ 2.2ฝ่ายบริหารของบริษัทสังเกตเห็นว่ายอดขายต่อปีไม่เพียงแต่ขึ้นอยู่กับพื้นที่ขายของร้านค้าเท่านั้น (ดูตัวอย่างที่ 2.1) แต่ยังขึ้นอยู่กับจำนวนผู้เข้าชมโดยเฉลี่ยด้วย ข้อมูลที่เกี่ยวข้องแสดงไว้ในตาราง 2.3.

ตารางที่ 2.3

สารละลาย.ให้เราแสดงว่า - จำนวนผู้เข้าชมร้านค้าโดยเฉลี่ยต่อวันพันคน

เพื่อกำหนดรูปแบบของความสัมพันธ์เชิงฟังก์ชันระหว่างตัวแปรและเราจะสร้างแผนภาพกระจาย (รูปที่ 2.2)

จากแผนภาพกระจาย เราสามารถสรุปได้ว่ามูลค่าการซื้อขายต่อปีจะขึ้นอยู่กับจำนวนผู้เข้าชมโดยเฉลี่ยต่อวัน (เช่น y จะเพิ่มขึ้นตามการเพิ่มขึ้น ) รูปแบบของการพึ่งพาฟังก์ชันเป็นแบบเส้นตรง

ข้าว. 2.2. Scatterplot สำหรับตัวอย่าง 2.2

ตารางที่ 2.4

ที	x2t	x 2t 2	ใช่ x 2t	x 1 ตัน x 2 ตัน

	8,25	68,0625	163,02	1,98
	10,24	104,8575	390,0416	3,1744
	9,31	86,6761	381,2445	5,1205
	11,01	121,2201	452,2908	5,2848
	8,54	72,9316	480,7166	6,6612
	7,51	56,4001	514,5101	7,3598
	12,36	152,7696	927,1236	11,6184
	10,81	116,8561	962,6305	13,0801
	9,89	97,8121	901,2757	12,7581
	13,72	188,2384	1252,0872	15,3664
	12,27	150,5529	1225,0368	15,8283
	13,92	193,7664	1511,016	20,7408
ส	127,83	1410,44	9160,9934	118,9728
เฉลี่ย	10,65

โดยทั่วไป จำเป็นต้องกำหนดพารามิเตอร์ของแบบจำลองเศรษฐมิติแบบสองปัจจัย

y เสื้อ = a 0 + a 1 x 1t + a 2 x 2t + ε เสื้อ

ข้อมูลที่จำเป็นสำหรับการคำนวณเพิ่มเติมแสดงไว้ในตาราง 2.4.

ขอให้เราประมาณค่าพารามิเตอร์ของแบบจำลองเศรษฐมิติแบบสองปัจจัยเชิงเส้นโดยใช้วิธีกำลังสองน้อยที่สุด

ดังนั้น,

การประมาณค่าสัมประสิทธิ์ =61.6583 แสดงให้เห็นว่าสิ่งอื่น ๆ ที่เท่าเทียมกันเมื่อพื้นที่ค้าปลีกเพิ่มขึ้น 1,000 ตารางเมตร มูลค่าการซื้อขายต่อปีจะเพิ่มขึ้นโดยเฉลี่ย 61.6583 ล้านรูเบิล

การประมาณค่าสัมประสิทธิ์ = 2.2748 แสดงให้เห็นว่าสิ่งอื่นๆ เท่ากัน โดยมีจำนวนผู้เข้าชมเฉลี่ยต่อ 1,000 คนเพิ่มขึ้น ต่อวันมูลค่าการซื้อขายต่อปีจะเพิ่มขึ้นโดยเฉลี่ย 2.2748 ล้านรูเบิล

ตัวอย่างที่ 2.3โดยใช้ข้อมูลที่นำเสนอในตาราง 2.2 และ 2.4 ประมาณการค่าพารามิเตอร์ของแบบจำลองเศรษฐมิติแบบปัจจัยเดียว

โดยที่มูลค่าศูนย์กลางของมูลค่าการซื้อขายประจำปีของร้านค้านั้นคือล้านรูเบิล - ค่ากึ่งกลางของจำนวนผู้เข้าชมร้านค้า t-th เฉลี่ยต่อวัน, พันคน (ดูตัวอย่างที่ 2.1-2.2)

สารละลาย.ข้อมูลเพิ่มเติมที่จำเป็นสำหรับการคำนวณแสดงอยู่ในตาราง 2.5.

ตารางที่ 2.5



	-48,53	-2,40	5,7720	116,6013
	-30,20	-0,41	0,1702	12,4589
	-27,34	-1,34	1,8023	36,7084
	-27,21	0,36	0,1278	-9,7288
	-12,00	-2,11	4,4627	25,3570
	0,22	-3,14	9,8753	-0,6809
	6,72	1,71	2,9156	11,4687
	20,76	0,16	0,0348	3,2992
	22,84	-0,76	0,5814	-17,413
	22,97	3,07	9,4096	70,4503
	31,55	1,62	2,6163	51,0267
	40,26	3,27	10,6766	131,5387
จำนวน			48,4344	431,0566

เราได้รับโดยใช้สูตร (2.35)

ดังนั้น,

http://www.cleverstudents.ru/articles/mnk.html

ตัวอย่าง.

ข้อมูลการทดลองเกี่ยวกับค่าของตัวแปร เอ็กซ์และ ที่จะได้รับในตาราง

จากการจัดตำแหน่ง ทำให้ได้ฟังก์ชันมา

สารละลาย.

ค่าในคอลัมน์สุดท้ายของตารางคือผลรวมของค่าระหว่างแถว

เพราะฉะนั้น, y = 0.165x+2.184- เส้นตรงโดยประมาณที่ต้องการ

การพิสูจน์.

ส่วนต่างลำดับที่สองมีรูปแบบ:

นั่นคือ

ผู้เยาว์เชิงมุมของลำดับแรก . ความไม่เท่าเทียมกันนั้นเข้มงวดตั้งแต่ประเด็น

บทเรียนเบื้องต้น ฟรี;
ครูที่มีประสบการณ์จำนวนมาก (เจ้าของภาษาและพูดภาษารัสเซีย)
หลักสูตรไม่ใช่หลักสูตรสำหรับระยะเวลาที่กำหนด (เดือน หกเดือน ปี) แต่สำหรับบทเรียนตามจำนวนที่กำหนด (5, 10, 20, 50)
ลูกค้าพึงพอใจมากกว่า 10,000 ราย
ค่าใช้จ่ายของบทเรียนหนึ่งบทเรียนกับครูที่พูดภาษารัสเซียคือ จาก 600 รูเบิลกับเจ้าของภาษา - จาก 1,500 รูเบิล

สาระสำคัญของวิธีกำลังสองน้อยที่สุดคือ ในการค้นหาพารามิเตอร์ของแบบจำลองแนวโน้มที่อธิบายแนวโน้มการพัฒนาของปรากฏการณ์สุ่มใด ๆ ในเวลาหรืออวกาศได้ดีที่สุด (แนวโน้มคือเส้นที่แสดงลักษณะแนวโน้มของการพัฒนานี้) งานของวิธีกำลังสองน้อยที่สุด (LSM) อยู่ที่การค้นหาไม่เพียงแต่แบบจำลองเทรนด์บางแบบเท่านั้น แต่ยังเพื่อค้นหาแบบจำลองที่ดีที่สุดหรือเหมาะสมที่สุดอีกด้วย โมเดลนี้จะเหมาะสมที่สุดหากผลรวมของการเบี่ยงเบนกำลังสองระหว่างค่าจริงที่สังเกตได้และค่าแนวโน้มที่คำนวณที่สอดคล้องกันนั้นน้อยที่สุด (น้อยที่สุด):

โดยที่ค่าเบี่ยงเบนกำลังสองระหว่างค่าจริงที่สังเกตได้

และค่าแนวโน้มที่คำนวณได้ที่สอดคล้องกัน

ค่าจริง (สังเกตได้) ของปรากฏการณ์ที่กำลังศึกษา

ค่าที่คำนวณได้ของแบบจำลองแนวโน้ม

จำนวนการสังเกตปรากฏการณ์ที่กำลังศึกษา

MNC ใช้งานค่อนข้างน้อยในตัวเอง ตามกฎแล้วส่วนใหญ่มักใช้เป็นเทคนิคทางเทคนิคที่จำเป็นในการศึกษาความสัมพันธ์เท่านั้น ควรจำไว้ว่าพื้นฐานข้อมูลของ OLS สามารถเป็นชุดทางสถิติที่เชื่อถือได้เท่านั้น และจำนวนการสังเกตไม่ควรน้อยกว่า 4 มิฉะนั้นขั้นตอนการปรับให้เรียบของ OLS อาจสูญเสียสามัญสำนึก

ชุดเครื่องมือ MNC ประกอบไปด้วยขั้นตอนต่อไปนี้:

ขั้นตอนแรก ปรากฎว่ามีแนวโน้มใดๆ เลยที่จะเปลี่ยนคุณลักษณะผลลัพธ์หรือไม่ เมื่อข้อโต้แย้งปัจจัยที่เลือกเปลี่ยนแปลง หรือกล่าวอีกนัยหนึ่ง มีความเชื่อมโยงระหว่าง “ ที่ " และ " เอ็กซ์ ».

ขั้นตอนที่สอง มีการกำหนดว่าเส้นใด (วิถี) สามารถอธิบายหรือแสดงลักษณะแนวโน้มนี้ได้ดีที่สุด

ขั้นตอนที่สาม

ตัวอย่าง. สมมติว่าเรามีข้อมูลเกี่ยวกับผลผลิตดอกทานตะวันโดยเฉลี่ยสำหรับฟาร์มที่กำลังศึกษาอยู่ (ตารางที่ 9.1)

ตารางที่ 9.1

เลขที่สังเกต

ผลผลิต c/ha

เนื่องจากระดับเทคโนโลยีในการผลิตดอกทานตะวันในประเทศของเรายังคงไม่เปลี่ยนแปลงในช่วง 10 ปีที่ผ่านมา เห็นได้ชัดว่าความผันผวนของผลผลิตในช่วงระยะเวลาที่วิเคราะห์ขึ้นอยู่กับความผันผวนของสภาพอากาศและสภาพภูมิอากาศเป็นอย่างมาก นี่เป็นเรื่องจริงเหรอ?

ขั้นตอน OLS แรก มีการทดสอบสมมติฐานเกี่ยวกับการมีอยู่ของแนวโน้มของผลผลิตดอกทานตะวันโดยขึ้นอยู่กับการเปลี่ยนแปลงของสภาพอากาศและสภาพภูมิอากาศในช่วง 10 ปีที่วิเคราะห์

ในตัวอย่างนี้ สำหรับ " ย " ขอแนะนำให้ใช้ผลผลิตดอกทานตะวันและสำหรับ " x » – จำนวนปีที่สังเกตในช่วงเวลาที่วิเคราะห์ ทดสอบสมมติฐานเกี่ยวกับการมีอยู่ของความสัมพันธ์ระหว่าง " x " และ " ย "สามารถทำได้ 2 วิธี คือ ด้วยตนเอง และการใช้โปรแกรมคอมพิวเตอร์ แน่นอนว่าด้วยความพร้อมใช้งานของเทคโนโลยีคอมพิวเตอร์ปัญหานี้จึงสามารถแก้ไขได้ด้วยตัวเอง แต่เพื่อให้เข้าใจเครื่องมือของ MNC ได้ดีขึ้น แนะนำให้ทดสอบสมมติฐานเรื่องการมีอยู่ของความสัมพันธ์ระหว่าง “ x " และ " ย » ด้วยตนเอง เมื่อมีเพียงปากกาและเครื่องคิดเลขธรรมดาเท่านั้นที่อยู่ในมือ ในกรณีเช่นนี้ สมมติฐานเกี่ยวกับการมีอยู่ของแนวโน้มจะได้รับการตรวจสอบด้วยสายตาได้ดีที่สุดโดยตำแหน่งของภาพกราฟิกของชุดไดนามิกที่วิเคราะห์ - ฟิลด์สหสัมพันธ์:

ช่องความสัมพันธ์ในตัวอย่างของเราอยู่รอบๆ เส้นที่เพิ่มขึ้นอย่างช้าๆ สิ่งนี้บ่งชี้ว่ามีแนวโน้มในการเปลี่ยนแปลงของผลผลิตดอกทานตะวัน เป็นไปไม่ได้ที่จะพูดถึงการมีแนวโน้มใดๆ เฉพาะเมื่อสนามความสัมพันธ์ดูเหมือนวงกลม วงกลม เมฆแนวตั้งหรือแนวนอนอย่างเคร่งครัด หรือประกอบด้วยจุดที่กระจัดกระจายอย่างวุ่นวาย ในกรณีอื่นๆ ทั้งหมด สมมติฐานเกี่ยวกับการดำรงอยู่ของความสัมพันธ์ระหว่าง “ x " และ " ย "และทำการวิจัยต่อไป

ขั้นตอน OLS ที่สอง จะพิจารณาว่าเส้นใด (วิถี) สามารถอธิบายหรือระบุลักษณะแนวโน้มการเปลี่ยนแปลงของผลผลิตดอกทานตะวันได้ดีที่สุดในช่วงเวลาที่วิเคราะห์

หากคุณมีเทคโนโลยีคอมพิวเตอร์ การเลือกแนวโน้มที่เหมาะสมที่สุดจะเกิดขึ้นโดยอัตโนมัติ ในการประมวลผลแบบ "แมนนวล" การเลือกฟังก์ชันที่เหมาะสมที่สุดจะดำเนินการตามกฎด้วยสายตา - ตามตำแหน่งของฟิลด์สหสัมพันธ์ นั่นคือ สมการของเส้นตรงที่เหมาะกับแนวโน้มเชิงประจักษ์ (วิถีโคจรจริง) จะถูกเลือกตามประเภทของกราฟ

ดังที่ทราบกันดีอยู่แล้วว่าโดยธรรมชาติแล้วมีการพึ่งพาการทำงานที่หลากหลายมากดังนั้นจึงเป็นเรื่องยากมากที่จะวิเคราะห์ด้วยสายตาแม้แต่ส่วนเล็ก ๆ ก็ตาม โชคดีที่ในทางปฏิบัติทางเศรษฐกิจ ความสัมพันธ์ส่วนใหญ่สามารถอธิบายได้ค่อนข้างแม่นยำโดยใช้พาราโบลา ไฮเปอร์โบลา หรือเส้นตรง ในเรื่องนี้ด้วยตัวเลือก "ด้วยตนเอง" ในการเลือกฟังก์ชันที่ดีที่สุด คุณสามารถจำกัดตัวเองไว้เพียงสามรุ่นนี้เท่านั้น

		ไฮเปอร์โบลา:

พาราโบลาลำดับที่สอง: :

จะเห็นได้ง่ายว่าในตัวอย่างของเรา แนวโน้มการเปลี่ยนแปลงของผลผลิตดอกทานตะวันในช่วง 10 ปีที่วิเคราะห์นั้นมีลักษณะเฉพาะที่ดีที่สุดคือเส้นตรง ดังนั้นสมการการถดถอยจะเป็นสมการของเส้นตรง

ขั้นตอนที่สาม พารามิเตอร์ของสมการถดถอยที่แสดงลักษณะของเส้นนี้ได้รับการคำนวณ หรือกล่าวอีกนัยหนึ่งคือ สูตรการวิเคราะห์ถูกกำหนดเพื่ออธิบายแบบจำลองแนวโน้มที่ดีที่สุด

การค้นหาค่าของพารามิเตอร์ของสมการการถดถอยในกรณีของเรา พารามิเตอร์ และ , เป็นแกนหลักของ OLS กระบวนการนี้เกี่ยวข้องกับการแก้ระบบสมการปกติ

(9.2)

ระบบสมการนี้สามารถแก้ได้อย่างง่ายดายโดยใช้วิธีเกาส์ ขอให้เราจำไว้ว่าผลลัพธ์ของการแก้ปัญหาในตัวอย่างของเราคือค่าของพารามิเตอร์และถูกค้นพบ ดังนั้นสมการถดถอยที่พบจะมีรูปแบบดังนี้

มีการใช้กันอย่างแพร่หลายในเศรษฐมิติในรูปแบบของการตีความพารามิเตอร์ทางเศรษฐกิจที่ชัดเจน

การถดถอยเชิงเส้นลงมาเพื่อค้นหาสมการของรูปแบบ

หรือ

สมการของแบบฟอร์ม อนุญาตตามค่าพารามิเตอร์ที่ระบุ เอ็กซ์มีค่าทางทฤษฎีของลักษณะผลลัพธ์โดยแทนที่ค่าที่แท้จริงของปัจจัยลงไป เอ็กซ์.

การสร้างการถดถอยเชิงเส้นนั้นมาจากการประมาณค่าพารามิเตอร์ - กและ วี.การประมาณค่าพารามิเตอร์การถดถอยเชิงเส้นสามารถพบได้โดยใช้วิธีการต่างๆ

วิธีการดั้งเดิมในการประมาณค่าพารามิเตอร์การถดถอยเชิงเส้นนั้นยึดตาม วิธีกำลังสองน้อยที่สุด(เอ็มเอ็นซี)

วิธีกำลังสองน้อยที่สุดช่วยให้เราสามารถประมาณค่าพารามิเตอร์ดังกล่าวได้ กและ วีซึ่งผลรวมของการเบี่ยงเบนกำลังสองของค่าที่แท้จริงของลักษณะผลลัพธ์ (ญ)จากการคำนวณ (ทางทฤษฎี) ขั้นต่ำ:

ในการหาค่าต่ำสุดของฟังก์ชัน คุณต้องคำนวณอนุพันธ์ย่อยของพารามิเตอร์แต่ละตัว กและ ขและตั้งค่าให้เท่ากับศูนย์

ให้เราแสดงด้วย S แล้ว:

การแปลงสูตรเราได้รับระบบสมการปกติต่อไปนี้สำหรับการประมาณค่าพารามิเตอร์ กและ วี:

การแก้ระบบสมการปกติ (3.5) ไม่ว่าจะโดยวิธีการกำจัดตัวแปรตามลำดับหรือโดยวิธีการกำหนดเราจะพบการประมาณค่าพารามิเตอร์ที่ต้องการ กและ วี.

พารามิเตอร์ วีเรียกว่าสัมประสิทธิ์การถดถอย ค่าของมันแสดงการเปลี่ยนแปลงโดยเฉลี่ยของผลลัพธ์โดยมีการเปลี่ยนแปลงปัจจัยหนึ่งหน่วย

สมการถดถอยจะเสริมด้วยตัวบ่งชี้ความใกล้ชิดของการเชื่อมต่อเสมอ เมื่อใช้การถดถอยเชิงเส้น ตัวบ่งชี้ดังกล่าวคือค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้น มีการปรับเปลี่ยนสูตรสัมประสิทธิ์สหสัมพันธ์เชิงเส้นที่แตกต่างกัน บางส่วนได้รับด้านล่าง:

ดังที่ทราบ ค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้นอยู่ภายในขีดจำกัด: -1 ≤ ≤ 1.

เพื่อประเมินคุณภาพของการเลือกฟังก์ชันเชิงเส้น จะมีการคำนวณกำลังสอง

สัมประสิทธิ์สหสัมพันธ์เชิงเส้นที่เรียกว่า ค่าสัมประสิทธิ์การตัดสินใจ.ค่าสัมประสิทธิ์การกำหนดลักษณะสัดส่วนของความแปรปรวนของลักษณะผลลัพธ์ ใช่อธิบายโดยการถดถอย ในความแปรปรวนรวมของลักษณะผลลัพธ์:

ดังนั้น ค่า 1 จึงแสดงถึงส่วนแบ่งของความแปรปรวน ใช่เกิดจากอิทธิพลของปัจจัยอื่นๆ ที่ไม่ได้นำมาพิจารณาในแบบจำลอง

คำถามเพื่อการควบคุมตนเอง

1. สาระสำคัญของวิธีกำลังสองน้อยที่สุด?

2. การถดถอยแบบคู่มีตัวแปรกี่ตัว?

3. ค่าสัมประสิทธิ์ใดกำหนดความใกล้ชิดของการเชื่อมต่อระหว่างการเปลี่ยนแปลง?

4. ค่าสัมประสิทธิ์การตัดสินใจถูกกำหนดไว้ภายในขอบเขตใด?

5. การประมาณค่าพารามิเตอร์ b ในการวิเคราะห์สหสัมพันธ์-การถดถอย?

1. คริสโตเฟอร์ โดเฮอร์ตี้ เศรษฐมิติเบื้องต้น - อ.: INFRA - ม. 2544 - 402 หน้า

2. เอส.เอ. โบโรดิช. เศรษฐมิติ. Minsk LLC "ความรู้ใหม่" 2544

3. ร.ศ. Rakhmetova หลักสูตรระยะสั้นทางเศรษฐมิติ บทช่วยสอน อัลมาตี 2004. -78น.

4. II. เอลิเซวา เศรษฐมิติ. - อ.: “การเงินและสถิติ”, 2545

5. ข้อมูลรายเดือนและนิตยสารเชิงวิเคราะห์

แบบจำลองเศรษฐศาสตร์ไม่เชิงเส้น ตัวแบบการถดถอยแบบไม่เชิงเส้น การเปลี่ยนแปลงของตัวแปร

โมเดลเศรษฐกิจไม่เชิงเส้น..

การเปลี่ยนแปลงของตัวแปร

ค่าสัมประสิทธิ์ความยืดหยุ่น

หากมีความสัมพันธ์แบบไม่เชิงเส้นระหว่างปรากฏการณ์ทางเศรษฐกิจ ก็จะแสดงออกมาโดยใช้ฟังก์ชันไม่เชิงเส้นที่สอดคล้องกัน เช่น ไฮเพอร์โบลาด้านเท่ากันหมด , พาราโบลาของระดับที่สอง ฯลฯ

การถดถอยแบบไม่เชิงเส้นมีสองประเภท:

1. การถดถอยที่ไม่เชิงเส้นตามตัวแปรอธิบายที่รวมอยู่ในการวิเคราะห์ แต่เป็นเส้นตรงตามพารามิเตอร์ที่ประมาณไว้ เช่น

พหุนามขององศาต่างๆ - , ;

ไฮเปอร์โบลาด้านเท่ากันหมด - ;

ฟังก์ชันเซมิลอการิทึม - .

2. การถดถอยที่ไม่เป็นเชิงเส้นในพารามิเตอร์ที่กำลังประมาณ ตัวอย่างเช่น:

พลัง - ;

สาธิต - ;

เอ็กซ์โปเนนเชียล - .

ผลรวมของการเบี่ยงเบนกำลังสองของแต่ละค่าของลักษณะผลลัพธ์ ที่จากค่าเฉลี่ยนั้นเกิดจากอิทธิพลของหลายสาเหตุ ให้เราแบ่งเหตุผลทั้งหมดออกเป็นสองกลุ่มอย่างมีเงื่อนไข: ปัจจัยภายใต้การศึกษา xและ ปัจจัยอื่นๆ

หากปัจจัยไม่ส่งผลต่อผลลัพธ์ เส้นการถดถอยบนกราฟจะขนานกับแกน โอ้และ

จากนั้นความแปรปรวนทั้งหมดของลักษณะผลลัพธ์นั้นเกิดจากอิทธิพลของปัจจัยอื่น ๆ และผลรวมของการเบี่ยงเบนกำลังสองจะตรงกับค่าคงเหลือ หากปัจจัยอื่นไม่ส่งผลต่อผลลัพธ์แล้ว คุณผูกอยู่กับ เอ็กซ์ตามหน้าที่และผลรวมที่เหลือของกำลังสองเป็นศูนย์ ในกรณีนี้ ผลรวมของการเบี่ยงเบนกำลังสองซึ่งอธิบายโดยการถดถอยจะเท่ากับผลรวมของกำลังสองทั้งหมด

เนื่องจากไม่ใช่ทุกจุดของสนามความสัมพันธ์จะอยู่บนเส้นถดถอย การกระจัดกระจายจึงเกิดขึ้นเสมออันเป็นผลมาจากอิทธิพลของปัจจัย เอ็กซ์นั่นคือการถดถอย ที่โดย เอ็กซ์,และเกิดจากสาเหตุอื่น (ความแปรผันที่ไม่สามารถอธิบายได้) ความเหมาะสมของเส้นการถดถอยในการพยากรณ์ขึ้นอยู่กับส่วนใดของการแปรผันรวมของลักษณะ ที่อธิบายความแปรผันที่อธิบายไว้

แน่นอนว่า หากผลรวมของการเบี่ยงเบนกำลังสองเนื่องจากการถดถอยมากกว่าผลรวมที่เหลือของกำลังสอง สมการการถดถอยจะมีนัยสำคัญทางสถิติและเป็นปัจจัย เอ็กซ์มีผลกระทบอย่างมีนัยสำคัญต่อผลลัพธ์ ยู.

, นั่นคือด้วยจำนวนอิสระของการแปรผันที่เป็นอิสระของคุณลักษณะ จำนวนระดับความเป็นอิสระสัมพันธ์กับจำนวนหน่วยของประชากร n และจำนวนค่าคงที่ที่กำหนด ในความสัมพันธ์กับปัญหาที่กำลังศึกษา จำนวนระดับความเป็นอิสระควรแสดงจำนวนค่าเบี่ยงเบนอิสระจาก ป

การประเมินนัยสำคัญของสมการการถดถอยโดยรวมจะใช้ เอฟ-เกณฑ์ชาวประมง ในกรณีนี้ มีการเสนอสมมติฐานว่างว่าสัมประสิทธิ์การถดถอยเท่ากับศูนย์ นั่นคือ ข = 0 และด้วยเหตุนี้จึงเป็นปัจจัย เอ็กซ์ไม่ส่งผลกระทบต่อผลลัพธ์ ยู.

การคำนวณการทดสอบ F ในทันทีนั้นนำหน้าด้วยการวิเคราะห์ความแปรปรวน จุดศูนย์กลางในนั้นถูกครอบครองโดยการสลายตัวของผลรวมของการเบี่ยงเบนกำลังสองของตัวแปร ที่จากค่าเฉลี่ย ที่ออกเป็นสองส่วน - "อธิบาย" และ "ไม่ได้อธิบาย":

ผลรวมของการเบี่ยงเบนกำลังสอง

ผลรวมของค่าเบี่ยงเบนกำลังสองที่อธิบายโดยการถดถอย

ผลรวมที่เหลือของการเบี่ยงเบนกำลังสอง

ผลรวมของการเบี่ยงเบนกำลังสองสัมพันธ์กับจำนวนดีกรีอิสระ , นั่นคือด้วยจำนวนอิสระของการแปรผันที่เป็นอิสระของคุณลักษณะ จำนวนองศาอิสระสัมพันธ์กับจำนวนหน่วยประชากร nและด้วยจำนวนค่าคงที่ที่กำหนดจากมัน ในความสัมพันธ์กับปัญหาที่กำลังศึกษา จำนวนระดับความเป็นอิสระควรแสดงจำนวนค่าเบี่ยงเบนอิสระจาก ปเป็นไปได้ที่จำเป็นในการสร้างผลรวมของกำลังสองที่กำหนด

การกระจายตัวต่อระดับความเป็นอิสระดี.

อัตราส่วน F (การทดสอบ F):

ถ้าสมมุติฐานว่างเป็นจริงแล้วปัจจัยและความแปรปรวนคงเหลือไม่แตกต่างกัน สำหรับ H 0 จำเป็นต้องมีการพิสูจน์เพื่อให้การกระจายตัวของปัจจัยเกินการกระจายตัวของสารตกค้างหลายครั้ง Snedekor นักสถิติชาวอังกฤษได้พัฒนาตารางค่าวิกฤต เอฟ-ความสัมพันธ์ในระดับนัยสำคัญต่างๆ ของสมมติฐานว่างและระดับความเป็นอิสระที่แตกต่างกัน ค่าตาราง เอฟ-เกณฑ์คือค่าสูงสุดของอัตราส่วนของความแปรปรวนที่สามารถเกิดขึ้นได้ในกรณีของความแตกต่างแบบสุ่มสำหรับระดับความน่าจะเป็นของการมีอยู่ของสมมติฐานที่เป็นโมฆะ ค่าที่คำนวณได้ เอฟ-ความสัมพันธ์จะถือว่าเชื่อถือได้ถ้า o มากกว่าตาราง

ในกรณีนี้ สมมติฐานว่างเกี่ยวกับการไม่มีความสัมพันธ์ระหว่างสัญญาณต่างๆ จะถูกปฏิเสธ และได้ข้อสรุปเกี่ยวกับความสำคัญของความสัมพันธ์นี้: F ข้อเท็จจริง > ตาราง F H 0 ถูกปฏิเสธ

หากค่าน้อยกว่าตาราง F ข้อเท็จจริง ‹, ตาราง Fดังนั้นความน่าจะเป็นของสมมติฐานว่างจะสูงกว่าระดับที่ระบุและไม่สามารถปฏิเสธได้หากไม่มีความเสี่ยงร้ายแรงในการสรุปข้อสรุปที่ผิดเกี่ยวกับการมีอยู่ของความสัมพันธ์ ในกรณีนี้ สมการการถดถอยถือว่าไม่มีนัยสำคัญทางสถิติ แต่เขาไม่เบี่ยงเบน

ค่าคลาดเคลื่อนมาตรฐานของสัมประสิทธิ์การถดถอย

เพื่อประเมินความสำคัญของสัมประสิทธิ์การถดถอย ค่าของมันจะถูกเปรียบเทียบกับข้อผิดพลาดมาตรฐาน เช่น กำหนดค่าจริง ที-Student's t-test: ซึ่งจะถูกเปรียบเทียบกับค่าตารางในระดับนัยสำคัญและจำนวนระดับความเป็นอิสระ ( n- 2).

ข้อผิดพลาดของพารามิเตอร์มาตรฐาน ก:

ความสำคัญของค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้นได้รับการตรวจสอบตามขนาดของข้อผิดพลาด ค่าสัมประสิทธิ์สหสัมพันธ์ ทีอาร์:

ความแปรปรวนลักษณะรวม เอ็กซ์:

การถดถอยเชิงเส้นพหุคูณ

การสร้างแบบจำลอง

การถดถอยหลายครั้งแสดงถึงการถดถอยของคุณลักษณะที่มีประสิทธิผลด้วยปัจจัยตั้งแต่ 2 ตัวขึ้นไป เช่น แบบจำลองของแบบฟอร์ม

การถดถอยสามารถให้ผลลัพธ์ที่ดีในการสร้างแบบจำลองได้ หากสามารถละเลยอิทธิพลของปัจจัยอื่นที่ส่งผลต่อวัตถุประสงค์ของการศึกษาได้ ไม่สามารถควบคุมพฤติกรรมของตัวแปรทางเศรษฐกิจแต่ละรายการได้ กล่าวคือ ไม่สามารถรับประกันความเท่าเทียมกันของเงื่อนไขอื่น ๆ ทั้งหมดในการประเมินอิทธิพลของปัจจัยหนึ่งภายใต้การศึกษา ในกรณีนี้ คุณควรพยายามระบุอิทธิพลของปัจจัยอื่นๆ ด้วยการนำปัจจัยเหล่านั้นเข้าไปในแบบจำลอง เช่น สร้างสมการการถดถอยพหุคูณ: y = a+b 1 x 1 +b 2 +…+b p x p + .

เป้าหมายหลักของการถดถอยพหุคูณคือการสร้างแบบจำลองที่มีปัจจัยจำนวนมาก ในขณะเดียวกันก็กำหนดอิทธิพลของปัจจัยแต่ละอย่างแยกกัน รวมถึงผลกระทบที่รวมกันต่อตัวบ่งชี้ที่เป็นแบบจำลอง ข้อกำหนดของแบบจำลองประกอบด้วยประเด็นสองช่วง ได้แก่ การเลือกปัจจัย และการเลือกประเภทของสมการการถดถอย