Wednesday 12 July 2017

อัต เคลื่อนไหว ค่าเฉลี่ย ใน r


ความรู้เบื้องต้นเกี่ยวกับรูปแบบที่ไม่เป็นกรรมสิทธิ์ของ ARIMA รูปแบบ ARIMA เป็นทฤษฎีในชั้นเรียนโดยทั่วไปในรูปแบบของการคาดการณ์ชุดเวลาซึ่งสามารถทำให้เคลื่อนที่ได้โดยการแยกแยะถ้าจำเป็นบางทีอาจใช้ร่วมกับการแปลงที่ไม่เป็นเชิงเส้น เช่นการบันทึกหรือการลดน้ำหนักถ้าจำเป็นตัวแปรแบบสุ่มที่เป็นชุดเวลาจะหยุดนิ่งถ้าคุณสมบัติทางสถิติมีค่าคงที่ตลอดช่วงเวลาชุดคงที่ไม่มีแนวโน้มมีการแปรผันรอบ ๆ ค่าเฉลี่ยของมันมีค่าแอมพลิจูดคงที่และเลื้อยตามแบบที่สอดคล้องกัน คือระยะสั้นของรูปแบบเวลาสุ่มมักจะมีลักษณะเดียวกันในแง่สถิติสภาพหลังหมายความว่า correlations ความสัมพันธ์กับความเบี่ยงเบนก่อนหน้านี้เองจากค่าคงที่ยังคงอยู่ตลอดเวลาหรือเทียบเท่าที่สเปกตรัมพลังงานคงที่ตลอดเวลาสุ่ม ตัวแปรของรูปแบบนี้สามารถดูได้ตามปกติเช่นการรวมกันของสัญญาณและเสียงและสัญญาณถ้าอย่างใดอย่างหนึ่งอาจจะเป็น PAT ern ของการพลิกกลับค่าเฉลี่ยอย่างรวดเร็วหรือช้าหรือการสั่นสะเทือนไซน์หรือสลับอย่างรวดเร็วในการลงนามและยังอาจมีองค์ประกอบตามฤดูกาลรูปแบบ ARIMA สามารถดูเป็นตัวกรองที่พยายามแยกสัญญาณจากเสียงและสัญญาณจะแล้ว ในอนาคตจะได้รับการคาดการณ์สมการพยากรณ์ ARIMA สำหรับชุดเวลานิ่งคือสมการถดถอยเชิงเส้นซึ่งตัวทำนายประกอบด้วยความล่าช้าของตัวแปรตามและหรือความล่าช้าของข้อผิดพลาดในการคาดการณ์นั่นคือค่าที่กำหนดของ Y ค่าคงที่และหรือผลรวมถ่วงน้ำหนักของหนึ่งหรือมากกว่าค่าล่าสุดของ Y และหรือผลรวมถ่วงน้ำหนักของหนึ่งหรือมากกว่าค่าล่าสุดของข้อผิดพลาดหากตัวทำนายประกอบด้วยเฉพาะค่า lag ของ Y มันเป็นแบบอัตถิภาวนิยมแบบอัตถิภาวนิยมแบบอัตถิภาวนิยม, ซึ่งเป็นเพียงกรณีพิเศษของรูปแบบการถดถอยและสามารถใช้กับซอฟต์แวร์การถดถอยตามมาตรฐานได้ตัวอย่างเช่นแบบจำลอง AR 1 แบบอัตโนมัติสำหรับคำสั่งแรกสำหรับ Y เป็นแบบจำลองการถดถอยแบบง่ายซึ่งตัวแปรอิสระ i s เพียง Y lagged โดยหนึ่งระยะเวลา LAG Y, 1 ใน Statgraphics หรือ YLAG1 ใน RegressIt ถ้าบางส่วนของ predictors ที่ล่าช้าของข้อผิดพลาดแบบจำลอง ARIMA ไม่เป็นแบบการถดถอยเชิงเส้นเพราะไม่มีวิธีการระบุข้อผิดพลาดของช่วงเวลาสุดท้าย เป็นตัวแปรอิสระข้อผิดพลาดต้องคำนวณเป็นระยะ ๆ เมื่อโมเดลพอดีกับข้อมูลจากมุมมองด้านเทคนิคปัญหาเกี่ยวกับการใช้ข้อผิดพลาดที่ล่าช้าเป็นตัวพยากรณ์คือการคาดการณ์ของแบบจำลองไม่ใช่หน้าที่เชิงเส้นของ สัมประสิทธิ์แม้ว่าจะเป็นฟังก์ชันเชิงเส้นของข้อมูลที่ผ่านมาดังนั้นค่าสัมประสิทธิ์ในแบบจำลอง ARIMA ที่มีข้อผิดพลาดที่ล้าหลังต้องถูกประเมินด้วยวิธีการเพิ่มประสิทธิภาพแบบไม่เชิงเส้นโดยการปีนเขามากกว่าเพียงแค่แก้ระบบสมการคำย่อ ARIMA ย่อมาจาก Auto-Regressive Integrated ความล่าช้าในการเคลื่อนที่ค่าเฉลี่ยของชุดเครื่องเขียนในสมการพยากรณ์จะเรียกว่าเงื่อนไขอัตโนมัติ (autoregressive terms) ความล่าช้าของข้อผิดพลาดในการคาดการณ์จะเรียกว่าค่าเฉลี่ยเคลื่อนที่และช่วงเวลาที่ต้องการ จะแตกต่างกันที่จะทำให้ stationary กล่าวจะเป็นแบบบูรณาการรุ่นของ stationary series แบบสุ่มเดินและแบบสุ่มแนวโน้มรุ่น autoregressive และแบบจำลองการเรียบเรียงอธิบายเป็นกรณีพิเศษของ ARIMA models. A แบบเรียล ARIMA ไม่ถูกจำแนกเป็น ARIMA p, d, q model, where. p คือจำนวนของเงื่อนไข autoregressive. d คือจำนวนความแตกต่างที่ไม่จำเป็นสำหรับ stationarity และ. q คือจำนวนข้อผิดพลาดในการคาดการณ์ที่ล่าช้าในสมการทำนายสมการพยากรณ์ถูกสร้างขึ้นดังนี้ อันดับแรกให้ y แสดงถึงความแตกต่าง d ของ Y ซึ่งหมายความว่าทราบว่าความแตกต่างที่สองของ Y d 2 กรณีไม่ใช่ความแตกต่างจาก 2 งวดก่อนหน้านี้ค่อนข้างเป็นความแตกต่างแรกของความแตกต่างของสิ่งแรกที่เป็น อะนาล็อกแบบไม่ต่อเนื่องของอนุพันธ์ลำดับที่สองคือการเร่งพื้นที่ท้องถิ่นของซีรีส์มากกว่าแนวโน้มในท้องถิ่นในแง่ของสมการพยากรณ์ทั่วไปของสมการนี้ค่าพารามิเตอร์เฉลี่ยเคลื่อนที่ถูกกำหนดเพื่อให้สัญญาณของพวกเขาเป็นค่าลบในสมการ uation ต่อไปนี้การประชุมนำโดย Box และ Jenkins ผู้เขียนบางคนและซอฟต์แวร์รวมถึงภาษาการเขียนโปรแกรม R กำหนดให้พวกเขามีเครื่องหมายบวกแทนเมื่อตัวเลขจริงถูกเสียบเข้ากับสมการไม่มีความคลุมเครือ แต่สิ่งสำคัญคือต้องทราบว่าการประชุมใด ซอฟท์แวร์ของคุณใช้เมื่อคุณอ่านข้อมูลออกบ่อยครั้งที่พารามิเตอร์แสดงโดย AR1, AR2, และ MA1, MA2 เป็นต้นหากต้องการระบุรูปแบบ ARIMA ที่เหมาะสมสำหรับ Y คุณจะเริ่มต้นด้วยการกำหนดลำดับของความต้องการ เพื่อหยุดนิ่งชุดและลบคุณลักษณะขั้นต้นของฤดูกาลบางทีร่วมกับการเปลี่ยนแปลงความแปรปรวน - เสถียรภาพเช่นการบันทึกหรือการทำให้หลุดลอยหากคุณหยุดที่จุดนี้และคาดการณ์ว่าชุด differenced เป็นค่าคงที่คุณมีเพียงติดตั้งแบบสุ่มเดินหรือแบบสุ่ม แบบจำลองแนวโน้มอย่างไรก็ตามชุด stationarized อาจยังมีข้อผิดพลาด autocorrelated แนะนำว่า AR จำนวนบางแง่ p 1 และหรือจำนวน MA บางข้อตกลง 1 ยังมีความจำเป็น ในสมการคาดการณ์กระบวนการของการกำหนดค่าของ p, d และ q ที่ดีที่สุดสำหรับชุดเวลาที่ระบุจะกล่าวถึงในส่วนถัดไปของโน้ตที่ลิงก์อยู่ที่ด้านบนสุดของหน้านี้ แต่เป็นการแสดงตัวอย่างบางส่วน ของประเภทของแบบจำลอง ARDSA แบบไม่ใช้เชิงเส้นที่พบโดยทั่วไปจะได้รับด้านล่างนี้แบบจำลองอัตถดถอย AUTIMAGE 1,0,0 ครั้งแรกหากชุดมีการเคลื่อนที่และสัมพันธ์กันอาจเป็นที่คาดการณ์ได้ว่าเป็นค่าหลายค่าของตนเองก่อนหน้าบวก ค่าคงที่สมการพยากรณ์ในกรณีนี้คือ Y ซึ่งถอยหลังตัวเองที่ล้าหลังโดยระยะเวลาหนึ่งนี่คือรูปแบบคงที่ ARIMA 1,0,0 ถ้าค่าเฉลี่ยของ Y เป็นศูนย์แล้วค่าคงที่จะไม่รวมอยู่หากความลาดชัน ค่าสัมประสิทธิ์ที่ 1 เป็นค่าบวกและน้อยกว่า 1 ในขนาดจะต้องน้อยกว่า 1 ในขนาดถ้า Y อยู่นิ่งแบบจำลองอธิบายพฤติกรรมการเปลี่ยนค่าเฉลี่ยซึ่งคาดว่าค่าของช่วงถัดไปจะเป็น 1 เท่าห่างจากค่าเฉลี่ยเท่ากับ ค่าของงวดถ้า 1 เป็นค่าลบ คาดการณ์พฤติกรรมการคืนค่าเฉลี่ยด้วยการสลับสัญญาณเช่นคาดการณ์ว่า Y จะต่ำกว่าระยะเวลาถัดไปหากมีค่าสูงกว่าช่วงเวลานี้ในแบบจำลองอัตถิภาวนิยมที่สองแบบ ARIMA 2,0,0 จะมี Y t-2 ระยะทางด้านขวาเช่นกันและอื่น ๆ ขึ้นอยู่กับสัญญาณและขนาดของค่าสัมประสิทธิ์แบบ ARIMA 2,0,0 สามารถอธิบายระบบที่มีการพลิกกลับหมายถึงเกิดขึ้นในรูปแบบการสั่น sinusoidally เช่นการเคลื่อนไหว ของมวลในฤดูใบไม้ผลิที่อยู่ภายใต้การกระแทกแบบสุ่มการเดินแบบสุ่มของ GRIMA 0,1,0 ถ้าชุด Y ไม่อยู่นิ่งแบบจำลองที่ง่ายที่สุดที่เป็นไปได้คือรูปแบบการเดินแบบสุ่มซึ่งถือได้ว่าเป็นข้อ จำกัด ของ แบบจำลอง AR 1 ซึ่งมีค่าสัมประสิทธิ์อัตถิภาวนาเท่ากับ 1 คือชุดที่มีการพลิกกลับของค่าเฉลี่ยที่ช้าอย่างไม่หยุดนิ่งสมการทำนายสำหรับแบบจำลองนี้สามารถเขียนได้ตามระยะเวลาคงที่คือการเปลี่ยนแปลงระยะเวลาเฉลี่ยเป็นระยะยาว drift in Y โมเดลนี้สามารถใช้เป็นแบบ non-intercept ได้ gression model ซึ่งความแตกต่างแรกของ Y คือตัวแปรที่ขึ้นกับตัวแปรเนื่องจากตัวแปรนี้มีเพียงความแตกต่างที่ไม่มีนัยและระยะคงที่ซึ่งจะถูกจัดเป็นแบบจำลอง ARIMA 0,1,0 โดยค่าคงที่โมเดลแบบเดินสุ่มโดยไม่มีการเปลี่ยนแปลงจะเป็น แบบจำลอง ARIMA 0,1.0 โดยไม่มีค่าคงที่ ARIMA 1,1,0 differenced แบบจำลอง autoregressive ลำดับแรกถ้าข้อผิดพลาดของรูปแบบการเดินแบบสุ่มเป็น autocorrelated บางทีปัญหาสามารถแก้ไขโดยการเพิ่มหนึ่งล่าช้าของตัวแปรที่ขึ้นกับ สมการทำนาย - คือโดยการถอยกลับความแตกต่างแรกของ Y บนตัวเอง lagged โดยหนึ่งระยะเวลานี้จะให้สมการทำนายต่อไปนี้ซึ่งสามารถ rearranged เพื่อนี้เป็นแบบลำดับแรกอัตโนมัติ autoregressive กับลำดับหนึ่งของ differencing nonseasonal และระยะคงที่ - มีรูปแบบ ARIMA 1,1,0.ARIMA 0,1,1 โดยไม่มีการเรียบแบบเรียบง่ายอย่างสม่ำเสมอกลยุทธ์อื่นในการแก้ไขข้อผิดพลาดที่เกี่ยวกับความสัมพันธ์ในรูปแบบการเดินแบบสุ่มได้รับการแนะนำโดยใช้แบบเรียบเรียบง่าย ชุดเวลาแบบไม่หยุดนิ่งเช่นคนที่แสดงความผันผวนที่มีเสียงดังอยู่รอบ ๆ ค่าเฉลี่ยที่เปลี่ยนแปลงไปอย่างช้า ๆ รูปแบบการเดินแบบสุ่มไม่ได้ทำเช่นเดียวกับค่าเฉลี่ยที่ผ่านมาของค่าที่ผ่านมาในคำอื่น ๆ แทนที่จะใช้การสังเกตล่าสุดเป็นการคาดการณ์การสังเกตครั้งต่อไป จะเป็นการดีกว่าที่จะใช้ค่าเฉลี่ยของข้อสังเกตสองสามข้อที่ผ่านมาเพื่อกรองเสียงและแม่นยำมากขึ้นประมาณค่าเฉลี่ยในท้องถิ่นรูปแบบการเรียบง่ายที่อธิบายถึงความคมชัดแบบ exponential ใช้ค่าเฉลี่ยเคลื่อนที่ที่ถ่วงน้ำหนักแบบ exponentential ของค่าที่ผ่านมาเพื่อให้บรรลุผลนี้สมการทำนายสำหรับ รูปแบบการเรียบง่ายชี้แจงสามารถเขียนในรูปแบบทางคณิตศาสตร์จำนวนหนึ่งซึ่งเป็นรูปแบบการแก้ไขข้อผิดพลาดที่เรียกว่าซึ่งในการคาดการณ์ก่อนหน้านี้มีการปรับในทิศทางของข้อผิดพลาดที่ทำเพราะ e t-1 Y t - 1 - t-1 โดยนิยามนี้สามารถถูกเขียนใหม่เป็น. ซึ่งเป็น ARIMA 0,1,1 - โดยไม่คิดค่าคงที่สมการพยากรณ์กับ 1 1 - ซึ่งหมายความว่าคุณสามารถใส่คำพูดแบบทึบง่ายๆ โดยระบุว่าเป็นรูปแบบ ARIMA 0,1,1 โดยไม่มีค่าคงที่และค่าสัมประสิทธิ์ของค่าสัมประสิทธิ์ของค่าสัมประสิทธิ์สมการของ MA 1 เท่ากับ 1-alpha ในสูตร SES โปรดจำไว้ว่าในรูปแบบ SES อายุโดยเฉลี่ยของข้อมูลในช่วง 1 - การคาดการณ์ล่วงหน้าเป็น 1 ความหมายว่าพวกเขาจะมีแนวโน้มที่จะล่าช้าหลังแนวโน้มหรือจุดหักเหโดยประมาณ 1 ช่วงเวลาดังต่อไปนี้ว่าอายุเฉลี่ยของข้อมูลในการคาดการณ์ล่วงหน้า 1 รอบของ ARIMA 0.1,1 - แบบคงที่คือ 1 1 - 1 ตัวอย่างเช่นถ้า 1 0 8 อายุเฉลี่ยเท่ากับ 5 เมื่อ 1 เข้าใกล้ 1 รูปแบบ ARIMA 0,1,1 - ไม่ต่อเนื่องจะกลายเป็นค่าเฉลี่ยเคลื่อนที่ที่ยาวมากและ เป็นวิธีที่ 1 0 จะกลายเป็นแบบสุ่มเดินโดยปราศจาก drift วิธี s วิธีที่ดีที่สุดเพื่อแก้ไข autocorrelation เพิ่มเงื่อนไข AR หรือเพิ่มเงื่อนไข MA ในสองรุ่นก่อนหน้ากล่าวข้างต้นปัญหาของข้อผิดพลาด autocorrelated ในแบบสุ่มเดิน ได้รับการแก้ไขในสองวิธีโดยการเพิ่มค่า lagged ของชุด differenced สมการหรือเพิ่มค่าล้าหลังของ foreca ข้อผิดพลาด st วิธีที่ดีที่สุดกฎของหัวแม่มือสำหรับสถานการณ์นี้ซึ่งจะมีการกล่าวถึงในรายละเอียดเพิ่มเติมในภายหลังเป็นที่ autocorrelation บวกมักจะได้รับการปฏิบัติที่ดีที่สุดโดยการเพิ่มคำ AR เพื่อรูปแบบและ autocorrelation เชิงลบมักจะได้รับการปฏิบัติที่ดีที่สุดโดย โดยทั่วไปแล้วความแตกต่างของค่าสัมประสิทธิ์การลดความเหลื่อมตัวในทางบวกและอาจทำให้เกิดการเปลี่ยนจากการบวกค่าเป็นลบ (autocorrelation) ดังนั้นรูปแบบ ARIMA 0.1,1 ในรูป differencing ที่มาพร้อมกับคำ MA จะใช้บ่อยกว่ารูปแบบ ARIMA 1,1,0ARIMA 0,1,1 ที่มีการเรียบง่ายเรียบเรียงง่ายๆด้วยการเจริญเติบโตโดยการใช้รูปแบบ SES เป็นรูปแบบ ARIMA คุณจะได้รับบางอย่าง ความยืดหยุ่นก่อนอื่นประเมินค่าสัมประสิทธิ์ของค่าสัมประสิทธิ์สมการของ MA 1 ที่เป็นค่าลบซึ่งสอดคล้องกับปัจจัยความราบเรียบที่มีขนาดใหญ่กว่า 1 ในรูปแบบ SES ซึ่งโดยปกติจะไม่ได้รับอนุญาตตามขั้นตอนการปรับรุ่น SES Sec ond คุณมีตัวเลือกในการรวมระยะเวลาคงที่ในรูปแบบ ARIMA หากต้องการเพื่อประเมินแนวโน้มโดยเฉลี่ยที่ไม่ใช่ศูนย์รูปแบบ ARIMA 0,1,1 กับค่าคงที่มีสมการทำนายหนึ่งรอบระยะเวลาล่วงหน้า การคาดการณ์จากแบบจำลองนี้มีคุณภาพคล้ายคลึงกับแบบจำลอง SES ยกเว้นว่าวิถีของการคาดการณ์ในระยะยาวโดยทั่วไปจะเป็นเส้นลาดซึ่งมีความลาดชันเท่ากับ mu มากกว่าแนวนอน ARIMA 0,2,1 หรือ 0, 2,2 โดยไม่ต้องเหนี่ยวรั้งแบบคงที่เชิงเส้นแบบคงที่ Linear exponential smoothing models คือแบบจำลอง ARIMA ซึ่งใช้ความแตกต่างกันสองประการร่วมกับข้อกำหนดของ MA ข้อแตกต่างที่สองของชุด Y ไม่ได้เป็นเพียงความแตกต่างระหว่าง Y กับตัวเองที่ล้าหลังไปสองช่วงคือ ความแตกต่างแรกของความแตกต่างแรกคือการเปลี่ยนการเปลี่ยนแปลงของ Y ที่ระยะเวลา t ดังนั้นความแตกต่างที่สองของ Y ในช่วง t เท่ากับ Y t - Y t - 1 - Y t - 1 - Y t-2 Y t-2Y t-1 Y t-2 ความแตกต่างที่สองของฟังก์ชันแบบแยกเป็น analogou s ไปยังอนุพันธ์ที่สองของฟังก์ชันต่อเนื่องจะวัดการเร่งหรือความโค้งในฟังก์ชัน ณ จุดที่กำหนดในเวลา ARIMA 0,2,2 แบบโดยไม่มีค่าคงที่คาดการณ์ว่าความแตกต่างที่สองของชุดเท่ากับฟังก์ชันเชิงเส้นของช่วง สองข้อผิดพลาดในการคาดการณ์ซึ่งสามารถจัดรูปแบบใหม่ได้ที่ 1 และ 2 คือค่าสัมประสิทธิ์ของ MA 1 และ MA 2 ซึ่งเป็นแบบจำลองการให้ความเรียบแบบเชิงเส้นแบบทั่วไปแบบเดียวกับรูปแบบของ Holt และแบบ Brown's เป็นกรณีพิเศษใช้การถ่วงน้ำหนักแบบทวีคูศ ค่าเฉลี่ยเคลื่อนที่เพื่อประเมินทั้งระดับท้องถิ่นและแนวโน้มในท้องถิ่นในชุดการคาดการณ์ในระยะยาวจากแบบจำลองนี้จะรวมกันเป็นเส้นตรงซึ่งความลาดชันขึ้นอยู่กับแนวโน้มโดยเฉลี่ยที่สังเกตได้จากตอนท้ายของชุดข้อมูล ARIMA 1,1,2 โดยไม่มี ค่าคงที่ของเส้นรอบวงเชิงเส้นแบบคงที่แบบคงที่แบบคงที่นี้เป็นภาพประกอบในภาพนิ่งที่มาพร้อมกับแบบจำลอง ARIMA ซึ่งคาดการณ์แนวโน้มท้องถิ่นในตอนท้ายของชุดข้อมูล แต่จะแผ่แบนออกไปในขอบเขตที่คาดการณ์อีกต่อไปเพื่อแนะนำ ote ของอนุรักษนิยมการปฏิบัติที่ได้รับการสนับสนุนเชิงประจักษ์ดูบทความเกี่ยวกับทำไมหมาดแนวโน้มทำงานโดย Gardner และ McKenzie และบทความกฎทองโดย Armstrong et al สำหรับรายละเอียดเป็นที่แนะนำโดยทั่วไปให้ติดรูปแบบที่อย่างน้อยหนึ่งของ p และ q ไม่ใหญ่กว่า 1 คือไม่พยายามให้พอดีกับรูปแบบเช่น ARIMA 2,1,2 เนื่องจากมีแนวโน้มที่จะนำไปสู่ปัญหา overfitting และ common-factor ที่กล่าวถึงในรายละเอียดเพิ่มเติมในหมายเหตุทางคณิตศาสตร์ โครงสร้างแบบ ARIMA การใช้ ARPI แบบสเปรดชีตการดำเนินการตามตาราง ARIMA เช่นแบบที่อธิบายไว้ข้างต้นเป็นเรื่องง่ายที่จะใช้ในสเปรดชีตสมการทำนายเป็นเพียงสมการเชิงเส้นที่อ้างถึงค่าที่ผ่านมาของชุดค่าเริ่มต้นและค่าที่ผ่านมาของข้อผิดพลาดดังนั้นคุณจึงสามารถตั้งค่าได้ อาร์เรย์การคาดการณ์ ARIMA โดยจัดเก็บข้อมูลในคอลัมน์ A สูตรพยากรณ์ในคอลัมน์ B และข้อมูลข้อผิดพลาดลบการคาดการณ์ในคอลัมน์ C สูตรการคาดการณ์ในเซลล์ทั่วไปในคอลัมน์ B จะเป็นเพียงการแสดงออกเชิงเส้น n หมายถึงค่าในแถวก่อนหน้าของคอลัมน์ A และ C คูณด้วย AR หรือ MA สัมประสิทธิ์ที่เหมาะสมที่เก็บไว้ในเซลล์ที่อื่นในกระดาษคำนวณ ARMA เฉลี่ยถ่วงการเคลื่อนไหว, q โมเดลสำหรับการวิเคราะห์อนุกรมเวลา - ตอนที่ 3. นี่เป็นครั้งที่สามและ โพสต์ครั้งสุดท้ายในมินิซีรีส์ในโมเดล ARMA แบบอัตถนิกราดแบบอัตโนมัติสำหรับการวิเคราะห์อนุกรมเวลาเราได้นำเสนอโมเดลอัตถิภาวนิยมและแบบจำลอง Moving Average ในบทความก่อน ๆ สองตอนนี้ถึงเวลาแล้วที่จะรวมเอาไว้เพื่อสร้างแบบจำลองที่ซับซ้อนมากขึ้น กับโมเดล ARIMA และ GARCH ที่จะช่วยให้เราคาดการณ์ผลตอบแทนของสินทรัพย์และความผันผวนของการคาดการณ์ได้โมเดลเหล่านี้จะเป็นพื้นฐานสำหรับสัญญาณการซื้อขายและเทคนิคการบริหารความเสี่ยงหากคุณได้อ่านบทที่ 1 และ 2 แล้วคุณจะเห็นว่าเรามีแนวโน้มที่จะปฏิบัติตาม รูปแบบสำหรับการวิเคราะห์แบบจำลองชุดเวลาฉันจะทำซ้ำในเวลาสั้น ๆ ที่นี่เหตุใดเหตุใดเราจึงสนใจในแบบจำลองนี้โดยเฉพาะคำจำกัดความ - นิยามทางคณิตศาสตร์เพื่อลด ambig uity. Correlogram - การวางแผนตัวอย่าง correlogram เพื่อให้เห็นภาพพฤติกรรมของโมเดลการจำลองและการติดตั้ง - การใส่แบบจำลองเพื่อจำลองเพื่อให้แน่ใจว่าเราได้ทำความเข้าใจโมเดลอย่างถูกต้องข้อมูลทางการเงินที่แท้จริง - ใช้แบบจำลองกับราคาสินทรัพย์ในอดีตจริงการค้ำประกัน - คาดการณ์ค่าที่ตามมาในการสร้างสัญญาณการซื้อขายหรือตัวกรองเพื่อที่จะทำตามบทความนี้ขอแนะนำให้ดูบทความก่อนหน้านี้เกี่ยวกับการวิเคราะห์อนุกรมเวลาทั้งหมดนี้สามารถพบได้ที่นี่ข้อมูลเกณฑ์ของเบส์ไซท์ในส่วนที่ 1 ของชุดบทความนี้เรา มองไปที่ Akaike ข้อมูลเกณฑ์ AIC เป็นวิธีการช่วยให้เราเลือกระหว่างชุดที่ดีที่สุดแบบแยกเวลาที่ดีที่สุดเครื่องมือที่เกี่ยวข้องอย่างใกล้ชิดคือ Bayesian Information Criterion BIC โดยพื้นฐานแล้วมันมีพฤติกรรมคล้ายกับ AIC ในสิ่งที่มันลงโทษโมเดลสำหรับการมีพารามิเตอร์มากเกินไป อาจนำไปสู่การ overfitting ความแตกต่างระหว่าง BIC และ AIC เป็นที่ BIC เข้มงวดมากขึ้นกับการลงโทษของพารามิเตอร์เพิ่มเติม Bayesian Infor mation Criterion ถ้าเราใช้ฟังก์ชันความน่าจะเป็นสำหรับแบบจำลองทางสถิติซึ่งมีพารามิเตอร์ k และ L จะเพิ่มความเป็นไปได้ที่ข้อมูลเกณฑ์ Bayesian Information Criterion จะได้รับโดยเมื่อ n คือจำนวนจุดข้อมูลในชุดข้อมูลเวลาเราจะใช้ AIC และ BIC ด้านล่างเมื่อเลือก ARMA p, q models. Ljung-Box Test ที่เหมาะสมในส่วนที่ 1 ของชุดบทความนี้ Rajan กล่าวในข้อคิดเห็น Disqus ว่าการทดสอบ Ljung-Box มีความเหมาะสมมากกว่าการใช้ Akaike Information Criterion ของ Bayesian ข้อมูลเกณฑ์ในการตัดสินใจว่าแบบจำลอง ARMA เหมาะสมกับชุดข้อมูลแบบเวลาหรือไม่การทดสอบ Ljung-Box เป็นการทดสอบสมมุติฐานแบบคลาสสิกที่ออกแบบมาเพื่อทดสอบว่าชุดของความสัมพันธ์แบบอัตโนมัติของชุดเวลาแบบติดตั้งมีความแตกต่างจากศูนย์อย่างมากการทดสอบทำอย่างไร ไม่ทดสอบแต่ละความล่าช้าสำหรับ randomness แต่ทดสอบการสุ่มมากกว่ากลุ่มของ lags. Ljung Box Test. We กำหนดสมมุติฐาน null เป็นข้อมูลชุดเวลาที่แต่ละล่าช้าเป็น iid ที่ correlations ระหว่างค่าชุดประชากรเป็นศูนย์เรากำหนดสมมุติฐานสำรองเป็นข้อมูลชุดเวลาไม่ได้ iid และมี correlation. We อนุกรมคำนวณสถิติทดสอบต่อไปนี้ Q. Where n คือความยาวของชุดตัวอย่างเวลาหมวก k เป็นตัวอย่าง autocorrelation ที่ล่าช้า k และ h คือจำนวนล่าช้าภายใต้การทดสอบกฎการตัดสินใจว่าจะปฏิเสธสมมติฐานที่เป็นโมฆะคือการตรวจสอบว่า Q chi 2 สำหรับการกระจาย chi-squared กับ h องศาอิสระที่ 100 1- alpha th percentile ในขณะที่รายละเอียดของการทดสอบอาจดูซับซ้อนเล็กน้อยเราสามารถใช้ R ในการคำนวณการทดสอบของเราได้โดยง่ายขั้นตอนการคำนวณค่อนข้างน้อย ARMA แบบจำลองการเคลื่อนย้ายตามอัตรส่วนใหญ่ของคำสั่ง p, q ขณะนี้เราได้กล่าวถึง BIC และการทดสอบ Ljung-Box เราพร้อมที่จะหารือเกี่ยวกับรูปแบบการผสมแบบแรกของเราคือค่าเฉลี่ยการเคลื่อนที่แบบอัตถดถอยของลำดับ p, q หรือ ARMA p, q ถึงวันที่เราได้พิจารณากระบวนการอัตโนมัติและการเคลื่อนย้ายกระบวนการเฉลี่ย พิจารณาของตัวเองต่อปี st เป็นปัจจัยการผลิตสำหรับรูปแบบและเป็นความพยายามดังกล่าวในการจับภาพผลกระทบของผู้มีส่วนร่วมในตลาดเช่นโมเมนตัมและการพลิกกลับค่าเฉลี่ยในการซื้อขายหุ้นรุ่นหลังถูกนำมาใช้เพื่อระบุลักษณะของข้อมูลที่น่าตกใจกับชุดต่างๆเช่นการประกาศรายได้ที่น่าแปลกใจหรือเหตุการณ์ที่ไม่คาดคิด เช่นการรั่วไหลของน้ำมัน BP Deepwater Horizon ดังนั้นโมเดล ARMA จึงพยายามจับภาพทั้งสองด้านนี้เมื่อทำแบบจำลองทางการเงินชุดข้อมูลโปรดทราบว่ารูปแบบ ARMA ไม่ได้คำนึงถึงความผันผวนของบัญชีซึ่งเป็นปรากฏการณ์เชิงประจักษ์ที่สำคัญของชุดเวลาทางการเงินจำนวนมาก ไม่ใช่รูปแบบ heteroscedastic conditionally สำหรับที่เราจะต้องรอให้ ARCH และ GARCH models. The ARMA p, q model คือการรวมกันเชิงเส้นของแบบจำลองเชิงเส้นสองแบบและด้วยเหตุนี้เองก็ยังคงเป็นแบบ linear linear average ค่าเฉลี่ยของ order p, qA แบบอนุกรมเวลา,, คือแบบจําลองเฉลี่ยถายทางเคลื่อนไหวอัตโนมัติของคําสั่ง p, q ARMA p, q, if เริ่มต้น xt alpha1 x alpha2 x ldots wt beta1 w beta2 ใน ldots betaq w end. Where มีเสียงสีขาวที่มี E wt 0 และ variance sigma 2. ถ้าเราพิจารณา Backward Shift Operator ดูบทความก่อนหน้านี้เราสามารถเขียนข้อความข้างต้นเป็นฟังก์ชันได้ theta และ phi ของเราสามารถตรงไปตรงมาเห็นว่าโดยการตั้งค่า p neq 0 และ q 0 เรากู้คืนโมเดล AR p เช่นเดียวกับถ้าเรากำหนด p 0 และ q neq 0 เรากู้คืนรูปแบบ MA q หนึ่งในคุณสมบัติที่สำคัญของรูปแบบ ARMA นั่นคือรูปแบบ ARMA มักจะต้องใช้พารามิเตอร์น้อยกว่าแบบ AR p หรือ MA q แบบเดียวนอกจากนี้ถ้าเราเขียนสมการใหม่ในแง่ของ BSO ​​แล้วชื่อย่อของ theta และ phi สามารถทำได้ บางครั้งมีปัจจัยร่วมกันซึ่งนำไปสู่รูปแบบที่ง่ายขึ้นการจำลองและ Correlograms ขณะที่โมเดลเฉลี่ยแบบอัตถดถอยและเคลื่อนไหวเราจะจำลอง ARMA ชุดต่างๆแล้วพยายามปรับรูปแบบ ARMA ให้บรรลุตามความเป็นจริงเหล่านี้เราดำเนินการนี้เนื่องจากต้องการ ให้แน่ใจว่าเราเข้าใจ ขั้นตอนการประกอบรวมถึงวิธีการคำนวณระยะเวลาความเชื่อมั่นสำหรับโมเดลรวมทั้งตรวจสอบให้แน่ใจว่าขั้นตอนนี้จะทำการกู้คืนค่าประมาณที่สมเหตุสมผลสำหรับพารามิเตอร์ ARMA เดิมในส่วนที่ 1 และส่วนที่ 2 เราสร้าง AR และ MA Series ด้วยตนเองโดยการวาดตัวอย่าง N จากการแจกจ่ายแบบปกติแล้วสร้างชุดรูปแบบของซีรีส์เวลาที่เฉพาะเจาะจงโดยใช้ความล่าช้าของตัวอย่างเหล่านี้อย่างไรก็ตามมีวิธีที่ง่ายกว่าในการจำลองข้อมูล AR, MA, ARMA และ ARIMA ได้ง่ายๆโดยใช้วิธีการในการเริ่มต้นของ R. Let แบบจำลอง ARMA ที่ไม่ง่ายที่สุดที่เป็นไปได้นั่นคือแบบจำลอง ARMA 1,1 นั่นคือแบบจำลองอัตถดถอยของคำสั่งหนึ่งบวกกับแบบจำลองค่าเฉลี่ยเคลื่อนที่ของคำสั่งหนึ่งโมเดลดังกล่าวมีเพียงสองค่าสัมประสิทธิ์อัลฟาและเบต้าซึ่งเป็นตัวแทนแรก ความล่าช้าของชุดเวลาที่ตัวเองและเงื่อนไขช็อตสีขาวดังรูปแบบดังกล่าวจะได้รับโดยเราจำเป็นต้องระบุค่าสัมประสิทธิ์ก่อนที่จะจำลองให้ s ใช้ alpha 0 5 และ beta -0 5. ผลลัพธ์ที่ได้ดังต่อไปนี้การปิดกั้น o f a ARMA 1,1 Model with alpha 0 5 และ beta 0 5. จากนั้นให้หาสูตร correlogram. Correlogram ของ ARMA 1,1 Model ด้วย alpha 0 5 และ beta 0 5. เราจะเห็นว่าไม่มีนัยสำคัญ autocorrelation ซึ่งคาดว่าจะมาจากแบบจำลอง ARMA 1,1 ท้ายที่สุดลองพิจารณาค่าสัมประสิทธิ์และข้อผิดพลาดมาตรฐานโดยใช้ฟังก์ชัน arima เราสามารถคำนวณช่วงความเชื่อมั่นสำหรับแต่ละพารามิเตอร์โดยใช้ข้อผิดพลาดมาตรฐานช่วงความเชื่อมั่น จะมีค่าพารามิเตอร์ที่แท้จริงสำหรับทั้งสองกรณีอย่างไรก็ตามเราควรทราบว่าช่วงความเชื่อมั่น 95 มีความกว้างมากเป็นผลมาจากข้อผิดพลาดมาตรฐานที่มีขนาดใหญ่พอสมควรให้ลองตอนนี้โมเดล ARMA 2,2 นั่นคือ AR 2 แบบรวมกับ รุ่น MA 2 เราจำเป็นต้องระบุพารามิเตอร์ 4 ตัวสำหรับ alpha1, alpha2, beta1 และ beta2 ลองใช้ alpha1 0 5, alpha2 -0 25 beta1 0 5 และ beta2 -0 3. ผลลัพธ์ของรูปแบบ ARMA 2,2 ของเราคือ ดังต่อไปนี้การแสดง ARMA 2,2 แบบมี alpha1 0 5, alpha2 -0 25, beta1 0 5 และ beta2 - 0 3. และการปรับเทียบอัตโนมัติที่เกี่ยวข้องกับกราฟ ARMA 2,2 ที่มี alpha1 0 5, alpha2 -0 25, beta1 0 5 และ beta2 -0 3. ขณะนี้เราสามารถลองใช้โมเดล ARMA 2,2 กับข้อมูล นอกจากนี้เรายังสามารถคำนวณระยะเวลาความเชื่อมั่นสำหรับแต่ละพารามิเตอร์ได้โดยสรุปว่าช่วงความเชื่อมั่นสำหรับค่าสัมประสิทธิ์สำหรับองค์ประกอบเฉลี่ยที่เคลื่อนที่ได้เบต้าและเบต้า 2 ไม่ได้มีค่าพารามิเตอร์เดิมโดยสรุปข้อเสนอนี้แสดงถึงอันตรายของการพยายามให้พอดีกับรูปแบบข้อมูลแม้ในขณะที่ เรารู้ค่าพารามิเตอร์ที่แท้จริงอย่างไรก็ตามเพื่อวัตถุประสงค์ในการซื้อขายเราจำเป็นต้องมีอำนาจในการคาดการณ์ที่เกินความเป็นไปได้และก่อให้เกิดผลกำไรสูงกว่าต้นทุนการทำธุรกรรมเพื่อที่จะทำกำไรได้ในระยะยาวตอนนี้เราได้เห็นตัวอย่างของการจำลองแล้ว รูปแบบ ARMA เราต้องการกลไกในการเลือกค่าของ p และ q เมื่อเหมาะสมกับรูปแบบข้อมูลทางการเงินจริงการเลือก ARMA p ที่ดีที่สุด q Model. In เพื่อที่จะกำหนดลำดับ p, q ของรูปแบบ ARMA เหมาะสมสำหรับชุด เราจำเป็นต้องใช้ AIC หรือ BIC ข้ามเซตย่อยของค่าสำหรับ p, q แล้วใช้การทดสอบ Ljung-Box เพื่อตรวจสอบว่ามีการพอดีหรือไม่สำหรับค่าเฉพาะของ p, q เมื่อต้องการแสดงวิธีการนี้เราจะจำลอง โดยเฉพาะ ARMA p, q process เราจะวนค่า pairwise ทั้งหมดของ p in และ q in และคำนวณ AIC เราจะเลือกรุ่นที่มีค่า AIC ต่ำสุดและเรียกใช้การทดสอบ Ljung-Box ที่เหลือเพื่อตรวจสอบว่าเราประสบความสำเร็จหรือไม่ fit. Let ดีเริ่มต้นด้วยการจำลอง ARMA 3,2 series. We ตอนนี้จะสร้างวัตถุสุดท้ายเพื่อเก็บพอดีรูปแบบที่ดีที่สุดและต่ำสุดค่า AIC เราห่วงมากกว่าชุดต่างๆ q และใช้วัตถุปัจจุบันเพื่อเก็บ พอดีของ ARMA i, j แบบสำหรับตัวแปรการวนรอบ i และ j ถ้าหาก AIC ปัจจุบันมีค่าน้อยกว่า AIC ใด ๆ ที่ได้คำนวณไว้ก่อนหน้านี้เราจะกำหนด AIC สุดท้ายให้เป็นค่าปัจจุบันนี้และเลือกคำสั่งดังกล่าวเมื่อสิ้นสุดการวนรอบเรามีคำสั่ง ของรูปแบบ ARMA เก็บไว้ในและ ARIMA p, d, q พอดีตัวเองกับชุดส่วนประกอบแบบบูรณาการที่ตั้งไว้ 0 ที่เก็บไว้ as. Let s ส่งออกค่าสัมประสิทธิ์ของ AIC, order และ ARIMA เราจะเห็นว่าคำสั่งเดิมของรูปแบบจำลอง ARMA ถูกกู้คืนคือด้วย p 3 และ q 2 เราสามารถคำนวณ corelogram ของส่วนที่เหลือของรูปแบบเพื่อดู ถ้าพวกเขามีลักษณะเหมือนการตระหนักถึงสัญญาณรบกวนสีขาวแบบไม่ต่อเนื่อง DWN คอร์เรลกราฟของส่วนที่เหลือของ ARMA p ที่เหมาะสมที่สุด q รุ่น p 3 และ q 2. Corelogram มีลักษณะเป็น DWN ในที่สุดเราทำ Ljung-Box ทดสอบค่าความยาว 20 ครั้งเพื่อยืนยันสิ่งนี้ข้อสังเกตว่าค่า p มากกว่า 0 05 ซึ่งระบุว่าส่วนที่เหลือมีความเป็นอิสระในระดับ 95 ดังนั้นแบบจำลอง ARMA 3,2 จึงให้รูปแบบที่เหมาะสมได้อย่างชัดเจนทั้งนี้ควรเป็น เนื่องจากเราได้ทำการจำลองข้อมูลไว้แล้วอย่างไรก็ตามขั้นตอนนี้จะเป็นขั้นตอนที่เราจะใช้เมื่อเราต้องการให้พอดีกับ ARMA p, q models กับดัชนี S P500 ในส่วนต่อไปนี้ข้อมูลทางการเงินตอนนี้เราได้ระบุขั้นตอนการเลือกไว้แล้ว ชุดรูปแบบเวลาที่เหมาะสมสำหรับชุดจำลองเป็นค่อนข้าง strai ghtforward เพื่อนำไปใช้กับข้อมูลทางการเงินตัวอย่างเช่นเราจะเลือกดัชนี S P500 US Equity Index อีกครั้งเลือกดาวน์โหลดราคาปิดรายวันโดยใช้ quantmod แล้วสร้างกระแสการรับส่งข้อมูลกลับไปปฏิบัติตามขั้นตอนที่เหมาะสมเช่นเดียวกับ ชุด ARMA 3,2 แบบจำลองด้านบนในชุดผลตอบแทนทางลัดของ S P500 โดยใช้ AIC แบบจำลองที่เหมาะสมที่สุดมีคำสั่ง ARMA 3,3 แสดงค่าส่วนที่เหลือของแบบจำลองที่ติดตั้งเข้ากับ S P500 log daily return stream Correlogram ของส่วนที่เหลือของแบบ ARMA p, q Model, p 3 และ q 3 ที่ดีที่สุดสำหรับ S P500 ซึ่งจะส่งผลกระทบต่อรายละเอียดของกระแสข้อมูลโดยปกติแล้วจะมี peak ที่มีนัยสำคัญโดยเฉพาะอย่างยิ่งที่ความล่าช้าที่สูงขึ้น ทำการทดสอบ Ljung-Box เพื่อดูว่าเรามีหลักฐานทางสถิติสำหรับเรื่องนี้หรือไม่ขณะที่เราสงสัยว่า p-value มีค่าน้อยกว่า 0 05 ดังนั้นเราจึงไม่สามารถบอกได้ว่าส่วนที่เหลือเป็นสัญญาณรบกวนสีขาวแบบแยกจากกันดังนั้นสัญญาณ autocorrelation ในส่วนที่เหลือที่ไม่ได้อธิบายโดย ติดตั้ง ARMA 3,3 model. As we ve กล่าวตลอดในชุดบทความนี้เราได้เห็นหลักฐานของความผันผวน heteroscedasticity แบบมีเงื่อนไขในชุด S P500 โดยเฉพาะอย่างยิ่งในรอบระยะเวลา 2007-2008 เมื่อเราใช้รูปแบบ GARCH ต่อไปในบทความ ชุดที่เราจะดูวิธีการกำจัด autocorrelations เหล่านี้ในทางปฏิบัติแบบจำลอง ARMA ไม่เคยดีโดยทั่วไปเหมาะสำหรับการเข้าสู่ตลาดหุ้นผลตอบแทนเราต้องคำนึงถึงเงื่อนไขและความยืดหยุ่นในการใช้การรวมกันของ ARIMA และ GARCH บทความต่อไปจะพิจารณา ARIMA และแสดงให้เห็นว่า ส่วนประกอบแบบบูรณาการที่แตกต่างจากรูปแบบ ARMA ที่เราได้รับการพิจารณาในบทความนี้เพียงเริ่มต้นกับการค้าเชิงปริมาณค่าเฉลี่ยเคลื่อนที่เฉลี่ย ARMA p, q โมเดลสำหรับการวิเคราะห์อนุกรมเวลา - ส่วนที่ 2. ในส่วนที่ 1 เราพิจารณาแบบจำลองอัตถิภาวนิยมของคำสั่ง p ยังเป็นที่รู้จักกันในนามของ AR p model เราแนะนำให้ใช้เป็นส่วนเสริมของรูปแบบการเดินแบบสุ่มในความพยายามที่จะอธิบายความสัมพันธ์แบบอนุกรมเพิ่มเติมในด้านการเงิน e series ในที่สุดเราตระหนักว่ามันไม่ได้มีความยืดหยุ่นเพียงพอที่จะจับภาพความสัมพันธ์ของความสัมพันธ์ระหว่างกันทั้งหมดในราคาปิดของ Amazon Inc AMZN และดัชนี S P500 US Equity Index เหตุผลหลักประการหนึ่งก็คือทั้งสองสินทรัพย์นี้มีเงื่อนไขที่มีความแตกต่างกันซึ่งหมายความว่า ที่พวกเขาจะไม่หยุดนิ่งและมีช่วงเวลาของการแปรปรวนที่แตกต่างกันหรือการจัดกลุ่มความผันผวนซึ่งไม่ได้นำเข้าบัญชีโดย AR p model. In บทความในอนาคตเราที่สุดจะสร้างขึ้นแบบอัตโนมัติแบบบูรณาการค่าเฉลี่ยเคลื่อนที่ ARIMA เช่นเดียวกับเงื่อนไข แบบจำลอง heteroskedastic ของ ARCH และตระกูล GARCH โมเดลเหล่านี้จะให้ความพยายามในการพยากรณ์ราคาทรัพย์สินของเราเป็นครั้งแรกในบทความนี้อย่างไรก็ตามเราจะแนะนำ Moving Average ของ order q model หรือที่เรียกว่า MA q ซึ่งเป็นส่วนประกอบ ของรูปแบบ ARMA ทั่วไปมากขึ้นและเป็นเช่นที่เราต้องเข้าใจก่อนที่จะย้าย further. I ขอแนะนำให้คุณอ่านบทความก่อนหน้านี้ในซีรีส์อนาล็อก Anal คอลเลกชัน ysis ถ้าคุณไม่ได้ทำดังนั้นพวกเขาทั้งหมดสามารถพบได้ที่นี่แบบจำลอง MA เฉลี่ยเฉลี่ยของใบสั่ง qA Moving Average model คล้ายกับแบบจำลอง Autoregressive ยกเว้นว่าแทนที่จะเป็นชุดค่าผสมของชุดค่าผสมที่ผ่านมาเป็นค่าที่เป็นเส้นตรง การรวมกันของคำพูดเสียงสีขาวที่ผ่านมาอย่างสังหรณ์ใจซึ่งหมายความว่ารูปแบบแมสซาชูเซตเห็นเช่นสุ่มเสียงรบกวนแบบสุ่มสีขาวโดยตรงที่ค่าปัจจุบันของแต่ละรุ่นนี้เป็นตรงกันข้ามกับรูปแบบ AR p ที่สัญญาณรบกวนสีขาวเสียงจะเห็นเฉพาะทางอ้อมผ่าน ความแตกต่างที่สำคัญคือรูปแบบ MA จะเห็นเฉพาะครั้งสุดท้าย q shock สำหรับ MA q model โดยเฉพาะในขณะที่รุ่น AR p จะใช้แรงกระแทกก่อนหน้านี้ทั้งหมดแม้ว่าจะลดลงอย่างอ่อนก็ตาม โดยปกติ MA q เป็นแบบจำลองการถดถอยเชิงเส้นและมีโครงสร้างคล้ายกับ AR p. Moving Average Model ของชุดคำสั่ง qA time series เป็นแบบจำลองค่าเฉลี่ยเคลื่อนที่ของลำดับ q MA q ถ้า เริ่มต้น xt wt beta1 ใน ldots betaq w end. Where เป็นเสียงสีขาวที่มี E wt 0 และ variance sigma 2. ถ้าเราพิจารณา Backward Shift Operator ดูบทความก่อนหน้านี้เราจะสามารถเขียนใหม่ข้างต้นเป็นฟังก์ชัน phi ของ เริ่มต้น xt 1 beta1 beta2 2 ldots betaq q wt wtq wt end เราจะใช้ประโยชน์จากฟังก์ชัน phi ในบทความในภายหลังประการที่สองคุณสมบัติการสั่งซื้อเช่นเดียวกับ AR p ค่าเฉลี่ยของกระบวนการ MA q เท่ากับ 0 นี่เป็นเรื่องง่ายที่จะมองเห็นเป็น หมายความว่าเป็นเพียงผลรวมของความหมายของคำขาวเสียงซึ่งทั้งหมดเป็นศูนย์ เริ่มต้นข้อความ ensemble mux E xt sum E wi 0 end เริ่มต้น text ensemble sigma 2w 1 beta 21 ldots beta 2q end text ensemble rhok left q end right. Where beta0 1. ขณะนี้เรากำลังสร้างข้อมูลจำลองและใช้เพื่อสร้าง correlograms นี้จะทำให้สูตรข้างต้นสำหรับ rhok คอนกรีตมากขึ้นและการจำลอง Correlograms เริ่มต้นด้วยกระบวนการ MA 1 ถ้าเราตั้ง beta1 0 6 เราได้รับรูปแบบดังต่อไปนี้เป็นรุ่น AR p ในบทความก่อนหน้านี้เราสามารถใช้ R เพื่อจำลองชุดดังกล่าวและพล็อต correlogram เนื่องจากเราเคยมีประสบการณ์มากมายในชุดบทความชุดการวิเคราะห์อนุกรมเวลาแบบอนุกรมก่อนหน้าในการดำเนินการแปลงข้อมูลฉันจะเขียนโค้ด R ในแบบเต็มแทนการแยกออกเป็นผลลัพธ์ ตามด้วยการจำลอง MA 1 กับ beta1 0 6 และ Correlogram ที่สัมพันธ์กันดังที่เราได้กล่าวไว้ข้างต้นในสูตรสำหรับ rhok สำหรับ kq ความสัมพันธ์กันทั้งหมดควรเป็นศูนย์ตั้งแต่ q 1 เราจะเห็น peak ที่สำคัญที่ k 1 และไม่มีนัยสำคัญ peaks หลังจากนั้นอย่างไรก็ตามเนื่องจากการสุ่มตัวอย่าง อคติเราควรคาดหวังว่าจะเห็นจุดสูงสุดที่มีนัยสำคัญ 5 จุดบนแผนภาพความสัมพันธ์แบบสุ่มตัวอย่างนี่คือสิ่งที่ correlogram แสดงให้เราเห็นในกรณีนี้เรามีจุดสูงสุดที่ k 1 และจุดสูงสุดที่ไม่มีนัยสำคัญสำหรับ k 1 ยกเว้นที่ k 4 ซึ่งเรามี a marginally significant peak. In fact, this is a useful way of seeing whether an MA q model is appropriate By taking a look at the correlogram of a particular series we can see how many sequential non-zero lags exist If q such lags exist then we can legitimately attempt to fit a MA q model to a particular series. Since we have evidence from our simulated data of a MA 1 process, we re now going to try and fit a MA 1 model to our simulated data Unfortunately, there isn t an equivalent ma command to the autoregressive model ar command in R. Instead, we must use the more general arima command and set the autoregressive and integrated components to zero We do this by creating a 3-vector and setting the first two components the autogressive a nd integrated parameters, respectively to zero. We receive some useful output from the arima command Firstly, we can see that the parameter has been estimated as hat 0 602 , which is very close to the true value of beta1 0 6 Secondly, the standard errors are already calculated for us, making it straightforward to calculate confidence intervals Thirdly, we receive an estimated variance, log-likelihood and Akaike Information Criterion necessary for model comparison. The major difference between arima and ar is that arima estimates an intercept term because it does not subtract the mean value of the series Hence we need to be careful when carrying out predictions using the arima command We ll return to this point later. As a quick check we re going to calculate confidence intervals for hat. We can see that the 95 confidence interval contains the true parameter value of beta1 0 6 and so we can judge the model a good fit Obviously this should be expected since we simulated the data in the first place. How do things change if we modify the sign of beta1 to -0 6 Let s perform the same analysis. The output is as follows. Realisation of MA 1 Model, with beta1 -0 6 and Associated Correlogram. We can see that at k 1 we have a significant peak in the correlogram, except that it shows negative correlation, as we d expect from a MA 1 model with negative first coefficient Once again all peaks beyond k 1 are insignificant Let s fit a MA 1 model and estimate the parameter. hat -0 730 , which is a small underestimate of beta1 -0 6 Finally, let s calculate the confidence interval. We can see that the true parameter value of beta1 -0 6 is contained within the 95 confidence interval, providing us with evidence of a good model fit. Let s run through the same procedure for a MA 3 process This time we should expect significant peaks at k in , and insignificant peaks for k 3.We are going to use the following coefficients beta1 0 6 , beta2 0 4 and beta3 0 2 Let s simulate a MA 3 process from this model I ve increased the number of random samples to 1000 in this simulation, which makes it easier to see the true autocorrelation structure, at the expense of making the original series harder to interpret. The output is as follows. Realisation of MA 3 Model and Associated Correlogram. As expected the first three peaks are significant However, so is the fourth But we can legitimately suggest that this may be due to sampling bias as we expect to see 5 of the peaks being sign ificant beyond k q. Let s now fit a MA 3 model to the data to try and estimate parameters. The estimates hat 0 544 , hat 0 345 and hat 0 298 are close to the true values of beta1 0 6 , beta2 0 4 and beta3 0 3 , respectively We can also produce confidence intervals using the respective standard errors. In each case the 95 confidence intervals do contain the true parameter value and we can conclude that we have a good fit with our MA 3 model, as should be expected. Financial Data. In Part 1 we considered Amazon Inc AMZN and the S P500 US Equity Index We fitted the AR p model to both and found that the model was unable to effectively capture the complexity of the serial correlation, especially in the cast of the S P500, where long-memory effects seem to be present. I won t plot the charts again for the prices and autocorrelation, instead I ll refer you to the previous post. Amazon Inc AMZN. Let s begin by trying to fit a selection of MA q models to AMZN, namely with q in As in Part 1, we ll use q uantmod to download the daily prices for AMZN and then convert them into a log returns stream of closing prices. Now that we have the log returns stream we can use the arima command to fit MA 1 , MA 2 and MA 3 models and then estimate the parameters of each For MA 1 we have. We can plot the residuals of the daily log returns and the fitted model. Residuals of MA 1 Model Fitted to AMZN Daily Log Prices. Notice that we have a few significant peaks at lags k 2 , k 11 , k 16 and k 18 , indicating that the MA 1 model is unlikely to be a good fit for the behaviour of the AMZN log returns, since this does not look like a realisation of white noise. Let s try a MA 2 model. Both of the estimates for the beta coefficients are negative Let s plot the residuals once again. Residuals of MA 2 Model Fitted to AMZN Daily Log Prices. We can see that there is almost zero autocorrelation in the first few lags However, we have five marginally significant peaks at lags k 12 , k 16 , k 19 , k 25 and k 27 This is su ggestive that the MA 2 model is capturing a lot of the autocorrelation, but not all of the long-memory effects How about a MA 3 model. Once again, we can plot the residuals. Residuals of MA 3 Model Fitted to AMZN Daily Log Prices. The MA 3 residuals plot looks almost identical to that of the MA 2 model This is not surprising, as we re adding a new parameter to a model that has seemingly explained away much of the correlations at shorter lags, but that won t have much of an effect on the longer term lags. All of this evidence is suggestive of the fact that an MA q model is unlikely to be useful in explaining all of the serial correlation in isolation at least for AMZN. If you recall, in Part 1 we saw that the first order differenced daily log returns structure of the S P500 possessed many significant peaks at various lags, both short and long This provided evidence of both conditional heteroskedasticity i e volatility clustering and long-memory effects It lead us to conclude that the AR p mo del was insufficient to capture all of the autocorrelation present. As we ve seen above the MA q model was insufficient to capture additional serial correlation in the residuals of the fitted model to the first order differenced daily log price series We will now attempt to fit the MA q model to the S P500.One might ask why we are doing this is if we know that it is unlikely to be a good fit This is a good question The answer is that we need to see exactly how it isn t a good fit, because this is the ultimate process we will be following when we come across much more sophisticated models, that are potentially harder to interpret. Let s begin by obtaining the data and converting it to a first order differenced series of logarithmically transformed daily closing prices as in the previous article. We are now going to fit a MA 1 , MA 2 and MA 3 model to the series, as we did above for AMZN Let s start with MA 1.Let s make a plot of the residuals of this fitted model. Residuals of MA 1 Model Fi tted to S P500 Daily Log Prices. The first significant peak occurs at k 2 , but there are many more at k in This is clearly not a realisation of white noise and so we must reject the MA 1 model as a potential good fit for the S P500.Does the situation improve with MA 2.Once again, let s make a plot of the residuals of this fitted MA 2 model. Residuals of MA 2 Model Fitted to S P500 Daily Log Prices. While the peak at k 2 has disappeared as we d expect , we are still left with the significant peaks at many longer lags in the residuals Once again, we find the MA 2 model is not a good fit. We should expect, for the MA 3 model, to see less serial correlation at k 3 than for the MA 2 , but once again we should also expect no reduction in further lags. Finally, let s make a plot of the residuals of this fitted MA 3 model. Residuals of MA 3 Model Fitted to S P500 Daily Log Prices. This is precisely what we see in the correlogram of the residuals Hence the MA 3 , as with the other models above, is no t a good fit for the S P500.We ve now examined two major time series models in detail, namely the Autogressive model of order p, AR p and then Moving Average of order q, MA q We ve seen that they re both capable of explaining away some of the autocorrelation in the residuals of first order differenced daily log prices of equities and indices, but volatility clustering and long-memory effects persist. It is finally time to turn our attention to the combination of these two models, namely the Autoregressive Moving Average of order p, q , ARMA p, q to see if it will improve the situation any further. However, we will have to wait until the next article for a full discussion. Just Getting Started with Quantitative Trading.

No comments:

Post a Comment