Pelabur menggunakan model pergerakan harga aset untuk meramalkan di mana harga pelaburan akan berada pada masa yang tertentu. Kaedah yang digunakan untuk membuat ramalan ini adalah sebahagian daripada medan dalam statistik yang dikenali sebagai analisis regresi. Pengiraan varians residu satu set nilai adalah alat analisis regresi yang mengukur seberapa tepat ramalan model sesuai dengan nilai sebenar.
Talian Regresi
The garis regresi menunjukkan bagaimana nilai aset telah berubah disebabkan oleh perubahan dalam pembolehubah yang berlainan. Juga dikenali sebagai a garis trend, garis regresi memaparkan "trend" harga aset. Garis regresi diwakili oleh persamaan linear:
Y = a + bX
di mana "Y" ialah nilai aset, "a" adalah malar, "b" adalah pengganda dan "X" adalah pemboleh ubah yang berkaitan dengan nilai aset.
Sebagai contoh, jika model meramalkan bahawa rumah satu bilik tidur menjual sebanyak $ 300,000, sebuah rumah dua bilik menjual sebanyak $ 400,000, dan sebuah rumah tiga bilik tidur menjual $ 500,000, garis regresi akan kelihatan seperti:
Y = 200,000 + 100,000X
di mana "Y" adalah harga jualan rumah dan "X" adalah bilangan bilik tidur.
Y = 200,000 + 100,000 (1) = 300,000
Y = 200,000 + 100,000 (2) = 400,000
Y = 200,000 + 100,000 (3) = 500,000
Plot bersepah
A plot bersepah menunjukkan mata yang mewakili korelasi sebenar antara nilai aset dan pembolehubah. Istilah "scatterplot" berasal dari fakta bahawa, apabila titik-titik ini dilukis pada graf, mereka nampaknya "bertaburan" di sekeliling, bukannya berbaring dengan sempurna pada garis regresi. Dengan menggunakan contoh di atas, kita boleh mempunyai scatterplot dengan mata data ini:
Titik 1: 1BR dijual dengan harga $ 288,000
Titik 2: 1BR dijual dengan harga $ 315,000
Titik 3: 2BR dijual dengan harga $ 395,000
Titik 4: 2BR dijual dengan harga $ 410,000
Titik 5: 3BR dijual dengan harga $ 492,000
Titik 6: 3BR dijual dengan harga $ 507,000
Pengiraan Varians Residual
Pengiraan varians sisa bermula dengan jumlah persegi perbezaan antara nilai aset pada garis regresi dan setiap nilai aset yang bersamaan pada scatterplot.
Kuadrat perbezaan ditunjukkan di sini:
Titik 1: $ 288,000 - $ 300,000 = (- $ 12,000); (-12,000)2 = 144,000,000
Titik 2: $ 315,000 - $ 300,000 = (+ $ 15,000); (+15,000)2 = 225,000,000
Titik 3: $ 395,000 - $ 400,000 = (- $ 5,000); (-5,000)2 = 25,000,000
Titik 4: $ 410,000 - $ 400,000 = (+ $ 10,000); (+10,000)2 = 100,000,000
Titik 5: $ 492,000 - $ 500,000 = (- $ 8,000); (-8,000)2 = 64,000,000
Titik 6: $ 507,000 - $ 500,000 = (+ $ 7,000); (+7,000)2 = 49,000,000
Jumlah kuadrat = 607,000,000
Varians residu didapati dengan mengambil jumlah kotak dan membahagikannya dengan (n-2), di mana "n" adalah bilangan titik data pada scatterplot.
RV = 607,000,000 / (6-2) = 607,000,000 / 4 = 151,750,000.
Kegunaan untuk Perbezaan Sisa
Walaupun setiap titik pada scatterplot tidak akan sesuai dengan garis regresi, model yang stabil akan mempunyai titik scatterplot dalam pengedaran biasa di sekitar garis regresi. Varians sisa juga dikenali sebagai "variance error." Varians residu yang tinggi menunjukkan bahawa garis regresi dalam model asal mungkin salah. Sesetengah fungsi spreadsheet boleh menunjukkan proses di sebalik mewujudkan garis regresi yang hampir dengan data penyebaran.