1. 從數據集中剔除異常數據一般用什么數據算法
常用的方法有:
1、可以通過“分析”下“描述統計“下“頻率”的”繪制“直方圖”,看圖發現頻數出現最少的值,就可能是異常值,但還要看距離其它情況的程度。
2、可通過“分析”下的“描述統計”下的“探索”下的“繪制”選項的“葉莖圖”,看個案偏離箱體邊緣(上端、下端)的距離是箱體的幾倍,“○”代表在1.5-3倍之間(離群點),“*”代表超過3倍(極端離群點)。
3、可以通過“分析”下“描述統計“下“描述”下的選項“將標準化存為變量Z”,選擇相應的變量,“確定”。將生成新變量,如果值超過2,肯定是異常值。
-
轉載請注明出處榮觀房產網 » 房地產評估案例剔除異常值