* Расределения номинальных и порядковых переменных.
FREQUENCIES
VARIABLES=ter mest chlico chisl chdet chisd decilr
/ORDER= ANALYSIS .
* Распределения некоторых числовых переменных.
FREQUENCIES
VARIABLES=potras prod pitres alk neprod uslug natdox /FORMAT=NOTABLE
/STATISTICS=MEAN MEDIAN
/HISTOGRAM
/ORDER= ANALYSIS .
* Вычисление доли расходов на алкоголь в общих потребительских расходах.
COMPUTE alkp = alk/potras .
EXECUTE .
* Вычисление аналогичных долей остальных статей.
COMPUTE prodp = prod/potras .
COMPUTE pitresp = pitres/potras .
COMPUTE neprodp = neprod/potras .
COMPUTE uslugp = uslug/potras .
* Определение тех домохозяйств, чьи расходы на алкоголь не превосходят 5000 руб.
* Определение тех домохозяйств, чьи расходы на алкоголь равны 0.
COMPUTE sumalk5000 = alk<=5000.
COMPUTE sumalk0 = alg=0.
* Вычисление указанных выше групп.
FREQUENCIES
VARIABLES=sumalk5000 sumalk0
/ORDER= ANALYSIS .
* Определение средних расходов на алкоголь по децильным группам.
MEANS
TABLES=potras alk alkp BY decilr
/CELLS MEAN COUNT STDDEV
/STATISTICS ANOVA .
* Изучение корреляционной структуры по децильным группам.
SORT CASES BY decilr .
SPLIT FILE
LAYERED BY decilr .
CORRELATIONS
/VARIABLES=prod pitres alk neprod uslug
/PRINT=TWOTAIL NOSIG
/MISSING=PAIRWISE .
CORRELATIONS
/VARIABLES=alkp prodp pitresp neprodp uslugp
/PRINT=TWOTAIL NOSIG
/MISSING=PAIRWISE .
SPLIT FILE
OFF.
* Вычисление стандартизированных значений расходов.
DESCRIPTIVES
VARIABLES=prod pitres alk neprod uslug /SAVE
/STATISTICS=MEAN STDDEV MIN MAX .
* Кластерное решение с 4 кластерами.
QUICK CLUSTER
Zalkp Zprodp Zpitresp Zneprodp Zuslugp
/MISSING=LISTWISE
/CRITERIA= CLUSTER(4) MXITER(100) CONVERGE(0)
/METHOD=KMEANS(NOUPDATE)
/SAVE CLUSTER DISTANCE
/PRINT INITIAL ANOVA CLUSTER DISTAN.
* Получение координат кластерных центров в исходных координатах
(не стандартизированных).
MEANS
TABLES=potras alk alkp BY QCL_3
/CELLS MEAN COUNT STDDEV
/STATISTICS ANOVA .
* Вычисление средних расстояний до центра кластера
(для определения "среднего диаметра" кластеров).
MEANS
TABLES=QCL_4 BY QCL_3
/CELLS MEAN COUNT STDDEV
/STATISTICS ANOVA .
* Наложение кластеров на основные группирующие переменные.
CROSSTABS
/TABLES=ter mest chisl chisd decilr BY QCL_3
/FORMAT= AVALUE TABLES
/STATISTIC=CHISQ
/CELLS= COUNT ROW
/COUNT ROUND CELL .
* Вычисление среднего размера натуральных поступлений по кластерам.
MEANS
TABLES=natdox BY QCL_3
/CELLS MEAN COUNT STDDEV
/STATISTICS ANOVA .
|