The Problem of Zero Cells in the Analysis of Contingency Tables

Autor

  • Justyna Brzezińska Uniwersytet Ekonomiczny w Katowicach, Katedra Analiz Gospodarczych i Finansowych

DOI:

https://doi.org/10.15678/ZNUEK.2015.0941.0504

Słowa kluczowe:

zerowe liczebności, analiza danych jakościowych, tablice kontyngencji, analiza logarytmiczno-liniowa

Abstrakt

Tytuł artykułu: Problem zerowych liczebności w analizie tablic kontyngencji

Analiza logarytmiczno-liniowa jest metodą badania zależności pomiędzy zmiennymi niemetrycznymi w tablicy kontyngencji, która pozwala analizować dowolną liczbę zmiennych nominalnych i porządkowych. Pomimo że jest ona uniwersalną metodą analizy zmiennych niemetrycznych, występują jednak pewne ograniczenia w jej stosowaniu ze względu na zerowe liczebności. Zera występujące w tablicy mogą być dwojakiego rodzaju: strukturalne lub związane ze schematem losowania. Zera strukturalne pojawiają się wtedy, gdy nie jest możliwa obserwacja kategorii zmiennej, a zera związane ze schematem losowania występują w małych próbach i znikają, gdy próba zostanie odpowiednio zwiększona. W artykule zaprezentowano sposoby radzenia sobie z zerowymi liczebnościami w tablicy kontyngencji. Wszystkie obliczenia przeprowadzono w programie R.

Pobrania

Statystyki pobrań niedostępne.

Bibliografia

Akaike H. (1973), Information Theory and an Extension of the Maximum Likelihood Principle, Proceedings of the 2nd International Symposium on Information, Budapest.

Andersen E. B. (1997), Introduction to the Statistical Analysis of Categorical Data, New York, Springer. DOI: https://doi.org/10.1007/978-3-642-59123-5

Brzezińska J. (2013), Metody wizualizacji danych jakościowych w programie R, Prace Naukowe Uniwersytetu Ekonomicznego we Wrocławiu, 279, Klasyfikacja i analiza danych - teoria i zastosowania, 21: 182-190.

Brzezińska J. (2014), Visual Models for Categorical Data in Economic Research, M. Spiliopoulou, L. Schmids-Thieme, R. Janning (eds), Studies in Classification, Data Analysis, and Knowledge Organization: Data Analysis, Machine Learning and Knowledge Discovery, Springer: 33-40. DOI: https://doi.org/10.1007/978-3-319-01595-8_4

Brzezińska J. (2015), Analiza logarytmiczno-liniowa. Teoria i zastosowania z wykorzystaniem programu R, C.H. Beck, Warszawa.

Clausen S. E. (1998), Applied Correspondence Analysis. An Introduction, Sage Publications, Thousand Oaks.

Clogg C. C., Eliason S. R. (1988), Some Common Problems in Log-linear Analysis (in:) J. S. Long (ed.), Common Problems/Propers Solutions, Sage, Newbury Park, CA.

Cohen A. (1980), On the Graphical Display of the Significant Components in a Two-way Contingency Table, "Communications in Statistics - Theory and Methods", 9(10): 1025-1041, http://dx.doi.org/10.1080/03610928008827940. DOI: https://doi.org/10.1080/03610928008827940

Everitt B. (1977), The Analysis of Contingency Tables, Chapman and Hall, London. DOI: https://doi.org/10.1007/978-1-4899-2927-3

Evers M., Namboodiri N. K. (1977), A Monte Carlo Assessment of the Stability of Log-linear Estimates in Small Samples, Proceedings of the American Statistical Association, Social Statistics Section, American Statistical Association, Washington, DC.

Fienberg S. E. (1980), The Analysis of Cross-classified Categorical Data, MIT Press, Cambridge.

Friendly M. (1991), The SAS System for Statistical Graphics, SAS Institute Inc., Carry, NC.

Friendly M. (2000), Visualizing Categorical Data, SAS Institute Inc., Carry, NC.

Goodman L. A. (1970), The Multivariate Analysis of Qualitative Data: Interaction among Multiple Classifications, "Journal of the American Statistical Association", 65(329): 226-256, http://dx.doi.org/10.1080/01621459.1970.10481076. DOI: https://doi.org/10.1080/01621459.1970.10481076

Greenacre M. J. (1984), Theory and Applications of Correspondence Analysis, Academic Press, London.

Grizzle J. E., Starmer C. F., Koch G. C. (1969), Analysis of Categorical Data by Linear Models, "Biometrics", 25(3): 489-504, http://dx.doi.org/10.2307/2528901. DOI: https://doi.org/10.2307/2528901

Ishii-Kunts M. (1994), Ordinal Log-linear Models, Sage University Paper Series on Quantitative Applications in the Social Science, series no. 07-097, Sage, Beverly Hills-London.

Knoke D., Burke P. J. (1980), Log-linear Models, Sage University Paper Series on Quantitative Applications in the Social Science, series no. 07-020, Sage, BeverlyHills-London.

Raftery A. E. (1986), Choosing Models for Bross-classification, "American Sociological Review", 51: 145-146. DOI: https://doi.org/10.2307/2095483

Smirnoff J. S. (2003), Analyzing Categorical Data, Springer Texts in Statistics, Springer, New York. DOI: https://doi.org/10.1007/978-0-387-21727-7

Snee R. D. (1974), Graphical Display of Two-way Contingency Tables, "The American Statistician", 28(1): 9-12, http://dx.doi.org/10.2307/2683520. DOI: https://doi.org/10.1080/00031305.1974.10479053

Opublikowane

2015-11-16

Numer

Dział

Artykuły

Jak cytować

Brzezińska, J. (2015). The Problem of Zero Cells in the Analysis of Contingency Tables. Krakow Review of Economics and Management Zeszyty Naukowe Uniwersytetu Ekonomicznego W Krakowie, 5(941), 49-61. https://doi.org/10.15678/ZNUEK.2015.0941.0504