Determining Variables That Predict Reading Comprehension Success by Data Mining in PISA 2018


Creative Commons License

KASAP Y., DOĞAN N., KOÇAK C.

Celal Bayar Üniversitesi Sosyal Bilimler Dergisi, vol.19, no.4, pp.241-258, 2021 (Peer-Reviewed Journal) identifier

Abstract

In this study, it was aimed to determine the important variables that can predict the success of reading comprehension with 34 independent variables obtained from the student questionnaire given to the students who participated in PISA in 2018. For this purpose, 79 countries participating in PISA were put in order of success percentage. Then, with equal slices, countries were divided into lower, middle and upper slices. The study sample was created by selecting 9 countries including Turkey according to their percentiles. In the analyzes made with the logistic model using Turkey, low, medium, high achievement group and study sample data, the important variables predicting reading comprehension success varied between 5 and 8. According to the results obtained, for Turkey, low, middle and high achievement group countries and study sample, it is determined that the important common predictors of success are, the difficulty perception of the PISA test, the highest education level index of the parents and the educational items in the house. Then, classification, cross-validation and prediction performances of success with important variables were calculated. It has been observed that with the estimations made with important variables, results were close to the performances of the models obtained with 34 variables.
Bu araştırmada 2018 yılında PISA’ya katılan öğrencilere sınavla verilen öğrenci anketinden elde edilen 34 bağımsız değişken ile, okuduğunu anlama başarısını yordayabilen önemli değişkenleri belirleme amaçlanmıştır. Bu amaç için PISA’ya katılan 79 ülke başarı yüzdelik sırasına konuldu. Ardından eşit dilimlerle ülkeler alt orta ve üst dilimler olarak ayrıldı. Yüzdelik dilimlerine göre Türkiye dahil 9 ülke seçilerek çalışma örneklemi oluşturulmuştur. Türkiye, alt, orta, üst başarı grubu ve çalışma örneklemi verileri kullanılarak lojistik model ile yapılan analizlerde okuduğunu anlama başarısını yordayan önemli değişkenler, 5-8 arasında değişmiştir. Elde edilen sonuçlara göre başarıyı yordama da Türkiye, alt, orta, üst başarı grubu ülkeler ve çalışma örneklemi için, önemli ortak yordayıcıların; PISA testinin zorluk algısı, ebeveynlerin en yüksek eğitim düzeyi indeksi ve evdeki eğitimsel eşyalar olduğu belirlenmiştir. Daha sonra, önemli değişkenlerle başarıyı sınıflama, çapraz geçerlik ve tahmin performansları hesaplanmıştır. Önemli değişkenlerle yapılan kestirimlerle 34 değişkenle elde edilen modellerdeki performanslara yakın sonuçlar elde edildiği görülmüştür.