•  
  •  
 

Title (Arabic)

مقارنه بين بعض طرائق التصنيف الخطية مع تطبيق عملي

DOI

10.33095/jeas.v20i80.848

Abstract

Linear discriminant analysis and logistic regression are the most widely used in multivariate statistical methods for analysis of data with categorical outcome variables .Both of them are appropriate for the development of linear classification models .linear discriminant analysis has been that the data of explanatory variables must be distributed multivariate normal distribution. While logistic regression no assumptions on the distribution of the explanatory data. Hence ,It is assumed that logistic regression is the more flexible and more robust method in case of violations of these assumptions. In this paper we have been focus for the comparison between three forms for classification data belongs two groups when the response variable with tow categorise only. The first form is the linear discriminant function ,The second is the probability form which it is derivative as alternative for the linear discriminant function while the third form is the probability function model. Of the logistic regression the comparison between these methods is based on measure of the probability of misclassification .We show that the results of the probability form of the logistic regression has minimum probability of misclassification through the application on the data of two types of (leukemia).

Abstract (Arabic)

يعد تحليل التمييز الخطي والانحدار اللوجستي من أهم طرائق التحليل الإحصائي متعدد المتغيرات استخداماً في مجال تحليل البيانات المصنفه (Categorical data) واللذين يمكن عدهما تطويراً لنماذج التصنيف الخطية .ان استخدام تحليل التمييز الخطي يتطلب ان تكون بيانات المتغيرات التوضيحية ذات توزيع طبيعي متعدد المتغيرات.في حين الانحدار اللوجستي لايشترط ايه افتراضات تخص توزيع المتغيرات التوضيحيه، اذ يعد الانحدار اللوجستي أكثر مرونه وأكثر حصانه في حاله عدم تحقق الافتراضات الأساسية للتحليل التمييزي الخطي. في هذا البحث تم التركيز على أجراء مقارنات بين ثلاث صيغ لتصنيف بيانات تعود لمجموعتين في حاله متغير الاستجابة مؤلف من مستتويين ( تصنيفين) فقط ، الصيغه الأولى كانت دالة التمييز الخطي في حالة المجموعتيين تتبعان التوزيع الطبيعي متعدد المتغيرات والثانيه فكانت الصيغه الاحتماليه التي اشتقت كبديل لدالة التمييز الخطي ،اما الثالثة فكانت الصيغه الاحتمالية لنموذج الانحدار اللوجستي ثنائي الاستجابه وتمت المقارنة بين هذه الصيغ الثلاثة على وفق معيار احتمال خطأ التصنيف(Misclassification) . واثبتت النتائج ان التصنيف بحسب الصيغة الاحتمالية لنموذج الانحدار اللوجستي تعطي أقل احتمال لخطأ التصنيف من خلال التطبيق على بيانات تخص نوعين من امراض سرطان الدم( اللوكيميا) .

First Page

393

Share

COinS