Jump to content

Testi hi-katror

Nga Wikipedia, enciklopedia e lirë
Shpërndarja në katror Chi, duke treguar χ2 në boshtin x dhe vlerën p (probabiliteti i bishtit të djathtë) në boshtin y .

Një test hi-katror (gjithashtu shënuar χ2 ) është një test hipoteze statistikore që përdoret në analizën e tabelave të kontigjencës kur madhësitë e kampionit janë të mëdha. Në terma më të thjeshtë, ky test përdoret kryesisht për të hetuar nëse dy variabla diskretë ( dy dimensione të tabelës së kontigjencës ) janë të pavarura në ndikimin e statistikave të testit (vlerat brenda tabelës ). [1] Testi është i vlefshëm kur statistika e testit ndjek shpërndarjen hi-katror sipas hipotezës zero, veçanërisht testi hi-katror i Pirsonit dhe variantet e tij. Testi hi-katror i Pirsonit përdoret për të përcaktuar nëse ka një ndryshim domethënës statistikor midis frekuencave të pritura dhe frekuencave të vëzhguara në një ose më shumë kategori të një tabele kontigjence . Për tabelat e kontigjencës me madhësi më të vogla të mostrës, përdoret një test i saktë i Fisheri .

Në zbatime standarde të këtij testi, vëzhgimet klasifikohen në klasa ndërsjellazi përjashtuese. Nëse hipoteza zero pohon se nuk ka dallime midis klasave në popullatë është e vërtetë, statistika e testit e llogaritur nga vëzhgimet ndjek një shpërndarje frekuence χ . Qëllimi i testit është të vlerësojë se sa kishin që të merreshin frekuencat e vëzhguara duke supozuar se hipoteza zero është e vërtetë.

Statistikat e testimit që ndjekin një shpërndarje χ2 ndodhin kur vëzhgimet janë të pavarura. Ekzistojnë gjithashtu teste χ2 për testimin e hipotezës zero të pavarësisë së një çifti variablash të rastësishëm bazuar në vëzhgimet e çifteve.

Testi hi-katror i Pearson

[Redakto | Redakto nëpërmjet kodit]

Në vitin 1900, Pearson botoi një paper [2] mbi testin χ2 i cili konsiderohet të jetë një nga themelet e statistikës moderne. [3] Në këtë letër, Pearson hetoi një test të mirësisë së përshtatjes.

Supozoni se n vëzhgime në një zgjedhje të rastësishme nga një popullatë klasifikohen në k klasa ndërsjellazi përjashtuese me numrat përkatës të vëzhguar xi (për i = 1,2,…,k ), dhe një hipotezë zero jep probabilitetin pi që një vëzhgim të bjerë në klasën e i të. Pra kemi numrat e pritur mi = npi i për të gjithë i, ku

Pearson propozoi që, në rast se hipoteza zero është e saktë, pasi n → ∞ shpërndarja kufizuese e madhësisë së dhënë më poshtë është shpërndarja χ2 .

Shembull testi hi-katror për të dhënat kategorike

[Redakto | Redakto nëpërmjet kodit]

Supozoni se ekziston një qytet me 1,000,000 banorë të ndarë në katër lagje: A, B, C dhe D . Është marrë një kampion rastësor prej 650 banorësh të qytetit dhe profesioni i tyre është regjistruar si "jakë e bardhë", "jakë blu" ose "pa jakë" . Hipoteza zero është se lagja e banimit të çdo personi është e pavarur nga tipi i profesionit të personit. Të dhënat janë tabeluar si:

A B C D Totali
Jakë e bardhë 90 60 104 95 349
Jakë blu 30 50 51 20 151
Pa kollare 30 40 45 35 150
Totali 150 150 200 150 650

Le të marrim kampionin që jeton në lagjen A, 150, për të vlerësuar se çfarë përqindje e të gjithë 1,000,000 banorëve jetojnë në lagjen A.Në mënyrë të ngjashme marrim  vlerësuar se çfarë përqindje e 1,000,000 janë punëtorë me jakë të bardhë. Me supozimin e pavarësisë nën hipotezë ne duhet të "presim" që numri i punëtorëve jakë të bardhë në lagjen A të jetë

Pastaj në atë "qelizë" të tabelës, kemi

Shuma e këtyre madhësive mbi të gjitha qelizat është statistika e provës; në këtë rast, . Sipas hipotezës zero, kjo shumë ka afërsisht një shpërndarje hi-katrore, numri i shkallëve të lirisë së së cilës është

Nëse statistika e testit është çuditërisht e madhe sipas asaj shpërndarjeje në katror, atëherë hipoteza zero e pavarësisë refuzohet.

Në kriptanalizë, testi hi-katror përdoret për të krahasuar shpërndarjen e tekstit të thjeshtë dhe (ndoshta) të deshifruar. Vlera më e ulët e testit do të thotë se deshifrimi ishte i suksesshëm me probabilitet të lartë. [4] [5] Kjo metodë mund të përgjithësohet për zgjidhjen e problemeve moderne kriptografike. [6]

bioinformatikë, testi hi-katror përdoret për të krahasuar shpërndarjen e disa vetive të gjeneve (p.sh., përmbajtja gjenomike, shkalla e mutacionit, grupimi i rrjetit të ndërveprimit, etj.) që u përkasin kategorive të ndryshme (p.sh., gjenet e sëmundjes, gjenet thelbësore, gjenet në një kromozom të caktuar etj. ). [7] [8]

  1. ^ "Chi-Square - Sociology 3112 - Department of Sociology - The University of utah". soc.utah.edu. Marrë më 2022-11-12. {{cite web}}: Mungon ose është bosh parametri |language= (Ndihmë!)
  2. ^ Pearson, Karl (1900). "On the criterion that a given system of deviations from the probable in the case of a correlated system of variables is such that it can be reasonably supposed to have arisen from random sampling" (PDF). Philosophical Magazine. Series 5. 50 (302): 157–175. doi:10.1080/14786440009463897. {{cite journal}}: Mungon ose është bosh parametri |language= (Ndihmë!)
  3. ^ Cochran, William G. (1952). "The Chi-square Test of Goodness of Fit". The Annals of Mathematical Statistics. 23 (3): 315–345. doi:10.1214/aoms/1177729380. JSTOR 2236678. {{cite journal}}: Mungon ose është bosh parametri |language= (Ndihmë!)
  4. ^ "Chi-squared Statistic". Practical Cryptography. Arkivuar nga origjinali më 18 shkurt 2015. Marrë më 18 shkurt 2015. {{cite web}}: Mungon ose është bosh parametri |language= (Ndihmë!)
  5. ^ "Using Chi Squared to Crack Codes". IB Maths Resources. British International School Phuket. 15 qershor 2014. {{cite web}}: Mungon ose është bosh parametri |language= (Ndihmë!)
  6. ^ Ryabko, B. Ya.; Stognienko, V. S.; Shokin, Yu. I. (2004). "A new test for randomness and its application to some cryptographic problems" (PDF). Journal of Statistical Planning and Inference. 123 (2): 365–376. doi:10.1016/s0378-3758(03)00149-6. Marrë më 18 shkurt 2015. {{cite journal}}: Mungon ose është bosh parametri |language= (Ndihmë!)
  7. ^ Feldman, I.; Rzhetsky, A.; Vitkup, D. (2008). "Network properties of genes harboring inherited disease mutations". PNAS. 105 (11): 4323–432. Bibcode:2008PNAS..105.4323F. doi:10.1073/pnas.0701722105. PMC 2393821. PMID 18326631. {{cite journal}}: Mungon ose është bosh parametri |language= (Ndihmë!)
  8. ^ "chi-square-tests" (PDF). Arkivuar nga origjinali (PDF) më 29 qershor 2018. Marrë më 29 qershor 2018. {{cite web}}: Mungon ose është bosh parametri |language= (Ndihmë!)