Vispārējās un izlases populācijas izlases lielums. Vispārējās un izlases populācijas. Reprezentativitātes jēdziens. Nepieciešamais parauga lielums

Statistiskā populācija- vienību kopums, kam ir masa, tipiskums, kvalitatīva viendabība un variāciju klātbūtne.

Statistisko kopu veido materiāli esošie objekti (Darbinieki, uzņēmumi, valstis, reģioni), ir objekts.

Iedzīvotāju vienība— katra konkrētā statistiskās kopas vienība.

Viena un tā pati statistiskā populācija var būt viendabīga vienā pazīmē un neviendabīga citā.

Kvalitatīva vienveidība- visu populācijas vienību līdzība uz kāda pamata un atšķirība uz visiem citiem.

Statistiskajā populācijā atšķirības starp vienu un citu populācijas vienību bieži vien ir kvantitatīvas. Kvantitatīvās izmaiņas dažādu populācijas vienību raksturlielumu vērtībās sauc par variācijām.

Iezīmes variācija- raksturlieluma kvantitatīvās izmaiņas (kvantitatīvam raksturlielumam), pārejot no vienas populācijas vienības uz citu.

Pierakstīties ir īpašums raksturīga vai cita vienību, objektu un parādību iezīme, ko var novērot vai izmērīt. Pazīmes iedala kvantitatīvās un kvalitatīvās. Tiek saukta raksturlieluma vērtības daudzveidība un mainīgums atsevišķās populācijas vienībās variācija.

Atribūtīvās (kvalitatīvās) īpašības nevar izteikt skaitliski (populācijas sastāvs pēc dzimuma). Kvantitatīviem raksturlielumiem ir skaitliska izteiksme (populācijas sastāvs pēc vecuma).

Rādītājs- tas ir vispārinošs kvantitatīvs un kvalitatīvs raksturlielums jebkurai vienību īpašībai vai populācijai kopumā īpašos laika un vietas apstākļos.

Rādītāju karte ir rādītāju kopums, kas vispusīgi atspoguļo pētāmo fenomenu.

Piemēram, tiek pētīta alga:
  • Zīme - darba samaksa
  • Statistiskā populācija – visi nodarbinātie
  • Iedzīvotāju vienība ir katrs darbinieks
  • Kvalitatīva viendabīgums – uzkrātās algas
  • Zīmes variācija - skaitļu virkne

Populācija un paraugs no tās

Pamats ir datu kopums, kas iegūts viena vai vairāku raksturlielumu mērīšanas rezultātā. Patiesi novērots objektu kopums, ko statistiski attēlo vairāki novērojumi nejaušais mainīgais, ir paraugu ņemšana, un hipotētiski esošais (nominālais) - vispārējā populācija. Populācija var būt ierobežota (novērojumu skaits N = konst) vai bezgalīgs ( N = ∞), un paraugs no populācijas vienmēr ir ierobežota skaita novērojumu rezultāts. Novērojumu skaitu, kas veido izlasi, sauc parauga lielums. Ja izlases lielums ir pietiekami liels ( n → ∞) paraugs tiek ņemts vērā liels, pretējā gadījumā to sauc par paraugu ņemšanu ierobežots apjoms. Paraugs tiek ņemts vērā mazs, ja, mērot viendimensionālu gadījuma lielumu, izlases lielums nepārsniedz 30 ( n<= 30 ), un, mērot vairākus vienlaicīgi ( k) pazīmes daudzdimensiju attiecību telpā n Uz k nepārsniedz 10 (n/k< 10) . Veidlapu paraugi variāciju sērija, ja tā dalībnieki ir parastā statistika, t.i., nejaušā lieluma izlases vērtības X tiek sakārtoti augošā secībā (ranžēti), tiek izsauktas raksturlieluma vērtības iespējas.

Piemērs. Gandrīz to pašu nejauši izvēlēto objektu kopu - viena Maskavas administratīvā rajona komercbankas var uzskatīt par izlasi no visu šī rajona komercbanku kopas un par paraugu no visu Maskavas komercbanku kopas. , kā arī paraugs no valsts komercbankām u.c.

Paraugu ņemšanas organizēšanas pamatmetodes

Statistisko secinājumu ticamība un rezultātu jēgpilna interpretācija ir atkarīga no reprezentativitāte paraugi, t.i. vispārējās kopas īpašību reprezentācijas pilnīgums un atbilstība, attiecībā uz kuru šo paraugu var uzskatīt par reprezentatīvu. Populācijas statistisko īpašību izpēti var organizēt divos veidos: izmantojot nepārtraukts Un nav nepārtraukts. Nepārtraukta novērošana paredz visu pārbaudīt vienības pētīta kopums, A daļēja (selektīva) novērošana- tikai tā daļas.

Ir pieci galvenie veidi, kā organizēt izlases novērošanu:

1. vienkārša nejauša atlase, kurā objekti tiek nejauši atlasīti no objektu kopas (piemēram, izmantojot tabulu vai nejaušo skaitļu ģeneratoru), un katram no iespējamajiem paraugiem ir vienāda varbūtība. Tādus paraugus sauc patiesībā nejauši;

2. vienkārša atlase, izmantojot parasto procedūru tiek veikta, izmantojot mehānisku komponentu (piemēram, datumu, nedēļas dienu, dzīvokļa numuru, alfabēta burtus utt.) un šādi iegūtos paraugus sauc mehānisks;

3. stratificēts atlase sastāv no tā, ka sējuma vispārējā populācija tiek sadalīta sējuma apakšpopulācijās jeb slāņos (slāņos), lai . Slāņi ir statistisko raksturlielumu ziņā viendabīgi objekti (piemēram, iedzīvotāji ir sadalīti slāņos pēc vecuma grupām vai sociālajām klasēm; uzņēmumi pēc nozares). Šajā gadījumā paraugi tiek izsaukti stratificēts(pretējā gadījumā, stratificēts, tipisks, reģionalizēts);

4. metodes seriāls formēšanai izmanto atlasi seriāls vai ligzdas paraugi. Tie ir ērti, ja nepieciešams uzreiz apsekot kādu “bloku” vai objektu sēriju (piemēram, preču partiju, noteiktas sērijas izstrādājumus vai valsts teritoriāli administratīvā iedalījuma iedzīvotājus). Sēriju atlasi var veikt tīri nejauši vai mehāniski. Šajā gadījumā tiek veikta noteiktas preču partijas vai visas teritoriālās vienības (dzīvojamās ēkas vai kvartāla) pilnīga pārbaude;

5. apvienots(pakāpeniskā) atlase var apvienot vairākas atlases metodes vienlaikus (piemēram, stratificētā un nejaušā vai nejaušā un mehāniskā); šādu paraugu sauc apvienots.

Atlases veidi

Autors prāts izšķir individuālo, grupu un kombinēto atlasi. Plkst individuāla atlase izlases populācijā tiek atlasītas atsevišķas vispārējās populācijas vienības, ar grupas izvēle- kvalitatīvi viendabīgas vienību grupas (sērijas) un kombinētā atlase ietver pirmā un otrā veida kombināciju.

Autors metodi tiek izdalīta atlase atkārtojas un neatkārtojas paraugs.

Neatkārtots sauc par atlasi, kurā izlasē iekļautā vienība neatgriežas sākotnējā populācijā un nepiedalās turpmākajā atlasē; savukārt vienību skaits kopējā populācijā N tiek samazināts atlases procesa laikā. Plkst atkārtoja atlase nozvejotas izlasē vienība pēc reģistrācijas tiek atgriezta vispārējai populācijai un tādējādi saglabā vienlīdzīgu iespēju kopā ar citām vienībām izmantot turpmākajā atlases procedūrā; savukārt vienību skaits kopējā populācijā N paliek nemainīgs (sociāli ekonomiskajos pētījumos metode tiek izmantota reti). Tomēr ar lieliem N (N → ∞) formulas priekš atkārtojams atlase tuvojas tiem, kas paredzēti atkārtoja atlase un pēdējie tiek praktiski biežāk izmantoti ( N = konst).

Vispārējās un izlases kopas parametru pamatraksturības

Pētījuma statistiskie secinājumi ir balstīti uz nejaušā lieluma sadalījumu un novērotajām vērtībām (x 1, x 2, ..., x n) sauc par gadījuma lieluma realizācijām X(n ir izlases lielums). Gadījuma lieluma sadalījumam vispārējā populācijā ir teorētisks, ideāls raksturs, un tā izlases analogs ir empīrisks izplatīšana. Daži teorētiskie sadalījumi ir noteikti analītiski, t.i. viņu iespējas noteikt sadalījuma funkcijas vērtību katrā nejaušā lieluma iespējamo vērtību telpas punktā. Paraugam sadalījuma funkciju ir grūti un dažreiz neiespējami noteikt iespējas tiek novērtēti no empīriskiem datiem, un pēc tam tie tiek aizstāti ar analītisku izteiksmi, kas apraksta teorētisko sadalījumu. Šajā gadījumā pieņēmums (vai hipotēze) par sadalījuma veidu var būt vai nu statistiski pareizs, vai kļūdains. Bet jebkurā gadījumā no parauga rekonstruētais empīriskais sadalījums tikai aptuveni raksturo patieso. Svarīgākie sadalījuma parametri ir paredzamā vērtība un dispersiju.

Pēc savas būtības sadalījumi ir nepārtraukts Un diskrēts. Vispazīstamākais nepārtrauktais sadalījums ir normāli. Parametru un tā analogu paraugi ir: vidējā vērtība un empīriskā dispersija. No diskrētajiem sociāli ekonomiskajos pētījumos visbiežāk izmantotais alternatīva (dihotoma) izplatīšana. Šī sadalījuma matemātiskās gaidīšanas parametrs izsaka relatīvo vērtību (vai dalīties) populācijas vienības, kurām ir pētāmā pazīme (to norāda ar burtu); ar burtu apzīmē to iedzīvotāju īpatsvaru, kuriem šī pazīme nav q (q = 1 - p). Alternatīvā sadalījuma dispersijai ir arī empīrisks analogs.

Atkarībā no sadalījuma veida un populācijas vienību atlases metodes sadalījuma parametru raksturlielumi tiek aprēķināti atšķirīgi. Galvenie teorētiskajiem un empīriskajiem sadalījumiem ir doti tabulā. 1.

Parauga daļa k n Izlases populācijas vienību skaita attiecību pret vienību skaitu vispārējā populācijā sauc:

kn = n/N.

Parauga daļa w ir to vienību attiecība, kurām piemīt pētāmā pazīme x uz parauga lielumu n:

w = n n/n.

Piemērs. Preču partijā, kurā ir 1000 vienības, ar 5% paraugu parauga daļa k n absolūtā vērtībā ir 50 vienības. (n = N*0,05); ja šajā paraugā tiek atrastas 2 preces ar trūkumiem, tad parauga defektu koeficients w būs 0,04 (w = 2/50 = 0,04 vai 4%).

Tā kā izlases kopa atšķiras no vispārējās populācijas, ir izlases kļūdas.

1. tabula. Vispārējās un izlases populācijas galvenie parametri

Izlases kļūdas

Jebkurā gadījumā (nepārtraukta un selektīva) var rasties divu veidu kļūdas: reģistrācija un reprezentativitāte. Kļūdas reģistrācija var piederēt nejauši Un sistemātiski raksturs. Nejauši kļūdas sastāv no daudziem dažādiem nekontrolējamiem cēloņiem, tās ir netīšas un parasti līdzsvaro viena otru (piemēram, ierīces veiktspējas izmaiņas telpas temperatūras svārstību dēļ).

Sistemātisks kļūdas ir neobjektīvas, jo tās pārkāpj parauga objektu atlases noteikumus (piemēram, novirzes mērījumos, mainot mērierīces iestatījumus).

Piemērs. Lai novērtētu iedzīvotāju sociālo situāciju pilsētā, plānots aptaujāt 25% ģimeņu. Ja katra ceturtā dzīvokļa izvēle tiek veikta pēc tā skaita, tad pastāv risks, ka tiks atlasīti tikai viena tipa dzīvokļi (piemēram, vienistabas dzīvokļi), kas nodrošinās sistemātisku kļūdu un sagrozīs rezultātus; Vēlams izvēlēties dzīvokļa numuru pēc izlozes, jo kļūda būs nejauša.

Reprezentativitātes kļūdas ir raksturīgi tikai izlases novērošanai, no tiem nevar izvairīties un tie rodas tādēļ, ka izlases kopa pilnībā neatražo vispārējo populāciju. No izlases iegūto rādītāju vērtības atšķiras no to pašu vērtību rādītājiem vispārējā populācijā (vai iegūti, veicot nepārtrauktu novērošanu).

Izlases neobjektivitāte ir starpība starp parametra vērtību populācijā un tās izlases vērtību. Kvantitatīvā raksturlieluma vidējai vērtībai tā ir vienāda ar: , un daļai (alternatīvā pazīme) - .

Izlases kļūdas ir raksturīgas tikai izlases novērojumiem. Jo lielākas ir šīs kļūdas, jo vairāk empīriskais sadalījums atšķiras no teorētiskā. Empīriskā sadalījuma parametri ir nejauši mainīgie, tāpēc izlases kļūdas ir arī nejauši mainīgie, tiem var būt dažādas vērtības dažādiem paraugiem, tāpēc ir ierasts aprēķināt vidējā kļūda.

Vidējā izlases kļūda ir lielums, kas izsaka izlases vidējā standarta novirzi no matemātiskās cerības. Šī vērtība, ievērojot nejaušās atlases principu, galvenokārt ir atkarīga no izlases lieluma un raksturlieluma variācijas pakāpes: jo lielāka un mazāka ir raksturlieluma (un līdz ar to arī vērtības) variācija, jo mazāka ir vidējā izlases kļūda. . Attiecību starp vispārējās un izlases populācijas dispersiju izsaka ar formulu:

tie. ja tas ir pietiekami liels, mēs varam pieņemt, ka . Vidējā izlases kļūda parāda iespējamās izlases kopas parametra novirzes no vispārējā populācijas parametra. Tabulā 2 parāda izteiksmes vidējās izlases kļūdas aprēķināšanai dažādām novērošanas organizēšanas metodēm.

2. tabula. Izlases vidējā kļūda (m) un proporcija dažādiem paraugu veidiem

Kur ir nepārtraukta atribūta izlases iekšējās novirzes vidējā vērtība;

Proporcijas grupas iekšējo dispersiju vidējā vērtība;

— atlasīto sēriju skaits, — kopējais sēriju skaits;

,

kur ir th sērijas vidējais rādītājs;

— kopējais vidējais rādītājs visai izlases kopai nepārtrauktam raksturlielumam;

,

kur ir raksturlieluma daļa th sērijā;

— raksturlieluma kopējā daļa visā izlases grupā.

Tomēr vidējās kļūdas lielumu var spriest tikai ar noteiktu varbūtību P (P ≤ 1). Ļapunovs A.M. pierādīja, ka izlases vidējo sadalījums un līdz ar to arī to novirzes no vispārējā vidējā pietiekami lielam skaitam aptuveni atbilst normālā sadalījuma likumam, ja vispārējai populācijai ir ierobežots vidējais un ierobežota dispersija.

Matemātiski šis vidējais rādītājs tiek izteikts šādi:

un akcijai izteiksme (1) būs šāda:

Kur - Tur ir margināla izlases kļūda, kas ir vidējās izlases kļūdas reizinājums , un daudzkārtības koeficients ir Stjudenta tests ("uzticamības koeficients"), ko ierosināja W.S. Gosset (pseidonīms "Students"); dažādu paraugu lielumu vērtības tiek glabātas īpašā tabulā.

Funkcijas Ф(t) vērtības dažām t vērtībām ir vienādas ar:

Tāpēc izteiksmi (3) var lasīt šādi: ar varbūtību P = 0,683 (68,3%) var apgalvot, ka atšķirība starp izlasi un vispārējo vidējo nepārsniegs vienu vidējās kļūdas vērtību m(t=1), ar varbūtību P = 0,954 (95,4%)- ka tas nepārsniegs divu vidējo kļūdu vērtību m (t = 2) , ar varbūtību P = 0,997 (99,7%)- nepārsniegs trīs vērtības m (t = 3) . Tādējādi iespējamību, ka šī starpība trīs reizes pārsniegs vidējo kļūdu, nosaka ar kļūdu līmenis un ne vairāk 0,3% .

Tabulā 3 parāda formulas maksimālās izlases kļūdas aprēķināšanai.

3. tabula. Izlases robežkļūda (D) vidējam un proporcija (p) dažādiem izlases novērošanas veidiem

Izlases rezultātu vispārināšana uz populāciju

Izlases novērošanas galvenais mērķis ir raksturot vispārējo populāciju. Ar nelielu izlases lielumu parametru empīriskie aprēķini ( un ) var ievērojami atšķirties no to patiesajām vērtībām ( un ). Tāpēc ir jānosaka robežas, kurās atrodas patiesās vērtības ( un ) parametru ( un ) parauga vērtībām.

Ticamības intervāls jebkura vispārējās populācijas parametra θ ir šī parametra nejaušs vērtību diapazons, kas ar varbūtību tuvu 1 ( uzticamība) satur šī parametra patieso vērtību.

Margināla kļūda paraugi Δ ļauj noteikt vispārējās populācijas un to īpašību robežvērtības ticamības intervāli, kas ir vienādi:

Apakšējā līnija ticamības intervāls iegūts atņemot maksimālā kļūda no izlases vidējā (daļa), un augšējā, to pievienojot.

Ticamības intervāls vidējai vērtībai tā izmanto maksimālo izlases kļūdu, un noteiktam ticamības līmenim nosaka pēc formulas:

Tas nozīmē, ka ar noteiktu varbūtību R, ko sauc par ticamības līmeni un unikāli nosaka vērtība t, var apgalvot, ka vidējā patiesā vērtība ir diapazonā no , un akcijas patiesā vērtība ir diapazonā no

Aprēķinot ticamības intervālu trim standarta ticamības līmeņiem P = 95%, P = 99% un P = 99,9% vērtību izvēlas . Pielietojumi atkarībā no brīvības pakāpju skaita. Ja izlases lielums ir pietiekami liels, tad vērtības, kas atbilst šīm varbūtībām t ir vienādi: 1,96, 2,58 Un 3,29 . Tādējādi izlases robežkļūda ļauj noteikt populācijas raksturlielumu robežvērtības un to ticamības intervālus:

Izlases novērošanas rezultātu izplatīšanai plašajā populācijā sociāli ekonomiskajos pētījumos ir savas īpatnības, jo tas prasa pilnīgu visu tā veidu un grupu pārstāvību. Šāda sadalījuma iespējamības pamatā ir aprēķins relatīvā kļūda:

Kur Δ % - relatīvā maksimālā izlases kļūda; , .

Ir divas galvenās metodes izlases novērojuma paplašināšanai uz populāciju: tiešā pārrēķina un koeficientu metode.

Esence tieša konversija sastāv no izlases vidējā!!\overline(x) reizināšanas ar populācijas lielumu.

Piemērs. Ļaujiet, lai vidējais mazuļu skaits pilsētā tiktu novērtēts pēc izlases metodes, un tas ir viens cilvēks. Ja pilsētā ir 1000 jauno ģimeņu, tad nepieciešamo vietu skaitu pašvaldības bērnudārzos iegūst, šo vidējo reizinot ar kopējo iedzīvotāju skaitu N = 1000, t.i. būs 1200 sēdvietas.

Likmes metode Ieteicams izmantot gadījumā, ja tiek veikta selektīva novērošana, lai precizētu nepārtrauktās novērošanas datus.

Šajā gadījumā izmantojiet formulu:

kur visi mainīgie ir populācijas lielums:

Nepieciešamais parauga lielums

4. tabula. Nepieciešamais izlases lielums (n) dažādiem izlases novērošanas organizācijas veidiem

Plānojot izlases novērojumu ar iepriekš noteiktu pieļaujamās izlases kļūdas vērtību, nepieciešams pareizi novērtēt nepieciešamo parauga lielums. Šo apjomu var noteikt, pamatojoties uz pieļaujamo kļūdu izlases novērošanas laikā, pamatojoties uz doto varbūtību, kas garantē pieļaujamo kļūdas līmeņa vērtību (ņemot vērā novērojuma organizēšanas metodi). Formulas vajadzīgā izlases lieluma n noteikšanai var viegli iegūt tieši no maksimālās izlases kļūdas formulām. Tātad no robežkļūdas izteiksmes:

parauga lielums ir tieši noteikts n:

Šī formula parāda, ka, samazinoties maksimālajai izlases kļūdai Δ nepieciešamais izlases lielums ievērojami palielinās, kas ir proporcionāls Stjudenta t testa dispersijai un kvadrātam.

Konkrētai novērošanas organizēšanas metodei nepieciešamo izlases lielumu aprēķina pēc tabulā norādītajām formulām. 9.4.

Praktiski aprēķinu piemēri

1. piemērs. Vidējās vērtības un ticamības intervāla aprēķins nepārtrauktam kvantitatīvam raksturlielumam.

Lai novērtētu norēķinu ātrumu ar kreditoriem, bankā tika veikta nejauša 10 maksājuma dokumentu izlase. To vērtības izrādījās vienādas (dienās): 10; 3; 15; 15; 22; 7; 8; 1; 19; 20.

Nepieciešams ar varbūtību P = 0,954 noteikt robežkļūdu Δ parauga vidējais un vidējā aprēķina laika ticamības robežas.

Risinājums. Vidējo vērtību aprēķina, izmantojot formulu no tabulas. 9.1 izlases kopai

Dispersija tiek aprēķināta, izmantojot formulu no tabulas. 9.1.

Dienas vidējā kvadrātiskā kļūda.

Vidējo kļūdu aprēķina pēc formulas:

tie. vidējais ir x ± m = 12,0 ± 2,3 dienas.

Vidējā ticamība bija

Mēs aprēķinām maksimālo kļūdu, izmantojot formulu no tabulas. 9.3 atkārtotai paraugu ņemšanai, jo populācijas lielums nav zināms, un par P = 0,954 pārliecības līmenis.

Tādējādi vidējā vērtība ir `x ± D = `x ± 2m = 12,0 ± 4,6, t.i. tā patiesā vērtība ir robežās no 7,4 līdz 16,6 dienām.

Studenta t-tabulas izmantošana. Lietojumprogramma ļauj secināt, ka n = 10 - 1 = 9 brīvības pakāpēm iegūtā vērtība ir ticama ar 0,001 £ nozīmīguma līmeni, t.i. iegūtā vidējā vērtība būtiski atšķiras no 0.

2. piemērs. Varbūtības novērtējums (vispārējā daļa) lpp.

Mehāniskā izlases metode 1000 ģimeņu sociālā statusa apsekošanai atklāja, ka maznodrošināto ģimeņu īpatsvars w = 0,3 (30%)(paraugs bija 2% , t.i. n/N = 0,02). Nepieciešams ar ticamības līmeni p = 0,997 noteikt indikatoru R maznodrošinātām ģimenēm visā reģionā.

Risinājums. Pamatojoties uz uzrādītajām funkciju vērtībām Ф(t) atrast noteiktam ticamības līmenim P = 0,997 nozīmē t = 3(skat. 3. formulu). Daļskaitļa robežkļūda w nosaka pēc formulas no tabulas. 9.3. neatkārtotai paraugu ņemšanai (mehāniskā paraugu ņemšana vienmēr ir neatkārtota):

Maksimālā relatīvā izlases kļūda % būs:

Maznodrošināto ģimeņu varbūtība (vispārējais īpatsvars) reģionā būs р=w±Δw, un ticamības robežas p aprēķina, pamatojoties uz dubulto nevienādību:

w — Δ w ≤ p ≤ w — Δ w, t.i. p patiesā vērtība atrodas:

0,3 — 0,014 < p <0,3 + 0,014, а именно от 28,6% до 31,4%.

Tādējādi ar varbūtību 0,997 var apgalvot, ka maznodrošināto ģimeņu īpatsvars starp visām reģiona ģimenēm svārstās no 28,6% līdz 31,4%.

3. piemērs. Vidējās vērtības un ticamības intervāla aprēķins diskrētam raksturlielumam, kas noteikts ar intervālu virkni.

Tabulā 5. precizēts pasūtījumu izgatavošanas pieteikumu sadalījums atbilstoši to izpildes termiņam uzņēmumā.

5. tabula. Novērojumu sadalījums pēc parādīšanās laika

Risinājums. Vidējais pasūtījumu izpildes laiks tiek aprēķināts pēc formulas:

Vidējais periods būs:

= (3 * 20 + 9 * 80 + 24 * 60 + 48 * 20 + 72 * 20) / 200 = 23,1 mēneši.

To pašu atbildi iegūstam, ja izmantojam p i datus no tabulas priekšpēdējās kolonnas. 9.5, izmantojot formulu:

Ņemiet vērā, ka pēdējās gradācijas intervāla vidus tiek atrasts, mākslīgi papildinot to ar iepriekšējās gradācijas intervāla platumu, kas vienāds ar 60 - 36 = 24 mēneši.

Dispersija tiek aprēķināta, izmantojot formulu

Kur x i- intervālu sērijas vidus.

Tāpēc!!\sigma = \frac (20^2 + 14^2 + 1 + 25^2 + 49^2)(4), un vidējā kvadrātiskā kļūda ir .

Vidējo kļūdu aprēķina, izmantojot mēneša formulu, t.i. vidējā vērtība ir!!\overline(x) ± m = 23,1 ± 13,4.

Mēs aprēķinām maksimālo kļūdu, izmantojot formulu no tabulas. 9.3 atkārtotai atlasei, jo populācijas lielums nav zināms, ticamības līmenim 0,954:

Tātad vidējais rādītājs ir:

tie. tā patiesā vērtība ir diapazonā no 0 līdz 50 mēnešiem.

4. piemērs. Lai noteiktu norēķinu ātrumu ar N = 500 korporatīvo uzņēmumu kreditoriem komercbankā, nepieciešams veikt izlases pētījumu, izmantojot nejaušas neatkārtotas atlases metodi. Nosakiet nepieciešamo izlases lielumu n tā, lai ar varbūtību P = 0,954 izlases vidējā kļūda nepārsniegtu 3 dienas, ja izmēģinājuma aplēses parādīja, ka standartnovirze s ir 10 dienas.

Risinājums. Lai noteiktu nepieciešamo pētījumu skaitu n, mēs izmantosim neatkārtotas atlases formulu no tabulas. 9.4:

Tajā t vērtību nosaka pēc ticamības līmeņa P = 0,954. Tas ir vienāds ar 2. Vidējā kvadrāta vērtība ir s = 10, populācijas lielums ir N = 500, un vidējā maksimālā kļūda ir Δ x = 3. Aizvietojot šīs vērtības formulā, mēs iegūstam:

tie. Pietiek ar 41 uzņēmuma izlasi, lai novērtētu nepieciešamo parametru - norēķinu ātrumu ar kreditoriem.

Visu noteiktas kategorijas indivīdu kopumu sauc par vispārējo populāciju. Iedzīvotāju skaitu nosaka pētījuma mērķi.

Ja tiek pētīta kāda savvaļas dzīvnieku vai augu suga, tad kopējā populācija būs visi šīs sugas indivīdi. Šajā gadījumā kopējās populācijas apjoms būs ļoti liels un aprēķinos tas tiek ņemts kā bezgala liela vērtība.

Ja tiek pētīta aģenta ietekme uz noteiktas kategorijas augiem un dzīvniekiem, tad vispārējā populācija būs visi šīs kategorijas augi un dzīvnieki (suga, dzimums, vecums, ekonomiskais mērķis), pie kuriem piederēja eksperimentālie objekti. Tas vairs nav ļoti liels personu skaits, taču tas joprojām nav pieejams visaptverošai izpētei.

Vispārējās populācijas apjoms ne vienmēr ir pieejams visaptverošam pētījumam. Dažkārt tiek pētītas nelielas populācijas, piemēram, tiek noteikts vidējais izslaukums vai vidējais vilnas nocirpums dzīvnieku grupai, kas piešķirta konkrētam darbiniekam. Šādos gadījumos populācija būs ļoti mazs indivīdu skaits, kas visi tiek pētīti. Neliela populācija tiek konstatēta arī, pētot kolekcijā atrodamos augus vai dzīvniekus, lai raksturotu noteiktu grupu šajā kolekcijā.

Grupas īpašību (u.c.) raksturojumus, kas saistīti ar visu populāciju, sauc par vispārīgajiem parametriem.

Paraugs ir objektu grupa, kas atšķiras pēc trim pazīmēm:

1 ir daļa no vispārējās populācijas;

2 nejauši izvēlēti noteiktā veidā;

3 pētīta, lai raksturotu visu populāciju.

Lai no izlases iegūtu diezgan precīzu visas populācijas raksturlielumu, ir nepieciešams organizēt pareizu objektu atlasi no kopas.

Teorija un prakse ir izstrādājušas vairākas sistēmas indivīdu atlasei izlasei. Visas šīs sistēmas ir balstītas uz vēlmi nodrošināt maksimālu iespēju atlasīt jebkuru objektu no vispārējās populācijas. Tendence un neobjektivitāte objektu atlasē izlases pētījumam neļauj izdarīt pareizus vispārīgus secinājumus un padara izlases pētījuma rezultātus neliecinošus visai populācijai, t.i., nereprezentatīvus.

Lai iegūtu pareizu, neizkropļotu visas populācijas raksturlielumu, jācenšas nodrošināt iespēju izlasē atlasīt jebkuru objektu no jebkuras populācijas daļas. Šī pamatprasība ir jāizpilda, jo stingrāk, jo mainīgāka ir pētāmā iezīme. Ir saprotams, ka tad, kad daudzveidība tuvojas nullei, piemēram, dažu sugu matu vai spalvu krāsas pētījumos, jebkura paraugu atlases metode dos reprezentatīvus rezultātus.

Dažādos pētījumos tiek izmantotas šādas objektu atlases metodes izlasē.

4 Nejauši atkārtota atlase, kurā pētāmos objektus atlasa no vispārējās populācijas, vispirms neņemot vērā pētāmās pazīmes attīstību, t.i., nejaušā (noteiktai pazīmei) secībā; Pēc atlases katrs objekts tiek izpētīts un pēc tam atgriezts tā populācijā, lai jebkuru objektu varētu atlasīt atkārtoti. Šī atlases metode ir līdzvērtīga atlasei no bezgala lielas vispārējās populācijas, kurai ir izstrādāti galvenie parauga un vispārīgo vērtību attiecības rādītāji.

5 Nejauši neatkārtota atlase, kurā nejauši atlasītie objekti, tāpat kā iepriekšējā metodē, neatgriežas vispārējā populācijā un nevar tikt atkārtoti iekļauti izlasē. Šis ir visizplatītākais izlases organizēšanas veids; tas ir līdzvērtīgs atlasei no lielas, bet ierobežotas populācijas, kas tiek ņemta vērā, nosakot vispārīgos rādītājus no izlases.

6 Mehāniskā atlase, kurā objekti tiek atlasīti no atsevišķām vispārējās populācijas daļām, un šīs daļas tiek provizoriski apzīmētas mehāniski atbilstoši eksperimenta lauka kvadrātiem, pēc nejaušām dzīvnieku grupām, kas ņemtas no dažādām populācijas zonām utt. daudzas šādas daļas ir ieskicētas, jo paredzams, ka tiks ņemti pētāmie objekti, tāpēc daļu skaits ir vienāds ar izlases lielumu. Mehāniskā selekcija dažkārt tiek veikta, izvēloties pētīt īpatņus pēc noteikta skaita, piemēram, izlaižot dzīvniekus caur šķelšanos un atlasot katru desmito, simto utt., vai pļaujot ik pēc 100 vai 200 m, vai izvēloties vienu objekts katriem sastaptajiem 10. 100 utt., pētot visu populāciju.

8 Sērijas (klasteru) atlase, kurā vispārējā populācija ir sadalīta daļās - sērijās, dažas no tām tiek pētītas pilnībā. Šo metodi veiksmīgi izmanto gadījumos, kad pētāmie objekti ir diezgan vienmērīgi sadalīti noteiktā tilpumā vai pa noteiktu teritoriju. Piemēram, pētot gaisa vai ūdens piesārņojumu ar mikroorganismiem, tiek ņemti paraugi un tie tiek pilnībā pārbaudīti. Atsevišķos gadījumos lauksaimniecības objektus var apsekot arī ar ligzdošanas metodi. Pētot gaļas šķirnes mājlopu gaļas un citu pārstrādes produktu iznākumu, izlasē var iekļaut visus šīs šķirnes dzīvniekus, kas nonākuši divos vai trijos gaļas pārstrādes uzņēmumos. Pētot olu lielumu kolhozu putnkopībā, šo pazīmi ir iespējams izpētīt vairākās kolhozos visā cāļu populācijā.

Grupas īpašību raksturojums (μ, s utt.), kas iegūti izlasei, sauc par izlases rādītājiem.

Reprezentativitāte

Tieša atlasīto objektu grupas izpēte nodrošina, pirmkārt, primāro materiālu un paša parauga īpašības.

Visi izlases dati un kopsavilkuma rādītāji ir svarīgi kā primārie pētījuma atklātie fakti, un tie ir rūpīgi apsvērti, analizēti un salīdzināmi ar citu darbu rezultātiem. Bet tas neierobežo primārajiem pētījumu materiāliem raksturīgās informācijas iegūšanas procesu.

Tas, ka objekti izlasei tika atlasīti, izmantojot īpašus paņēmienus un pietiekamā daudzumā, padara izlases izpētes rezultātus par indikatīviem ne tikai pašai izlasei, bet arī visai populācijai, no kuras šī parauga ņemta.

Paraugs noteiktos apstākļos kļūst vairāk vai mazāk precīzs visas populācijas atspoguļojums. Šo parauga īpašību sauc par reprezentativitāti, kas nozīmē reprezentativitāti ar noteiktu precizitāti un ticamību.

Tāpat kā jebkura īpašība, arī izlases datu reprezentativitāte var tikt izteikta pietiekamā vai nepietiekamā mērā. Pirmajā gadījumā izlasē tiek iegūti uzticami vispārējo parametru aprēķini, otrajā - neuzticami. Ir svarīgi atcerēties, ka neuzticamu aplēšu iegūšana nemazina izlases rādītāju vērtību pašas izlases raksturošanai. Uzticamu aplēšu iegūšana paplašina izlases pētījumā iegūto sasniegumu pielietojuma jomu.

http://www.hi-edu.ru/e-books/xbook096/01/index.html?part-011.htm- ļoti noderīga vietne!

Pētījuma izlases metode ir galvenā statistikas metode. Tas ir dabiski, jo pētāmo objektu apjoms parasti ir bezgalīgs (un, pat ja tas ir ierobežots, ir ļoti grūti sakārtot visus objektus, ir jāsamierinās tikai ar daļu no tiem, atlasi).

Vispārējās un izlases populācijas

Vispārējā populācija ir visu attiecīgajā eksperimentā pētīto elementu kopums.

Izlases kopa (vai izlase) ir ierobežota objektu kolekcija, kas nejauši atlasīta no populācijas.

Populācijas apjoms (izlases vai vispārīgais) ir objektu skaits šajā populācijā.

Vispārējo un izlases kopu piemērs

Pieņemsim, ka mēs pētām cilvēka psiholoģisko noslieci sadalīt noteiktu segmentu attiecībā pret zelta griezumu. Tā kā paša zelta griezuma jēdziena izcelsmi nosaka cilvēka ķermeņa antropometrija, ir skaidrs, ka šajā gadījumā vispārējā populācija ir jebkura antropogēna būtne, kas ir sasniegusi fizisku briedumu un ieguvusi galīgos apmērus, tas ir, visa pieaugušā cilvēces daļa. Šīs kolekcijas apjoms ir praktiski bezgalīgs.

Ja šī nosliece tiek pētīta tikai mākslinieciskajā vidē, tad kopumā ir cilvēki, kas ir tieši saistīti ar dizainu: mākslinieki, arhitekti, dizaineri. Arī šādu cilvēku ir ļoti daudz, un varam pieņemt, ka arī kopējā populācijas apjoms šajā gadījumā ir bezgalīgs.

Abos gadījumos pētniecībai esam spiesti aprobežoties ar saprātīgu izlases lielumu, par vienas vai otras populācijas pārstāvjiem izvēloties tehnisko specialitāšu studentus (kā cilvēkus, kas attālināti no mākslas pasaules) vai dizaina studentus (kā cilvēkus, kas tieši saistīti ar pasaules mākslinieciskie attēli).

Reprezentativitāte

Izlases metodes galvenā problēma ir jautājums par to, cik precīzi no vispārējās populācijas pētniecībai atlasītie objekti atspoguļo vispārējās populācijas pētītās īpašības, tas ir, jautājums par izlases reprezentativitāti.

Tātad paraugu sauc par reprezentatīvu, ja tas pietiekami precīzi atspoguļo vispārējās populācijas kvantitatīvās attiecības.

Protams, grūti pateikt, kas īsti slēpjas aiz neskaidrā formulējuma diezgan precīzi. Reprezentativitātes jautājumi parasti ir vispretrunīgākie jebkurā eksperimentālā pētījumā. Ir daudz piemēru, kas jau kļuvuši par klasiskiem, kad izlases nepietiekama reprezentativitāte noveda eksperimentētājus pie absurdiem rezultātiem.

Parasti reprezentativitātes jautājumi tiek atrisināti ar ekspertu vērtējumu, kad zinātnieku aprindās ir pieņemts autoritatīvu ekspertu grupas viedoklis par pētījuma pareizību.

Reprezentativitātes piemērs

Atgriezīsimies pie segmenta dalīšanas piemēra. Paraugu reprezentativitātes jautājumi šeit ir pašā pētījuma pamatā: nekādā gadījumā nevajadzētu jaukt priekšmetu grupas, pamatojoties uz to piederību mākslinieciskajai videi.

Novērotā raksturlieluma statistiskais sadalījums

Novērotās vērtības biežums

Ļaujiet, ka testēšanas rezultātā parauga tilpumā novērotais atribūts iegūst vērtības,, ..., un vērtība tika novērota vienu reizi, vērtība tika novērota vienreiz utt., vērtība tika novērota vienreiz. Tad novērotās vērtības biežumu sauc par skaitli, vērtības ir skaitļi utt.

Novērotās vērtības relatīvais biežums

Novērotās vērtības relatīvais biežums ir biežuma attiecība pret izlases lielumu:

Ir skaidrs, ka novērotā raksturlieluma frekvenču summai vajadzētu dot izlases lielumu

un relatīvo frekvenču summai jādod vienotība:

Šos apsvērumus var izmantot kontrolei, veidojot statistikas tabulas. Ja vienādības nav izpildītas, tad eksperimenta rezultātu ierakstīšanas laikā tika pieļauta kļūda.

Novērotās vērtības statistiskais sadalījums

Novērotā raksturlieluma statistiskais sadalījums ir atbilstība starp novērotajām raksturlieluma vērtībām un atbilstošajām frekvencēm (vai relatīvajām frekvencēm).

Parasti statistisko sadalījumu raksta divu rindu tabulas veidā, kurā pirmajā rindā ir norādītas pazīmes novērotās vērtības, bet otrajā - atbilstošās frekvences (vai relatīvās frekvences). rinda:

Ja novēroto raksturlielumu raksturo nepārtraukts gadījuma lielums, kas ņem vērtības no intervāla, tad tā statistisko sadalījumu apraksta ar daļējos intervālos sadalīšanās biežumu:

Tātad modeļus, kuriem ir pakļauts pētāmais gadījuma mainīgais, fiziski pilnībā nosaka tā novērošanas (vai eksperimenta) reālais nosacījumu kopums, un tos matemātiski nosaka atbilstošā varbūtības telpa vai, kas ir tas pats, ar atbilstošo. varbūtības sadalījuma likums. Tomēr, veicot statistiskos pētījumus, nedaudz ērtāka izrādās cita ar vispārējās populācijas jēdzienu saistīta terminoloģija.

Vispārējā populācija ir visu iedomājamo novērojumu kopums (vai visi garīgi iespējamie mūs interesējošā tipa objekti, no kuriem tiek “ņemti novērojumi”), ko varētu veikt noteiktā reālo apstākļu kopumā. Tā kā definīcija attiecas uz visiem garīgi iespējamiem novērojumiem (vai objektiem), vispārējās populācijas jēdziens ir nosacīti matemātisks, abstrakts jēdziens, un to nevajadzētu jaukt ar reālām populācijām, uz kurām attiecas statistikas izpēte. Tādējādi, apskatot pat visus apakšnozares uzņēmumus no tos raksturojošo tehnisko un ekonomisko rādītāju vērtību fiksēšanas viedokļa, apsekoto kopu varam uzskatīt tikai par hipotētiski iespējamas plašākas uzņēmumu kopas pārstāvi. kas varētu darboties tādos pašos reālos apstākļu kopumā

Praktiskajā darbā izvēli ir ērtāk saistīt ar novērojamajiem objektiem, nevis ar šo objektu īpašībām. Mēs izvēlamies izpētei mašīnas, ģeoloģiskos paraugus, cilvēkus, bet ne mašīnu, paraugu, cilvēku raksturlielumu vērtības. Savukārt matemātiskajā teorijā objekti un to raksturlielumu kopums neatšķiras un zūd ieviestās definīcijas dualitāte.

Kā redzam, matemātisko jēdzienu “vispārējā populācija”, kā arī jēdzienus “varbūtības telpa”, “nejaušais mainīgais” un “varbūtības sadalījuma likums” fiziski pilnībā nosaka atbilstošs reālais nosacījumu kopums, un tāpēc visi. šos četrus matemātiskos jēdzienus var uzskatīt par sinonīmiem noteiktā nozīmē. Populāciju sauc par ierobežotu vai bezgalīgu atkarībā no tā, vai visu iespējamo novērojumu kopums ir ierobežots vai bezgalīgs.

No definīcijas izriet, ka nepārtrauktas populācijas (kas sastāv no nepārtrauktas dabas pazīmju novērojumiem) vienmēr ir bezgalīgas. Diskrētas vispārējās populācijas var būt bezgalīgas vai ierobežotas. Piemēram, ja tiek analizēta N produktu partija pēc kategorijas (sk. piemēru 4.1.3. punktā), kad katru produktu var iedalīt vienā no četrām kategorijām, pētāmais gadījuma lielums ir tāda produkta kategorijas numurs, kas nejauši iegūts no partija, un iespējamo vērtību izlases lieluma kopa sastāv attiecīgi no četriem punktiem (1, 2, 3 un 4), tad, acīmredzot, populācija būs ierobežota (tikai N iedomājami novērojumi).

Bezgalīgas populācijas jēdziens ir matemātiska abstrakcija, tāpat kā ideja, ka nejauša lieluma mērījumus var atkārtot bezgalīgi daudz reižu. Aptuveni bezgalīgu vispārējo populāciju var interpretēt kā ierobežotu ierobežotu gadījumu, kad objektu skaits, ko ģenerē noteikta reāla apstākļu kopa, palielinās bezgalīgi. Tātad, ja tikko sniegtajā piemērā produktu partiju vietā mēs uzskatām to pašu produktu nepārtrauktu masveida ražošanu, mēs nonāksim pie bezgalīgas vispārējās populācijas jēdziena. Praksē šāda modifikācija ir līdzvērtīga prasībai

Paraugs no noteiktas populācijas ir nejauša lieluma ierobežotas novērojumu sērijas rezultāti. Izlasi var uzskatīt par sava veida empīrisku vispārējās populācijas analogu, ar ko mēs visbiežāk nodarbojamies praksē, jo visas vispārējās populācijas apsekošana var būt vai nu pārāk darbietilpīga (liela N gadījumā), vai būtībā neiespējama. (bezgalīgu vispārējo populāciju gadījumā).

Novērojumu skaitu, kas veido izlasi, sauc par izlases lielumu.

Ja izlases lielums ir liels un mums ir darīšana ar viendimensijas nepārtrauktu vērtību (vai ar viendimensionālu diskrētu vērtību, kuras iespējamo vērtību skaits ir diezgan liels, teiksim, vairāk nekā 10), tad tas bieži vien ir ērtāk, no novērojumu rezultātu turpmākās statistiskās apstrādes vienkāršošanas viedokļa, pāriet uz tā sauktajiem "grupētajiem" izlases datiem. Šo pāreju parasti veic šādi:

a) tiek atzīmētas mazākās un lielākās vērtības paraugā;

b) viss apsekotais diapazons ir sadalīts noteiktā skaitā 5 vienādos grupēšanas intervālos; šajā gadījumā intervālu skaitam s nevajadzētu būt mazākam par 8–10 un vairāk par 20–25: intervālu skaita izvēle būtiski ir atkarīga no izlases lieluma; aptuvenai orientācijai 5. izvēlē varat izmantot aptuvenā formula

kas drīzāk būtu jāuzskata par zemāku aplēsi s (īpaši lieliem

c) augošā secībā ir atzīmēti katra intervāla galējie punkti, kā arī to viduspunkti

d) tiek skaitīts paraugdatu skaits, kas ietilpst katrā no intervāliem: (acīmredzami); paraugdati, kas iekrīt uz intervālu robežām, ir vai nu vienmērīgi sadalīti pa diviem blakus esošiem intervāliem, vai arī ir norunāts tos attiecināt tikai uz vienu no tiem, piemēram, uz kreiso.

Atkarībā no problēmas konkrētā satura šajā grupēšanas shēmā var tikt veiktas dažas modifikācijas (piemēram, atsevišķos gadījumos ir ieteicams atteikties no vienāda garuma grupēšanas intervālu prasības).

Visos turpmākajos argumentos, izmantojot paraugdatus, mēs turpināsim no tikko aprakstītā apzīmējuma.

Atgādināsim, ka statistikas metožu būtība ir izmantot noteiktu kopējās populācijas daļu (t.i., izlasi), lai pieņemtu spriedumus par tās īpašībām kopumā.

Viens no būtiskākajiem jautājumiem, kura veiksmīgs risinājums nosaka datu statistiskās apstrādes rezultātā iegūto secinājumu ticamību, ir jautājums par izlases reprezentativitāti, t.i. jautājums par to, cik pilnīga un adekvāta ir mūs interesējošo analizētās vispārējās populācijas īpašību reprezentācija. Praktiskajā darbā vienu un to pašu izpētei ņemto objektu grupu var uzskatīt par paraugu no dažādām vispārējām populācijām. Tādējādi ģimeņu grupu, kas nejauši izvēlēta no viena no pilsētas rajonu mājokļu uzturēšanas biroja (ZhEK) kooperatīvajām mājām detalizētai socioloģiskai apsekojumam, var uzskatīt gan par izlasi no ģimeņu vispārējās populācijas (ar kooperatīvu). mājokļa forma) un kā paraugs no konkrētā apgabala vispārējām iedzīvotāju ģimenēm, kā arī kā paraugs no visu pilsētas ģimeņu kopējās populācijas un, visbeidzot, kā paraugs no visu ģimeņu kopējās populācijas. ģimenes pilsētā, kas dzīvo kooperatīvās mājās. Pārbaudes rezultātu jēgpilna interpretācija būtiski ir atkarīga no tā, kuras vispārējās populācijas pārstāvi mēs uzskatām izvēlēto ģimeņu grupu, kurai vispārējai populācijai šo paraugu var uzskatīt par reprezentatīvu. Atbilde uz šo jautājumu ir atkarīga no daudziem faktoriem. Iepriekš minētajā piemērā tas jo īpaši ir atkarīgs no īpaša (varbūt slēpta) faktora esamības vai neesamības, kas nosaka ģimenes piederību konkrētajam mājokļu birojam vai rajonam kopumā (šāds faktors varētu būt, piemēram, ģimenes vidējie ienākumi uz vienu iedzīvotāju, rajona ģeogrāfiskā atrašanās vieta pilsētā, apgabala “vecums” utt.).


Populācija- visu objektu (vienību) kopums, par kuriem zinātnieks plāno izdarīt secinājumus, pētot konkrētu problēmu. Populāciju veido visi objekti, kas ir pakļauti izpētei. Iedzīvotāju sastāvs ir atkarīgs no pētījuma mērķiem. Dažkārt kopējā populācija ir visa noteikta reģiona iedzīvotāji (piemēram, pētot potenciālo vēlētāju attieksmi pret kandidātu), visbiežāk tiek norādīti vairāki kritēriji, kas nosaka pētījuma objektu. Piemēram, sievietes vecumā no 18 līdz 29 gadiem, kuras vismaz reizi nedēļā lieto noteiktu zīmolu roku krēmus un kuru ienākumi uz vienu ģimenes locekli ir vismaz 150 USD.

Paraugs- gadījumu kopums (subjekti, objekti, notikumi, paraugi), izmantojot noteiktu procedūru, kas atlasīti no vispārējās populācijas, lai piedalītos pētījumā.

  1. parauga lielums;
  2. Atkarīgi un neatkarīgi paraugi;
  3. Pārstāvība:
    1. Nereprezentatīvas izlases piemērs;
  4. Plāna veidi grupu veidošanai no paraugiem;
  5. Grupu veidošanas stratēģijas:
    1. Randomizācija;
    2. Pāru atlase;
    3. Stratometriskā atlase;
    4. Aptuvenā modelēšana.

Parauga lielums- izlases populācijā iekļauto gadījumu skaits. Statistikas apsvērumu dēļ ir ieteicams, lai gadījumu skaits būtu vismaz 30-35.

Atkarīgi un neatkarīgi paraugi

Salīdzinot divus (vai vairākus) paraugus, svarīgs parametrs ir to atkarība. Ja ir iespējams izveidot homomorfu pāri (tas ir, ja viens gadījums no parauga X atbilst vienam un tikai viens gadījums no parauga Y un otrādi) katram gadījumam divos paraugos (un šis attiecības pamats ir svarīgs pazīme, kas tiek mērīta paraugos), šādus paraugus sauc par atkarīgiem. Atkarīgo paraugu piemēri: dvīņu pāri, divi pazīmes mērījumi pirms un pēc eksperimentālās ietekmes, vīri un sievas utt.

Ja starp paraugiem šādas attiecības nav, tad šīs izlases tiek uzskatītas par neatkarīgiem, piemēram: vīrieši un sievietes, psihologi un matemātiķi.

Attiecīgi atkarīgajiem paraugiem vienmēr ir vienāds izmērs, savukārt neatkarīgo paraugu lielums var atšķirties.

Paraugu salīdzināšana tiek veikta, izmantojot dažādus statistikas kritērijus:

  • Studenta t-tests;
  • Vilkoksona T-tests;
  • Mann-Whitney U tests;
  • Zīmes kritērijs utt.

Reprezentativitāte

Izlasi var uzskatīt par reprezentatīvu vai nereprezentatīvu.

Nereprezentatīvas izlases piemērs

Amerikas Savienotajās Valstīs par vienu no slavenākajiem vēsturiskajiem nereprezentatīvās izlases piemēriem uzskata gadījumu, kas notika prezidenta vēlēšanu laikā 1936. gadā. Žurnāls Literary Digest, kas veiksmīgi prognozēja vairāku iepriekšējo vēlēšanu notikumus, kļūdījās. savās prognozēs, izsūtot desmit miljonus pārbaudes biļetenu saviem abonentiem, cilvēkiem, kas atlasīti no tālruņu grāmatām visā valstī, un no personām, kas iekļautas automašīnu reģistrācijas sarakstos. 25% atgriezto biļetenu (gandrīz 2,5 miljoni) balsis sadalījās šādi:

57% deva priekšroku republikāņu kandidātam Alfam Lendonam

40% izvēlējās toreizējo demokrātu prezidentu Franklinu Rūzveltu

Faktiskajās vēlēšanās, kā zināms, uzvarēja Rūzvelts, iegūstot vairāk nekā 60% balsu. Literary Digest kļūda bija šāda: vēloties palielināt izlases reprezentativitāti, jo viņi zināja, ka lielākā daļa viņu abonentu uzskata sevi par republikāņiem, viņi paplašināja izlasi, iekļaujot cilvēkus, kas atlasīti no tālruņu grāmatām un reģistrācijas sarakstiem. Tomēr viņi neņēma vērā sava laika realitāti un faktiski savervēja vēl vairāk republikāņu: Lielās depresijas laikā tālruņus un automašīnas varēja atļauties galvenokārt vidējās un augstākās klases pārstāvji (tas ir, lielākā daļa republikāņu). , nevis demokrāti).

Plānu veidi grupu veidošanai no paraugiem

Ir vairāki galvenie grupu veidošanas plānu veidi:

  1. Pētījums ar eksperimentālajām un kontroles grupām, kuras novietotas dažādos apstākļos;
  2. Pētījums ar eksperimentālajām un kontroles grupām, izmantojot pāru atlases stratēģiju;
  3. Pētījums, kurā izmanto tikai vienu grupu - eksperimentāls;
  4. Pētījums, kurā izmantots jaukts (faktoriāls) dizains - visas grupas tiek novietotas dažādos apstākļos.

Grupu veidošanas stratēģijas

Grupu atlase dalībai psiholoģiskajā eksperimentā tiek veikta, izmantojot dažādas stratēģijas, kas nepieciešamas, lai nodrošinātu pēc iespējas lielāku iekšējo un ārējo derīguma ievērošanu:

  1. Randomizācija (izlases nejaušība);
  2. Pāru atlase;
  3. Stratometriskā atlase;
  4. Aptuvenā modelēšana;
  5. Īstu grupu piesaiste.

Randomizācija

Lai izveidotu vienkāršus izlases paraugus, tiek izmantota nejaušība vai izlases veida izlase. Šādas izlases izmantošana ir balstīta uz pieņēmumu, ka katram kopas loceklim ir vienāda iespēja tikt iekļautam izlasē. Piemēram, lai nejauši izvēlētos 100 universitātes studentus, cepurē varat ievietot papīra gabalus ar visu universitātes studentu vārdiem un pēc tam izņemt no tās 100 papīra lapas - tā būs nejauša atlase.

Pāru atlase

Pāru atlase ir stratēģija izlases grupu izveidošanai, kurās subjektu grupas sastāv no subjektiem, kas ir līdzvērtīgi eksperimentam nozīmīgu sekundāro parametru ziņā. Šī stratēģija ir efektīva eksperimentiem, izmantojot eksperimentālās un kontroles grupas, un labākā iespēja ir dvīņu pāru (mono- un dizigotisko) iesaistīšana, jo tā ļauj jums izveidot.

Stratometriskā izvēle

Stratometriskā atlase - randomizācija ar slāņu (vai klasteru) sadali. Ar šo izlases metodi vispārējā populācija tiek sadalīta grupās (slāņos) ar noteiktām pazīmēm (dzimums, vecums, politiskās preferences, izglītība, ienākumu līmenis utt.), un tiek atlasīti subjekti ar atbilstošām pazīmēm.

Aptuvenā modelēšana

Aptuvenā modelēšana - ierobežotu izlasi un secinājumu vispārināšana par šo paraugu plašākai populācijai. Piemēram, pētījumā piedaloties augstskolas 2. kursa studentiem, šī pētījuma dati attiecas uz “cilvēkiem vecumā no 17 līdz 21 gadam”. Šādu vispārinājumu pieļaujamība ir ārkārtīgi ierobežota.

Vai jums patika raksts? Dalies ar draugiem!