2022年碩士研究生考試即將開始,首都體育學(xué)院2022年心理與教育測量考研大綱及參考書目已經(jīng)發(fā)布,對于報考首都體育學(xué)院的同學(xué)有很大的參考意義。
高頓考研為大家整理了首都體育學(xué)院2022年心理與教育測量考研大綱及參考書目的詳細內(nèi)容,供大家參考!
心理測量圍繞心理量表這個核心主要分為測驗理論和測驗應(yīng)用兩大部分。學(xué)習(xí)理論部分內(nèi)容時,應(yīng)對每部分涉及的知識點進行整理和歸納,以系統(tǒng)的觀點來學(xué)習(xí)和運用相關(guān)知識。這一部分中測驗的編制更體現(xiàn)了學(xué)習(xí)的系統(tǒng)性,編制的各個環(huán)節(jié)都是相扣的,一定要聯(lián)系起來掌握,并且需要把握每個環(huán)節(jié)需要注意的問題,在實際操作中能減少一些誤差的產(chǎn)生。這部分中信度、效度、項目區(qū)分度的計算是重點,考生需要掌握幾個常用的公式,理解它們的適用范圍。而心理測量理論的新發(fā)展我們可以適當(dāng)了解,不必深究。
心理測驗的應(yīng)用部分主要是心理測驗在實際中的應(yīng)用。考生應(yīng)在學(xué)習(xí)中關(guān)注各類測驗的定義、特點、編制、實施和解釋的內(nèi)容。尤其對一些經(jīng)典的測驗要熟練掌握??傮w來說這部分內(nèi)容既非考查的重點,同時識記難度也不大。
總之,這兩部分中,測驗理論是重點,信度、效度的分析,常模參照測驗與標準參照測驗、測驗的制作過程等重在理解。各種測驗主要是了解每種測驗中有代表性的幾種著名量表。同時特別強調(diào)的是測驗部分很可能會考察它的應(yīng)用方面,所以不僅要再認和記憶其中的細節(jié),也要注意對其應(yīng)用方面的思考和練習(xí)。
第一章心理與教育測量概述
第一節(jié)心理與教育測量的相關(guān)概念
一、測量的概念:依據(jù)一定的法則使用量具對事物的特征進行定量描述的過程。
二、任何測量都必須具備兩個基本要素:參照點和測量的單位。其中參照點分為絕對參照點和相對參照點。
三、測量的量表:能夠使事物的特征數(shù)量化的數(shù)字的連續(xù)體就是量表。
量表可以分為四種:①命名量表:用數(shù)字代表事物或用數(shù)字對事物進行分類。命名量表又分為名稱量表(用數(shù)字指代個別事物)和類別量表(用數(shù)字指代事物種類)。
②順序量表:按照事物的大小,等級,程度而排列數(shù)字的量表。
③等距量表:不僅能夠指代事物的類別,等級而且具有相等的單位。等距量表的數(shù)字是一個真正的數(shù)量,這個數(shù)量中各個部分的單位是相等的。因此可以對其進行加減運算。等距量表沒有絕對的零點。它的零點是人們假定的相對零點。對于等距量表的兩個數(shù)不能進行乘除運算。
④比率量表:除了具有類別、等級、等距的特征外,還有絕對的零點。
四、影響測量精確的因素
1、測量對象本身的性質(zhì)。①確定型(物體的長度)。②隨機型(人的短時記憶容量)③模糊型,即事物本身的量是模糊不定的(人的性格特征)
2、測量的精確度取決于測量工具的精確性。
3、根據(jù)測量的性質(zhì)和不同的特點,可以將不同形式的測量大致分為4種類型。
①物理測量:及對事物物理特征的測量。長度,重量等。
②生理測量:對機體生理特征的測量。如對動植物各種化學(xué)成分含量的測量。
③社會測量:即對社會現(xiàn)象的測量,如人口普查。
④心理測量:對人的心理特征的測量。如智力、人格測量。
第二節(jié)心理與教育測量的性質(zhì)
一、心理與教育測量的定義:依據(jù)一定的心理學(xué)和教育學(xué)原理,使用測驗對人的心理特質(zhì)和教育成就進行定量描述的過程。
其獨特的性質(zhì):①心理與教育測量依據(jù)的法則在很大程度上只是一種理論,很難達到如同物理測量依據(jù)的法則那樣普遍被人們接受的水平。②心理與教育測量的對象是人的心理特質(zhì)和教育成就。③心理與教育測量的量具是有關(guān)領(lǐng)域的專家編制,經(jīng)過長期的試用,修訂,完善而逐漸形成的標準化測驗。他的編制是一門高度專門化的系統(tǒng)工作。④心理與教育測量的目標雖然是對人的心理特質(zhì)和教育成就進行定量分析,但這種定量分析的精確度遠不及物理測量的精確度高。
二、心理與教育測量的理論基礎(chǔ):
①人的心理現(xiàn)象和知識水平如同其他一切物理現(xiàn)象一樣是有差異的,有質(zhì)的差異也有量的差異。因為有差異,所以要測定差異的數(shù)量,描述差異的程度。②心理特質(zhì)和知識水平雖然不是物理實體,不能直接測量,卻必然表現(xiàn)于人的外部行為之中,并調(diào)節(jié)著人的外部行為。因此,通過觀測人的外部行為的差異就有可能測量出人的心理特質(zhì)和知識水平的差異。③教育和心理測量的準確性和可靠性如同其他一切測量技術(shù)一樣是相對的,如同其他一切測量技術(shù)一樣是科學(xué)技術(shù)的進步發(fā)展而逐步提高。
三、心理與教育測量中的測驗
測驗:由有關(guān)領(lǐng)域的專家經(jīng)過長期的編制、試用、修訂、完善而逐漸形成的標準化測量工具。
編制一個測驗應(yīng)當(dāng)具備4個基本條件:
①行為樣本(被抽取出來的,作為直接測量對象的行為就是行為樣本)
②標準化。分為:測驗內(nèi)容標準化、施測條件標準化(相同的指導(dǎo)語,相同的測驗情景,相同的測驗時限)、評分規(guī)則的標準化、測驗常模的標準化。
③難度或應(yīng)答率。
④信度和效度。
第三節(jié)心理及教育測量的種類及其功能
一、心理及教育測驗的種類
1、按測驗功能所作分類:智力測驗?zāi)芰A向測驗成就測驗人格測驗
2、按測驗對象所做的分類:個別測驗團體測驗
3、按測驗內(nèi)容的形式所做的分類:文字(紙筆)測驗非文字(操作)測驗
4、按測驗?zāi)康淖龅姆诸悾好枋鲂詼y驗診斷性測驗預(yù)測性測驗
5、按測驗的難度和時限做的分類:難度測驗與速度測驗
6、按測驗的要求分類:最高作為測驗典型作為測驗
7、按測驗的性質(zhì)分類:構(gòu)造性測驗投射性測驗
8、按測驗的標準化程度分類:標準化測驗非標準化測驗
9、按評價所參照的標準:常模參照測驗?zāi)繕藚⒄諟y驗潛力參照測驗
10、按測驗的運用領(lǐng)域分類:教育測驗職業(yè)測驗臨床測驗
二、心理與教育測量的功能
(一)理論研究功能:①收集研究資料②建立和檢驗理論假設(shè)③實驗分組
(二)實際應(yīng)用功能:①選拔人才②人員安置③心理診斷④描述評⑤心理咨詢⑥預(yù)測
第二章心理與教育測量的誤差
第一節(jié)測量誤差的定義及分類
一、誤差的定義:在一切測量中,由于各種因素的影響,測量所得的觀測值并不準確地等于被測之量的真值。二者之差稱為測量誤差。指在測量過程中,那些與測量目的無關(guān)的因素所導(dǎo)致的測量結(jié)果不準確或不一致的測量效應(yīng)。
二、誤差的種類:根據(jù)測量誤差的性質(zhì)來源,測量誤差可分為系統(tǒng)誤差和隨機誤差。
第二節(jié)測量誤差的來源及控制
一、測量誤差的來源
常見的影響測驗誤差的因素主要有三方面:測驗工具、施測過程、測量對象。
(一)測驗工具
測驗自身的誤差主要來源于測驗的編制過程,其中項目取樣影響最大。測驗所要測量的內(nèi)容是什么,測驗的項目能否代表這些內(nèi)容,是至關(guān)重要的。當(dāng)測驗的項目較少而取樣缺乏代表性時,被試的反應(yīng)很難代表其真實水平。對于有些類型的項目,例如是非題、選擇題,被試可能憑猜測作答,從而降低分數(shù)的可靠性。此外,題目用詞模棱兩可,或?qū)σ髷⑹霾磺宓?,也都會帶來誤差。
(二)施測過程
在測驗的實施過程中可能引起誤差的因素很多,如測試環(huán)境、時間、主試因素、意外干擾、評分記分等。
(三)測驗對象
在測量工作中,最復(fù)雜的和最難控制的是由被試本身引起的各種誤差。測驗中被試的應(yīng)試動機、被試的焦慮、測驗經(jīng)驗、練習(xí)效應(yīng)、反應(yīng)傾向和生理變因等因素都會帶來誤差。
二、測量誤差的控制
要想控制誤差,就必須使測驗標準化,即測驗的編制、施測、評分、解釋都必須標準化,控制導(dǎo)致誤差的因素,減少誤差,使測驗分數(shù)更可信、有效。保證有效性和準確性程度。
第三章心理與教育測量的信度
第一節(jié)信度概述
一、信度的定義
信度的描述定義
指測驗結(jié)果的一致性或穩(wěn)定性,其測量定義為一組測量分數(shù)的真變異數(shù)與總變異數(shù)(實得變異數(shù))的比率,含義是在實得分數(shù)的變異中有多大比例是由真分數(shù)的變異決定的。
rxx=S2T/S2x
二、信度系數(shù)的估計(種類)
①重測信度:
a.求法是對同一批被試運用某個測驗實施首測,相隔一段時間后對它進行再測,然后計算首測與再測所得分數(shù)的相關(guān)(一般是積差相關(guān)),即得重測信度。這種信度能表示兩次測驗結(jié)果有無變動,反映測驗分數(shù)的穩(wěn)定程度,故又稱穩(wěn)定性系數(shù)。
b.優(yōu)點:能提供有關(guān)測驗結(jié)果是否隨時間而變異的資料,可作為預(yù)測受測者將來行為表現(xiàn)的依據(jù)。
c.缺點:易受練習(xí)和記憶的影響,前后兩次施測間隔的長短必須適度。如果相隔時間太短,則記憶猶新,練習(xí)的影響較大;如果相隔時間太長,則身心的發(fā)展與學(xué)習(xí)經(jīng)驗的累積等都足以改變測驗分數(shù)的意義,而使相關(guān)降低。另外,第一次嘗試所發(fā)現(xiàn)的錯誤也可能導(dǎo)致第二次反應(yīng)的變化而增加誤差變異。
d.誤差來源:時間的不同所帶來的隨機影響,如氣候、偶然的噪音或其他干擾,以及引起被試本身身心狀態(tài)變化的因素如疾病、疲勞、情緒類型、焦慮等。重測信度代表測驗成績能夠應(yīng)用于不同時間的程度,信度越高,受測驗環(huán)境中日常的隨機因素的影響越小。由于測驗的穩(wěn)定性系數(shù)受時間和其他各種因素的影響,故任何一個測驗都可有不止一個重測信度系數(shù)。所以在測驗手冊中報告此種信度時應(yīng)說明時間間隔以及在此間隔中被試的有關(guān)經(jīng)歷,如受過何種教育訓(xùn)練、心理治療以及有何學(xué)習(xí)經(jīng)歷等。
②復(fù)本信度:
兩個平行測驗測量同一批被試所得結(jié)果的一致性程度,其大小等同一批被試在兩個復(fù)本測驗上所得分數(shù)的皮爾遜積差相關(guān)系數(shù)。
a.求法是先運用同一測驗的一型或A型施測,隨后在最短的時間內(nèi)運用二型或B型進行再測,然后再求它們得分的相關(guān)系數(shù)。
b.誤差來源:測驗兩種形式是否等值:測題取樣是否匹配,格式是否相同,內(nèi)容、題數(shù)、難度、平均數(shù)、標準差是否一致。再就是被試方面情緒波動、動機變化等,以及測驗情境的變化,偶發(fā)因素的干擾。這些都會引起測量誤差。在報告復(fù)本信度時,也應(yīng)說明兩次施測的間隔,以及在此間隔內(nèi)被試的有關(guān)經(jīng)歷。
③內(nèi)部一致性信度估計內(nèi)部一致性系數(shù)的方法通常有兩類:一類是分半法,另外一類方法需要對項目反應(yīng)的方差或協(xié)方差進行分析。
a.分半法是將一個測驗分裂為兩個假定相等而獨立的部分,然后計算這兩部分的記分的相關(guān)系數(shù)(一般是以項目的奇數(shù)為一組,偶數(shù)為另一組),繼而再用斯皮爾曼-布朗公式來估計整個測驗的信度(斯-布公式要求兩半的變異數(shù)相等)。
缺點:把測驗劃分成兩半的方法實際上有多種,而每一種劃分方法產(chǎn)生的估計都有差別,因此用分半法得到的信度估計值不具備惟一性。
b.克朗巴赫α系數(shù)
適用于非0,1記分的一種內(nèi)在一致性系數(shù),計算公式為:
c.除了以上兩種方法,還有庫德-理查遜公式(只適合于0、1記分的題目);荷伊特信度;因素分析等方法。有些測量學(xué)家認為因素分析是決定測驗同質(zhì)性的最好方法。
因素分析方法最初是由心理學(xué)家斯皮爾曼在研究智力理論時提出來的,后來發(fā)展成為一種復(fù)雜的統(tǒng)計技術(shù),用于確定一組變量間的相互關(guān)系最少需要幾個因素來解釋。在測驗上,如果一個因素就足以解釋所有題目分數(shù)的變異時,這個測驗就是同質(zhì)的,假如需要一個以上的因素時,則測驗的組成是異質(zhì)的。
d.內(nèi)在一致性信度的優(yōu)點:只需施測一次,就可以估計信度系數(shù),省時節(jié)力。另外用內(nèi)在一致性系數(shù)一般要比重測信度、復(fù)本信度所算出的信度系數(shù)高。
e.不足之處:求分半信度時,分半的方法不同,估計出的信度系數(shù)就不同。而且,測驗須要求具有同質(zhì)性。所以項目異質(zhì)的人格測驗,通常就不能用內(nèi)在一致性系數(shù)來估計信度。
④評分者信度
隨機抽取相當(dāng)份數(shù)的試卷,由兩位評分者按記分規(guī)則分別給分。然后根據(jù)每份試卷的兩個分數(shù)計算其相關(guān)系數(shù),即得評分者信度。一般要求在成對的、受過訓(xùn)練的評分者之間平均一致性達到0.90以上,才認為評分是客觀的。
綜上所述,信度高低是用相關(guān)系數(shù)表示的。不同的測驗內(nèi)容,對相關(guān)系數(shù)的要求有所不同。一般說來,標準智力測驗應(yīng)達到0.85以上,個性測驗和興趣測驗一般應(yīng)達0.70~0.80水平。學(xué)業(yè)成就測驗要求信度在0.90以上,才能被稱為是一個良好的測驗。
第二節(jié)信度的影響因素及提高信度的方法
信度與誤差變異之間有密切的關(guān)系。誤差變異越大,信度愈低。凡被試、主試、測驗內(nèi)容和施測情境等各個方面能引起隨機誤差而導(dǎo)致分數(shù)不一致的因素,都會降低測驗的信度。
1、被試方面——身心健康狀況、動機、注意力、持久性、求勝心、作答態(tài)度等。
2、主試方面——不按規(guī)定實施測驗,制造緊張氣氛,給予特別協(xié)助,評分主觀等。
3、測驗內(nèi)容方面——試題取樣不當(dāng),內(nèi)部一致性低,題數(shù)過少,題意模糊等。
4、施測情境方面——測驗現(xiàn)場條件,如通風(fēng)、溫度、光線、噪音、桌面好壞、空間闊窄等。
5、除此之外,還有以下幾個因素會影響信度系數(shù)的大?。孩俦辉嚇颖居绊懶哦认禂?shù)的一個重要因素是用來確定信度的被試團體的特性。②團體的異質(zhì)性(公式)如同所有相關(guān)系數(shù)一樣,信度系數(shù)受分數(shù)的分布范圍影響,而分數(shù)范圍與被試團體的異質(zhì)程度有關(guān)。一個團體越是異質(zhì),其分數(shù)范圍越大。而一個經(jīng)過篩選、相對同質(zhì)的團體分數(shù)則較為均勻。③團體的平均水平信度系數(shù)不僅受被試樣本的個體差異程度的影響,而且受被試團體的平均水平的影響。這是因為,對于不同水平的團體,題目具有不同的難度。每個題目在難度上的微小差異累積起來便會影響信度。由于信度系數(shù)與被試樣本的異質(zhì)程度和平均水平有關(guān),因此在編制測驗時,應(yīng)把常模團體按年齡、性別、文化程度分為更同質(zhì)的亞團體,并分別報告每個亞團體的信度系數(shù),這樣測驗才能適用于各種團體。④題目的數(shù)量(公式)題目的數(shù)量(亦即測驗的長度)也是影響信度系數(shù)的一個因素。一般說來,在一個測驗中增加同質(zhì)的題目,可以使信度提高。因為增加測驗的長度可以加大分數(shù)范圍。這里要注意一點,只有當(dāng)新題目是與原題目選自同一總體,即與原題目具有同質(zhì)性時,增長測驗才能改進信度。⑤測驗難度測驗的難度與信度間沒有簡單的關(guān)系。然而,若測驗對某團體太難或太容易,則分數(shù)范圍將縮小,從而使信度降低。這表明,要使信度達到最高,能產(chǎn)生最廣分數(shù)分布的難度水平方為合適。⑥間隔時間以再測法或復(fù)本法求信度,兩次測驗相隔時間越短,其信度系數(shù)越大;間隔時間越久,其他變因介入的可能性越大,受外界的影響也越多,信度系數(shù)便越低。
第四章心理與教育測量的效度
第一節(jié)測量的效度概述
一、效度的定義
1、效度的測量定義:與測量目標有關(guān)的真變異數(shù)與總變異數(shù)的比率,含義是在一組測驗分數(shù)中,有多大的比例是由測驗所要測量的目標引起的。
2、描述定義:效度是指一個測驗或量具能夠測量出其所要測量目標的程度。
第二節(jié)效度的種類和估計方法
一、測驗的效度分為三大類:內(nèi)容效度、構(gòu)想效度、效標效度。
(一)內(nèi)容效度(表面效度)
內(nèi)容效度指的是測驗題目對有關(guān)內(nèi)容或行為范圍取樣的適當(dāng)性。這種測驗的效度主要與測驗內(nèi)容有關(guān),所以叫內(nèi)容效度,指測驗題目在要測量的行為領(lǐng)域的代表性。內(nèi)容效度的評估方法主要應(yīng)用于對學(xué)績測驗的評估。
一個測驗要有內(nèi)容效度必須具備兩個條件:要有定義得完好的內(nèi)容范圍;測驗題目應(yīng)是所界定的內(nèi)容范圍的代表性取樣。測驗題目并不需要包羅該范圍的所有材料,而只需包含測驗編制者認為是重要的材料。確定內(nèi)容效度的方法主要有專家判斷、統(tǒng)計分析、經(jīng)驗法等。
a.專家判斷
為了確定一個測驗是否具有內(nèi)容效度,最常用的方法是請有關(guān)專家對測驗題目與原定內(nèi)容范圍的符合性做出判斷。
b.統(tǒng)計分析
內(nèi)容效度可由一組被試在獨立取自同樣內(nèi)容范圍的兩個測驗復(fù)本上得分之相關(guān)來作數(shù)量的估計。若相關(guān)低,說明二者至少有一個缺乏內(nèi)容效度;若相關(guān)高,一般可推論測驗有內(nèi)容效度。
c.經(jīng)驗法
檢查不同年級的學(xué)生在測驗上的得分和在每個題目上的反應(yīng)情況。一般說來,測驗總分和題目通過率隨年級而提高,便是測驗具有內(nèi)容效度的證據(jù)。
(二)構(gòu)想效度
構(gòu)想效度就是測驗對某一理論概念或特質(zhì)測量的程度。研究和考察構(gòu)想效度要回答三個問題:一個測驗測量什么心理構(gòu)想,對這構(gòu)想測得有多好,測驗分數(shù)中有多少比例的變異數(shù)是來自測驗所要測的構(gòu)想。確定構(gòu)想效度的方法主要分為測驗內(nèi)方法、測驗間方法。a.測驗內(nèi)方法主要是通過研究測驗內(nèi)部構(gòu)造來界定所測量的構(gòu)想的范圍。如確定測驗的內(nèi)容效度,分析被試對題目作反應(yīng)的過程,考察測驗的同質(zhì)性等方式。b.測驗間是通過研究幾個測驗間的相互關(guān)系,找出他們的共同特點,進而推斷出所測的共同特質(zhì)是什么,便可確定這些測驗是否有構(gòu)想效度。如確定相容效度、區(qū)分效度、因素分析效度等方式。
(三)效標效度
效標效度又稱實證效度,指一個測驗對處于特定情景中的個體的行為進行預(yù)測時的有效性,也就是對于研究者所感興趣的行為能夠預(yù)測得怎么樣。其中,被預(yù)測的行為是檢驗測驗效度的標準,簡稱效標。確定效標效度的方法主要有相關(guān)法、區(qū)分法、命中率和功利率等。
a.相關(guān)法最常用來建立實證效度的方法是求測驗分數(shù)與效標測量間的相關(guān),所得到的數(shù)量指標稱作效度系數(shù)。在測驗手冊中,一般用它來報告測驗對每種效標的效度。計算效度系數(shù)最常用的是積差相關(guān)法。
b.區(qū)分法第二個決定效度的方法是看預(yù)測源的分數(shù)是否可區(qū)分由效標測量所定義的團體。
c.命中率(公式)
當(dāng)測驗用來作取舍的根據(jù)時,其有效性的指標就是正確決定的比例(總命中率)。(正命中率和總命中率)
d.功利率
為了確定測驗的功效,人們還常常對使用測驗所花掉的費用與得到的利益進行比較,看是否利大于弊。這種效度指標,叫功利率。
第三節(jié)效度的影響因素與改進
影響測驗效度的因素很多,在編制測驗或選擇標準化測驗時,都應(yīng)該考慮到這些因素,以免影響測驗結(jié)果的有效性。
①測驗本身的因素
a.測題中所用詞匯和句型不能過于困難。測題中的詞匯和句型應(yīng)適于被試的文化水平。b.試題的意思應(yīng)該清楚。題意含糊,容易產(chǎn)生歧義,以致被試產(chǎn)生誤解也會降低測驗的效度。c.所編制的測題應(yīng)該適合所要測量的學(xué)習(xí)結(jié)果。d.測題中不能提供額外線索。若測題為被試提供了額外線索,就無法確認測題是否真正測量到了所欲測量的學(xué)習(xí)結(jié)果。e.測題的編制要合理。一般地,測題以由易到難的順序排列。f.選擇題的正確答案不能有明顯的組型。如果測驗正確答案的位置有明顯的規(guī)律,學(xué)生有可能發(fā)現(xiàn)規(guī)律答對一些原本較難的題目,從而影響測驗結(jié)果的效度。g.測題數(shù)目。增加測題的數(shù)目(即增加測驗長度)通??梢蕴岣邷y驗的信度和效度。h.測題的難度要適當(dāng)。標準參照測驗中的測題平均難度應(yīng)在0.05左右,并有適當(dāng)?shù)碾y度分布,測題太難或太易都無法區(qū)分學(xué)生的優(yōu)劣,從而降低測驗的效度。標準參照測驗并不強調(diào)測驗分數(shù)間的差異,也就不需要區(qū)分學(xué)生的優(yōu)劣,這時的測題難度就應(yīng)該與教學(xué)目標的要求相一致。
②校標因素
③樣本的代表性
④干涉變量
第五章心理測驗的項目分析
第一節(jié)題目的難度
一、難度的含義:難度就是項目(或題目)的難易程度。能力測驗中常以該項目的通過(或答對)率表示,即以答對或通過該題的人數(shù)的百分比來表示。
二、難度的計算方法
(一)二分法記分的項目
當(dāng)被試人數(shù)較多時,則可以根據(jù)測驗總成績將被試分成三組:分數(shù)最高的27%的被試為高分組(HN),分數(shù)最低的27%的被試為低分組(HN),中間46%的被試為中間組。分別計算高分組和低分組的通過率,再求試題的難度:
②非二分法計分的項目當(dāng)測驗項目為問答題或其他不能用二分法計分的形式時,常常對部分正確的反應(yīng)也給一定分數(shù)。對于這類項目,一般用下面的公式計算難度:
三、難度水平的確定①在測驗編制過程中,分析項目難度主要是為了篩選項目。項目的難度水平多高合適,取決于測驗的目的、項目的形式以及測驗的性質(zhì)。0.5上下浮動0.2。在教育工作中,有些測驗的目的是為了考查學(xué)生對某些方面的知識、技能是否掌握,此時可以不考慮難度。當(dāng)測驗用于選人時,應(yīng)該比較多地采用那些難度值接近錄取率的項目。②作為一個整體的測驗的難度,直接依賴于組成測驗的項目的難度。對整個測驗的難度的綜合性檢驗,可由分數(shù)的分布提供。當(dāng)分數(shù)分布是正偏態(tài),分數(shù)密集在低端,表明測驗的難度偏高。當(dāng)分數(shù)分布是負偏態(tài),分數(shù)密集在高端,表明測驗的難度偏低。
第二節(jié)題目的區(qū)分度
一、概念:區(qū)分度是指項目對所測量的心理特性的區(qū)分程度或鑒別能力,也就是項目的效度。常以高分組與低分組在該項目得分的平均數(shù)的差異表示,或以該項目得分與測驗總分的相關(guān)表示。
二、確定區(qū)分度的方法確定區(qū)分度常用的是相關(guān)法,即以項目分數(shù)與效標分數(shù)(或測驗總分)的相關(guān)作為項目區(qū)分度的指標,相關(guān)越高,區(qū)分能力越好。
①二列相關(guān)。二列相關(guān)適用于兩個可以連續(xù)測量的變量,但其中有一個由于某種原因被分成兩個類別。
②點二列相關(guān)。點二列相關(guān)適用于一個變量為連續(xù)變量,另一個變量為二分變量的資料。當(dāng)一個變量是雙峰分配時。盡管它并不是真正的二分變量,這種統(tǒng)計方法也適用。
③四分相關(guān)。四分相關(guān)適用于兩個常態(tài)的連續(xù)變量均被人為二分的資料。如果一個題目分數(shù)被二分成通過不通過,效標成績也被分成通過與不通過,這時就會得到四個類別,從而可組成一個四格表。計算四分相關(guān)最常用的是皮爾遜的余弦公式。
④Φ相關(guān)。相關(guān)的統(tǒng)計方法適用于兩個變量都是點分配的資料,即兩個變量都是二分名義變量。
⑤項目和總分相關(guān)重疊的校正。在做項目分析時,需要經(jīng)常計算項目和總分的相關(guān),這是一種局部和總體的相關(guān),在一個測驗中,只有當(dāng)每一項目的變異數(shù)相同或項目非常多,以致每個項目所貢獻的變異數(shù)比例都很微小時,才能把項目和總分的相關(guān)作為項目區(qū)分度的指標。如果不具備這些條件,最好計算每一項目和所有其他項目合成分數(shù)之間的相關(guān)。
對于教育成就測驗來說,一般要求項目與總分的相關(guān)達到0.20以上,高分組與低分組通過率之差達到0.15~0.20以上。
3、區(qū)分度與難度的關(guān)系難度和區(qū)分度都是相對的,是針對一定團體而言的(絕對的難度和區(qū)分度是不存在的)。一般說來,較難的項目對高水平被試區(qū)分度高,較易的項目對水平低的被試區(qū)分度高,中等難度的項目對中等水平的被試區(qū)分度高。這與中等難度的項目區(qū)分度最高的說法并不矛盾。由于人的多數(shù)心理特性呈常態(tài)分布,所以項目難度的分布也以常態(tài)為好,即特別難與特別容易的題目較少,越接近中等難度的題目越多,而所有項目的平均難度為0.50。
三、題目的綜合分析和篩選
1、鑒別力
取舍題目時,首先要看鑒別力。按照測題的鑒別指數(shù)與優(yōu)劣之評鑒標準,0.30以上的項目是比較好的。
2、難度
P值一般在0.35至0.65之間為好,但就整個測驗而言,難度為0.5的測題應(yīng)居多,也需一些難度較大或較小的測題。
3、選項
項目的選項分析是指對選擇題后面所提供的幾個答案的分析。選項分析的異常情況主要有:正確答案無人選擇,或少于其他選項人數(shù);錯誤答案選的人太多;正確選項上高分組選擇人數(shù)少于低分組;錯誤選項上高分組選擇人數(shù)又多于低分組;某個選項無人選擇;未答的人數(shù)較多。
第六章測驗分數(shù)的合成與解釋
第一節(jié)測驗分數(shù)的合成
一、分數(shù)合成的方法
二、分數(shù)合成的方法比較
第二節(jié)測驗分數(shù)的解釋
一、呈現(xiàn)常模分數(shù)的方法:①分數(shù)轉(zhuǎn)換表②剖析圖③正態(tài)百分位圖表
二、幾種主要的常模分數(shù):①發(fā)展量表②商數(shù)③百分等級④標準分數(shù)
三、標準參照分數(shù):①內(nèi)容參照分數(shù)②結(jié)果參照分數(shù)
四、分數(shù)的解釋與交流
1、解釋分數(shù)要注意的問題:
(1)測驗分數(shù)是遺傳特征、學(xué)習(xí)與經(jīng)驗以及測驗情境的函數(shù)。
(2)為了對測驗分數(shù)做出確切的解釋必須有效度資料。
(3)不要把測驗分數(shù)看成確切的點。
(4)對于不同的分數(shù)不能直接加以比較
2、如何向當(dāng)事人報告分數(shù):
(1)使用當(dāng)事人所理解的語言。
(2)要保證當(dāng)事人知道這個測驗測量或預(yù)測什么。
(3)要使當(dāng)事人認識到分數(shù)只是一個“最好”的估計。
(4)要使當(dāng)事人知道如何運用他的分數(shù)。
(5)要考慮測驗分數(shù)將給當(dāng)事人帶來什么心理影響。
(6)要讓當(dāng)事人積極參與測驗分數(shù)的解釋。
第七章測驗的編制
第一節(jié)標準化測驗的編制程序
一、測驗編制過程
1、三階段六步驟:
(1)準備階段:確定測驗?zāi)康暮蛿M定計劃兩個步驟;
(2)編制階段:產(chǎn)生測驗題目以及預(yù)測與合成測驗等步驟
(3)完善階段:將測驗使用標準化、評鑒測驗基本特征并編寫測驗說明書等步驟。
2、項目編制的基本原則:
科學(xué)性原則、目的性原則、代表性原則、合理性原則、經(jīng)濟性原則。
3、項目編制的具體要求:
(1)題目格式應(yīng)明確具體,不要讓被試誤解。
(2)題目之間必須彼此獨立,不可互相重復(fù)或牽連,不要使一個題目的回答影響另外一個題目的回答。
(3)題目文句要簡明扼要,即文字應(yīng)該力求淺顯簡短,避免使用孤僻艱深的字句。
(4)題目意義必須明確,不得含糊,盡量避免使用雙重否定句。
(5)題目中不可含有暗示本題或其他題正確答案之線索。
(6)所提問題應(yīng)避免涉及社會禁忌與個人隱私,避免使用主觀性和情緒化的字句,
避免提出令被試為難的問題。
(7)題目應(yīng)有確切答案,沒有引起疑義和歧義的可能,也就是要有不致引起爭論的確定答案(創(chuàng)造力測驗、人格測驗除外)
(8)題目內(nèi)容不要超出受測團體的知識、能力范圍,難度要適合被試水平。
(9)盡量做到施測與評分省時。
第八章測驗的使用
第一節(jié)測驗的選擇
一、測驗的目的與對象
二、測驗的質(zhì)量
三、選擇測驗應(yīng)考慮的其他因素
第二節(jié)測驗的實施
第三節(jié)測驗的管理
第九章常用心理測驗
第一節(jié)能力測驗
一、智力測驗(比內(nèi)量表、韋氏智力量表、瑞文標準推理測驗)
二、特殊能力測驗
三、能力傾向測驗
四、創(chuàng)造力測驗
第二節(jié)人格測驗
一、人格測驗的編制
二、自陳量表(卡特爾16種人格因素測驗、艾森克人格問卷EPQ、愛德華個性偏好量表)
三、投射測驗
四、情境測驗
第三節(jié)成就測驗
第四節(jié)態(tài)度測驗
第五節(jié)教育測驗
第六節(jié)職業(yè)測驗
一、霍蘭德職業(yè)興趣測驗
第七節(jié)臨床測驗
一、明尼蘇達多項人格測驗MMPI
參考書目:鄭日昌主編心理與教育測量人民教育出版社2011年6月第1版
原文地址:https://gs.cupes.edu.cn/zsgz/zstz/de38c285efba4c6f9d7a196ab8f6cf9a.htm