中国有很早的心理测量标准参照测验与测验记录,为何现代的心理测量标准参照测验与测验的先进理论与工具

  1.测量的基本要素:【参照点】、【单位】.

  2.测量量表的几种分类:【称名量表】【顺序量表】【等距量表】【比率量表】.

  3.编制一个测验应当具备的四个基本条件:【行为样本】【标准化】【难度或应答率】【信度和效度】.

  4.测验的分类:根据测验的对象来分测验可以分为【智力测验】【能力傾向测验】【成就测验】【人格测验】;根据测验的人数或方式来分,测验可以分为【个别测验】【团体测验】.

  5.心理测量标准参照测驗的价值与作用:(1)人才选拔;(2)人员安置;(3)心理诊断;(4)描述评价;(5)心理咨询.

  1.我国古代教育家孔子曾把人分为中人、中人以下、中人以上这实际上相当于测量学中的【称名量表】和【顺序量表】.这种划分包含了【能力测量】的思想.

  2.三国时期【刘邵】的《人物志》可以说是一部【研究能力】的专门著作.

  3.【卡特尔】于1890年发表了《心理测验和测量》一文,首创了【心理测验】这个術语.

  4.著名美国学者波林指出:“在测验领域19世纪80年代是【高尔顿】的十年;90年代是【卡特尔】的十年;20世纪头十年则是【比纳】的┿年.

  5.第一个团体测验【陆军甲种测验】和【陆军乙种测验】.

  6.团体测验的优缺点;优点:(1)节省人力、物力、财力;(2)对主试要求不高;(3)评分较客观;(4)容易建立常模;缺点:(1)不易发现被试的特殊反应;(2)对测验环境控制差;(3)主试不了解被试对测验要求与题目理解与否。

  7.人格测验的种类及优缺点:(一)问卷式人格测验;包括自陈量表,评定量表自陈测验的优点:(1)测验应用的广泛性;(2)测验使用的便捷性;(3)测验编制的科学性;(4)测验结果的可靠性缺点:(1)有反应偏差;(2)对自己的认识不一定都是正确嘚(3)解释时会有误差(二)投射测验;优点:(1)使用非结构任务,这种任务允许被试有各种各样不受限制的反应;(2)测量目标具有掩蔽性;(3)解释的整体性缺点:(1)评分缺乏客观标准,难以量化;(2)缺少充分的常模资料测验结果不易解释;(3)信度和效度鈈易建立;(4)原理复杂、深奥。非经专门训练者不能使用

  1.测量误差的定义及分类:是指在测量过程中由那些与测量目的无关的变囮因素所产生的一种不准确或不一致的测量效应.分为系统误差和随机误差。

  1.信度是指测量结果的稳定性程度.

  3.提高信度的五种常用方法:1.适当增加测验的长度;2.使测验中所有试题的难度接近正态分布并控制在中等水平;3.努力提高测验的试题的区分度;4.选择恰当的被試团体,提高测验在各同质性较强的亚团体上的信度;5.主试者要严格执行实测规程评分者要严格按标准给分,实测场地要按测验手册的偠求进行布置减少无关因素的干扰。

  1.效度是指一个测验或量表实际能测出其所要测的心理特质的程度

  3.效度的分类:内容效度、结构效度、实证效度

  4.校标就是衡量一个测验是否有效的外在标准。

  5.提高测量效度的方法:

  ① 精心编制测验量表避免出現较大的系统误差;

  ② 妥善组织测验,控制随机误差;

  ③ 创设标准的应试情境让每个被试都能发挥正常水平;

  ④ 选恏正确的校标,定好恰当的效标测量正确使用有关公式

  1.测验项目的难度指被试完成测验项目任务时所遇到的困难程度

  3.项目难度沝平取决于【测验的目的】和【测验的性质】。

  4.区分度是指测验项目对被试心理品质水平差异的区分能力

  1.原始分数指测验实施鉯后,将受测者的反应与答案作比较即可得到每个人在测验上的分数导出分数:指通过统计方法由原始分数转化到量表上的分数。为了使原始分数有意义也为了不同的原始分数可以相互比较,必须把它们转换成具有一定的参照点和单位的测验量表上的数值导出分数提供了一个可比较的量度,从而使对个体在不同测验中的作业情况的比较成为可能

  2.常模是根据标准化样本的测验分数经过统计处理而建立起来的具有参照点和单位的测验量表。

  3.常模编制的步骤:a.确定有关比较团体;b.获得该团体成员的分数;c.把原始分数转化为量表分數

  4.常模团体是指具有某种共同特征的人组成的一个群体。

  5.确定常模团体的注意事项:

  ② 群体构成的界限必须明确;

  ③ 常模团体必须是所测群体的一个代表性样本;

  ④ 取样过程必须明确且有详尽的描述

  ⑤ 样本大小要适当;

  ⑥ 常模团體必须是近时的;

  ⑦ 注意一般常模与特殊常模的结合

  6.制定常模的过程:

  ① 确定测验将用于那个团体;

  ② 对常模團体进行施测,并获得团体成员的测验分数及分布

  ③ 确定常模分数类型制作常模量表,同时给出常模团体的书面说明以及常模汾数的解释指南等。

  1.编制一个标准化心理测验的步骤:

  ② 确定测验目的;

  ③ 制定编题计划;

  ④ 编辑测验项目;

  ⑤ 预测与项目分析;

  ⑨ 编写测验说明书

  1.目标参照测验指根据某一明确界定的内容范围而缜密编制的测验

  2.目标参照測验与常模参照测验的区别:后者着重于学生之间的比较前者关心有没有达到预定的学习目标;常模参照测验适用于选拔性考试和总结性评定,而目标参照测验适用于诊断和发现学生的不足从而为教学提供反馈信息。

  1.在解释测验分数的意义时应遵循的基本原则:

  ① 主试应充分了解测验的性质与功能;

  ② 对导致测验结果的原因的解释应慎重,谨防片面极端;

  ③ 必须充分估计测验嘚常模和效度的局限性;

  ④ 解释分数应参考其他有关资料;

  ⑤ 对测验分数应以“一段分数”来解释而不应以“特定的数值來解释

  ⑥ 对来自不同测验的分数不能直接加以比较。

  2.心理测验与心理测量标准参照测验的区别:

  ① 心理测验是指心理测量标准参照测验的工具;

  ② 心理测量标准参照测验是指心理测验的过程;是测验的具体实施

  3.出于诊断异常儿童智力的需要,【比内—西蒙】于1905年编制而成的世界上第一个【智力量表】

  4.1908年量表是基于1905年量表的修订而编制成的第一个年龄量表

  5.1934年开始编制于1939姩发表的【韦氏智力量表】是第一个【成人智力量表;韦氏儿童智力量表是韦氏成人智力量表向较低年龄水平的扩展它是1949年韦克斯勒在W-BI嘚基础上修订而成。

  6.韦氏儿童智力量表译本于1979年由林传鼎、张厚粲等人提出并于1981年底初步完成修订工作使题目尽可能的适合中国儿童特点。

  7.韦氏幼儿智力量表出版于1967年适用于4~6岁半的儿童。

  8.瑞文推理测验是由英国心理学家瑞文编制的一种团体智力测验为三個水平:(1)瑞文标准推理测验:1938年编制;适用于5.5岁以上智力发展正常的人。(2)瑞文采图推理测验:1947年编制适用于幼儿和智力低于平均沝平的人是最低水平的瑞文推理测验。(3)瑞文高级推理测验:最初编制与1941年经1947、1962两次修订为现在形式,适用于智力高于平均水平的囚是最高水平的瑞文推理测验。

  9.主要人格测验:(1)问卷式人格测验;包括包括自陈量表,评定量表;(2)投射测验;包括主题统觉測验[TAT]和罗夏克墨迹测验

  10.明尼苏达多项人格调查表【MMPI】:所包含的三个效度量表:(1)说荒量表;(2)诈病量表;(3)校正量表;(4)疑问量表。

  11.卡特尔16种人格因素量表【16PF】 特点:客观性 标准化 多功能 广泛性 深刻性 

  12.艾森克人格问卷【EPQ】 四个分量表:精神质 外倾性 神经质 说谎量表 

  13.内隐联想测验[IAT]由格林沃德提絀的研究内隐社会认知的一种新方法;IAT常在计算机上进行让受测者完成一系列选择反应任务来测量概念之间的联系,以反应时为指标;通过测量概念词和属性词之间的自动化联系程度间接推测个体的内隐态度基本程序:让受测者对计算机屏幕上自动呈现的刺激迅速分类并做出反应。

  分类刺激:一对客体概念和一对属性概念;分类任务:相容任务和不相容任务

教育测验的标准及其建立方法 第┅节 教育测验标准的含义 一 对标准参照测验及其标准的再认识 心理学家波帕姆认为标准参照测验是依据 实现明确规定的知识能力标准而制訂 并 据此标准可以对被试的测验成绩做出解释 的一类测验 标准测验主要关心的问题是要获得严格而 精确的领域规范 specifications for domains 或行为领域规范 上述定義的缺陷 切断点 cut off point 标准的内涵 从定性方面讲 标准一词指的是测验的内容或 行为的范围 而这个范围是测验分数所参照的 它将通过内容领域规范嘚到明确 从定量方面讲 每当人们利用标准参照测验成 绩进行有关评价决策时 客观上需要一个切断 点作为分类决策的依据 切断点在一定程度仩 体现了标准一词在测量评价功能上的定量标准 常模参照测验与标准测验的对比 二 几个与标准参照测验相关的概念 领域参照测验 或内容参照测验 domain referenced test 是建立在一套完善的题目 汇编或内容领域规范汇编基础上用以检查 被试的素质及发展水平的测验 目标参照测验是由和目标相适应的┅组题 目所构成的测验 掌握测验是建立一组教学和行为目标上的 测验 主要用于判断学生是否掌握某组给 定的教育目标 思考 领域参照测验 目標参照测验和掌 握测验有何异同 若将 标准参照测验 视作 依据某种特定操作标 准可以直接解释测量结果的及测验 上述三种 测验在本质上无多夶差别 领域参照测验可以看成标准参照测验的同义词 目标参照测验和掌握参照测验是标准参照测 验的变式 第二节 标准参照测验分数的解释 ┅ 正确百分数 正确百分数是以学生在标准参照测验中答 对题目的比例来解释测验分数或描述学生 取得成就的方法 使用百分数 应注意 测验所偠测定的内容 成就 范围必须明确 而且测 验题目能够组成成为这个内容 成就 范围的代表性 良好的样本 在标准参照测验中 可以针对整个测验为烸一个学生 确定其答案的正确百分数 对学生的内容掌握作出判 断 在课堂教学评价及其他有关资格证书的测验中 为了 对多层次的测验结果分別作出解释和描述 就需要分 别针对每一教育目标或内容板块去选择题目组 构成 总测验 为求客观 可利用学生测验的原始分数和测验 总分数之間的关系 计算学生个人的得分百分 数 二 掌握分数 掌握分数用于判断学生是否掌握所学的内 容 分数的标准是人为确定的 可以是百 分之评分量呎上的某一个点 也可以是 80 90 的正确反应所对应的分数 作为 最低通过标准 以掌握分数为判断标准 可将学生区分为 掌握和为掌握两类 掌握 与 未掌握 是人为确定的 从知识的掌握状态来讲 事实上更应该是一种 连续模型 掌握 及格 或 合格 的概念类似 但有区别 当利用测验的掌握分数给学生进荇二分类时 对于不同的年级 不同的课程内容 不同的测 验乃至同一测验中不同的分测验 人为规定的 掌握分数也未必相同 三 内容等级分数 为了哽好地解释教育测验的分数 人们把 内容参照和常模参照结合起来 在编制测 验的过程中 不仅要明确内容范围 具体 任务 而且要把成就分成若干差别明显的 等级水平 标明不同等级水平的成就特征 与问题类型 建立起内容等级分数及其评 定量表 内容等级分数体现了相对评价与绝对评价 嘚相结合 第三节 标准参照测验的定性标准 测验内容领域规范 内容领域规范是标准参照测验最重要的一 环 为试题编写人员准备试题时提供内嫆和技术上 的指导 向内容方面或测量方面的专家提供每种能力所 包括的内容和行为的清晰描述 帮助解释被试个体的能力水平 向用户提供能仂广度和范围的明确规定 一 汉布莱顿模式 内容领域规范的四个组成部分 说明 实例指导与题目样本 内容范围 答案范围 二 美国IOE模式 IOE Instructional Objectives Exchange 教学目标交鋶所 其所运用的标准参照 测验格式由以下五部分组成 一般描述 样本题目 刺激的界定 反应的界定 其他补充说明 三 英国GCSE模式 英国中等教育普通證书 简称GCSE考试 是面向校内外举办的英国国家证书制度 其显著特点之一是有全国统一考试标准 包含 总标准 和 学科具体标准 不同科目的测验编寫结构大同小异 一般 包含 简介或引言 目标 评价目标 内 容或核心内容 评价目标和内容的关系 评价技术 等级描述 来自GCSE考试的启发 考试大纲应强調与鼓励学生理解本学科与其他学科 生活 政治 经济 社会 环境等方面的联系 考试大纲必须包括对课程学习所期望达到的教育目标的描述 考试夶纲必须包括足够的知识覆盖面 使考试能充分表现出 学生对某一知识和技能的掌握程度 考试大纲都应有一定的学科知识考查深度 而不应以犧牲技 能和理解力的考查为代价去追求学科知识内容的考查广度 考试大纲不仅应包括某一学科所要测试的内容范围 也要介 绍测试方法 提供樣卷 题 以及一些必要的指导性材料 四 我国高中考试毕业会考标准的 建立模式 浙江的模式 定性描述学科标准 形成学科考试大纲规范性文件 编淛有良好内容效度的参照试卷 取样抽测 建立高中毕 业会考的标准份数量 将高中毕业会考的成绩确定为五个等级 与T分数的关系 如下表 编制一份与参照试卷大体平行的学科会考试卷 准备用于 实际的高中毕业会考 在保密状态下 在省内或省外抽取一批高中生 其水平应 与浙江省高中生嘚总体水平相当 随机分成两组后 分 别用会考试卷和参照试卷进行测验 取得数据 利用百分等级的等值技术或线性标准分数的等值技术 在 会考試卷原始分数Y和参照试卷原始分数X之间建立等值 对应关系 从而在X Y T之间建立对应关系的转换表 把会考试卷正式用于高中会考 每个学生都得到洎己的会 考原始分数Xi 通过X Y T分数转换表 得到每位高中生的 毕业会考学科量分表 根据表7 2 得到高中毕业会考的 等级分数 五 我国高等教育自学考试標准 的建立模式 自学考试课程大纲包括四部分 概括叙述课程性质与设置目的 具体叙述各章节的课程内容与考试目标要求 有关考试说明与实施的要求 提供样题或样卷 第四节 标准参照测验的定量标准 合格分数线 一 基于题目分类下的经验判断方 法 利用课任教师或对成就测验标准的 格式塔 心理 现象和教师具备的考评经验来分析测验题目 并 作出分类与判断的思想方法 具体方法 编制测验 把测验中所有的题目分为三类 基本偠求的 中等要求的 高要求的 假想一组 最低能力的且恰是可接受 的被试 对他们在作答以上三类题目时提出具体标准 如 题型要求每人至少答对嘚比率 基本要求的90 中等要求的60 高要求的30 现设三类题目在测验中所占分数即为W1 W2和W3 再 设课任教师经过协商认为 最低能力且又是可接受的任一 位學生 其至少应答对第一类题目的P1 第二类题目的 P2 第三类题目的P3 那么 该特定测验的最低合格 分数线E确定为 例 某次数学测验 课任教师认为属于第┅类的有22个 题目 占40分 属于第二类的有8个题目 占32分 属于 第三类的只有两个题目 占28分 如果课任老师认为最低 能力限度下可接受的学生 至少应答對第一类题目的80 第二类题目的50 第三类题目的20 求该次数学测验 最低合格线 解 二 基于题目双基度指标下的经验 评判法 双基度 指的是题目的考查內容和测量目标对体 现特定学科 基础知识 基本技能 双基教学要求 的适切性程度 双基度的取值在0 1之间 题目的双基度越大 说 明该题目的教学双基性要求越强 题目越能体现 教学过程和知识结构中的基本要求 题目内容对 学生越是重要 题目的双基度与经典测验理论中的难度没有必然 的聯系 题目的双基度指标赋值 可以由任课教师根据教 学与考评经验 在较彻底的理解教学大纲课程标 准和熟悉教材内容结构的前提下进行 可参照表7 3 同一考查内容中题目所设计的测量目标不 同 双基度也不同 假设一份测验卷中有N个题目 它们的双基度及其分数值 可用 b1 x1 b2 x2 bN XN 来表示 该测 验的合格线分数为 例 某次语文测验共有50道试题 每题2分 今已知题目 的双基度指标如表7 4所示 解 三 基于题目 目标 难度 层次 评估法 主要思路 根据对题目考查目标层次的认识以及对题目难 易程度作出的经验判断 把整个测验卷中所有 题目按照两个特征进行双向分类 由课任教师给每一类题目指派┅个临界概率 临界概率是 设想一个尚可接受的最低能力的学 生能够正确回答该类题目的可能性大小 或者说这一 临界概率是对每一位合格的學生至少应答对该类题目 的比例大小 方法 课任教师把一份测验卷中的所有题目按K个考 查目标能力层次进行分类 设这K类所占分数 分别为M1 M2 Mk 把上述每一题目按照难 中 易分成三组 计 算各组题目的分数 可得到测验题目双向分类 下的数据块 以矩阵的形式记为 设想一个可接受的最低能力的被试 答对上述 第i个难 度层次第j个能力目标层次 所有题目的可能性大小为Pij i 1 2 3 j 1 2 K 得到一个概率矩阵 记为 计算该试验的最低合格分数 记为 进一步地 综匼若干位学科专家和命题人员的意见 认为 一个尚可接受的最低能力的学生 答对上述各组题目的概 率为 例 某次 教育统计学 课程结业考试 由课任教师命题 双向细目表的设计 题目分成五个目标层次和难 中 易 三种难度水平 得到如下双向分类数据 解 四 基于已知 掌握 未掌握 效 标组的统计汾析法 切断分数的有效性 方法 选择两组学生样本 其中一组被课任教师认为 已经掌握了特定课程的内容 另一组则被公认 为未掌握特定课程的內容 把有待确定合格线的测验 放到两组学生中试 测 统计两组学生的测验成绩分布 判断测验 的合格线 完

我要回帖

更多关于 心理测量标准参照测验 的文章

 

随机推荐