- Barajar
ActivarDesactivar
- Alphabetizar
ActivarDesactivar
- Frente Primero
ActivarDesactivar
- Ambos lados
ActivarDesactivar
- Leer
ActivarDesactivar
Leyendo...
Cómo estudiar sus tarjetas
Teclas de Derecha/Izquierda: Navegar entre tarjetas.tecla derechatecla izquierda
Teclas Arriba/Abajo: Colvea la carta entre frente y dorso.tecla abajotecla arriba
Tecla H: Muestra pista (3er lado).tecla h
Tecla N: Lea el texto en voz.tecla n
Boton play
Boton play
161 Cartas en este set
- Frente
- Atrás
Estudia las características formales de los test, lo cual es útil para construir instrumentos de medida y para saber interpretarlos
|
psicometría
|
fases de la construcción de un test
|
1. definición constructo y finalidad del test
2. construcción de ítems 3. selección de ítems: estudio piloto 4. confección de la prueba piloto 5. análisis de las propiedades psicométricas del test resultante: fiabilidad y validez 6. corrección de la prueba, asignación de puntuaciones a los sujetos y elaboración de las normas de interpretación |
el proceso de convertir las respuestas del sujeto en puntuaciones en la fase 6 de corrección de la prueba en la construcción de un test se denomina...
|
escalamiento
|
a la hora de definir el constructo y finalidad de un test hay que tener en cuenta
|
contenido, utilidad y población diana
|
índice de Gulliksen con valor 0 indica...
|
que el test es puro de velocidad (valor 1 sería puro de potencia)
0-1 (el de Stafford |
índice de Stafford con valor 0 indica...
|
que el test es puro de potencia (valor 100 sería puro de velocidad)
0-100 |
cancelación, clave de números, búsqueda de símbolos del Wais serían pruebas de... (velocidad/potencia o fondo)
|
velocidad
por tanto, índice de Stafford alto (cercano a 100) |
matrices, semejanzas del Wais serían pruebas de... (Velocidad/potencia o fondo)
|
potencia o fondo
por tanto, índice de Gulliksen alto (cercano a 1) |
hay tests puros de velocidad o de ejecución máxima, V o F
|
F, no hay tests PUROS, sino tests que puntuarían alto en velocidad o ejecución máxima
|
ítems en que las respuestas están cerradas a elegir entre varias opciones
|
ítems de elección (vs de construcción en que la respuesta es abierta y puede ser R corta o extensa)
dentro de estos ítems de elección: - si se evaluan aptitudes, habilidades y conocimientos: hay respuesta correcta a. dos alternativas o dicotómicos b. elección múltiple c. emparejamiento d. formato cloze o incompleto - para eval. de personalidad, actitudes y opiniones: no hay respuesta correcta a. escala de clasificación o rating scales b. listados o checklists |
dentro del estudio piloto (fase 3 de la construcción de un test), se realiza el análisis...
|
cuantitativo y cualitativo
|
análisis en el que se recurre al juicio de expertos para que evalúen la validez de contenido de test.
|
análisis cualitativo
dentro de la evaluación de la validez de contenido del test: - ratio de validez de contenido (número de expertos que consideran un ítem como innecesario, útil o esencial***) - índice de congruencia o relevancia (evaluación del grado en que cada ítem tiene relación con el constructo que se pretende medir) |
evaluación del grado en que cada ítem** tiene relación con el constructo que se pretende medir
|
índice de congruencia o relevancia, dentro del análisis cualitativo a la hora de seleccionar los ítems para la construcción del test
|
número de expertos que consideran un ítem** como innecesario, útil o esencial
|
ratio de validez de contenido, dentro del análisis cualitativo en la selección de ítems para la construcción de un test
|
numero de personas que aciertan el ítem/número de personas que lo contestan.
|
dificultad del ítem
va entre 0 (máx. dificultad) y 1 (mínima dificultad) depende de la muestra concreta en la que se aplica el ítem en la TCT |
capacidad del ítem** para distinguir entre sujetos con puntuaciones extremas en el test
|
discriminación
se suele aplicar en ítems de aptitud/hh |
métodos para evaluar la discriminación del ítem** en la TCT
|
basado en grupos extremos (25% aciertos del ítem en sujetos con punt. superior en el test / 25% sujetos con punt. inferior en el test). las puntuaciones oscilan entre -1 y 1. Una puntuación de 1 significará que el ítem discrimina mucho, porque solo la gente con altas puntuaciones acierta ese ítem. 0 significa que no discrimina porque no hay diferencias, y -1 sería muy raro, solo aciertan las personas con puntuaciones más bajas en el test (anomalía).
basado en la correlación: entre ítem y el test |
índice de discriminación que normalmente se utiliza en test de actitudes
|
homogeneidad (vs discriminación que se utiliza en los tests de aptitud/hh)
se calcula con el método de la correlación entre ítem y test (aislando el ítem) |
la discriminación y la homogeneidad, en el análisis cuantitativo de los ítems en la TCT se pueden calcular ambas con el método de...
|
correlación entre ítem y test (aislando la puntuación de ese ítem)
|
índices del análisis cuantitativo de la TCT
|
dificultad, discriminación, homogeneidad, fiabilidad y validez
|
la S es la...
|
desviación típica
|
cálculo de la fiabilidad del ítem en TCT
|
(S (dt) del ítem) * (correlación r entre la puntuación del ítem y puntuación total del sujeto en el test (quitando la punt. del ítem))
|
cálculo de la validez del ítem en TCT
|
(S (dt) del ítem) * (correlación r entre la puntuación del ítem y la puntuación total del sujeto en OTRO test criterio)
|
la puntuación observada en un test es igual a la puntuación verdadera más el error aleatorio
supuesto de... |
de la TCT
|
El supuesto de la TCT dice que la esperanza (media) de los errores es...
|
nula
su varianza es constante y su distribución sigue la curva normal |
según la TCT, existe correlación entre los errores y la puntuación verdadera V o F
|
F
tampoco existe correlación entre los errores de dos tests distintos PORQUE SEGUN TCT EL ERROR ES ALEATORIO |
Autor TCT
|
Spearman
|
consistencia, precisión y estabilidad en el tiempo de las medidas obtenidas en un test hace referencia a...
|
fiablidad
|
para la medida de fiabilidad como acuerdo entre evaluadores o interjueces se utiliza...
|
kappa de Cohen
|
el coeficiente de fiabilidad o de determinación es...
|
correlación entre puntuación empírica y verdadera al cuadrado
indica qué proporción de la varianza total de las puntuaciones observadas corresponde a las puntuaciones verdaderas y cual al error aleatorio |
el coeficiente de fiabilidad o determinación tiene unos valores entre...
|
1 (toda la varianza de las punt. observadas corresponde a la punt. verdadera) y 0 (toda la varianza corresponde a la varianza error)
|
la raiz cuadrada del coeficiente de fiabilidad es...
|
el índice de fiabilidad
también va entre 0 y 1, como el coeficiente |
tipos de formas de cálculo del coeficiente de fiabilidad con VARIAS APLICACIONES
|
- Formas paralelas
- Test-retest - test-retest con formas paralelas |
forma de cálculo de coeficiente de fiabilidad con varias aplicaciones en que se crean dos formas paralelas y se aplican ambas a todos los sujetos de forma consecutiva y calculas correlación entre ellas
|
con formas paralelas
(ej:TONI4) |
el coeficiente de EQUIVALENCIA se calcula mediante el método de...
|
de formas paralelas. es una forma de cálculo del coeficiente de fiabilidad con varias aplicaciones
entonces el coeficiente de equivalencia es otro nombre para el coeficiente de fiabilidad calculado con este método |
dos medidas son paralelas si cumplen...
|
puntuaciones verdaderas iguales
igual varianza de error de medida en ambos tests |
medida que no cumple con los supuestos que exige el paralelismo
- tiene puntuaciones verdaderas iguales - posibilidad de desigualdad de varianza de error de medida en ambos tests |
tau-equivalentes
|
medida que no cumple con los supuestos que exige el paralelismo
V1 = a (constante) + V2 varianza de error desigual entre los tests |
esencialmente tau-equivalentes
|
medida que no cumple con los supuestos que exige el paralelismo
- puntuaciones verdaderas mantienen relación lineal (V1 = a + bV2), por tanto punt. verdaderas se aproximan si aplico la fórmula de regresión lineal - distinta varianza de error de medida en ambos tests |
lintealmente equivalentes o congenéricas**
|
para paliar el efecto fatiga en las formas paralelas, podemos utilizar...
|
contrabalanceo, equiponderación...
|
método para el cálculo de la fiabilidad con varias aplicaciones, en que se aplica dos veces el mismo test de forma diferida en los mismos sujetos y se calcula la CORRELACIÓN entre ambas puntuaciones
|
test-retest
idóneas para los tests de velocidad porque sino puede haber efecto entrenamiento el coeficiente de fiabilidad calculado con este método se denomina también COEFICIENTE DE ESTABILIDAD |
forma de cálculo de coeficiente de fiabilidad que muestra el grado en que las puntuaciones son independientes de factores situacionales externos o internos
|
test-retest
|
cálculo del coeficiente de fiabilidad con varias aplicaciones en que se aplican a todos los sujetos dos test paralelos, de forma diferida en el tiempo, y se calcula la correlación entre todas las puntuaciones
|
test-retest con formas paralelas
|
calculo del coeficiente de fiabilidad con una sola aplicación en que se administra el test, se divide el test en dos mitades, y se examina el paralelismo entre mitades para después calcular su correlación
|
método basado en dividir el test en dos partes (dos mitades)
basados en consistencia interna |
formula de cálculo de coeficiente de fiabilidad, consistencia interna entre dos mitades PARALELAS
|
ecuación de Spearman-Brown
|
fórmula de cálculo de coeficiente de fiabilidad, consistencia interna entre mitades TAU-EQUIVALENTES o ESENCIALMENTE TAU-EQUIVALENTES
|
ecuaciones de Rulon o Guttman-Flanagan
|
fórmula de cálculo del coeficiente de fiabilidad, consistencia interna entre mitades CONGENÉRICAS o LINEALMENTE EQUIVALENTES
|
coeficiente Beta de Raju
|
coeficiente que sirve para calcular el coeficiente de fiabilidad/consistencia interna de tests formados por diferentes subescalas, con diferente longitud, y sólo conocemos las puntuaciones de éstas y no de sus ítems
|
coeficiente Beta de Raju
*también para consistencia interna entre mitades CONGENÉRICAS o LINEALMENTE EQUIVALENTES |
cálculo del coeficiente de fiabilidad con una sola aplicación, basado en la RELACIÓN ENTRE LOS ÍTEMS
|
Coeficiente alfa de Cronbach
si dividimos el test en tantas partes como ítems contiene, la fiabilidad será la relación existente entre los ítems que lo forman |
tipo de variable para la que se puede utilizar el alfa de Cronbach
|
ítems medidos en variables CONTINUAS
|
es una estimación del límite inferior del coeficiente de fiabilidad de un test: te da las puntuaciones más bajas si utilizaras diversos métodos para el calculo del coef. de fiabilidad
|
coeficiente de alfa de Cronbach
también coeficiente delta de Guttman |
derivación de alfa de cronbach para el cálculo de la fiabilidad en ítems dicotómicos
|
Kuder-Richardson 20 (KR20)
el 21 para ítems dicotómicos de IGUAL DIFICULTAD |
derivación de alfa de cronbach para cálculo de fiabilidad en ítems dicotómicos de IGUAL DIFICULTAD
|
Kuder-Richardson 21 (KR21)
|
otros coeficientes diferentes a alfa de cronbach basados en el análisis factorial de los ítems
|
theta de carmines
omega de heise y bohrnstedt |
los antecedentes del índice de alfa de cronbach se encuentran en los trabajos de...
|
C. Hoyt
|
factores que afectan a la fiabilidad
|
variabilidad de la muestra
longitud del test |
a mayor variabilidad de las puntuaciones de la muestra, ____ valor del coeficiente de fiabilidad y viceversa
|
mayor
porque se calcula con el coeficiente de correlación de Pearson |
cálculo de cuantos ítems hay que quitar o añadir para tener un índice de fiabilidad decente
|
fórmula de Spearman Brown
|
la forma de Spearman Brown se puede utilizar si los ítems son...
|
Paralelos
|
métodos de estimación de la puntuación verdadera
|
- estimación mediante la desigualdad de Chebychev
- estimación basada en la distribución normal de los errores - estimación basada en el modelo de regresión lineal |
método de estimación de puntuación verdadera en que no se tiene en cuenta la distribución de la puntuación ni de los errores
|
estimación mediante desigualdad de Chebychev
|
método de estimación de punt. verdadera en que se asume una distribución normal de X y de los errores
|
estimación basada en la distribución normal de los errores
|
método de estimación de punt. verdadera en que a partir de la punt. verdadera pronosticada por el modelo, se establece el intervalo confidencial
|
estimación basada en el modelo de regresión lineal
|
en el cálculo de la puntuación verdadera, a medida que la fiabilidad aumenta, la amplitud del intervalo ____.
|
disminuye
|
para los 3 métodos existentes de estimación de puntuación V, se hará una estimación basada en un intervalo confidencial V o F
|
V
|
tipos de error segun TCT
|
error de medida
error de estimación de V error de predicción error de sustitución |
error descrito desde la TCT:
diferencia entre la punt. observada y la verdadera |
error de medida (es conceptual porque la punt verdadera no se puede calcular)
|
error descrito desde la TCT: diferencia entre punt. verdadera real y punt. verdadera estimada mediante regresión lineal
|
error de estimación de la puntuación verdadera (es conceptual porque la punt verdadera no se puede calcular)
|
error descrito desde la TCT: diferencia entre la puntuación observada en un test y la punt. predicha para ese mismo test mediante un test paralelo
|
error de predicción
|
error descrito desde la TCT: diferencia entre las puntuaciones de un sujeto en un test y las obtenidas en un test paralelo
|
error de sustitución
|
según TCT, la punt. verdadera es siempre...
|
CONCEPTUAL
|
la fiabilidad es el grado en que un instrumento mide lo que pretende medir V o F
|
F
|
la fiabilidad es la comparación entre las puntuaciones de un test y una distribución de puntuaciones obtenida con una muestra representativa V o F
|
F
|
la fiabilidad es la correlación entre las puntuaciones de un test y otras medidas externas e independientes de la misma variable V o F
|
f
|
La fiabilidad es la consistencia, precisión y estabilidad de las medidas obtenidas en un test V o F
|
V
|
La fiabilidad es la relevancia y representatividad de los ítems de un test V o F
|
F
|
cuando hay mucha homogeneidad en las puntuaciones se da el efecto... (poca variabilidad)
|
efecto de restricción de rango (el rango es un índice de variabilidad o dispersión)
|
Spearman-Brown hay que relacionarlo con...
|
mitades paralelas, ítems paralelos
|
la validez aparente y lógica/muestral forman parte de...
|
la validez de contenido
|
la validez convergente, discriminante y factorial forman parte de...
|
la validez de constructo
|
la validez predictiva, concurrente y retrospectiva forman parte de...
|
la validez de criterio
|
se analiza en esta validez el grado en que los ítems del test son una muestra relevante y representativa respecto a todo el dominio de aspectos que conforman el constructo
|
validez de contenido
|
serie de evaluadores o examinados dan juicios subjetivos respecto la validez del test
|
validez aparente
forma parte de la de contenido |
cada uno de los aspectos que constituyen el constructo está adecuadamente representado en el test y no existen ítems que se refieran a aspectos ajenos al constructo
|
validez lógica o muestral
forma parte de la validez de contenido |
engloba las otras dos fuentes de validez
|
validez de constructo
engloba la de contenido y la de criterio |
método para el estudio de la estructura externa* del test
se aplica a una misma muestra distintos tipos de pruebas |
matriz multimétodo-multirrasgo
|
en la matriz multimétodo-multirrasto se aplica...
|
a una misma muestra las pruebas:
- test objeto de validación - test que mide mismo constructo con otro método - test que mide constructo diferente con el mismo método - test que mide constructo diferente con método diferente |
en la matriz multimétodo-multirrasgo se analizan las correlaciones...
|
validez convergente
validez discriminante |
método de evaluación de la validez de constructo para explicar una serie de indicadores observables (ítems) en funcion de un número menos de variables latentes o factores
|
análisis factorial y análisis de componentes principales
ESTUDIA LA ESTRUCTURA INTERNA DEL TEST |
método para estudiar la estructura externa del test:
método para estudiar la estructura interna del test: |
externa: matriz multimétodo-multirrasgo
interna: análisis factorial y análisis de comp. principales (tb puede aportar información sobre validez convergente y discriminante, es decir, estructura externa) |
tipos de estructura interna
|
unidimensional o multidimensional
|
tipos de enfoques del análisis factorial
|
exploratorio o confirmatorio
según tengamos investigaciones previas o no |
el análisis factorial analiza SOLO la estructura interna del test, sin darnos información sobre la estructura externa V o F
|
F, aunque se utiliza para la estructura interna, también puede aportar evidencia de validez convergente y discriminante (Externa) EN CUANTO A FACTORES O SUBESCALAS***
|
el análisis factorial tiene mucha relación con los diseños factoriales V o F
|
FALSO
El análisis factorial es una técnica psicométrica de validez de constructo (análisis factorial de comp. principales, técnica para reducir datos si los ítems se agrupan en distintas subescalas, es contenido de ESTE TEMA) en cambio los diseños factoriales manipulan variables independientes (mínimo 2, es una ANOVA tipo II) para ver el efecto en las variables dependientes (EXPERIMENTAL) |
forma de evaluar la validez en el que el objetivo es determinar el grado en que el test puede hacer inferencias sobre algún aspecto del comp. real del sujeto
|
validez referida al criterio
|
tipos de validez de criterio
|
validez predictiva
validez concurrente validez retrospectiva/postdictiva |
valor absoluto de la correlación entre el test y el criterio
|
coeficiente de validez
SIEMPRE ES MENOR QUE LA FIABILIDAD PORQUE la correlación entre test y criterio (validez) siempre será menos que la correlación entre el test consigo mismo o el test con una forma paralela (fiabilidad) el criterio en la validez es un test que mide algo parecido pero no es una forma paralela. se utilizará los distintos coef. de correlación según las variables del test y el criterio sean cuanti/cuali, etc (pearson, Phi, etc) |
características de la validez:
|
- la validez siempre es menor q la fiabilidad. a más fiabilidad, más validez
- a más longitud de un test, más coeficiente de validez - a más variabilidad en las puntuaciones, más coeficiente de validez |
fórmula que corrige la disminución en el coeficiente de validez por los errores de medida
|
fórmula de atenuación
atenua la influencia de los errores de medida que son aleatorios LA HERRAMIENTA ES UNA CORRELACIÓN PARCIAL O SEMIPARCIAL (correlación quitando el efecto de una tercera variable) las fórmulas de atenuación se utilizan para estimar el coeficiente de validez en el supuesto de que la fiabilidad sea perfecta. la razón señal/ruido compara tests compuestos por ítems paralelos pero de diferente longitud. |
si aumenta la homogeneidad de una MUESTRA,
el coeficiente de correlación _____. la validez de conclusión estadística _____. |
el coeficiente de correl. disminuye
la validez de conclusión estadística aumenta |
si aumenta la variabilidad de las PUNTUACIONES (menor restricción de rango):
- el coeficiente de correlación _____. - la validez de conclusión estadística _____. |
- coeficiente de correlación aumenta
- validez de conclusión estadística aumenta |
para la validez de conclusión estadística nos interesa... (respecto a la variabilidad de la muestra y de las puntuaciones)
|
HOMOGENEIDAD DE LA MUESTRA (pacientes con el mismo dx)
VARIABILIDAD DE LAS PUNTUACIONES (menor restriccion de rango) nos interesan pacientes con el mismo dx con DISTINTAS PUNTUACIONES, porque si tienes variabilidad vas a encontrar distintas combinaciones de pares y podrás correlacionar si hay una relación real en la población. |
para el coeficiente de correlación interesa... (respecto variabilidad de la muestra y de las puntuaciones)
|
VARIABILIDAD DE LA MUESTRA Y* DE LAS PUNTUACIONES
aumentarán el coeficiente de fiabilidad y de validez porque su herramienta es el coef. de correlación |
correlación para 2 vv cuantitativas
|
PEARSON
|
correlación para 2 vv ordinales
|
SPEARMAN
KENDALL SI NO EMPATES GOODMAN Y KRUSKAL PARA MUCHOS EMPATES |
correlación, cualitativa dicotómica y cuantitativa
|
biserial puntual
biserial si una es artificialmente dicotomizada |
coeficiente de validez al cuadrado
proporción de varianza de las puntuaciones en el criterio predicha por el test |
coeficiente de determinación
|
al cuadrado es el complementario del coeficiente de determinación
proporción de varianza de las puntuaciones en el criterio no predicha por el test representa la inseguridad (u otras vv aleatorias) que interfieren en la predicción del criterio |
coeficiente de alienación
|
complementario del coeficiente de alienación
proporción de seguridad a la hora de predecir el criterio |
coeficiente de valor predictivo
|
en la validez de criterio se mide el mismo constructo V o F
|
F, se compara por ejemplo un test que mide extraversión con uno que mide simpatía. podrá ser concurrente, predictiva o postdictiva/retrospectiva
si compararamos el mismo constructo con otro test, estaríamos midiendo la validez CONVERGENTE |
teoria base desde la que se puede obtener evidencia sobre la VALIDEZ DE CONTENIDO mediante:
- el análisis de los temas, palabras, formatos y códigos - instrucciones - directrices admin/puntuaciones |
TCT
Conductual |
teoria base desde la que se puede obtener evidencia sobre la VALIDEZ BASADA EN PROCESOS DE RESPUESTA mediante
- análisis procesos de respuesta - datos que muestran R con procedimientos adecuados - entrenamiento para eliminar sesgos en las observ. |
TCT
Conductual |
teoria base desde la que se puede obtener evidencia sobre la VALIDEZ, generalizabilidad mediante:
- correlación con criterios - precisión - exactitud |
TCT
TRI* Conductual |
teoria base desde la que se puede obtener evidencia sobre la VALIDEZ, estructura interna mediante:
- análisis factoriales . análisis de consistencia interna |
TCT
|
teoria base desde la que se puede obtener evidencia en relación a otras variables mediante:
- evidencias convergente y discriminante (modelos estructurales) - red nomológica - exactitud |
TCT
TRI |
teoria base desde la que se puede obtener evidencia sobre la evidencia sobre las consecuencias mediante:
- consecuencias para el evaluado - sensibilidad, especificidad, poder predictivo, utilidad |
TCT
Conductual |
teoria base desde la que se puede obtener evidencia sobre la fiabilidad: estabilidad de la medida mediante:
- formas paralelas - test-retest - estabilidad de la línea base |
TCT
Conductual |
teoria base desde la que se puede obtener evidencia sobre la objetividad del registro mediante:
- formas paralelas - test-retest - correlación entre observadores |
TCT
Conductual |
teoria base desde la que se puede obtener evidencia sobre el acuerdo interjueces mediante: acuerdo interjueves
|
TCT
|
teoria base desde la que se puede obtener evidencia sobre la homogeneidad de la prueba mediante:
- dos mitades - covarianza de los ítems - análisis de la varianza |
TCT
|
teoria base desde la que se puede obtener evidencia sobre la precisión de la prueba mediante la función de información
|
TRI
|
la teoría de la generalizabilidad fue desarrollada por...
|
Cronbach
|
TG no considera que existan múltiples fuentes de error V o F
|
F, considera las múltiples fuentes a diferencia de la TCT
|
la teoría 1._____ intenta que las condiciones de medición sean lo más variadas posible, para abarcar el mayor número de situaciones, mientras que la teoría 2._____ trata de mantener dichas condiciones constantes
|
1. de la generalizabilidad
2. clásica de los tests |
para la teoría de la generalizabilidad, al estudiar el error de medida se utiliza...
|
ANOVA
|
el coeficiente de generalizabilidad es...
|
proporción de la puntuación observada total que se corresponde a la puntuación verdadera
(se define igual que el coeficiente de fiabilidad) |
la teoría de respuesta al ítem fue desarrollada por
|
Lord, Rasch y Lazarsfeld
se aplicó originalmente a tests de aptitud y/o logro |
- suposición de la existencia de un rasgo latente
- énfasis en las características del ítem - utilización de modelos no lineales son características de... |
la teoría de respuesta al ítem
|
Supuestos básicos de la TRI
|
Dimensionalidad
Independencia local Modelización |
supuesto de la TRI:
Se pueden definir una serie de factores que van a comoner la variable latente. conjunto de dimensiones que configuran un rasgo se denominan: espacio latente |
DIMENSIONALIDAD
La mayor parte de los modelos son unidimensionales |
supuesto de la TRI:
La probabilidad de acertar un ítem es independiente de la probabilidad de acertar otro aunque todos estén relacionados con una misma aptitud (Entre ítems) la respuesta de un sujeto a un ítem no va a depender de la respuesta de otro sujeto (entre sujetos) |
INDEPENDENCIA LOCAL
|
Supuesto de la TRI:
La respuesta de los sujetos a los ítems puede modelarse mediante una funcion de respuesta al ítem o curva característica del ítem |
MODELIZACIÓN
|
informa de la probabilidad que tiene un sujeto de acertar un ítem, según su nivel de aptitud
curva creciente, cuanta mayor aptitud tenga, mayor probabilidad de acertar la pregunta |
curca característica del ítem
|
pendiente de la curva caracteristica del ítem (a)
|
discriminación del ítem
|
punto de inflexion de la curva caracteristica del ítem (b)
|
dificultad del ítem
|
probabilidad de acertar por conjetura (c) en la curva característica del ítem
|
adivinación o pseudoazar
|
máxima probabilidad de acertar el ítem a pesar de una elevada aptitud (y)
|
techo
|
característica de los ítems en la TRI, independientes de n y del test
|
invarianza de los parámetros del ítem
a, b, c, y |
todo lo que se aumente en rasgo latente por debajo del punto de discriminación (a), será proporcionalmente ___ que cualquier aumento por encima de este punto.
|
menor
por eso la curva es creciente a medida que aumenta el nivel de rasgo |
equivalente a la fiabilidad en la TCT, indica la cantidad de información que nos proporciona un test dada una aptitud concreta.
cuanto mayor sea, mayor será la precisión de un test para ese nivel de aptitud y menor su error |
función de información
su complementario es el error de medida (la varianza del error) |
factores que determinan el valor de la función de información del test
|
- cuanto mayor sea el número de ítems administrados
- cuanto mayor sea la diferencia entre los valores de los parámetros a y c (discriminación lejos de la probabilidad de acertar por azar) - cuanto mayor sea la diferencia entre los valores del rasgo latente y la probabilidad de acertar por azar - cuanto menor sea la diferencia entre los valores del rasgo latente y la dificultad |
precisión de un test frente a otro para un determinado nivel de aptitud
|
eficiencia relativa (ER)
|
la fiabilidad de cada uno de los items siempre es en función de...
|
la cuantía de rasgo latente.
un ítem puede ser muy fiable para evaluar sujetos con altas capacidades para ese RL, pero poco fiable para bajas capacidades |
distribuciones de probabilidad más utilizados en TRI
|
- ojiva normal
- logístico en la teoría fuerta de la puntuación verdadera (precedente de TRI) se utilizaban: - error binomial - poisson |
modelo probabilístico para TRI, sigue una curva acumulada de distribución normal.
los modelos más comunes son los de dos parámetros |
OJIVA NORMAL
con el factor de escalamiento D, como constante 1.7 se reescala la distribución normal hacia la logística |
modelo probabilístico que sigue la distribución logística acumulada.
muy famoso el modelo logístico de Rasch que tiene solo 1 parámetro (b) |
LOGÍSTICO (la más utilizada)
|
se utiliza para reescalar la distribución normal hacia la logística y viceversa
|
factor de escalamiento D como constante 1.7
cuando este factor de escalamiento se aproxima a 1.7, la distribución normal se aproxima a la logística y viceversa |
modelo de la TRI que:
solo contempla "b" la discriminación del ítem "a" es una constante "c" e "y" = 0 no hay azar en las respuestas, y misma discriminación de los ítems |
modelo de 1 parámetro
un ejemplo es el modelo logístico de Rasch |
modelo de la TRI que:
- contempla "a" y "b" - "c" e "y" = 0 - la adivinación no es asumible o no es posible |
modelo de 2 parámetros
|
modelo de la TRI que:
-contempla a, b y c -"y" = 0 - utilizado para tests con ítems dicotómicos |
modelo de 3 parámetros
|
modelo de la TRI que:
- contempla a, b, c, y - explica los fallos de ítems en sujetos con elevado nivel en una aptitud |
modelo de 4 parámetros
|
aplicaciones prácticas de la TRI
|
equiparación
calibración funcionalidad diferencial del ítem |
aplicación práctica de la TRI: poner en una misma escala los resultados de una o más pruebas que evalúan el mismo constructo
|
equiparación
- equiparación de parámetros: test de anclaje |
aplicación práctica de la TRI: estimación del valor de los parámetros (dificultad, discriminación)
|
calibración
test informatizados: fijos o lineales, adaptativos (se da calibración), basados en los modelos |
aplicación práctica de la TRI, es una medida interna de sesgo
|
funcionamiento diferencial del ítem
probabilidad diferencial de acierto para sujetos con = valor de rasgo latente |
el signo positivo o negativo de la dependencia local entre ítems ha de interpretarse...
|
una DLI positiva informa de una mayor o menos probabilidad de acertar una pareja de ítems que la esperada
una DLI negativa informa de una inusualmente elevada probabilidad de acertar un ítem junto a una inusualmente baja probabilidad de acertar otro ítem como en una correlación |
la dependencia local entre ítems (DLI) refleja...
|
que hay otro factor más allá del nivel de RL que está alterando la probabilidad de acertar o decantarse por una determinada respuesta en un conjunto de ítems
puede ser positiva o negativa |
la escala de las puntuaciones en el test en la TRI va entre...
|
entre menos infinito y más infinito (o alguna transformación de éstas
en la TCT va entre cero y la puntuación máxima en el test |
tamaño muestral en TCT y TRI
|
TCT: puede funcionar bien con muestras entre 200 y 500 personas aproximadamente
TRI: se recomiendan más de 500 personas aunque depende del modelo |
Modelo en TCT y TRI
|
TCT: Lineal
TRI: No lineal |
errores de medida en TCT y TRI
|
TCT: error típico de medida (Común para toda la muestra)
TRI: función de información (Varía segun el nivel en la variable medida) |