English Deutsch Français Italiano Español Português 繁體中文 Bahasa Indonesia Tiếng Việt ภาษาไทย
Todas las categorías

Quisiera saber que prueba estadistica puedo usar para eliminar un dato registrado (valor) que aparentemente contiene un error grande por ejemplo (tengo 9 datos dentro de 445 a 485 y uno 630) Entonces para que no afecte toda mi respuesta debo eliminar el dato extremo con la prueba estadistica que busco. gracias de antemano.

2006-12-27 15:26:08 · 4 respuestas · pregunta de RoMiNa 2 en Ciencias y matemáticas Matemáticas

4 respuestas

no se si entendí bien la consulta, por las dudas comparto desde mi humilde opinión y experiencia, espero le sirva :-)

esos valores muy alejados del resto creo que se llaman valores extremos, o para el caso los llamaremos así, algunas forma de reducir su impacto en los cálculos, es usar lo que en estadística se llama: modas (para quedarnos con los resultados más frecuentes) o percentiles (para descartar los más altos y los más bajos), también podría usar otros indicadores, como media geométrica o mediana (esos puede buscarlos en libros de matemática, para no extenderme tanto acá por ese lado) :-)

con los percentiles por ejemplo usted podría descartar de los resultados el 5% más bajo y el 5% más alto, para decir que el 90% de los resultados están entre tanto y tanto, de modo similar, si descarta el 0.5% de cada extremo, se queda con el 99% central, etc ...

eso funciona bien para muestras relativamente grandes ... si la muestra es chica, y los experimentos, ensayos o muestreos serán pocos, normalmente lo más conveniente es actuar por criterio (lo que en la práctica se hace), o buscar formas de argumentar el descarte de los valores inesperados (o aceptarlos si no puede descartarlos)

por ejemplo, en un curso con pocos alumnos, en una evaluación la mayoría tuvo notas inferiores a 4 (aplazados), muchos de ellos incluso con notas inferiores a 2, pero uno de los alumnos tuvo un 10 (por la razón que fuera) ... con lo que al ser pocos el promedio del curso termina quedando superior a 4, es decir, la estadística nos dice que en ese curso los alumnos reprobaron (menos de 7), pero no aplazaron, cuando la realidad es que casi todos quedaron aplazados, salvo uno que tuvo la nota máxima ...

ese es un caso en el que se justifica aceptar el valor extremo, pero también descartar el uso del promedio como indicador aceptable para describir las calificaciones ...

otro caso, usted encuentra que las edades de los alumnos de un jardín de infantes (como se llame) está entre 3 y 6 años, salvo uno que parece tener 55 años ... ese valor es totalmente improbable, por lo que debería descartarlo, puede ser un error de tipeo, o cualquier otra cosa, pero si usted conoce el contexto de la medición, comprenderá que es inviable encontrar un alumno de esas edad en ese nivel de cursado ... a menos que alguien le muestre que en ese caso se trata de alguien con discapacidad mental, un desarrollo intelectual de 4 a 5 años, que está bajo permanente observación, bajo un proyecto experimental de escolarización que lo incluye en el perfila ceptado, en el que está participando ese jardín, etc ... en ese caso usted tiene una base, excepcional pero aceptable, para dejar ese dato como válido y seguir adelante ... aunque tendrá que revisar todo el proceso pra que los resultados no se desvirtúen, si utiliza indicadores inapropiados para casos con valores extremos ...

espero se entienda la idea, usted describe un caso, con ciertos valores, indicando que el valor extremo es un error y es un error grande ...

si realmente es así y puede precisar el error, justificarlo, entonces en general el dato debe ser descartado, como si no fuera parte de la muestra, y en lo posible la medición debe realizarse nuevamente (com digo, en lo posible, aunque muchas veces no podrá medirse nuevamente ese dato, hay veces en las que si podrá hacerse)

pero si no es un error, entonces debe encontrar el argumento para aceptarlo como parte de la muestra, y luego el argumetno para descartarlo entre los valores priorizados ... ahí entra en juego lo que puse al principio, los percentiles, las modas, etc ...

saludos cordiales desde san juan, argentina :-)

2006-12-27 16:23:01 · answer #1 · answered by Anonymous · 0 0

Un procedimiento es calcular la media.Alineas de menor a mayor toda la muestra.Si el numero de datos es par,calculas 1/2 de la suma de los 2 elementos centrales.Si el numero de datos es impar,tomas el central y eso te da la estimacion
Esto funciona mientras la cantidad de datos malos sea menor que la mitad de la muestra

2006-12-30 18:44:51 · answer #2 · answered by Hilde B 4 · 0 0

Lo que te han dicho esta bien pero la mayoría de las veces se trata de un error del que anotó los datos, si tienes acceso al trabajo original deberías ver si es correcto.

2006-12-28 09:39:01 · answer #3 · answered by Fotón 5 · 0 0

Creo entender. Tienes 8 datos muy parecidos entre si, pero un noveno escapa a la "media", es decir si sacas el promedio, te arroja un valor muy alejado del grupo más significativo. Si ese es el problema, existen los llamados estadígrafos de posición o tendencia central,que indican alrededor de que valor se agrupan los datos obtenidos, prueba con la moda, la media geométrica o la mediana. Para éste caso, son los más indicados.
Ejemplo: El promedio de 3,4,5 y 10 es 5.5; Pero su media geométrica es sólo 4.94 (más cercano a la realidad no?).La media geométrica en este caso es raiz cuarta de 3*4*5*10. si fuesen 5 datos sería raiz quinta del producto de éstos, si fuesen dos, será raiz cuadrada de su producto, ej: media geometrica de 2 y 8 es 4, ya 2*8=16 y raiz de 16 es 4.
espero haber ayudado.

2006-12-28 00:21:59 · answer #4 · answered by Anonymous · 0 0

fedest.com, questions and answers