Method and apparatus for significance testing and confidence interval construction based on user-specified distribution

   
   

A computer and computer implemented method and program product for analyzing statistical data in which the data to be analyzed need not be transformed into a "Normal" distribution, thus avoiding introduction of error. Generally, the user first determines a test statistic (formula) and associated null hypothesis. Then the distribution from which the original data arose, consistent with the null hypothesis, is defined. The computer then produces numerous randomly-generated data sets of the identical size and dimensions of the original statistical data set, according to the distribution defined above. A numerical value of the test statistic is computed from the test statistic formula for each randomly generated data set and stored in a vectored array. The numerical value of the test statistic computed from the original statistical data is then compared with the array and the associated percentile determined. With this information, the significance of the numerical value of the test statistic derived from the original data can be determined and the null hypothesis may be rejected, as indicated. Embodiments of the invention may likewise be used in alternative statistical applications, including computation of confidence intervals and likelihood ratios.

Una computadora y la computadora pusieron el producto del método en ejecucio'n y del programa para analizar los datos estadísticos en los cuales los datos que se analizarán no necesitan ser transformados en una distribución "Normal", así evitando la introducción del error. Generalmente, el usuario primero determina una estadística de la prueba (fórmula) e hipótesis nula asociada. Entonces la distribución de la cual los datos originales se presentaron, constante con la hipótesis nula, se define. La computadora entonces produce los modems al azar-generados numerosos del tamaño y de las dimensiones idénticos del modem estadístico original, según la distribución definida arriba. Un valor numérico de la estadística de la prueba se computa del fórmula de la estadística de la prueba para cada modem aleatoriamente generado y se almacena en un arsenal vectored. El valor numérico de la estadística de la prueba computada de los datos estadísticos originales entonces se compara con el arsenal y el porcentaje asociado determinados. Con esta información, la significación del valor numérico de la estadística de la prueba derivada de los datos originales puede ser determinada y la hipótesis nula se puede rechazar, según lo indicado. Las encarnaciones de la invención se pueden utilizar además en usos estadísticos alternativos, incluyendo el cómputo de los intervalos de la confianza y de los cocientes de la probabilidad.

 
Web www.patentalert.com

< Proxy processing method

< High performance object cache

> Self archiving log structured volume with intrinsic data protection

> Automatic database statistics creation

~ 00157