Conceptos de estadรญstica para traders๐Ÿ‘ฝ

ืžืขื•ื“ื›ืŸ
Comprender la estadรญstica es una de las habilidades fundamentales que se requieren para el anรกlisis cuantitativo, se tratan dos conceptos bรกsicos distribuciรณn y probabilidad, ambos conceptos estรกn estrechamente relacionados, el concepto de probabilidad nos brinda un soporte para los cรกlculos matemรกticos y las distribuciones nos ayudan a visualizar lo que estรก sucediendo con los datos.

Distribuciรณn de frecuencia e histograma๐Ÿฆ–
Comencemos por la parte mรกs sencilla, una distribuciรณn es simplemente una manera de describir el patrรณn de los datos, ejemplo simple pensamos en los rendimientos diarios de una acciรณn en bolsa o en los resultados de un backtest, estos retornos son nuestros datos de muestra, para tener una visiรณn mรกs clara a estos rendimientos o rentabilidades podemos clasificarlos en intervalos de igual tamaรฑo y contar el nรบmero de observaciones de cada intervalo, si representamos estos resultados en un grรกfico obtendremos lo que en estadรญstica se llama un histograma de frecuencias, los histogramas nos permiten tener un panorama general de cรณmo se han distribuido los retornos.

Ademรกs, a partir de esta distribuciรณn de frecuencias podremos conocer sus medidas de tendencia central de nuestra muestra.
โ€“ El valor que estรก en el centro de nuestro histograma nos indica la media aritmรฉtica de los datos (el rendimiento medio).
โ€“ La mediana parte la distribuciรณn en dos dejando la misma cantidad de valores a un lado que a otro.
Tambiรฉn podremos ver quรฉ tan variables han sido los resultados medidas de dispersiรณn, la volatilidad de los retornos se mide con la desviaciรณn estรกndar o desviaciรณn tรญpica, por รบltimo tambiรฉn podremos ver la forma que tiene la distribuciรณn, si es una distribuciรณn simรฉtrica, si tiene colas mรกs gordas lรฉase resultados mรกs extremos de lo que deberรญa, etc.

Vamos a ver estas caracterรญsticas con mayor detalle, caracterรญsticas de una distribuciรณn๐Ÿ”ฅ

Asimetrรญa estadรญstica
Un aspecto muy importante es la simetrรญa de la distribuciรณn, si una distribuciรณn es simรฉtrica, existe el mismo nรบmero de valores a la derecha que a la izquierda de la media, por tanto, el mismo nรบmero de desviaciones con signo positivo que con signo negativo, decimos que hay asimetrรญa positiva o a la derecha si la cola a la derecha de la media es mรกs larga que la de la izquierda, es decir, si hay valores mรกs separados de la media a la derecha, diremos que hay asimetrรญa negativa o a la izquierda si la cola a la izquierda de la media es mรกs larga que la de la derecha, es decir, si hay valores mรกs separados de la media a la izquierda.
Cuando hablamos de sistemas de trading, un sistema puede tener una asimetrรญa negativa o positiva segรบn cรณmo sean sus caracterรญsticas, para mรญ, el ejemplo mรกs evidente es cuando analizamos la distribuciรณn entre los resultados de un sistema tendencial comparado a los resultados de un sistema de reversiรณn a la media, en el primer caso, nuestra muestra tendrรญa una simetrรญa positiva cuando acierta gana mucho y los retornos se alejan del valor medio media, cuando no acierta pierde poco y los valores a la izquierda de la media no estรกn muy alejados de esta, en el segundo caso serรญa a la inversa.

Curtosis
La curtosis es una medida estadรญstica que determina el grado de concentraciรณn de los valores de una distribuciรณn alrededor de su media, el coeficiente de curtosis indica si la distribuciรณn tiene colas ยซpesadasยป, es decir, si los valores extremos concentran o no una alta frecuencia. El coeficiente mide el ยซgrado de apuntamiento o achatamiento de las colasยป respecto a la distribuciรณn normal, entonces, si tomamos la distribuciรณn normal como referencia, una distribuciรณn puede ser leptocรบrtica, platicรบrtica o mesocรบrtica.

Distribuciรณn de probabilidad
Hasta aquรญ simplemente hemos estados analizando los datos de nuestra muestra en el ejemplo, los resultados de las operaciones utilizando estadรญstica descriptiva, sin embargo, tal y como comentรกbamos en nuestro sobre las series temporales y la inversiรณn cuantitativa, cuando trabajamos con los datos buscamos algo mรกs que simplemente describirlos, buscamos poder predecir cรณmo se comportarรก esa serie de datos en el futuro, para esto echamos mano de la teorรญa de la probabilidad y la estadรญstica inferencial, a partir los resultados de una muestra, buscamos extraer conclusiones para el total de la poblaciรณn, existen numerosos tipos de distribuciรณn de variables, solo nos vamos a ocupar de la distribuciรณn normal, que es el tipo de distribuciรณn mรกs conocido y sobre el que se asientan la mayorรญa de modelos de probabilidad, para describirla solo se necesitan dos parรกmetros la media aritmรฉtica que define el valor central y la desviaciรณn estรกndar que describe el ancho de la campana.

Antes comentaba que para modelizar el riesgo lo รบnico necesario es conocer la media y la desviaciรณn estรกndar, esto es asรญ porque la distribuciรณn de probabilidad asigna una probabilidad a cada posible resultado de un experimento, la funciรณn de probabilidad que se mencionaba antes en el extracto es un concepto matemรกtico que nos permite utilizar el รกrea debajo de la curva para representar el espacio de probabilidad, podemos entender intuitivamente que aquellos valores que estรกn mรกs distantes de la media se repiten con menos frecuencia, mientras que aquellos valores mรกs cercanos a la media son mucho mรกs frecuentes, de esta forma se pueden definir intervalos de probabilidad dentro de los cuales podremos encontrar la rentabilidad del total de la muestra., este tipo de anรกlisis es el que utiliza el modelo de VaR (Value at risk) para evaluar la probabilidad del riesgo de una inversiรณn.

La volatilidad, que en este caso estรก medida por el valor de la desviaciรณn estรกndar, es una medida de incertidumbre riesgo, esta incertidumbre estรก relacionada con la probabilidad de obtener un rendimiento que sea igual al rendimiento esperado la media, como podemos ver en ejemplo de debajo, para el mismo rendimiento esperado, la curva se aplana cuando la volatilidad es mรกs grande mientras que se vuelve mรกs delgada y mรกs alta cuando la volatilidad disminuye, un activo cuya rentabilidad tiene una desviaciรณn estรกndar mรกs alta se considera mรกs volรกtil, y por lo tanto, mรกs arriesgado que un activo con una volatilidad mรกs baja.

Otras notas๐Ÿฆ–
Cuando hablamos de una distribuciรณn de toda la poblaciรณn, las propiedades media, desviaciรณn tรญpica, etc, son parรกmetros, cuando hablamos de la distribuciรณn de la muestra, las propiedades son estadรญsticas.
ยฟPor quรฉ utilizar distribuciones estadรญsticas para medir el riesgo, si al final los resultados no se ajustan a un modelo de distribuciรณn?, porque estรกs trabajando con modelos, tener un marco teรณrico en el que asentar una estrategia de inversiรณn cuantitativa aรฑade solidez al conjunto.
ืขืกืงื” ืกื’ื•ืจื”: ื”ื™ืขื“ ื”ื•ืฉื’
DJIFundamental AnalysisTechnical IndicatorsNasdaq Composite Index CFDNDAQNYASPX (S&P 500 Index)S&P 500 (SPX500)spx500analysisUS SPX 500Trend AnalysisUSD

ื’ื ืขืœ:

ื›ืชื‘ ื•ื™ืชื•ืจ