miércoles, 26 de enero de 2022

Un ejercicio de contraste de una proporción

ENUNCIADO. Se ha realizado una encuesta sobre los hábitos de lectura de la población universitaria, tomando una muestra aleatoria simple de $180$ personas, y obteniéndose como resultado que $117$ de dichas personas manifiestan leer, como mínimo, $1$ libro al mes. Hace $5$ años, la proporción de universitarios que declaraban leer, como mínimo $1$ libro al mes, era del $60\,\%$. Se pide:
(a) Realizar un contraste de hipótesis bilateral, a un nivel de significación $\alpha=0{,}05$ (nivel de confianza del $95\,\%$), para decidir si la población de universitarios que declaran leer como mínimo $1$ libro al mes sigue siendo del $60\,\%$ (hipótesis fundamental)
(b) ¿Qué tamaño muestral tendría que tener la muestra para poder rechazar la hipótesis fundamental?

SOLUCIÓN

(a)
1. Realización del test calculando la ubicación del valor observado en la muestra en el intervalo/zona de aceptación o bien en en la zona de rechazo de la misma:

Llamamos $p$ a la proporción en la población que corresponde a leer como mínimo $1$ libro al mes.

Denominamos $\hat{p}$ al estimador de la proporción en la población a partir de la información de la muestra, por lo que $\hat{p}$ es una variable aleatoria, que es función de las variables del muestreo, ya que $\hat{p}:=\dfrac{Y}{n}$, siendo $Y$ el número de veces que se verifica en la población una determinada clase $S$ caracterizada por la propiedad; es decir, $Y$ es el número de elementos de la muestra $(e_1,e_2,\ldots,e_n)$ que son de la clase $S$. Así, considerando las variables aleatorias de Bernouilli independientes del mismo parámetro $p:=P(S)$ $$X_i=\left\{ \begin{matrix} 1 & \text{si el elemento} \, e_i \in S \\ 0 & \text{si el elemento}\, e_i \in S \end{matrix} \right. \,\text{para}\, i=1,\ldots\,n$$ la variable $Y$ es la suma de las mismas $$\displaystyle Y=\dfrac{\displaystyle\sum_{i=1}^{n}\,X_i}{n}$$ por lo que tendremos que $Y$ es una variable aleatoria binomial $B(n,p)$, ya que se supone que la realización del muestro se realiza con reemplazamiento —démonos cuenta de que se puede pues considerar que la variable $\hat{p}:=\dfrac{Y}{n}$ es un caso particular del estimador de la media, $\bar{X}$.

Realizaremos el contraste de hipótesis (la estimación) manejando dicho estimador (estadístico).

Sabemos que el valor observado de la proporción medida en la muestra es $\hat{p}_{\text{observado}}=\dfrac{117}{180}=0{,}65$.
También tenemos que tener en cuenta, claro está, el tamaño de la muestra, que es $n=180$.

Si bien la variable aleatoria $Y$, y por tanto también $\hat{p}$, obedecen a una distribución binomial, podremos facilitar el cálculo aproximando $\hat{p}$ a una distribución normal. En efecto, por el Teorema del Límite Central, sabemos que la variable aleatoria del estadístico (estimador) $\hat{p}$ sigue una distribución aproximada normal de media $p$ y desviación estándar $\sqrt{\dfrac{p\cdot(1-p)}{n}}$, esto es, $\hat{p}$ es $N\left(p\,,\,\sqrt{\dfrac{p\cdot(1-p)}{n}}\right)$.

Para la población actual no conocemos el valor del parámetro $p$, por lo que tendremos que arreglárnos sustituyendo éste por algún valor aproximado del mismo, $p_0$, y que, según el enunciado, tomaremos el valor de éste es del $60\,\%$, que corresponde al que se conocía hace unos años en la población y al que llamaremos pongamos que $p_0$; así que establecemos $p\approx p_{0}=0,60$. Con todo esto ya podemos decir que el estadístico $\hat{p}$ (variable aleatoria asociada al estimador de la proporción de la población) sigue la siguiente distribución de probabilidad en el muestreo: $$\hat{p} \approx N \left( p_0 \,,\, \sqrt{ \dfrac{p_0 \cdot(1-p_0) }{n}} \right)$$
(a) Plateemos el test de hipótesis:
Queremos contrastar la hipótesis fundamental (o hipótesis nula) $H_0$ —nos parece bastante plausible, y por tanto confiamos en que sea cierta— en contraposición a la hipótesis alternativa $H_1$; y ello, con un nivel de significación del test prefijado $\alpha=5\,\%=0,05$ (y pot tanto con un nivel de confianza $1-\alpha=95\,\%=0,95$). Establecemos pues la hipótesis fundamental: $$H_0:\, p\approx p_0=0,60$$ frente a la hipótesis alternativa: $$H_1:\, p\approx p_0 \neq 0{,}60$$

Tratándose de un test (contraste) bilateral —habrá que manejar las dos colas (izquierda y derecha) de la función de densidad de probabilidad de la variable aleatoria del estadístico de contraste—, aceptaremos $H_0$ si $P\{p_0 -E \le \hat{p} \le p_0+E\} = 1-\alpha$, luego el intervalo de aceptación de $H_0$ viene dado por $$\text{IA}=(p_0-E\,,\,p_0+E)$$, siendo la amplitud de error $E=z_{\alpha/2}\cdot \sqrt{\dfrac{p_0 \cdot (1-p_0)}{n}}$

Al tipificar la variable $\hat{p}$, se pasa a la variable $$Z=\dfrac{\hat{p}-p_0}{\sqrt{p_0 \cdot (1-p_0)/n}}$$ que es una normal $N(0,1)$. Obtendremos, ahora, la abscisa crítica $z_{\alpha/2}$ —se determina de la misma forma que en los problemas de intervalos de confianza—, teniendo en cuenta que $P\{Z \le z_{\alpha/2}\} = 1-\alpha/2$; y, como $\alpha/2=0{,}05/2=0{,}025$, consultando las tablas de la función de distribución de probabilidad $N(0,1)$, para $P\{Z \le z_{\alpha/2}\} = 0{,}975$, encontramos $z_{\alpha/2}=1{,96}$

Así, la amplitud de error a la que llegamos es $E=1{,}96 \cdot \sqrt{0{,}6\cdot (1-0{,}6)/180}=0{,}0716$, luego el intervalo de aceptación de $H_0$, $\text{IA}$, debe cumplir que $\left|\hat{p}-p_0\right|=E$, luego $$\text{IA}=(0{,}6-0{,}0716\,,\,0{,}6+0{,}0716)$$ esto es $$\text{IA}=(0{,}5284\,,\,0{,}6716)$$
Y como la proporción medida en la muestra $\hat{p}=0{,}65 \in \text{IA}$, concluimos que debemos confiar en la aceptación de la hipótesis fundamental $H_0$, esto es, aceptamos que la proporción de la población de estudiantes que como mínimo leen un libro al mes se mantiene en un $60\,\%$, según un nivel de significación $\alpha=0,05$ (es decir, a un nivel de confianza del $95\,\%$).


-oOo-

2. Realización del test calculando el $\text{p-valor}$:


Otra manera de llegar a la misma conclusión consiste en calcular el p-valor (o valor-p) utilizando la distribución de probabilidad en el muestreo del estadístico de prueba asumiendo que la hipótesis fundamental es cierta. Subrayemos pues que entendemos el p-valor como el error de tipo I observado (no el establecido de antemano en el test y al que denominamos nivel de significación $\alpha$, que en nuestro caso es del $0.05$); dicho de otra manera, el p-valor es el mínimo nivel de significación necesario para poder rechazar la hipótesis fundamental $H_0$ que se ha aceptado como cierta en un principio (para realizar el cálculo del p-valor). Por tanto, una vez conocido el p-valor procederemos de la manera siguiente para realizar el contraste:
  Si $\text{p-valor}\le \alpha$ entonces deberemos rechazar la hipótesis fundamental $H_0$ (que habíamos supuesta cierta en un principio) y por tanto aceptaremos la hipótesis alternativa $H_1$
  En caso contrario, si $\text{p-valor}\gt \alpha$, no podremos rechazar la hipótesis fundamental $H_0$

Al cálcular el p-valor nos podemos encontrar que, según el caso, el contraste se tenga que realizar por la cola superior, por la cola inferior, o bien de manera bilateral. Este último caso es el que procede para este problema que nos ocupa ahora. Hagamos el cálculo:
  Como al estadístico del contraste corresponde una variable $Z=\dfrac{\hat{p}-p_0}{\sqrt{p_0 \cdot (1-p_0)/n)}}\sim N(0,1)$ (lo cual ya se ha justificado arriba) tenemos que, el valor observado del estadístico para la variable tipificada $Z$ del contraste (o valor de prueba del estadístico) es igual a $z_{\text{prueba}}:=\dfrac{\hat{p}_{\text{prueba}}-p_0}{\sqrt{p_0 \cdot (1-p_0)/n)}}=\dfrac{0,65-0,60}{\sqrt{0,60\cdot (1-0,60)/180)}}=1,3693$ , y al tener en cuenta la bilateralidad con la función de densidad de probabilidad de $Z\sim N(0,1)$ simétrica y centrada en el valor $z=0$, encontramos que $\text{p-valor}:=P\{Z \le - z_{\text{prueba} }\}+P\{Z \ge z_{\text{prueba} }\}=2\,P\{Z \ge z_{\text{prueba}}\}=2\cdot (1-P\{Z \le z_{\text{prueba}}\})=$
  $=2\cdot (1-P\{Z \le 1,3693\})=2\cdot (1-F(1,3693))\overset{\text{tablas de}\,F(z)}{=}2\cdot(1-0,9145)\approx 0,171 \gt \alpha=0,05$ de lo cual concluimos que no podemos rechazar la hipótesis fundamental $H_0$. Como cabía esperar, es la misma conclusión a la que hemos llegado razonando mediante los intervalos de aceptación y rechazo de la hipótesis fundamental.

Observación:
Por el significado del $\text{p-valor}$, démonos cuenta de que si hubiésemos tomado un nivel de significación $\alpha$ mayor que $0,05$ pero, eso sí, menor que $0,171$, la conclusión del test sería la misma: no rechazar la hipótesis fundamental $H_0$. Por el contrario, para valores de $\alpha$ mayores que $0,171$, esto es, para un contraste más «exigente» que eso, sí tendríamos que rechazar la hipótesis fundamental.


* * *


(b)
Si el tamaño muestral $n$ aumenta, entonces el intervalo de aceptación se estrecha (se reduce el error $E$, que es la amplitud de dicho intervalo), por tanto, a partir de un cierto valor de $n$, la proporción medida en la muestra caerá fuera del intervalo de aceptación (se situará en la zona de rechazo de la hipótesis fundamental), con lo cual, no podremos seguir dando apoyo a la hipótesis fundamental, debiendo aceptar la h. alternativa, y por consiguiente hay que concluir, en ese caso, que la proporción en la población no es del $60\,\%$. Veamos cuánto debe ser el valor mínimo de $n$ para que eso ocurra:

Por lo dicho anteriormente, para poder rechazar $H_0$, deberá cumplirse (condición crítica) que $\left|\hat{p}-p_0\right| = E$; por lo que imponiendo esta condición, $$0{,}65-0{,}60=1{,}96 \cdot \sqrt{0{,}6\cdot (1-0{,}6)/n}$$ es decir
$$0{,}05=1{,}96 \cdot \sqrt{0{,}6\cdot (1-0{,}6)/n}$$ elevando al cuadrado y despejando $n$ llegamos a $$n=\dfrac{0{,}6\cdot 0{,}4}{(0{,}05/1{,}96)^2} \approx 368$$

Con lo cual, para tamaños muestrales $n \ge 368$, tendremos que rechazar la hipótesis fundamental (a nivel de significación $\alpha=0{,}05 $). $\square$
- - -

Referencias:
  [1] Guàrdia, J.; Viader, M., Estadística, Castellnou, Barcelona, 1999
  [2] Gonick, L.; Smith, W, La Estadística en Cómic, Zendrera Zariquiey, Barcelona, 1999
  [3] García Pérez, A., Estadística Básica con R, UNED, Madrid, 2010
  [4] García Pérez, A., Estadística Aplicada: Conceptos básicos , UNED, Madrid, 2008
  [5] García Pérez, A., Problemas resueltos de estadística básica , UNED, Madrid, 1998
  [6] García Pérez, A., Ejercicios de estadística aplicada , UNED, Madrid, 2008
  [7] González Manteiga, M.T.; Pérez de Vargas Luque, A., Estadística Aplicada. Una visión instrumental, Ediciones Díaz de Santos, Madrid, 2009
  [8] Delgado de la Torre, Probabilidad y Estadística para Ciencias e Ingenierías, Delta, Madrid, 2007
  [9] Allepús, J., et. al., Exercicis d'inferència estadística, Cossetània, Valls, 2002
  [10] Vélez Ibarrola, R.; García Pérez, A., Cálculo de Probabilidades y Estadística Matemática, UNED, Madrid, 1993

jueves, 20 de enero de 2022

Ejemplo de resolución de un sistema de ecuaciones lineales compatible determinado utilizando R

En este breve artículo voy a mostraros cómo podemos resolver un sistema de ecuaciones lineales compatible determinado utilizando el programa de cálculo R, que se emplea en análisis numérico matricial y, especialmente, en estadística y probabilidad. Veamos el siguiente ejemplo: $$\left\{\begin{matrix}x+y+z=1\\x-y+z=0\\x-y-z=2\end{matrix}\right.$$ Este sistema de ecuaciones podemos escribirlo en forma matricial $$\begin{pmatrix}1&1&1\\1&-1&1\\ 1&-1&-1\end{pmatrix}\begin{pmatrix}x\\y\\z\end{pmatrix}=\begin{pmatrix}1\\0\\2\end{pmatrix}$$ Una vez identicados los elementos de la matriz de los coeficientes del sistema y los de la matriz de los términos independientes, basta utilizar las siguientes instrucciones de R


para obtener la solución:


esto es: $$x=\dfrac{3}{2}, y=\dfrac{1}{2}, z=-1$$

Aplicaciones de la distribución multinomial. Cálculo con R

ENUNCIADO
En un grupo de diez profesores hay tres de inglés, cuatro de matemáticas, dos de lengua y uno de física. Se selecciona al azar un comité de cuatro profesores. Calcúlese la probabilidad de que el comité esté formado por dos profesores de matemáticas, uno de física y uno de lengua

SOLUCIÓN.

Éste es un caso de distribución multinomial $$P(x_1,x_2,x_3,x_4)=\dfrac{(x_1+x_2+x_3+x_4)!}{x_{1}!\,x_{2}!\,x_{3}!\,x_{4}!}\,p_{1}^{x_1}\,p_{2}^{x_2}\,p_{3}^{x_3}\,p_{4}^{x_4}$$ donde:
|---------------------------------------|
|probabilidad de elegir un profesor de: | 
|---------------------------------------|
|inglés | matemáticas | lengua | física |
|---------------------------------------|
|  3/10 |    4/10     |  2/10  |  1/10  |
|---------------------------------------|

|---------------------------------------|
|integrantes de la comisión:            | 
|---------------------------------------|
|inglés | matemáticas | lengua | física |
|---------------------------------------|
|  0    |    2        |    1  |    1    |
|---------------------------------------|

Así pues debemos calcular $$P(0,2,1,1)=\dfrac{(0+2+1+1)!}{0!\cdot 2!\cdot 1!\cdot 1!}\cdot (3/10)^{0}\cdot (2/10)^{2}\cdot (1/10)^{1}\cdot (1/10)^{1}$$

A modo de práctica de aprendizaje de la herramienta R, vamos a realizar el cálculo con dicho software matemático orientado a la probabilidad y la estadística ( si bien también al cálculo numérico y a la programación científica ). La siguiente imagen es una captura de pantalla de la sesión de trabajo en el entorno RCommander de R, en la que aparecen las instrucciones que hemos dado para calcular la probabilidad pedida:

y hemos obtenido el siguiente resultado: $$P(0,2,1,1)=0,0384$$

$\square$

Unba idea introductòria sobre l'aplicació dels mètodes Monte Carlo. Oobtenció d'una aproximació del número π

Inestabilitats numèriques. Un senzill experiment sobre el caos determinista

Html5

Fa molts anys, vaig trobar al llibre del conegut matemàtic i divulgador Ian Stewart (¿Juega Dios a los dados?, Crítica, colección Drakontos, Barcelona, 1991, pàgina 25), un senzill programa escrit en llengutage Basic (aquí podeu fer un cop d'ull a les característiques d'aquest popular i ja molt vellet llenguatge de programació) el breu programa que podeu llegir a sota, amb el qual hom pot comprovar fàcilment la generació d'inestabilitats numériques en un exemple ben simple, depenent del valor que donem al paràmetre $k$. He decidit reproduir-lo i incloure'l com una proposta més d'activitats de programació i càlcul. Va, proveu-ho! I no cal que l'escrigueu en Basic: podeu transcriure'l fàcilment (l'algorisme s'entén prou bé) al vostre llenguatge favorit (Python, Scratch, C, ...)

input k 
  x=0.54321 
  for n=1 to 50  
    x=k*x*x-1 
  next n 
  for n=1 to 100  
    x=k*x*x-1 
    print x 
  next n 
end
] 
$\square$

miércoles, 12 de enero de 2022

Suma de una serie cuadrático-geométrica

En un artículo anterior hablaba de la suma de la serie $\displaystyle \sum_{i=1}^{\infty}\,i\cdot r^i$ en la que utilizaba lo conocido sobre las series geométricas convergentes (siendo, claro está, la razón $r$ menor que $1$ en valor absoluto). Ahora voy a exponer una técnica básica para suma una serie del tipo $\displaystyle \sum_{i=1}^{\infty}\,i^2 \cdot r^i$ empleando también la misma técnica (de &#multiplicar por $r$») empleada para hacer el cálculo de $\displaystyle \sum_{i=1}^{\infty}\,i\cdot r^i$, pero aplicándola ahora consecutivametne dos veces consecutivas para llegar a encontrar una serie geométrica (cuya suma infita que sabemos calcular) entre los términos que convergen. Insisto en que para que dichas series converjan es necesario que $|r|\lt 1$.


Examinemos la sumas parciales $$S_1=r$$ $$S_2=r+4r^2$$ $$S_3=r+4r^2+9r^3$$ $$\ldots$$ luego el término general de las mismas es $$\displaystyle S_n=r+2r^2+9^r3+16r^4+\ldots+(n-1)^2r^{n-1}+n^2r^n$$ multiplicando por $r$ en cada miembro de la igualda anterior nos queda $$\displaystyle r\cdot S_n=r^2+4r^3+9r^4+16r^5\ldots+(n-1)^{2}r^n+n^{2}r^{n+1}$$ Restando, miembro a miembro, la segunda igualdad a la primera llegamos a $$(1-r)\cdot S_n=\left(r+3r^2+5r^3+7r^4+\ldots+(2n-5)r^{n-2}+(2n-3)r^{n-1}+(2n-1)r^{n}\right)-n^2r^{n+1}$$ Volviendo ahora a multiplicar por $r$ ambos miembros de esta igualdad se llega a $$r(1-r)\cdot S_n=r^2+3r^3+5r^4+7r^5+\ldots+(2n-5)r^{n-2}+(2n-3)r^{n}+(2n-1)r^{n+1}-n^2r^{n+2}$$ Y restando (otra vez) esta expresión de la de las dos líneas superiores llegamos a $$\left( (1-r)-(1-r)\,r\right) \, S_n=r+2r^2+2r^3+2r^4+2r^5+\ldots+2r^{n-1}+2r^n+(-n^2-2n+1)r^{n+1}+n^2r^{n+2}$$ esto es $$(1-r)^2 \, S_n=r+2\,\left(r^2+r^3+r^4+\ldots+2r^5+\ldots+r^n\right)+(-n^2-2n+1)r^{n+1}+n^2r^{n+2}$$ Notemos que al pasar al límite cundo $n\rightarrow \infty$ ambos miembros de la igualdad para calcular la suma infinita démonos cuenta de que los dos últimos miembros del segundo término tienden a cero (habida cuenta de que si bien las potencias de $n$ tienden a infinito las potencias de $r$ con exponente mayor que $n$ tienden a cero más rápidamente ya que $|r|\lt 1$. Por otra parte, la serie geométrica $r^2+r^3+r^4+\ldots+2r^5+\ldots+r^n \overset{n\,\rightarrow\,\infty}{\rightarrow} \dfrac{r^2}{1-r}$, por consiguiente $$\displaystyle \sum_{i=1}^{\infty}\,i^2 \cdot r^i=\dfrac{r}{(1-r)^2}+2\,\dfrac{r^2}{(1-r)^3}$$
-oOo-

Ejemplo
A modo de práctica, vamos a sumar la serie $$\displaystyle \sum_{i=0}^{\infty}\,\dfrac{i^2-1}{3^i}$$ En primer lugar, podemos descomponer esta serie en una suma de dos series: una serie del tipo tratado sumada a una série geométrica: $$\displaystyle \sum_{i=0}^{\infty}\,\dfrac{i^2-1}{3^i}=\sum_{i=0}^{\infty}\,\dfrac{i^2}{3^i}-\sum_{i=0}^{\infty}\,\dfrac{1}{3^i}$$ y aplicando los resultados obtenidos concluimos que, siendo $r=1/3$, $$\displaystyle \sum_{i=0}^{\infty}\,\dfrac{i^2-1}{3^i}=\left(\dfrac{1/3}{(1-1/3)^2}+2\cdot \dfrac{(1/3)^2}{(1-1/3)^3}\right)-\dfrac{1/3}{1-1/3}=1$$ $\square$

Tirando del hilo de las series geométricas o de cómo sumar algunos otros tipos de series de infinitos términos

Recordemoos que una serie geométrica de infinitos $\displaystyle \sum_{i=0}^{\infty}\,r^i$ con $|r|\lt 1$ converge a $\dfrac{1}{1-r}$. Valiéndonos de este resultado, podemos escribir el desarrollo en serie de potencias de una variable real $x$ para valores de la misma tales que $-1 -1 \lt x \lt 1$ sin más que cambiar $r$ por $x$ $$\displaystyle \sum_{i=0}^{\infty}\,x^i=\dfrac{1}{1-x}$$ Y si calculamos la integral indefinida o bien derivamos en cada miembro de esta igualdad obtendremos otros desarrollos en serie de potencias que pueden ayudarnos a sumar otras series numéricas infinitas, tal y como vamos a mostrar en breve. Así, si integramos en cada unos de los miembros de la igualda anterior, llegamos a $$\displaystyle \int \sum_{i=0}^{\infty}\,x^i\,dx =\int \dfrac{1}{1-x}\,dx$$ esto es $$\displaystyle \sum_{i=0}^{\infty}\,\dfrac{x^{i+1}}{i+1} =\ln\,(|1-x|)+C$$ Calculamos el valor de la constante de integración $C$, teniendo en cuenta que para $x=0$ se tiene que cumplir que $\displaystyle \sum_{i=0}^{\infty}\,\dfrac{0^{i+1}}{i+1} =\ln\,(|1-0|)+C$ y por tanto $0=0+C \Rightarrow C=0$, luego se tiene que $$\displaystyle \sum_{i=0}^{\infty}\,\dfrac{x^{i+1}}{i+1} =\ln\,(|1-x|)+0$$ esto es $$\displaystyle \sum_{i=0}^{\infty}\,\dfrac{x^{i+1}}{i+1} =\ln\,(|1-x|)$$ Podemos hacer un cambio de índice en el sumatorio para obtener una igualdad también válida un poco más compacta; así, si denominamos $j$ a $i+1$, el nuevo índice $j$ tomará el valor $1$ cuando $i$ tome el valor $0$, por tanto también es vàlido el siguiente resultado $$\displaystyle \sum_{j=1}^{\infty}\,\dfrac{x^{j}}{j} =\ln\,(|1-x|)$$ Volviendo ahora a las series numéricas, podemos enrriquecer nuestro «cajón de sastre» con una nueva herramienta: $$\displaystyle \sum_{j=1}^{\infty}\,\dfrac{r^{j}}{j} =\ln\,(|1-r|)\quad \text{para}\quad |r|\lt 1$$ Y, a modo de ejemplo, consideremos la siguiente $\displaystyle \sum_{k=1}^{\infty}\,\dfrac{1}{k\cdot 2^{k}}$. ¿Podríamos aprovechar este nuevo resultado para calcular su suma? Veamos que, en efecto, así es; para ello, hay que intentar reescribir el argumento del sumatorio perfilando el patrón del nuevo tipo de serie que ya sabemos sumar: $$\displaystyle \sum_{k=1}^{\infty} \,\dfrac{1}{k\cdot 2^{k}}= \sum_{k=1}^{\infty}\,\dfrac{1}{k} \cdot \left(\dfrac{1}{2}\right)^{k}= \sum_{k=1}^{\infty}\,\dfrac{\left(\dfrac{1}{2}\right)^{k}}{k} $$ que se asemeja perfectamente con el resultando (siendo en este caso $r=1/2$), con lo cual concluimos que $$\displaystyle \sum_{k=1}^{\infty} \,\dfrac{1}{k\cdot 2^{k}}=\ln\,\dfrac{1}{2}$$
-oOo-

Volviendo al desarrollo en serie de potencias, también podemos obtener un nuevo resultado para la suma infinita de otro nuevo tipo de series numéricas derivando respecto de la variable $x$ cada miembro de la igualdad $\displaystyle \sum_{i=0}^{\infty}\,x^i=\dfrac{1}{1-x}$ (que recordemos que és valida para $|x|\lt 1$): $$\displaystyle \dfrac{d}{dx}\left( \sum_{i=0}^{\infty}\,x^i\right) =\dfrac{d}{dx}\,\left(\dfrac{1}{1-x}\right)$$ con lo cual $$\displaystyle \sum_{i=0}^{\infty}\,i\,x^{i-1} =\dfrac{1}{(1-x)^2}$$ Y retornando ahora a las series numéricas, podemos reescribir lo anterior como un nuevo resultado muy útil para calcula la suma infita de un nuevo tipo de series. Cambiando $x$ por $r$ (recordando, eso sí, que $r$ ha de cumplir que $|r|\lt 1$): $$\displaystyle \sum_{i=0}^{\infty}\,i\cdot r^{i-1} \overset{\text{la contribución para}\,i=0\,\text{es nula}}{=}\sum_{i=1}^{\infty}\,i\cdot r^{i-1} = \dfrac{1}{(1-r)^2}$$ A modo de ejemplo, calculemos la siguiente suma infinita: $$\displaystyle \sum_{k=0}^{\infty}\,\dfrac{k+1}{3^k}$$ Esta serie se ajusta bien al tipo de serie que acabamos de tratar. En efecto, $$\displaystyle \sum_{k=0}^{\infty}\,\dfrac{k+1}{3^k} \overset{\ell:=k+1\,\text{con lo cual, cuando}\,k=0,\ell\,\text{toma el valor}\,1}{=}$$ $$=\displaystyle \sum_{\ell=1}^{\infty}\,\ell \cdot \left(\dfrac{1}{3}\right)^{\ell-1}\overset{$r=1/3$}{=}\dfrac{1}{\left(1-(1/3)\right)^2}=\dfrac{1}{(2/3)^2}=\dfrac{9}{4}$$ $\square$

El número e y su relación con las series de potencias

Sabemos que el desarrollo en serie de potencias por Taylor de la función $f(x)=e^x$ viene dado por $\displaystyle e^x=\sum_{i=0}^{\infty}\,\dfrac{x^i}{i!}$, para todo $x\in \mathbb{R}$; en particular, si hacemos que $x$ tome el valor $1$, tenderemos que $\displaystyle e=e^1=\sum_{i=0}^{\infty}\,\dfrac{1^i}{i!}=\sum_{i=0}^{\infty}\,\dfrac{1}{i!}=1/0!+1/1!+1/2!+1/3!+1/4!+\ldots=1+1+1/2!+1/3!+1/4!+\ldots$, esto es, podemos escribir $\displaystyle e=1+\sum_{i=1}^{\infty}\,\dfrac{1}{i!}$
Esto nos puede ayudar a sumar series parecidas; por ejemplo, $\displaystyle \sum_{i=3}^{\infty}\,\dfrac{1}{(i+2)!}\overset{j:=i+2\Rightarrow j=5\,\text{cuando}\,i=3}{=}\sum_{j=5}^{\infty}\,\dfrac{1}{j!}=\sum_{j=0}^{\infty}\,\dfrac{1}{j!}-\sum_{j=0}^{4}\,\dfrac{1}{j!}=e-\left(1/0!+1/1!+1/2!+1/3!+1/4!\right)=$
    $e-\dfrac{65}{24}$ $\square$

martes, 11 de enero de 2022

Suma de una serie aritmético-geométrica

En el artículo anterior hablaba de la suma de una serie geométrica en la que era necesario el uso de algunos pequeños artilugios algebraicos para arreglarla convenientemente; en éste, voy a exponer la técnica para calcular la suma de la serie aritmético-geométrica $\displaystyle \sum_{i=1}^{\infty}\,i\,r^i \quad \text{donde} \quad |r|\lt 1$, condición que debe cumplirse para garantizar que dicha serie converge, tal y como comprobaremos en el desarrollo.


El término geeral de las sumas parciales $$S_1=r$$ $$S_2=r+2r^2$$ $$S_3=r+2r^2+3r^3$$ $$\ldots$$ es $$\displaystyle S_n=r+2r^2+3^r3+4r^4+\ldots+(n-1)r^{n-1}+nr^n$$ multiplicando por $r$ en cada miembro de la igualda anterior nos queda $$\displaystyle rS_n=r^2+2r^3+3r^4+4r^5\ldots+(n-1)r^n+nr^{n+1}$$ y restando, miembro a miembro, la segunda igualdad a la primera llegamos a $$S_n-rS_n=r+r^2+r^3+\ldots+r^n-nr^{n+1}$$ esto es $$(1-r)\,S_{n}=\left(r+r^2+r^3+\ldots+r^n\right)-nr^{n+1}$$ donde la suma de términos entre paréntesis del segundo miembro corresponde a la de $n$ términos consecutivos de una sucesión geométrica de razón $r$ y de primer término $r$, luego, como ya sabemos, $r+r^2+r^3+\ldots+r^n=r\cdot \dfrac{r^{n}-1}{r-1}$ con lo cual, podemos escribir que $$(1-r)\,S_{n}=r\cdot \dfrac{r^{n}-1}{r-1}-nr^{n+1}$$ Ahora, para sumar los infinitos términos, tenemos que pasar al límite cuando $n\rightarrow \infty$ en los dos miembros de la igualdad, por lo tanto $$\displaystyle \lim_{n\rightarrow \infty}\left((1-r)\,S_{n}\right)=\lim_{n\rightarrow \infty}\left(r\cdot \dfrac{r^{n}-1}{r-1}-nr^{n+1}\right)$$ esto es $$\displaystyle (1-r)\,\lim_{n\rightarrow \infty}\,S_{n}=\lim_{n\rightarrow \infty}\left(r\cdot \dfrac{r^{n}-1}{r-1}\right)-\lim_{n\rightarrow \infty}\left(nr^{n+1}\right)$$ Así $$\displaystyle (1-r)\,\sum_{i=1}^{\infty}\,ir^i=r\cdot \dfrac{0-1}{r-1}-0=\dfrac{r}{1-r}$$ habida cuenta de que, el límite del segundo término del segundo miembro, $\displaystyle \lim_{n\rightarrow \infty}\left(nr^{n+1}\right)$, es igual a cero, pues si bien el primer factor $n$ tiende a infinito y $r^{n+1}$ tiende a cero (por ser $|r|\lt 1$), éste último lo hace más rápidamente de lo que crece el primero; por tanto, concluimos que $$\displaystyle \sum_{i=1}^{\infty}\,ir^i=\dfrac{r/(1-r)}{1-r}=\dfrac{r}{(1-r)^2}$$
-oOo-

Ejemplo
A modo de práctica, vamos a sumar la serie $$\displaystyle \sum_{i=0}^{\infty}\,\dfrac{5i+1}{2^i}$$ En primer lugar, podemos descomponerla como suma de una serie aritmético geométrica (más sencilla) y una série geométrica: $$\displaystyle \sum_{i=0}^{\infty}\,\dfrac{5i+1}{2^i}=\sum_{i=0}^{\infty}\,\dfrac{5i}{2^i}+\sum_{i=0}^{\infty}\,\dfrac{1}{2^i}=$$ $$\displaystyle=5\,\sum_{i=0}^{\infty}\,i\,\left(\dfrac{1}{2}\right)^i+\sum_{i=0}^{\infty}\,\left(\dfrac{1}{2}\right)^i=5\left(0+\,\sum_{i=1}^{\infty}\,i\,\left(\dfrac{1}{2}\right)^i\right)+\left(\left(\dfrac{1}{2}\right)^0+\sum_{i=1}^{\infty}\,\left(\dfrac{1}{2}\right)^i\right)$$ La razón $r$, de sendas series toma el valor $1/2$, luego las dos sumas convergen, y, aplicando lo que hemos visto arriba, concluimos: $$\displaystyle \sum_{i=0}^{\infty}\,\dfrac{5i+1}{2^i}=\left(0+5\,\dfrac{1/2}{(1-1/2)^2}\right)+\left(1+\dfrac{1}{2}\cdot \dfrac{1}{1-1/2}\right)=5\,\dfrac{1/2}{(1/2)^2}+\left(1+\dfrac{1}{2}\cdot 2\right)=5\cdot 2+2=12$$ $\square$

lunes, 10 de enero de 2022

Un ejercicio de suma de una serie geométrica convergente, con un paso intermedio interesante

En muchos problemas de cálculo de probabilidades en los que se trata de calcular la probabilidad de que gane uno y otro jugador en un juego con extracciones repetidas de bolas de una urna, o en el lanzamiento repetido de dados, aparece a menudo la necesidad de sumar series convergentes con infinitos términos al objeto de calcular probabilidades y esperanzas matemáticas. Tal es el caso de la resolución de la siguiente serie, que expongo simplemente a modo de ejemplo.


Nos proponemos calcular la suma de los infinitos términos de la siguiente sucesión geométrica convergente: $\displaystyle a_i=\left(\dfrac{2}{3}\right)^{i}\left(\dfrac{1}{3}\right)^{i-1},\quad i=1,2,3,\ldots$
Entonces,
$\displaystyle \sum_{i=1}^{\infty}\,\left(\dfrac{2}{3}\right)^{i}\left(\dfrac{1}{3}\right)^{i-1}=\dfrac{1}{1/3} \sum_{i=1}^{\infty}\,\left(\dfrac{2}{3}\right)^{i}\dfrac{1}{3}\left(\dfrac{1}{3}\right)^{i-1}=3\sum_{i=1}^{\infty}\,\left(\dfrac{2}{3}\right)^{i}\left(\dfrac{1}{3}\right)^{i}=3\sum_{i=1}^{\infty}\,\left(\dfrac{2}{3}\cdot \frac{1}{3}\right)^{i}=3\sum_{i=1}^{\infty}\,\left(\dfrac{2}{9}\right)^{i}$
    Observemos ahora que como la razón de la sucesión de los términos, $\dfrac{2}{9}$, es menor que $1$, esta serie geométrica infinita es convergente, y, al pasar al límte, la expresión de la suma de $n$ términos consecutivos de la misma, se obiene como resultado $\displaystyle 3\,\sum_{i=1}^{\infty}\,\left(\dfrac{2}{9}\right)^{i}=3\,\lim_{n\rightarrow\,\infty}\dfrac{\left(\dfrac{2}{9}\right)^{n}-1}{\dfrac{2}{9}-1}=3\cdot \dfrac{0-1}{\dfrac{2}{9}-1}=3\cdot \dfrac{1}{1-\dfrac{2}{9}}=3\cdot \dfrac{9}{9-2}=3\cdot \dfrac{9}{7}=\dfrac{27}{7}$
$\square$

Ejercicio de la suma convergente de una serie geométrica de infinitos términos

Deseamos resolver la siguiente suma infinita $\displaystyle \sum_{t=1}^{\infty}\,\left(\dfrac{k}{n}\right)^{t}\,(1-p)^{t-1}\,p$

Démonos cuenta de que se trata de una serie geométrica:
Si vamos dando los primeros valores consecutivos a $t$, nos encontramos que el primer sumando (haciendo $t:=1$) es $\dfrac{k}{n}p$; haciendo $t:=2$, vemos que el segundo sumando es $\left(\dfrac{k}{n}\right)^2\,(1-p)p=\dfrac{kp}{n}\,\dfrac{k(1-p)}{n}$; para $t:=3$, el tercer sumando es $\left(\dfrac{k}{n}\right)^3\,(1-p)^2\,p=\dfrac{kp}{n}\,\left(\dfrac{k(1-p)}{n}\right)^2$, y así sucesivamente, con lo cual inducimos que el $t$-ésimo sumando puede escribirse de la forma $\dfrac{kp}{n}\,\left(\dfrac{k(1-p)}{n}\right)^{t-1}$.

Entonces, aplicando la propiedad distributiva podemos extraer $\dfrac{kp}{n}$ como factor común de todos los sumandos $$\displaystyle \sum_{t=1}^{\infty}\,\left(\dfrac{k}{n}\right)^{t}\,(1-p)^{t-1}\,p=\sum_{t=1}^{\infty}\,\dfrac{kp}{n}\,\left(\dfrac{k}{n}\right)^{t-1}\,(1-p)^{t-1}=\dfrac{kp}{n}\,\sum_{t=1}^{\infty}\,\left(\dfrac{k}{n}\,(1-p)\right)^{t-1}$$ con lo cual nos damos cuenta claramente de que el segundo factor es la suma de los infinitos términos de una sucesión geométrica de primer término $a_1=1$ y cuya razón geométrica es $r=\dfrac{k(1-p)}{n}$. Y como sabemos que, si $r\prec 1$ (lo cual se cumple si $k\le n$), el resultado de la suma de una serie geométrica de infinitos términos genérica converge es igual a $S_{\infty}=\dfrac{a_1}{1-r}$ [recordemos que se llega fácilmente a eso pasando al límite la expresión genérica de la suma de los $t$ primeros términos, $S_t=a_1\,\dfrac{r^t-1}{r-1}$, cuando $t\rightarrow \infty$, siendo $r\prec 1$ (para lo cual es necesario, en nuestro caso, que $\dfrac{k(1-p)}{n}\prec 1$)], luego aplicándolo al caso que nos ocupa llegamos a: $$\displaystyle \sum_{t=1}^{\infty}\,\left(\dfrac{k}{n}\right)^{t}\,(1-p)^{t-1}\,p=\dfrac{kp}{n}\,\dfrac{1}{1-\dfrac{k(1-p)}{n}}=\dfrac{kp}{n-k(1-p)}$$ $\square$