jueves, 28 de agosto de 2025

Cálculo de la potencia n-ésima de una matriz cuadrada diagonalizable

Se pide que calculemos $A^{20}$, siendo $A=\begin{pmatrix}1&0&0\\0&1&1\\0&1&1\end{pmatrix}$

Método I:
Si calculamos las primeras potencias encontramos:

  1. $A^1$ puede expresarse de la forma $A^1=\begin{pmatrix}1&0&0\\0&2^0&2^0\\0&2^0&2^0\end{pmatrix}$
  2. $A^2=A\cdot A=\begin{pmatrix}1&0&0\\0&2^1&2^1\\0&2^1&2^1\end{pmatrix}$
  3. $A^3=A^2\cdot A=\begin{pmatrix}1&0&0\\0&2^2&2^2\\0&2^2&2^2\end{pmatrix}$
  4. $A^4=A^3\cdot A=\begin{pmatrix}1&0&0\\0&2^3&2^3\\0&2^3&2^3\end{pmatrix}$
  5. $A^5=A^4\cdot A=\begin{pmatrix}1&0&0\\0&2^4&2^4\\0&2^4&2^4\end{pmatrix}$
  6. $\ldots$
Luego, se induce claramente el siguiente resultado: $$A^n=\begin{pmatrix}1&0&0\\0&2^{n-1}&2^{n-1}\\0&2^{n-1}&2^{n-1}\end{pmatrix}$$ y, en consecuencia: $$A^{20}=\begin{pmatrix}1&0&0\\0&2^{19}&2^{19}\\0&2^{19}&2^{19}\end{pmatrix}=\begin{pmatrix}1&0&0\\0&524\,288&524\,288\\0&524\,288&524\,288 \end{pmatrix}$$

Método II:
Si, calculando la matriz canónica de $A$, ocurre que dicha matriz es diagonal, $D$, entonces sabemos que $A^n=P\,D^n\,P^{-1} \quad \quad (1)$, donde $P$ es la matriz del cambio de base y $$D^n=\begin{pmatrix}\lambda_{1}^{n}&0&0 \\ 0& \lambda_{2}^{n}&0\\ 0&0&\lambda_{3}^{n}\end{pmatrix}$$

Veamos pues si la matriz dada puede diagonalizarse:
Empecemos calculando los valores propios de $A$ y sus multiplicidades, $$\begin{vmatrix}1-\lambda&0&0\\0&1-\lambda &1\\0&1&1-\lambda\end{vmatrix}=0 $$ de donde nos encontramos con tres valores propios distintos (y por tanto con multiplicada igual a uno para cada uno de ellos): $\lambda_1=0$, $\lambda_2=1$ y $\lambda_3=2$, con lo cual la matriz sí es diagonalizable, siendo ésta $$D=\begin{pmatrix}0&0&0 \\ 0& 1&0\\ 0&0&2\end{pmatrix}$$ y por tanto $$D^{20}=\begin{pmatrix}0^{19}&0&0 \\ 0& 1^{19}&0\\ 0&0&2^{19}\end{pmatrix}=\begin{pmatrix}0&0&0 \\ 0& 1&0\\ 0&0&524\,288\end{pmatrix}\quad \quad (2)$$

Vamos a calcular ahora la matriz de paso de la base canónica (con respecto de la cual viene referida la matriz $A$) a la nueva base, con respecto de la cual la matriz del endomorfismo, $f:E\rightarrow E$, se expresa como la matriz diagonal que acabamos de encontrar.

Para ello debemos encontrar una base para cada uno de los subespacios propios, $E(0):=\text{ker}(f-0\,I)$, $E(1):=\text{ker}(f-1\,I)$ y $E(2):=\text{ker}(f-2\,I)$, cuya suma directa es el espacio total, $E=E_1(0)\bigoplus E_2(1) \bigoplus E_3(2)$

Entonces,para $E_1(0)$:
$$\left( \begin{pmatrix}1&0&0\\0&1&1\\0&1&1\end{pmatrix} - 0\,\begin{pmatrix}1&0&0\\0&1&0\\0&0&1\end{pmatrix} \right)\,\begin{pmatrix}x_1\\x_2\\x_3\end{pmatrix}=\begin{pmatrix}0\\0\\0\end{pmatrix}$$ es decir $$\begin{pmatrix}1&0&0\\0&1&1\\0&1&1\end{pmatrix} \,\begin{pmatrix}x_1\\x_2\\x_3\end{pmatrix}=\begin{pmatrix}0\\0\\0\end{pmatrix}\Rightarrow \left\{\begin{matrix}x_1=0\\ x_3=-x_2\end{matrix}\right.$$ por lo que,$E_1(0)=\{(0,x_2,-x_2)\,\forall x_2\in \mathbb{R}\}$ y, tomando (por ejemplo) $x_2=1$, una base válida para este subespacio es $\{(0,1,-1)\}$, luego $E_1(0)=\langle (0,1,-1)\rangle$

Para $E_2(1)$:
$$\left( \begin{pmatrix}1&0&0\\0&1&1\\0&1&1\end{pmatrix} - 1\,\begin{pmatrix}1&0&0\\0&1&0\\0&0&1\end{pmatrix} \right)\,\begin{pmatrix}x_1\\x_2\\x_3\end{pmatrix}=\begin{pmatrix}0\\0\\0\end{pmatrix}$$ es decir, $$\begin{pmatrix}0&0&0\\0&0&1\\0&1&0\end{pmatrix} \,\begin{pmatrix}x_1\\x_2\\x_3\end{pmatrix}=\begin{pmatrix}0\\0\\0\end{pmatrix}\Rightarrow \left\{\begin{matrix}x_3=x_2=0\end{matrix}\right.$$ por lo que,$E_2(1)=\{(x_1,0,0)\,\forall x_1\in \mathbb{R}\}$ y, tomando (por ejemplo) $x_1=1$, una base válida para este subespacio es $\{(1,0,0)\}$, luego $E_2(1)=\langle (1,0,0)\rangle$

Y para $E_2(2)$:
$$\left( \begin{pmatrix}1&0&0\\0&1&1\\0&1&1\end{pmatrix} -2\, \begin{pmatrix}1&0&0\\0&1&0\\0&0&1\end{pmatrix} \right)\,\begin{pmatrix}x_1\\x_2\\x_3\end{pmatrix}=\begin{pmatrix}0\\0\\0\end{pmatrix}$$ es decir, $$\begin{pmatrix}-1&0&0\\0&-1&1\\0&1&-1\end{pmatrix} \,\begin{pmatrix}x_1\\x_2\\x_3\end{pmatrix}=\begin{pmatrix}0\\0\\0\end{pmatrix}\Rightarrow \left\{\begin{matrix}x_1=0\\ x_3=x_2\end{matrix}\right.$$ por lo que,$E_2(2)=\{(0,x_2,x_2)\,\forall x_2\in \mathbb{R}\}$ y, tomando (por ejemplo) $x_2=1$, una base válida para este subespacio es $\{(0,1,1)\}$, luego $E_2(2)=\langle (0,1,1)\rangle$

Así pues, disponiendo las coordenadas de los vectores propios por columnas y por orden, la matriz del cambio de base es $$P=\begin{pmatrix}0&1&0\\ 1&0&1\\ -1&0&1\end{pmatrix}$$ y calculando su matriz inversa, encontramos $$P^{-1}=\begin{pmatrix}1&1/2&-1/2\\ 1&0&0\\ 0&1/2&1/2\end{pmatrix}$$

Luego, de acuerdo con $(1)$ y con el resultado $(2)$
$A^{20}=P\,D^{20}\,P^{-1}=\begin{pmatrix}0&1&0\\ 1&0&1\\ -1&0&1\end{pmatrix}\,\begin{pmatrix}0&0&0 \\ 0& 1&0\\ 0&0&524\,288\end{pmatrix}\,\begin{pmatrix}1&1/2&-1/2\\ 1&0&0\\ 0&1/2&1/2\end{pmatrix}=\begin{pmatrix}1&0&0\\0&524\,288&524\,288\\0&524\,288&524\,288 \end{pmatrix}$ (como era de esperar, según hemos visto empleando el método I). $\diamond$

miércoles, 27 de agosto de 2025

Geometría de una curva en el espacio. Ecuaciones de Frenet-Serret

Hemos dicho ya que en una curva en un plano de $\mathbb{R}^3$, en todo punto de la misma podemos hablar de un vector tangente $\vec{\sigma}$ (unitario) y de un vector ortogonal al mismo, $\vec{n}$, también unitario.

Estos dos vectores se encuentran ambos en el llamado plano osculador, y por tanto, $\vec{\sigma}\times \vec{n}=:\vec{b}$ es un vector ortogonal a ambos (y unitario) que determina la dirección de dicho plano, $\pi_{\text{osculador}}$. Este plano osculador es, por tanto, perpendicular (ortogonal) al plano que contiene a $\vec{\sigma}$ pero no a $\vec{n}$ y al que se le donomina plano normal, $\pi_{\text{normal}}$, y al plano que contiene a $\vec{n}$ pero no a $\vec{\sigma}$ al cual se le denomina plano binormal, $\pi_{\text{binormal}}$.

Así pues, en cada punto de la curva podemos situar un tres ejes formando un triedro trirectangulo de tal manera que si imaginamos un punto que recorra la curva, dicho triedro se va moviendo con él. La derivada vectoril de $\vec{b}$ con respecto al parámetro natural longitud de arco es por tanto, $$\dfrac{d\,\vec{b}}{ds}=\dfrac{d\,(\vec{\sigma} \times \vec{n})}{ds}=\vec{\sigma} \times \dfrac{d\,\vec{n}}{ds}+ \dfrac{d\,\vec{\sigma}}{ds} \times \vec{n} \quad (1)$$

Se ha visto ya que $\dfrac{d\,\vec{\sigma}}{ds}=\dfrac{1}{R(s)}\,\vec{n}$ (recordemos que $R(s)$ es el radio de curvatura y $\mathcal{K}(s)=\dfrac{1}{R(s)}$ la curvatura en cada punto, y como $\dfrac{d\,\vec{\sigma}}{ds} \times \vec{n}=\dfrac{1}{R(s)}\,\vec{n} \times \vec{n}=\vec{0}$, lo escrito en $(1)$ nos queda, $$\dfrac{d\,\vec{b}}{ds}=\vec{\sigma} \times \dfrac{d\,\vec{n}}{ds}+\vec{0}=\vec{\sigma} \times \dfrac{d\,\vec{n}}{ds}$$ donde, en cada punto, la cantidad escalar $\dfrac{1}{\mathcal{\tau}(s)}$, que representa el factor de proporcionalidad de un vector con respecto al otro, definimos $\mathcal{\tau}(s)$ como la torsión de la curva

Por otra parte, $\dfrac{d\,\vec{b}}{ds} \perp \vec{b}$ y $\dfrac{d\,\vec{b}}{ds} \perp \vec{\sigma}$, luego $\dfrac{d\,\vec{b}}{ds} \propto \vec{n}$, y por tanto podemos escribir que $$\dfrac{d\,\vec{b}}{ds}= \dfrac{1}{\tau(s)}\,\vec{n}$$ Entonces, $$\dfrac{1}{\tau(s)}\,\vec{n}=\sigma \times \dfrac{d\,\vec{n}}{ds}$$ por consiguiente $$\dfrac{1}{\tau(s)}\,\langle \vec{n}\,,\,\vec{n} \rangle=\langle \sigma \times \dfrac{d\,\vec{n}}{ds}\,,\,\vec{n} \rangle$$ y teniendo en cuenta que $\langle \vec{n}\,,\,\vec{n}\rangle=1$, se tiene que $$\dfrac{1}{\tau(s)}=\langle \vec{\sigma} \times \dfrac{d\,\vec{n}}{ds}\,,\,\vec{n} \rangle=\langle \vec{\sigma}\,,\, \dfrac{d\,\vec{n}}{ds}\times \vec{n} \rangle \rangle $$ Ahora bien, $\vec{n}=R(s)\,\dfrac{d^2\,\vec{r}}{ds^2}$, luego $\dfrac{d\vec{n}}{ds}=R(s)\,\dfrac{d^3\,\vec{r}}{ds^3}$ y $\vec{\sigma}=\dfrac{\vec{dr}}{ds}$ por lo que lo anterior puede escribirse de la forma $$\dfrac{1}{\tau(s)}=\langle \dfrac{\vec{dr}}{ds}\,,\, \dfrac{d\vec{n}}{ds}\rangle=\langle \dfrac{\vec{dr}}{ds}\,,\,R(s)\,\dfrac{d^3\,\vec{r}}{ds^3}\times R(s)\,\dfrac{d^2\,\vec{r}}{ds^2} \rangle=-R^2(s)\, \langle \dfrac{\vec{dr}}{ds}\,,\, \dfrac{d^2\,\vec{r}}{ds^2} \times \dfrac{d^3\vec{r}}{ds^3} \rangle$$ Y, recordando, por otra parte que $$\dfrac{1}{R(s)}=\left\|\dfrac{d^2\vec{r}}{ds^2}\right\| = \langle \dfrac{d^2\vec{r}}{ds^2}\,,\,\dfrac{ d^2\vec{r}}{ds^2} \rangle $$ y por tanto $$R(s)=\dfrac{1}{\left\|\dfrac{d^2\vec{r}}{ds^2}\right\|} = \dfrac{1}{\langle \dfrac{d^2\vec{r}}{ds^2}\,,\,\dfrac{ d^2\vec{r}}{ds^2} \rangle} $$ podemos escribir $$\dfrac{1}{\tau(s)}=-\dfrac{ \langle \dfrac{\vec{dr}}{ds}\,,\, \dfrac{d^2\,\vec{r}}{ds^2} \times \dfrac{d^3\vec{r}}{ds^3} \rangle}{\left(\langle \dfrac{d^2\vec{r}}{ds^2}\,,\,\dfrac{ d^2\vec{r}}{ds^2} \rangle\right)^2} \quad (2)$$

Para ir zanjando esta exposición, podemos decir que ya casi estamos en condiciones de escribir las fórmulas de Serret-Frenet que sintentizan lo que se ha descrito (la tercera es necesario acabar de justificarla):

  • $\dfrac{d\vec{\sigma}(s)}{ds}=\mathcal{K}(s)\,\vec{n}(s)$
  • $\dfrac{d\vec{b}(s)}{ds}=-\tau(s)\,\vec{n}(s)$
  • $\dfrac{d\vec{n}(s)}{ds}=-\mathcal{K}(s)\,\vec{\sigma}(s)+\tau(s)\,\vec{b}(s)$

-oOo-

Observación de interés físico:
Como ya he comentado que en otro artículo, en física, el parámetro usual es el tiempo, por lo que a menudo nos vemos en la necesidad de calcular la curvatura y el radio de curvatura a partir de la expresión de la curva en función del parámetro $t$ en lugar de $s$. Para ello, tengamos en cuenta que $$\dfrac{d\vec{r(s)}}{ds}=\dfrac{d\vec{r(s)}}{dt}\cdot \dfrac{dt}{ds}=\dfrac{d\vec{r(s)}}{dt}\cdot \dfrac{1}{\dfrac{ds}{dt}}$$ Por consiguiente, $$\dfrac{d^2\vec{r(s)}}{ds^2}=\dfrac{d}{ds}\,\left(\dfrac{d\vec{r(s)}}{dt}\right)\cdot \dfrac{1}{\dfrac{ds}{dt}}+\dfrac{d}{ds}\left( \dfrac{1}{\dfrac{ds}{dt}} \right) \cdot \dfrac{d\vec{r(s)}}{dt}$$ luego $$\dfrac{d^2\vec{r(s)}}{ds^2}=\dfrac{d}{ds}\,\left(\dfrac{d\vec{r(s)}}{dt}\right)\cdot \dfrac{1}{\dfrac{ds}{dt}}+(-1)\,\dfrac{\dfrac{d^2s}{dt^2}}{\left(\dfrac{ds}{dt}\right)^3}\cdot \dfrac{d\vec{r(s)}}{dt}$$ esto es $$\dfrac{d^2\vec{r(s)}}{ds^2}=\dfrac{\dfrac{d}{dt}\,\left(\dfrac{d\vec{r(s)}}{dt}\right)}{\dfrac{ds}{dt}} \cdot \dfrac{1}{\dfrac{ds}{dt}}+(-1)\,\dfrac{\dfrac{d^2s}{dt^2}}{\left(\dfrac{ds}{dt}\right)^3}\cdot \dfrac{d\vec{r(s)}}{dt}$$ con lo cual $$\dfrac{d^2\vec{r(s)}}{ds^2}=\dfrac{d^2\vec{r(s)}}{dt^2}\cdot \dfrac{1}{\left(\dfrac{ds}{dt}\right)^2}+(-1)\,\dfrac{\dfrac{d^2s}{dt^2}}{\left(\dfrac{ds}{dt}\right)^3}\cdot \dfrac{d\vec{r(s)}}{dt}$$

Recordemos también que $\vec{r(t)}=(x(t),y(t),y(t))$, por tanto $\dfrac{d\vec{r(t)}}{dt}=(\dot{x}(t),\dot{y}(t),\dot{z}(t))$ y $\dfrac{d^2\vec{r(t)}}{dt^2}=(\ddot{x}(t),\ddot{y}(t),\ddot{z}(t))$ con lo cual podemos escribir el resultado de la forma, $$\dfrac{d^2\vec{r(s)}}{ds^2}=(\ddot{x}(t),\ddot{y}(t),\ddot{z}(t))\cdot \dfrac{1}{\left(\dfrac{ds}{dt}\right)^2}+(-1)\,\dfrac{\dfrac{d^2s}{dt^2}}{\left(\dfrac{ds}{dt}\right)^3}\cdot (\dot{x}(t),\dot{y}(t),\dot{z}(t))$$

Recordemos también que $\mathcal{K}(t)=\dfrac{1}{R(t)}=\dfrac{\left\| \dfrac{d\vec{r}(t)}{dt}\times \dfrac{d^2\vec{r}(t)}{dt}\right\|}{\left( \left\| \dfrac{d\vec{r}(t)}{dt}\right\|\right)^3}$

Así pues, la expresión $(2)$ (torsión de la curva en cada punto de la misma) podemos escribirla en términos del parámetro de evolución temporal $t$ de un punto que siga el recorrido de la curva como: $$\dfrac{1}{\tau(t)}=-\dfrac{ \langle \dfrac{d\vec{r}(t)}{dt}\,,\, \dfrac{d^2\,\vec{r}(t)}{dt^2} \times \dfrac{d^3\vec{r}(t)}{dt^3} \rangle}{\left(\left\|\dfrac{d\vec{r}(t)}{dt} \times \,\dfrac{ d^2\vec{r}(t)}{dt^2} \right\|\right)^2} \quad (2')$$

-oOo-

Fórmulas de Serret-Frenet:

  • $\dfrac{d\vec{\sigma}(s)}{ds}=\mathcal{K}(s)\,\vec{n}(s)$
  • $\dfrac{d\vec{b}(s)}{ds}=-\tau(s)\,\vec{n}(s)$
  • $\dfrac{d\vec{n}(s)}{ds}=-\mathcal{K}(s)\,\vec{\sigma}(s)+\tau(s)\,\vec{b}(s)$

$\diamond$

jueves, 21 de agosto de 2025

Acerca del movimiento circular no uniforme en un plano

Consideremos un movimiento circular no uniforme en el plano $Oxy$, de radio $R$, $\vec{r}(t)=R\,\cos(t)\,\hat{i}+R\,\sin(t)\,\hat{j}$, en cada punto de la trayectoria el vector velocidad viende dado por $\dfrac{d\vec{r}(t)}{dt}=\dfrac{d\vec{r}}{ds}\cdot \dfrac{ds}{dt}=\vec{\sigma}\, c_\sigma$, donde $s$ es el parámetro natural longitud de arco y, por tanto, $c_\sigma=\dfrac{ds}{dt}$ es la celeridad a lo largo de la trayectoria circular (módulo del vector velocidad); por otra parte, recordemos que $\vec{\sigma}$ -véase el artículo en el que hablaba de ello- es el vector unitario en la dirección de la recta tangente a la circunferencia en cada punto de la misma.

Entonces, es bien sabido que el vector aceleración en cada punto de la trayectoria viene dada por la derivada del vector velocidad, esto es $\dfrac{d}{dt}\,(c_\sigma\,\vec{\sigma})=\dfrac{dc_\sigma}{dt}\,\vec{\sigma}+c_\sigma\dfrac{d\vec{\sigma}}{dt}=a_\sigma\,\vec{\sigma}+c\,\dfrac{d\vec{\sigma}}{ds}\,\dfrac{ds}{dt}=a_\sigma\,\vec{\sigma}+\dfrac{c^2}{R}\,\vec{n}$, ya que $\dfrac{d{\vec{\sigma}}}{ds}=\dfrac{1}{R}\,\vec{n}$ donde $\vec{n}$ recordemos que es el vector normal unitario (en la dirección perpendicular al vector tangente). Así pues, el vector aceleración se descompone en como suma ortogonal de un vector aceleración tangente a la trayectoria (cuyo módulo es $a_\sigma$) y un vector aceleración normal a la trayectoria (cuyo módulo es $\dfrac{c^2}{R}$). La curvatura, $\mathcal{K}=\dfrac{1}{R}$ es en este caso también constante, pues, de alguna manera, la partícula en movimiento no puede salirse del camino circular. $\diamond$

Curvatura, radio de curvatura y aceleración (normal) en el caso de un movimiento circular uniforme en el plano $Oxy$

En un movimiento circular de radio $R$, $\vec{r}(t)=R\,\cos(t)\,\hat{i}+R\,\sin(t)\,\hat{j}$, a velocidad tangencial constante, en cada punto de la trayectoria el vector velocidad viende dado por $\dfrac{d\vec{r}(t)}{dt}=\dfrac{d\vec{r}}{ds}\cdot \dfrac{ds}{dt}=\vec{\sigma}\, c$, donde $s$ es el parámetro natural longitud de arco y, por tanto, $c=\dfrac{ds}{dt}$ es la celeridad a lo largo de la trayectoria circular (módulo del vector velocidad), que, de acuerdo con el planteamiento, es constante; por otra parte, recordemos que $\vec{\sigma}$ -véase el artículo anterior- es el vector unitario en la dirección de la recta tangente a la circunferencia en cada punto de la misma.

Entonces, es bien sabido que la aceleración en cada punto de la trayectoria viene dada por la derivada del vector velocidad, esto es $\dfrac{d}{dt}\,(c\,\vec{\sigma})=\dfrac{dc}{dt}\,\vec{\sigma}+c\dfrac{d\vec{\sigma}}{dt}=0+c\,\dfrac{d\vec{\sigma}}{ds}\,\dfrac{ds}{dt}=\dfrac{c^2}{R}\,\vec{n}$, ya que $\dfrac{d{\vec{\sigma}}}{ds}=\dfrac{1}{R}\,\vec{n}$ donde $\vec{n}$ recordemos que es el vector normal unitario (en la dirección perpendicular al vector tangente). Así pues, el vector aceleración es normal a la trayectoria y su módulo es $\dfrac{c^2}{R}$. Es claro que en esta situación que, en cuanto a la curvatura, $\mathcal{K}=\dfrac{1}{R}$ es constante, por ser el constante el radio de curvatura. $\diamond$

miércoles, 20 de agosto de 2025

Curvatura y radio de curvatura en cada punto de una curva de $\mathbb{R}^3$

Consideremos una curva $\mathcal{C}$ en $\mathbb{R}^3$ en la que expresamos la posición de los puntos de la misma en función de un parámetro natural como es la longitud de arco $s$ -en física, el parámetro natural suele ser el tiempo-; $\vec{r(s)}=x(s)\,\hat{i}+y(s)\,\hat{j}+z(s)\,\hat{k}$ apunta pues a un punto genérico de la curva. Vamos a ver cómo expresar la curvatura y la torsión en un punto dado de dicha curva.

Manejaremos para ello las derivadas vectoriales $\dfrac{d\vec{r(s)}}{ds}=:\vec{\sigma}$ (vector tangente a la curva en el punto dado) y $\dfrac{d(\vec{\sigma(s)})}{ds}=\dfrac{d^2(\vec{r(s))}}{ds^2}$, y la necesidad de ello se verá enseguida.

Es claro que el vector $\dfrac{d(\vec{\sigma(s)})}{ds} \perp \vec{\sigma(s)}$ (vector tangente a la curva en el punto a considerar), por lo que esta segunda derivada de $\vec{r(s)}$, la entendemos como un vector proporcional al vector unitario normal a la curva en el punto dado, $\vec{n}$, y por tanto podemos escribir, $$\dfrac{d\vec{\sigma(s)}}{ds}=\mathcal{K(s)}\,\vec{n}$$ siendo por tanto $\mathcal{K(s)}=\left\|\dfrac{d\vec{\sigma(s)}}{ds}\right\|=\left\|\dfrac{d^2\vec{r(s)}}{ds^2}\right\| \quad (1)$

Es evidente que el ángulo formado entre los vectores de posición de dos puntos próximos $P$ y $P'$, $\Delta\,\varphi:=\measuredangle(\vec{r(s)}\,,\,\vec{r(s+\Delta\,s)})$ tiene que ver con lo que acabamos de escribir, y entenderemos por tanto como curvatura de la curva en el punto $P$ a la cantidad $$\displaystyle \mathcal{K}(s):=\lim_{\Delta\,s}\,\left| \dfrac{\Delta\,\varphi}{ds} \right|$$ y definimos el radio de curvatura como $$R(s):=\dfrac{1}{\mathcal{K}(s)}=\dfrac{1}{\left\|\dfrac{d^2\vec{r(s)}}{ds^2}\right\|}$$

Pues bien, de acuerdo con $(1)$, $$\mathcal{K}(s)=\sqrt{\left(\dfrac{d^2(x(s)) }{ds^2}\right)^2+\left(\dfrac{d^2(y(s)) }{ds^2}\right)^2+\left(\dfrac{d^2(z(s)) }{ds^2}\right)^2}$$ y por tanto $$R(s)=\dfrac{1}{\sqrt{\left(\dfrac{d^2(x(s)) }{ds^2}\right)^2+\left(\dfrac{d^2(y(s)) }{ds^2}\right)^2+\left(\dfrac{d^2(z(s)) }{ds^2}\right)^2}}$$ Nota:
En muchos cálculos suele aparecer también el cuadrado de la curvatura y el cuadrado del radio de curvatura, $$(\mathcal{K(s)})^2=\dfrac{1}{(R(s))^2}=\left(\dfrac{d^2(x(s)) }{ds^2}\right)^2+\left(\dfrac{d^2(y(s)) }{ds^2}\right)^2+\left(\dfrac{d^2(z(s)) }{ds^2}\right)^2$$ y $$ (R(s))^2=\dfrac{1}{\left(\dfrac{d^2(x(s)) }{ds^2}\right)^2+\left(\dfrac{d^2(y(s)) }{ds^2}\right)^2+\left(\dfrac{d^2(z(s)) }{ds^2}\right)^2}$$

-oOo-

Ya se ha comentado que en física, el parámetro usual es el tiempo, por lo que a menudo nos vemos en la necesidad de calcular la curvatura y el radio de curvatura a partir de la expresión de la curva en función del parámetro $t$ en lugar de $s$. Para ello, tengamos en cuenta que $$\dfrac{d\vec{r(s)}}{ds}=\dfrac{d\vec{r(s)}}{dt}\cdot \dfrac{dt}{ds}=\dfrac{d\vec{r(s)}}{dt}\cdot \dfrac{1}{\dfrac{ds}{dt}}$$ Por consiguiente, $$\dfrac{d^2\vec{r(s)}}{ds^2}=\dfrac{d}{ds}\,\left(\dfrac{d\vec{r(s)}}{dt}\right)\cdot \dfrac{1}{\dfrac{ds}{dt}}+\dfrac{d}{ds}\left( \dfrac{1}{\dfrac{ds}{dt}} \right) \cdot \dfrac{d\vec{r(s)}}{dt}$$ luego $$\dfrac{d^2\vec{r(s)}}{ds^2}=\dfrac{d}{ds}\,\left(\dfrac{d\vec{r(s)}}{dt}\right)\cdot \dfrac{1}{\dfrac{ds}{dt}}+(-1)\,\dfrac{\dfrac{d^2s}{dt^2}}{\left(\dfrac{ds}{dt}\right)^3}\cdot \dfrac{d\vec{r(s)}}{dt}$$ esto es $$\dfrac{d^2\vec{r(s)}}{ds^2}=\dfrac{\dfrac{d}{dt}\,\left(\dfrac{d\vec{r(s)}}{dt}\right)}{\dfrac{ds}{dt}} \cdot \dfrac{1}{\dfrac{ds}{dt}}+(-1)\,\dfrac{\dfrac{d^2s}{dt^2}}{\left(\dfrac{ds}{dt}\right)^3}\cdot \dfrac{d\vec{r(s)}}{dt}$$ con lo cual $$\dfrac{d^2\vec{r(s)}}{ds^2}=\dfrac{d^2\vec{r(s)}}{dt^2}\cdot \dfrac{1}{\left(\dfrac{ds}{dt}\right)^2}+(-1)\,\dfrac{\dfrac{d^2s}{dt^2}}{\left(\dfrac{ds}{dt}\right)^3}\cdot \dfrac{d\vec{r(s)}}{dt}$$

Recordemos que $\vec{r(t)}=(x(t),y(t),y(t))$, por tanto $\dfrac{d\vec{r(t)}}{dt}=(\dot{x}(t),\dot{y}(t),\dot{z}(t))$ y $\dfrac{d^2\vec{r(t)}}{dt^2}=(\ddot{x}(t),\ddot{y}(t),\ddot{z}(t))$ con lo cual podemos escribir el resultado de la forma, $$\dfrac{d^2\vec{r(s)}}{ds^2}=(\ddot{x}(t),\ddot{y}(t),\ddot{z}(t))\cdot \dfrac{1}{\left(\dfrac{ds}{dt}\right)^2}+(-1)\,\dfrac{\dfrac{d^2s}{dt^2}}{\left(\dfrac{ds}{dt}\right)^3}\cdot (\dot{x}(t),\dot{y}(t),\dot{z}(t))$$

De todo ello se acaba de deducir que $\mathcal{K}(t)=\dfrac{1}{R(t)}=\dfrac{\left\| \dfrac{d\vec{r}}{dt}\times \dfrac{d^2\vec{r}}{dt}\right\|}{\left( \left\| \dfrac{d\vec{r}}{dt}\right\|\right)^3}$ o si se prefiere utilizar la notación punto para la derivada vectorial, por comodidad: $\mathcal{K}(t)=\dfrac{1}{R(t)}=\dfrac{\left\| \dot{\vec{r}}(t) \times \ddot{\vec{r}}(t) \right\|}{\left( \left\| \dot{\vec{r}}(t) \right\| \right)^3}$

En particular, para curvas planas (en el plano $Oxy$) se tiene que $$\mathcal{K}=\dfrac{1}{R}=\dfrac{\left( (\dot{x})^2+(\dot{y})^2 \right)^\frac{3}{2}}{|\dot{x}\,\ddot{y}-\dot{y}\,\ddot{x}|}$$ y en el caso de que la curva venga expresada en forma explícita, $y=f(x)$, es fácil ver que $$\mathcal{K}=\dfrac{1}{R}=\dfrac{\left( 1+\left(\dfrac{f(x)}{dx}\right)^2\right)^\frac{3}{2}}{\left|\dfrac{d^2\,f(x)}{dx^2}\right|}$$ Nota: Recordemos que $\mathcal{K}$ se denomina curvatura y $R(t)$ radio de curvatura

$\diamond$

Ecuaciones de la recta tangente a una curva de $\mathbb{R}^3$ en un punto $P$ y del plano perpendicular a la misma, dada dicha curva como la intersección de dos superficies

Consideremos una curva $\mathcal{C}$ en $\mathbb{R}^3$ que viene dada por la intersección de dos superficies $F_1(x,y,z)=0$ y $F_2(x,y,z)=0$. A partir de estas ecuaciones, que se suponen dadas, voy a determinar la ecuación de la rectan tangente a dicha curva y también la el plano perpendicular (normal) a la misma en un punto $P$ de dicha curva.

Escribiendo la diferencial de $(1)$ y de $(2)$, $$\left\{\begin{matrix} \dfrac{\partial\,F_1}{\partial\,x}\cdot \dot{x}(t)+\dfrac{\partial\,F_1}{\partial\,y}\cdot \dot{y}(t)+\dfrac{\partial\,F_1}{\partial\,z}\cdot \dot{z}(t)=0 \\ \dfrac{\partial\,F_2}{\partial\,x}\cdot \dot{x}(t)+\dfrac{\partial\,F_2}{\partial\,y}\cdot \dot{y}(t)+\dfrac{\partial\,F_2}{\partial\,z}\cdot \dot{z}(t)=0 \end{matrix}\right.$$ que podemos escribir de la forma, $$\left\{\begin{matrix} \dfrac{\partial\,F_1}{\partial\,x}\cdot \dot{x}(t)=-\dfrac{\partial\,F_1}{\partial\,y}\cdot \dot{y}(t)-\dfrac{\partial\,F_1}{\partial\,z}\cdot \dot{z}(t) \\ \dfrac{\partial\,F_2}{\partial\,x}\cdot \dot{x}(t)=-\dfrac{\partial\,F_2}{\partial\,y}\cdot \dot{y}(t)-\dfrac{\partial\,F_2}{\partial\,z}\cdot \dot{z}(t) \end{matrix}\right.$$ y expresado en forma matricial se puede escribir de la forma $$\begin{pmatrix}\dfrac{\partial\,F_1}{\partial\,y} & \dfrac{\partial\,F_1}{\partial\,z} \\ \dfrac{\partial\,F_2}{\partial\,y} & \dfrac{\partial\,F_2}{\partial\,z} \end{pmatrix}\,\begin{pmatrix}\dot{y}(t)\\\dot{z}(t)\end{pmatrix}=-\dot{x}(t)\,\begin{pmatrix}\dfrac{\partial\,F_1}{\partial\,x} \\ \dfrac{\partial\,F_2}{\partial\,x}\end{pmatrix}$$ Entonces, $$\dot{y}(t)=-\dot{x}(t)\cdot\dfrac{\begin{vmatrix}\dfrac{\partial\,F_1}{\partial\,x} & \dfrac{\partial\,F_1}{\partial\,z} \\ \dfrac{\partial\,F_2}{\partial\,x} & \dfrac{\partial\,F_2}{\partial\,z}\end{vmatrix}}{\begin{vmatrix}\dfrac{\partial\,F_1}{\partial\,y} & \dfrac{\partial\,F_1}{\partial\,z} \\ \dfrac{\partial\,F_2}{\partial\,y} & \dfrac{\partial\,F_2}{\partial\,z}\end{vmatrix}}$$ y $$\dot{z}(t)=-\dot{x}(t)\cdot\dfrac{\begin{vmatrix}\dfrac{\partial\,F_1}{\partial\,y} & \dfrac{\partial\,F_1}{\partial\,x} \\ \dfrac{\partial\,F_2}{\partial\,y} & \dfrac{\partial\,F_2}{\partial\,x}\end{vmatrix}}{\begin{vmatrix}\dfrac{\partial\,F_1}{\partial\,y} & \dfrac{\partial\,F_1}{\partial\,z} \\ \dfrac{\partial\,F_2}{\partial\,y} & \dfrac{\partial\,F_2}{\partial\,z}\end{vmatrix}}$$ y siendo un vector tangente a un punto genérico de la recta, $$\vec{v(t)}:=(\dot{x}(t),\dot{y}(t),\dot{z(t)})$$ lo podemos escribir como $$\vec{v(t)}=\left(\dot{x}(t)\,,\,-\dot{x}(t)\cdot \dfrac{\begin{vmatrix}\dfrac{\partial\,F_1}{\partial\,x} & \dfrac{\partial\,F_1}{\partial\,z} \\ \dfrac{\partial\,F_2}{\partial\,x} & \dfrac{\partial\,F_2}{\partial\,z}\end{vmatrix}}{\begin{vmatrix}\dfrac{\partial\,F_1}{\partial\,y} & \dfrac{\partial\,F_1}{\partial\,z} \\ \dfrac{\partial\,F_2}{\partial\,y} & \dfrac{\partial\,F_2}{\partial\,z}\end{vmatrix}} \,,\, -\dot{x}(t)\cdot\dfrac{\begin{vmatrix}\dfrac{\partial\,F_1}{\partial\,y} & \dfrac{\partial\,F_1}{\partial\,x} \\ \dfrac{\partial\,F_2}{\partial\,y} & \dfrac{\partial\,F_2}{\partial\,x}\end{vmatrix}}{\begin{vmatrix}\dfrac{\partial\,F_1}{\partial\,y} & \dfrac{\partial\,F_1}{\partial\,z} \\ \dfrac{\partial\,F_2}{\partial\,y} & \dfrac{\partial\,F_2}{\partial\,z}\end{vmatrix}} \right)$$ es decir, $$\vec{v(t)}=\dot{x}(t) \left(1\,,\, -\dfrac{\begin{vmatrix}\dfrac{\partial\,F_1}{\partial\,x} & \dfrac{\partial\,F_1}{\partial\,z} \\ \dfrac{\partial\,F_2}{\partial\,x} & \dfrac{\partial\,F_2}{\partial\,z}\end{vmatrix}}{\begin{vmatrix}\dfrac{\partial\,F_1}{\partial\,y} & \dfrac{\partial\,F_1}{\partial\,z} \\ \dfrac{\partial\,F_2}{\partial\,y} & \dfrac{\partial\,F_2}{\partial\,z}\end{vmatrix}} \,,\, -\dfrac{\begin{vmatrix}\dfrac{\partial\,F_1}{\partial\,y} & \dfrac{\partial\,F_1}{\partial\,x} \\ \dfrac{\partial\,F_2}{\partial\,y} & \dfrac{\partial\,F_2}{\partial\,x}\end{vmatrix}}{\begin{vmatrix}\dfrac{\partial\,F_1}{\partial\,y} & \dfrac{\partial\,F_1}{\partial\,z} \\ \dfrac{\partial\,F_2}{\partial\,y} & \dfrac{\partial\,F_2}{\partial\,z}\end{vmatrix}} \right)$$ y que es proporcional a $$\dot{x}(t) \cdot \left( \begin{vmatrix}\dfrac{\partial\,F_1}{\partial\,y} & \dfrac{\partial\,F_1}{\partial\,z} \\ \dfrac{\partial\,F_2}{\partial\,y} & \dfrac{\partial\,F_2}{\partial\,z}\end{vmatrix} \,,\, -\begin{vmatrix}\dfrac{\partial\,F_1}{\partial\,x} & \dfrac{\partial\,F_1}{\partial\,z} \\ \dfrac{\partial\,F_2}{\partial\,x} & \dfrac{\partial\,F_2}{\partial\,z}\end{vmatrix} \,,\, -\begin{vmatrix}\dfrac{\partial\,F_1}{\partial\,y} & \dfrac{\partial\,F_1}{\partial\,x} \\ \dfrac{\partial\,F_2}{\partial\,y} & \dfrac{\partial\,F_2}{\partial\,x}\end{vmatrix} \right)$$ y por tanto, también a $$ \left( \begin{vmatrix}\dfrac{\partial\,F_1}{\partial\,y} & \dfrac{\partial\,F_1}{\partial\,z} \\ \dfrac{\partial\,F_2}{\partial\,y} & \dfrac{\partial\,F_2}{\partial\,z}\end{vmatrix} \,,\, -\begin{vmatrix}\dfrac{\partial\,F_1}{\partial\,x} & \dfrac{\partial\,F_1}{\partial\,z} \\ \dfrac{\partial\,F_2}{\partial\,x} & \dfrac{\partial\,F_2}{\partial\,z}\end{vmatrix} \,,\, -\begin{vmatrix}\dfrac{\partial\,F_1}{\partial\,y} & \dfrac{\partial\,F_1}{\partial\,x} \\ \dfrac{\partial\,F_2}{\partial\,y} & \dfrac{\partial\,F_2}{\partial\,x}\end{vmatrix} \right)$$

Así pues, la ecuación de la recta tangente en forma continua en un punto $P$ de la curva $\mathcal{C}$ queda de la forma: $$\dfrac{x-x_P}{\begin{vmatrix}\dfrac{\partial\,F_1}{\partial\,y} & \dfrac{\partial\,F_1}{\partial\,z} \\ \dfrac{\partial\,F_2}{\partial\,y} & \dfrac{\partial\,F_2}{\partial\,z}\end{vmatrix}} = \dfrac{y-y_P}{ -\begin{vmatrix}\dfrac{\partial\,F_1}{\partial\,x} & \dfrac{\partial\,F_1}{\partial\,z} \\ \dfrac{\partial\,F_2}{\partial\,x} & \dfrac{\partial\,F_2}{\partial\,z}\end{vmatrix} } = \dfrac{z-z_P}{-\begin{vmatrix}\dfrac{\partial\,F_1}{\partial\,y} & \dfrac{\partial\,F_1}{\partial\,x} \\ \dfrac{\partial\,F_2}{\partial\,y} & \dfrac{\partial\,F_2}{\partial\,x}\end{vmatrix}} $$

Por consiguiente, la ecuación del plano perpendicular (normal) a la recta tangente en el punto $P$ de la curva $\mathcal{C}$ tendrá por ecuación, $$\pi_\perp:\begin{vmatrix}\dfrac{\partial\,F_1}{\partial\,y} & \dfrac{\partial\,F_1}{\partial\,z} \\ \dfrac{\partial\,F_2}{\partial\,y} & \dfrac{\partial\,F_2}{\partial\,z}\end{vmatrix}\cdot (x-x_P) -\begin{vmatrix}\dfrac{\partial\,F_1}{\partial\,x} & \dfrac{\partial\,F_1}{\partial\,z} \\ \dfrac{\partial\,F_2}{\partial\,x} & \dfrac{\partial\,F_2}{\partial\,z}\end{vmatrix}\cdot (y-y_P) -\begin{vmatrix}\dfrac{\partial\,F_1}{\partial\,y} & \dfrac{\partial\,F_1}{\partial\,x} \\ \dfrac{\partial\,F_2}{\partial\,y} & \dfrac{\partial\,F_2}{\partial\,x}\end{vmatrix}\cdot (z-z_P)=0 $$ $\diamond$

Recta tangente y plano perpendicular a dicha recta en un punto de una curva en $\mathbb{R}^3$, dada ésta en forma vectorial y en función del parámetro de evolución de un punto sobre la misma

La ecuación de una curva en el espacio $\mathbb{R}^3$ puede escribirse de manera vectorial, mediante el vector de posición en cada punto de la curva. Las coordenadas de dicho vector se expresan en función del parámetro de evolución de un punto sobre la curva; en física, éste suele ser el tiempo $t$. Así, se tiene que $$\mathcal{C}:\vec{r(t)}=x(t)\,\hat{i}+y(t)\,\hat{j}+z(t)\,\hat{k}$$ La derivada vectorial de dicho vector de posición respresenta el vector tangente en cada punto de la curva $P$: $$\text{v.t.}:\vec{v(t_P)}:=\left(\dfrac{d\vec{r(t)}}{dt}\right)_P=\dot{x}(t)|_{t=t_P}\hat{i}+\dot{y}(t)|_{t=t_P}\hat{j}+\dot{z}(t)|_{t=t_P}\hat{k}$$ y, en particular, representando el parámetro $t$ el tiempo, dicho vector tangente no es otro que el vector velocidad en cada punto de la curva.

La ecuación de la recta tangente en cada punto de la curva es por tanto $$\text{r.t. en P}:\dfrac{x-x_P}{ \dot{x}(t)|_{t=t_P} }=\dfrac{y-y_P}{ \dot{y}(t)|_{t=t_P} }=\dfrac{z-z_P}{ \dot{z}(t)|_{t=t_P} }$$ Dicha recta tangente tiene que ser perpendicular -en cada punto $P$ de la curva- a un plano (plano normal al vector tangente) cuya ecuación vendra dada por $$\pi_\perp:\dot{x}(t)|_{t=t_P}\cdot(x-x_P)+\dot{y}(t)|_{t=t_P}\cdot(y-y_P)+\dot{z}(t)|_{t=t_P}\cdot(z-z_P)=0$$

Ejemplo:
Consideremos la circunferencia de radio unidad contenida en el plano $Oxy$, $\mathcal{C}:\vec{r(t)}=\cos(t)\,\hat{i}+\sin(t)\,\hat{j}+0\,\hat{k}$. Entonces el vector velocidad (vector tangente) en cada punto de dicha circunferencia es $\mathcal{C}:\vec{v(t)}=-\sin(t)\,\hat{i}+\cos(t)\,\hat{j}+0\,\hat{k}$, luego la ecuación de la recta tangente, pongamos que en el $P(1,0,0)$ que corresponda al valor $t=0$ vendrá dada por $\text{r.t.}:\dfrac{x-1}{-\sin(0)}=\dfrac{y-0}{\cos(0)}=\dfrac{z-0}{0}$, ecuación que expresada en forma cartesiana es $\text{r.t}:x=1$. Y, por otra parte, la ecuación del plano perpendicular a la misma es $\pi_\perp:-\sin(0)\cdot (x-1)+\cos(0)\cdot (y-0)+0=0$, esto es, $\pi_\perp:y=0$, y que, dicho de otra manera, es el plano $Oxz$. $\diamond$

lunes, 18 de agosto de 2025

Plano tangente a una superficie en un punto dado

La euación del plano tangente a una superficie $F(x,y,z)=0$ en un punto de la misma $P(x_P,y_P,z_P)$ viene dada por $$\left(\dfrac{\partial\,F}{\partial\,x}\right)_P\,(x-x_P)+\left(\dfrac{\partial\,F}{\partial\,y}\right)_P\,(y-y_P)+\left(\dfrac{\partial\,F}{\partial\,z}\right)_P\,(z-z_P)=0$$

Ejemplo:
Consideremos la superficie de la esfera $\mathcal{E}:x^2+y^2+z^2=1$, entonces la ecuación del plano tangente en el punto $\pi_t:P(0,0,1)$ es $$(2x)_P\cdot (x-x_p)+(2y)_P\cdot (y-y_P)+(2z)_P\cdot (z-z_P)=0$$ que, con las coordenadas del punto $P$ queda $$\pi_t:(2\cdot 0)\cdot (x-0)+(2\cdot 0)\cdot (y-0)+(2\cdot 1)\cdot (z-1)=0$$ $$\pi_t:2\cdot (z-1)=0$$ esto es, $$\pi_t:z=1$$ que representa el plano paralelo al plano $Oxy$ en el polo norte de la esfera de radio unidad $\diamond$

viernes, 15 de agosto de 2025

Análisis del rango de una matriz cuyos elementos dependen de un parámetro, por el método de reducción

Me propongo analizar el rango de la siguiente matriz según los valores que tome el parámetro $a \in \mathbb{R}$ $$A=\begin{pmatrix}1&a&-1\\2&-1&a\\1&10&-6\end{pmatrix}$$

Reduciendo de manera escalonada la matriz llegamos a la siguiente matriz equivalente en rango: $$\begin{pmatrix}1&a&-1\\0&-2a-1&2+a\\0&0&\dfrac{(a+5)(a-3)}{2a+1}\end{pmatrix} \underset{\sim}{(2a+1)\cdot f_3\rightarrow f_3} \begin{pmatrix}1&a&-1\\0&-2a-1&2+a\\0&0&(a+5)(a-3)\end{pmatrix}$$

---

Operaciones que he realizado entre filas:

  • Primera etapa:
    • $-2f_1+f_2\rightarrow f_2$
    • $f_1-f_3\rightarrow f_3$
  • Segunda y última etapa:
    • $f_2\cdot \dfrac{a-10}{2a+1}+f_3\rightarrow f_3$; $(2a+1)\,f_3\rightarrow f_3$
---

Puede suceder que:

  1. Atendiendo a los posibles valores del numerador del elemento de la tercera fila y de la tercera columna, vemos que éste se anula si $a$ es $-5$ o bien es $3$, por lo que la tercera fila sería identicamente nula para dichos valores del parámetro; y, para esos mismos valores, sin embargo, no serían nulos los elementos de la segunda fila, luego el número de filas no indenticamente nulas sería $2$ en este supuesto, con lo cual el rango de la matriz sería $2$.
  2. En cualquier otro caso, ninguno de los elementos que dependen del parámetro $a$ se anulará (tanto el de la tercera fila, como los de la segunda), con lo cual el número de filas no identicamente nulas sería $3$, luego el rango de la matriz sería $3$

$\diamond$

Análisis y resolución de un sistema de ecuaciones lineales con coeficientes complejos mediante reducción

Vamos a analizar, y -si procede- resolver el siguiente sistema de ecuaciones lineales con coeficientes en el cuerpo de los números complejos: $$\left\{\begin{matrix}x-i\,y&=&2 \\ y+i\,z&=&1+2\,i\\x+y&=&1+i\end{matrix}\right.$$

La matriz de los ecoeficientes es $$A=\begin{pmatrix}1&-i&0\\0&1&i\\1&1&0\end{pmatrix}$$ y la matriz ampliada $$\tilde{A}=\begin{pmatrix}1&-i&0&2\\0&1&i&1+2\,i\\1&1&0&1+i\end{pmatrix}$$ Reduciendo la matriz $\tilde{A}$, restándole a la primera fila la tercera y sustituyendo dicho resultado en la tercera fila; y, a continuación, multiplicando la segunda fila por $1+i$, sumandole los elementos de la tercerca fila, y sustituyendo el resultado en la tercera fila, se comprueba que es equivalente en rango a $\begin{pmatrix}1&-i&0&2\\0&1&i&1+2\,i\\0&0&-1+i&-1\end{pmatrix}$

Teniendo ya escalonada la matriz, es claro que el rango de las matrices $A$ y $\tilde{A}$ coinciden y es igual a $3$ (número de filas no identicamenate nulas), luego el sistema es compatible; además, como dicho rango es igual al númro de incóngitas, la solución es única (sistema compatible determinado). Veamos ahora cuál es dicha solución.

Toda vez que ya tenemos escalonada la matriz ampliada, podemos afirmar que el sistem de ecuaciones equivalente en solución es: $$\left\{\begin{matrix}x&-i\,y&&&=&2 \\ & y&+&i\,z&=&1+2\,i\\&&&(-1+i)\,z&=&-1\end{matrix}\right.$$ De la tercera ecuación, tenemos que $$z=\dfrac{1}{1-i}=\dfrac{1}{1-i}\cdot \dfrac{1+i}{1+i}=\dfrac{1+i}{1-i^2}=\dfrac{1+i}{1-(-1)}=\dfrac{1}{2}\,(1+i)$$ Sustituyendo este resultado en la segunda ecuación y despejando $y$ llegamos a $$y=\dfrac{3}{2}\,(1+i)$$ y sustituyendo a su vez los valores encontrados para $y$ y $z$ en la primera ecuación, al despejar $x$ obtenemos $$x=\dfrac{1}{2}\,(1+3\,i)$$

Nota:
Se puede comprobar que sustituyendo estos valores en cualesquiera de la ecuaciones originales satisfacen las igualdades, como debe ser.

$\diamond$

jueves, 14 de agosto de 2025

Cálculo de la matriz inversa de una matriz regular mediante el método de reducción

A modo de ejercicio, voy a calcular la matriz inversa de $A=\begin{pmatrix}i&1\\1&i\end{pmatrix}$, cuyos elementos pertenecen al cuerpo de los números complejos

Voy a utilizar el método de reducción:
$$\left(\begin{array}{cc|cc}
i & 1 & 1 & 0 \\
1 & i & 0 & 1 \\
\end{array}\right) $$ Multiplicando por $i$ los elementos de la primera fila y sumando la fila resultante a los elementos de la segunda obtenemos: $$\left(\begin{array}{cc|cc}
i & 1 & 1 & 0 \\
0 & 2i & i & 1 \\
\end{array}\right) $$ Ahora, multipliquemos por $\dfrac{1}{2}\,i$ los elementos de la segunda fila y sumemos a los de la primera: $$\left(\begin{array}{cc|cc}
i & 0 & \frac{1}{2} & \frac{1}{2}\,i \\
0 & 2i & i & 1 \\
\end{array}\right) $$ Multiplicando lo0s elementos de la primera fila por $-i$: $$\left(\begin{array}{cc|cc}
1 & 0 & -\frac{1}{2}\,i & \frac{1}{2} \\
0 & 2i & i & 1 \\
\end{array}\right) $$ Y, finalmente, multipliquemos los elementos de la segunda fila por $-\frac{1}{2}\,i$: $$\left(\begin{array}{cc|cc}
1 & 0 & -\frac{1}{2}\,i & \frac{1}{2} \\
0 & 1 & \frac{1}{2} & -\frac{1}{2}\,i \\
\end{array}\right) $$ Así pues, $$A^{-1}=\begin{pmatrix}-\frac{1}{2}\,i & \frac{1}{2} \\ \frac{1}{2} & -\frac{1}{2}\,i \end{pmatrix}=\dfrac{1}{2}\, \begin{pmatrix}-i & 1 \\ 1 & -i \end{pmatrix}$$

-oOo-

Nota:
Un método alternativo es el de la matriz de los cofactores: $A^{-1}=\dfrac{C^t}{\text{det}(A)}$ donde $C=[c_{ij}]_{n\times n}:=[(-1)^{i+j}\,\mathcal{A}_{ij}]_{n \times n}$ siendo $\mathcal{A}$ la matriz de los adjuntos asociada a $A$

Así, en el caso que nos ocupa, $C=\begin{pmatrix}(-1)^{1+1}\,\text{det}(a_{22})&(-1)^{1+2}\,\text{det}(a_{21}) \\ (-1)^{2+1}\,\text{det}(a_{12})&(-1)^{2+2}\,\text{det}(a_{11}) \end{pmatrix}=\begin{pmatrix}i&-1\\-1&i\end{pmatrix}$, con lo cual $C^t=\begin{pmatrix}i&-1\\-1&i\end{pmatrix}$; por otra parte, $\det{A}=\begin{vmatrix}i&1\\1&i\end{vmatrix}=i^2-1^2=-1-1=-2$, luego $A^{-1}=\dfrac{1}{-2}\,\begin{pmatrix}i&-1\\-1&i\end{pmatrix}=\dfrac{1}{2}\,\begin{pmatrix}-i&1\\1&-i\end{pmatrix}$, tal y como ya hemos calculado antes por el método de reducción.

$\diamond$

miércoles, 6 de agosto de 2025

Un ejercicio en el que se aplica la sobre un parámetro para que un conjunto de tres vectores dados, y que dependen de dicho parámetro, forme una base de $\mathbb{R}^3$

¿Para qué valores del parámetro real $a$, el conjunto de vectores $\{(\alpha,0,1),(0,1,1),(2,-1,\alpha)\}$ es una base de $\mathbb{R}^3$?

Como la dimensión del espacio vectorial es $3$ se necesitan exactamente tres vectores linealmente independientes para formar una base. Veamos si estos tres candidatos cumplen esta condición, lo cual es equivalente a decir que la combinación lineal para describir el vector nulo, $a\,(\alpha,0,1)+b\,(0,1,1)+c\,(2,-1,\alpha)=(0,0,0) \quad (1)$, ha de ser tal que los coeficientes $a,b$ y $c$ sean los tres igual a cero.

De $(1)$ puede escribirse el siguiente sistema homogéneo: $$\left\{\begin{matrix}\alpha \, a+2\,c=0\\b-c=0\\a+b+\alpha\,c=0\end{matrix}\right.$$

La matriz de los coeficientes es $\begin{pmatrix}\alpha&0&2\\0&1&-1\\1&1&\alpha\end{pmatrix}$ y la matriz ampliada es $\begin{pmatrix} \alpha & 0 & 2 & 0\\ 0 &1&-1&0 \\ 1&1&\alpha&0 \end{pmatrix}$

Para que $a=b=c=0$ (solución única), el sistema homogéneo tendrá que ser compatible determinado, y siendo el número de incógnitas igual a $3$, el rango de la matriz de los coeficientes ha de ser igual a $3$ (éste será también el rango de la matriz amplicada, por ser la última columna nula); y, para ello, el determinante de la matriz ampliada tendrá que ser distinto de cero: $$\begin{vmatrix}\alpha&0&2\\0&1&-1\\1&1&\alpha\end{vmatrix}\neq 0 \Leftrightarrow \alpha^2+\alpha-2 \neq 0 \, \Leftrightarrow \alpha \not \in \{1\,,-2\}$$

$\diamond$

martes, 5 de agosto de 2025

La derivación de polinomios como aplicación lineal

Acerca de la aplicación lineal derivación de polinomios de grado $3$ $$\mathcal{D}:P_{\mathbb{R}}^{(3)}[x] \rightarrow P_{\mathbb{R}}^{(2)}[x]$$, ¿cuál es la matriz asociada a dicha aplicación lineal con respecto a las bases canónicas respectivas de los espacios de partida y de llegada?

Con respecto a las bases canónicas $\{1,x,x^2,x^3\}$ del espacio vectorial $P_{\mathbb{R}}^{(3)}[x]$ (de dimensión igual a $4$), y $\{1,x,x^2\}$ del espacio vectorial $P_{\mathbb{R}}^{(2)}[x]$ (de dimensión igual a $3$), se tiene que $$\left\{\begin{matrix}\mathcal{D}(1)=0\,\cdot 1+0\cdot x+0\cdot x^2\\ \mathcal{D}(x)=1\,\cdot 1+0\cdot x+0\cdot x^2\\ \mathcal{D}(x^2)=0\,\cdot 1+2\cdot x+0\cdot x^2\\ \mathcal{D}(x^3)=0\,\cdot 1+0\cdot x+3\cdot x^2 \end{matrix}\right.$$ es decir, $$\begin{pmatrix}1&0&0&0 \\ 0&2&0&0 \\ 0&0&3&0 \end{pmatrix}\,\begin{pmatrix}1\\x\\x^2\\x^3\end{pmatrix}=\begin{pmatrix}1\\2x\\3x^2\\\end{pmatrix} $$ luego la matriz asociada a la aplicación lineal es $D=\begin{pmatrix}1&0&0&0 \\ 0&2&0&0 \\ 0&0&3&0\end{pmatrix} \in \mathcal{M}_{3\times 4}(\mathbb{R})$

-oOo-

Redefinamos un poco esta aplicación lineal. Consideremos ahora la operación derivación de polinomios como el endomorfismo $$\mathcal{D}:P_{\mathbb{R}}^{(3)}[x] \rightarrow P_{\mathbb{R}}^{(3)}[x]$$ Me propongo demostrar que el conjunto de polinomios de grado $0$ constituye el núcleo de dicho endomorfismo

Con respecto a las base canónica $\{1,x,x^2,x^3\}$ del espacio vectorial de partida y de llegada $P_{\mathbb{R}}^{(3)}[x]$ (de dimensión igual a $4$) se tiene que $$\left\{\begin{matrix}\mathcal{D}(1)=0\,\cdot 1+0\cdot x+0\cdot x^2+0\cdot x^3\\ \mathcal{D}(x)=1\,\cdot 1+0\cdot x+0\cdot x^2+0\cdot x^3\\ \mathcal{D}(x^2)=0\,\cdot 1+2\cdot x+0\cdot x^2+0\cdot x^3\\ \mathcal{D}(x^3)=0\,\cdot 1+0\cdot x+3\cdot x^2+0\cdot x^3 \end{matrix}\right.$$ es decir, $$\begin{pmatrix}0&0&0&0\\ 1&0&0&0 \\ 0&2&0&0 \\ 0&0&3&0 \end{pmatrix}\,\begin{pmatrix}1\\x\\x^2\\x^3\end{pmatrix}=\begin{pmatrix}0\\1\\2x\\3x^2\\\end{pmatrix} $$ luego, así las cosas, la matriz asociada a la aplicación lineal es $$D=\begin{pmatrix}0&0&0&0 \\ 1&0&0&0 \\ 0&2&0&0 \\ 0&0&3&0\end{pmatrix} \in \mathcal{M}_{4\times 4}(\mathbb{R})$$

Veamos quien es el núcleo del endomorfismo, que, como es sabido, representa el conjunto de elementos del espacio vectorial que son enviados cuya imagen es el elemento cero: $$\begin{pmatrix}0&0&0&0 \\ 1&0&0&0 \\ 0&2&0&0 \\ 0&0&3&0\end{pmatrix}\,\begin{pmatrix}x_1\\x_2\\x_3\\x_4\end{pmatrix}=\begin{pmatrix}0\\0\\0\\0\end{pmatrix}$$

El rango de la matriz de los coeficientes es $3$, luego $\text{dim}(\text{Ker}(\mathcal{D}))=\text{dim}(P_{\mathbb{R}}^{(3)}[x])-\text{rango}(D)=4-3=1$. Resolviendo el sistema de ecuaciones encontramos fácilmente $x_1=x_2=x_3=0$, quedando $\lambda:=x_4$ como el correspondiente parámetro libre; por consiguiente, las bases del núcleo del endomorfismo (subespacio vectorial del espacio vectorial $P_{\mathbb{R}}^{(3)}[x]$) son del tipo $ (0,0,0,\alpha) \,\forall \alpha \in \mathbb{R}$, con las cuales es evidente que con ellas sólo pueden describirse los polinomios de grado cero. Es decir, el conjunto de polinomios de grado cero (los números reales) constituyen el núcleo del endomorfismo derivación de polinomios (de $P_{\mathbb{R}}^{(3)}[x]$ en si mismo). Por supuesto, y generalizando, podemos decir lo mismo para la derivación en el espacio de polinomios de grado arbitrario $n$.

-oOo-

Observación:
Observemos que la matriz de este endomorfismo, $\begin{pmatrix}0&0&0&0 \\ 1&0&0&0 \\ 0&2&0&0 \\ 0&0&3&0\end{pmatrix}$, no es diagonalizable al no cumplirse la condición necesaria y suficiente; en efecto, si calculamos los valores propios, solamente encontramos uno: $\lambda=0$ $$P(\lambda):=\begin{vmatrix}0-\lambda&0&0&0 \\ 1&0-\lambda&0&0 \\ 0&2&0-\lambda&0 \\ 0&0&3&-\lambda\end{vmatrix}=0 \Leftrightarrow \lambda=0$$ con lo cual, el polinomio característico se escribe de la forma $P(\lambda)=\lambda^4$, siendo por tanto su multiplicidad igual a $m=4\neq \text{dim}(\text{Ker}(\mathcal{D}))=1$

$\diamond$

Una base del espacio vectorial $\mathcal{M}_{2\times 2}(\mathbb{R})$

Se considera el espacio vectorial $\mathcal{M}_{2\times 2}$ sobre el cuerpo $\mathbb{R}$. ¿Es el siguiente conjunto de matrices una base de dicho espacio vectorial? $$\left\{ \begin{pmatrix}1&0\\1&1\end{pmatrix},\begin{pmatrix}0&1\\1&1\end{pmatrix},\begin{pmatrix}1&1\\0&1\end{pmatrix},\begin{pmatrix}1&1\\1&0\end{pmatrix}\right\}$$

La dimensión del espacio vectorial $\mathcal{M}_{2\times 2}$ es $2\cdot 2=4$, luego todo sistema de generadores ha de tener al menos $4$ vectores linealmente independientes; y, como toda base es un sistema de generadores mínimo, el conjunto propuesto es candidato a ser una base. Veamos si los elementos dados son linealmente independientes. Para ello, sabemos que una combinación lineal de los mismos que exprese el elemento nulo. $\begin{pmatrix}0&0\\0&0\end{pmatrix}$, debe ser tal que los coeficientes de dicha combinación lineal, $a,b,c,d\in \mathbb{R}$ sean todos nulos. Planteemoslo:

$$a\,\begin{pmatrix}1&0\\1&1\end{pmatrix}+b\,\begin{pmatrix}0&1\\1&1\end{pmatrix}+c\,\begin{pmatrix}1&1\\0&1\end{pmatrix}+d\,\begin{pmatrix}1&1\\1&0\end{pmatrix}=\begin{pmatrix}0&0\\0&0\end{pmatrix} $$ luego el sistema de ecuaciones lineales asociado es un sistema homogéneo, $$\left\{\begin{matrix}a+c+d=0\\b+c+d=0\\a+b+d=0\\a+b+c=0\end{matrix}\right.$$ La matriz de los coeficientes es $$A=\begin{pmatrix}
1 & 0 & 1 & 1 \\ 0 & 1 & 1 & 1 \\ 1 & 1 & 0 & 1 \\ 1 & 1 & 1 & 0 \\ \end{pmatrix} $$ y la matriz ampliada, $$\tilde{A}=\left(\begin{array}{cccc|c}
1 & 0 & 1 & 1 & 0 \\
0 & 1 & 1 & 1 & 0 \\
1 & 1 & 0 & 1 & 0 \\
1 & 1 & 1 & 0 & 0 \\
\end{array}\right) $$ Al ser nulos los elementos de la quinta columna, es claro que $\text{rango}(\tilde{A})=\text{rango}{A}\le 4$; y, por otra parte, se puede comprobar que $\text{det}(A)\neq 0$, luego $\text{rango}(\tilde{A})=\text{rango}{A} = 4$, que es igual al número de incógnitas ($n=4$), por consiguiente, según el teorema de Rouché-Fröbenius, el sistema es compatible determinado (solución única), y, siendo homogéneo, ésta es $a=b=c=d=0$. En consecuencia, los cuatro elementos propuestos del sistema de generadores son linealmente independientes, y siendo éste mínimo (el número de los mismos es igual a la dimensión del espacio vectorial), constituyen una base del mismo.

$\diamond$

lunes, 4 de agosto de 2025

Un ejercicio para determinar una base del núcleo de una aplicación lineal dada

Se considera el endomorfismo $f:V_3(\mathbb{R})\rightarrow V_2(\mathbb{R});\,(x_1,x_2,x_3)^\top \mapsto (x_1+x_2+x_3,x_1+x_2)^\top$. Me propongo encontrar una base del núcleo de la aplicación lineal, $\text{Ker}(f)$

Veamos cuál es la matriz asociada $A$ a $f$: Como $\left\{\begin{matrix}f(x_1)&=&x_1+x_2+x_3\\f(x_2)&=&x_1+x_2\end{matrix}\right.$, se tiene que $A_{2\times 3}=\begin{pmatrix}1 & 1 & 1\\ 1 & 1 & 0\end{pmatrix}$. Es claro que $\text{rango}(A)=2$, pues podemos encontrar menores complementarios de orden $2$ distintos de cero, luego como $\text{dim}(V_3)=\text{rango}(A)+\text{dim}(\text{Ker}(f))$, vemos que $3=2+\text{dim}(\text{Ker}(f))$ y por tanto, $\text{dim}(\text{Ker}(f))=3-2=1$; así que una base de $\text{Ker}(f)$ estará formada por un sólo vector.

Encontremos uno, teniendo en cuenta que todo vector del núcleo tiene el vector $\vec{0}_{V_2}$: $$\begin{pmatrix}1 & 1 & 1\\ 1 & 1 & 0\end{pmatrix}\begin{pmatrix}x_1\\x_2\\x_3\end{pmatrix}=\begin{pmatrix}0\\0\end{pmatrix}$$ esto es $$\left\{\begin{matrix}0&=&x_1+x_2+x_3\\0&=&x_1+x_2\end{matrix}\right. \sim \left\{\begin{matrix}0&=&x_1+x_2+x_3\\0&=&x_3=0\end{matrix}\right. \Rightarrow \lambda:=x_1=-x_2$$ en consecuencia, tomando (pongamos que) $\lambda=1$, un vector válido es $(1,-1,0)$, luego podemos escribir que $\text{Ker}(f)=\langle (1,-1,0)\rangle$

$\diamond$