Efecto Coriolis

El efecto Coriolis es una consecuencia de estudiar el movimiento de los cuerpos desde un sistema de referencia particular. Los sistemas de referencia pueden clasificarse en “inerciales” y “no inerciales”, y la diferencia entre estas clases está en que las leyes de Newton son válidas en la primera pero no en la segunda. En particular, un sistema de referencia que rota respecto a un sistema inercial es no inercial, y es precisamente éste el caso en el que surge el efecto Coriolis. Para aclarar un poco, imaginemos un cañón en reposo en el origen de un sistema de referencia inercial K y un segundo sistema de referencia K’ con el mismo origen, pero rotando respecto al primero sobre una plataforma giratoria con velocidad angular constante ω, tal como se muestra en la figura

fig1

En el instante t=0 el cañón dispara un proyectil. En el sistema de referencia inercial la situación es muy simple: Como no hay acciones externas el proyectil va a mantener su estado de movimiento (esta es la primera ley de Newton), siguiendo una trayectoria recta. En el sistema de referencia en rotación el movimiento es un poquito más complicado pues esta trayectoria recta va a aparecer curva, lo que implica que, para este observador, la bala aparecerá como acelerada. Si este observador utilizara las leyes de Newton se vería obligado a concluir que una fuerza de origen desconocido actúa sobre el proyectil, causando la curvatura en la trayectoria. Esta fuerza es ficticia, puesto que surge de utilizar las leyes de Newton en un sistema de referencia no inercial.

En 1835 el ingeniero Gaspard-Gustave de Coriolis se dedicó a estudiar el movimiento de cuerpos en sistemas de referencia en rotación y encontró que esta fuerza ficticia puede descomponerse en dos contribuciones. La primera es la fuerza centrífuga por todos conocida; esa fuerza que sentimos que nos empuja contra la puerta cuando vamos por una curva en el auto. La otra contribución es hoy conocida como fuerza de Coriolis, pero en su momento él la llamó fuerza centrífuga compuesta, y determinó que depende tanto de la velocidad v de la bala como de la velocidad angular ω entre los sistemas. Esta aceleración de Coriolis es responsable por la curvatura en la trayectoria del proyectil. 

Movimiento relativo a la Tierra

Como la Tierra gira en torno a un eje propio un observador sobre su superficie es un observador no inercial, y por lo tanto está en la situación del observador en rotación discutido más arriba. De manera que al estudiar el movimiento de un cuerpo desde nuestro laboratorio, en reposo respecto a la Tierra, vamos a observar que su trayectoria se ve afectada por la aceleración de Coriolis.

Volvamos al cañón del ejemplo anterior. Supongamos que está sobre la superficie de la Tierra y dispara sus proyectiles en dirección horizontal. Si estamos en reposo respecto al cañón esperaríamos ver que el proyectil se aleja en línea recta hacia adelante con velocidad constante, pero no es el caso. Debido a la rotación de la Tierra vamos a encontrar que, de hecho, la trayectoria se desvía siempre hacia la derecha si estamos en el hemisferio norte, o siempre hacia la izquierda si es que estamos en el hemisferio sur. Podemos entender por qué ésta es la trayectoria del proyectil sin hacer cálculos, si en lugar de quedarnos fijos a la superficie de la Tierra nos imaginamos levitando sobre esta, de manera de percibir su rotación (o sea, si nos cambiamos a un referencial inercial). Además, como la velocidad en cualquier dirección puede descomponerse en una contribución en dirección Norte-Sur más una contribución Este-Oeste, con entender estos dos casos va a ser suficiente.

Movimiento en dirección Norte-Sur

Supongamos que el cañón está en algún punto de latitud λ1 en el hemisferio norte y dispara el proyectil hacia el Norte, como se ve en el dibujo de abajo. Como el cañón está fijo a la superficie de la Tierra vamos a ver que el proyectil tiene no solo velocidad en dirección hacía el polo sino también una componente de velocidad hacia el Este igual a la velocidad con la que vemos moverse a la superficie, debido a la inercia. En otras palabras, vamos a ver que además de ir hacia el Norte el proyectil sigue rotando con la Tierra. Para saber qué trayectoria va a describir el proyectil podemos considerar su momento angular. Lo importante para nosotros sobre esta cantidad es que implica que el producto entre la velocidad de rotación ω del proyectil y su distancia al eje de la Tierra r, debe mantenerse constante. Ahora bien, como la distancia desde la superficie al eje de la Tierra disminuye al aumentar la latitud, como se aprecia en el dibujo, en su camino en dirección Norte el proyectil va a ir acercándose más y más al eje, lo que implica que la velocidad a la que rota debe aumentar para mantener constante el producto ω.r, y por lo tanto debe adelantar a la Tierra en su movimiento de rotación. Como resultado, vamos a ver que el proyectil no solo se desplaza respecto a la superficie en dirección Norte, sino también en dirección Este. Si por, por el contrario, el disparo fuese hacia el Sur, entonces en su viaje el proyectil se va a alejar del eje, y como resultado su velocidad de rotación va a disminuir, atrasando respecto de la superficie de la Tierra, y aterrizando en un lugar más al Oeste del inicial.

fig2

Un observador situado sobre la superficie, evidentemente, debe observar el mismo desplazamiento del proyectil respecto al suelo. Pero como no puede percibir la rotación de la Tierra no puede hacer el mismo análisis que nosotros. Este observador nota el mismo cambio en la velocidad del proyectil relativa al suelo, y por las leyes de Newton deduce que una fuerza debe estar actuando sobre éste, aunque su origen es desconocido. Ésta es la fuerza de Coriolis.

Movimiento en dirección Este-OestE

Supongamos nuevamente que nuestro cañón está en algún punto con latitud λ. El cañón no está adherido a la superficie, sino que simplemente está apoyado, y se mantiene en reposo respecto al suelo gracias a la acción de la gravedad terrestre.  Por estar describiendo una trayectoria circular el cañón acelera hacia el eje de rotación, pues de otra forma se desplazaría sobre la superficie. La fuerza que le imprime esa aceleración no es otra que la gravedad; podemos pensar que parte del peso del cañón (y el proyectil en su interior) se invierte en modificar constantemente su velocidad para mantenerlo en reposo sobre la superficie, de manera que lo que medimos con una balanza no es el total de la acción de la gravedad, sino la fuerza neta que queda tras confinarlo a estar en el suelo. Pero disparemos ahora el proyectil. Si lo disparamos hacia el Este la velocidad v que le imprime el cañón se va sumar a la velocidad de rotación de la Tierra,  y como ahora la velocidad neta es mayor hace falta invertir una parte mayor del peso para confinarlo sobre la superficie. En dirección vertical la tendencia a alejarse va a ser compensada por el peso (el que medimos con la balanza), pero en la dirección horizontal no hay fuerza para compensar.  La siguiente figura ilustra esta situación.

fig3

El resultado entonces es que el proyectil va a alejarse en dirección Sur si estamos en el hemisferio norte, y en dirección Norte si estamos en el hemisferio sur. La trayectoria, por lo tanto, se desvía hacia la derecha en el hemisferio norte y hacia la izquierda en el hemisferio sur. Si, por el contrario, disparamos hacia el oeste, la velocidad v se va a restar de la velocidad de rotación de la Tierra; la velocidad neta va a ser menor y por lo tanto una parte menor del peso es necesaria para confinar el proyectil a la superficie. Como ahora la gravedad hace más fuerza de la necesaria en dirección hacia el eje de rotación y no hay otra fuerza que la compense en dirección paralela al piso, el resultado es que el proyectil va a acelerar hacia el Norte (hacia la derecha) en el hemisferio norte y hacia el Sur (hacia la izquierda) en el hemisferio sur.

Un observador sobre la superficie de la Tierra va a ver el mismo desplazamiento del proyectil respecto al suelo, pero al no percibir la rotación de la Tierra se ve obligado a concluir que una fuerza de origen desconocido acelera el proyectil apartándolo de una trayectoria que, de otra manera, sería recta. Esta es la aceleración de Coriolis.

Vemos entonces que tanto en la dirección Norte-Sur como en la dirección Este-Oeste la rotación de la Tierra deflecta las trayectorias hacia la derecha en el hemisferio norte y hacia la izquierda en el hemisferio sur. No solamente eso, sino que es posible demostrar que en los dos casos la aceleración hacia la derecha de la trayectoria es de la misma magnitud: 2ωvSen(λ), donde ω es la velocidad angular de la Tierra, y  v y λ son la velocidad del proyectil respecto a tierra y la latitud, como siempre. Podemos describir entonces al efecto Coriolis como una tendencia de los cuerpos en movimiento a retornar a su posición inicial, que es despreciable cerca del ecuador, y se hace más importante a medida que nos acercamos a los polos. La baja velocidad angular ω de la Tierra (una revolución cada 24 hs) hace que el efecto no sea apreciable a la escala en la que hacemos la mayoría de las cosas. Así, mientras elefecto Coriolis es importante para el disparo de un misil intercontinental, que tiene un gran tiempo de vuelo, es completamente despreciable para alguien practicando tiro en un polígono.

La aceleración de Coriolis tiene gran importancia para la meteorología, pues es un efecto con una fuerte incidencia en el movimiento de grandes masas de aire. La siguiente imagen, tomada por el satélite METEOSAT-7 EN 2011, representa una espectacular manifestación del efecto Coriolis

918_20111230-thanebinilde

En la imagen, prácticamente sobre el mismo meridiano se muestran dos ciclones ocurriendo simultáneamente: Thane, Al norte del Ecuador y sobre la costa India, y Benilde, al sur del Ecuador y sobre el océano Índico. Debido a que están en diferentes hemisferios estos ciclones rotan en sentido contrario. El ciclón Benilde rota en sentido horario mientras Thane rota en sentido antihorario.

Anuncios

Del horizonte y otros demonios

El horizonte es esa línea que vemos separar al agua del cielo cuando vamos a la playa. Si viviésemos en un plano infinito, el horizonte sería una línea exactamente a la altura de los ojos, conteniendo el punto de fuga donde las cosas parecen desaparecer en la distancia, y las líneas paralelas parecen cortarse debido a la perspectiva. Pero ese no es el caso. Como la Tierra tiene una forma muy aproximadamente esférica, el horizonte no es una línea imaginaria sino que es un lugar sobre la superficie, como muestra la figura siguiente

fig1

Las líneas punteadas son líneas de visión; muestran el camino que recorre la luz hasta nuestros ojos tras reflejarse en las cosas que vemos. Cuando estamos en la playa y miramos al horizonte la línea de visión, marcada con puntos blancos en el dibujo, es la recta tangente a la superficie de la Tierra, y el punto de tangencia marcado es precisamente el centro de la línea que llamamos horizonte (la línea marcada en verde en el dibujo). Si miramos más arriba vamos a ver el cielo, y si miramos más abajo vamos a ver el agua, como muestran las líneas en rojo.

De manera que el horizonte que vemos no está allá en el infinito, sino sobre la superficie, a alguna distancia de nosotros. Pero, ¿A qué distancia? Volvamos a la pizarra:

fig2

El dibujo muestra nuestra posición a una altura h sobre la superficie de la Tierra, representada por el círculo grande de radio R, y dos distancias al lugar donde vemos el horizonte. La distancia d se mide en línea recta desde donde estamos. La distancia s mide cuánto tendríamos que movernos sobre la superficie, si bajamos de donde estamos y viajamos por tierra/agua hasta ese lugar. Como se ve en la figura, averiguar cuánto vale d es fácil; solamente hay que usar el teorema de Pitágoras. Calcular s es un poquito más difícil porque requiere encontrar la ecuación de la recta que une nuestra posición y el punto donde está el horizonte, pero la dificultad es mínima. Si ahora consideramos que el radio de la Tierra es R=6371km, y que cuando estamos parados en la playa la altura h de nuestros ojos ronda los 1.7m, entonces usando las ecuaciones de la figura encontramos que ambas distancias, d y s nos dan aproximadamente el mismo valor de 4.6km de distancia. O sea que, aunque sorprenda un poco, eso que parece tan lejano no está más allá de 5km. Una cosa que se aprecia en el dibujo, y se ve en las formulitas que sacamos para d y s, es que la distancia se hace más grande si h es más grande. Esto dicho de otra manera, es algo que todos intuitivamente sabemos: Si vamos más arriba, podemos ver más lejos.

Hasta acá vamos bien, pero esto es pura geometría. No estamos teniendo en cuenta algo importante: La atmósfera. Vemos el horizonte porque la luz se refleja en la superficie y viaja hasta nosotros. Pero esa luz se propaga en la atmósfera, y como la densidad de ésta es diferente a diferentes alturas esos rayos que dibujamos rectos en realidad deberían ser líneas curvas, debido a la refracción. ¿Cómo tener en cuenta este efecto en los cálculos?

Un tratamiento detallado del problema requeriría de ecuaciones diferenciales y otras sofisticaciones que lo harían muy difícil, pero si suponemos que la densidad (y por lo tanto el índice de refracción) de la atmósfera solo depende de la altura podemos atacarlo usando nada más que geometría. En la figura que sigue se esquematiza la refracción de un rayo en esta atmósfera simplificada

fig3

Ahora bien, en los primeros 2 kilómetros de altura el cambio en el índice de refracción es muy aproximadamente proporcional a la altura, disminuyendo una cantidad de 40×10^-5 por cada kilómetro (estos son valores estándar). Esta proporcionalidad implica que la forma del rayo es de arco de círculo. ¿Con qué radio? Eso es fácil: En la figura concluimos que para que el rayo describa un círculo de radio C, el producto entre C y el valor del índice de refracción debe permanecer constante. Eso quiere decir que la variación del índice con la altura tiene que ser igual al recíproco del radio C, de otra manera el producto no sería constante. Por lo tanto, el radio del rayo será de 25000km en condiciones atmosféricas normales.

Nuestra situación ahora que tomamos en cuenta el efecto de la refracción atmósférica es como la que se muestra del lado izquierdo en la siguiente figura. El rayo que representa nuestra línea de visión es un arco de círculo de 25000km, y el horizonte se encuentra en el punto en el que este arco es tangente a la superficie de la Tierra, que tiene 6371km de radio

fig4

Pero precisamente porque la línea de visión describe un arco de círculo, esta situación es equivalente tener una Tierra sin refracción atmosférica, pero con un radio más grande, de unos 8500km (4/3 del radio real), como se muestra en la derecha de la figura. Y eso es una suerte, porque entonces podemos corregir nuestro cálculo de la distancia al horizonte usando las mismas ecuaciones de antes, pero utilizando estos 8500km para el radio terrestre. Haciendo estas cuentas, encontramos que la distancia al horizonte, corregida por refracción atmosférica es de unos 5.4km. Vemos entonces que el efecto de la refracción es importante, puesto que el valor corregido difiere en un 15% del valor puramente geométrico.

Llegado este punto, estaría bien darle un poco más de utilidad las cuentas que hicimos. Tomemos la siguiente foto:

1527095_565360083557308_951327436_n

Lo que se ve a lo lejos es Mallorca. La foto fue sacada por Alfons Puertas, Meterólogo del Observatorio Fabra, ubicado a unos 415m sobre el nivel del mar, en Barcelona, a una distancia media s de unos 186km. En la imagen de abajo se detalla la zona de los picos, marcando el Puig Major cuya altura es de 1,436km, y el pico Puig Roig, con una altura de 1,003km

detalle_mallorca

Conociendo la altura de estos dos picos, una regla de tres nos permite estimar que el horizonte, la línea a partir de la que empezamos a ver la sierra (marcada como “nivel del mar” en la foto), está a unos 640m. Lo que vamos a hacer ahora es mostrar que nuestros cálculos aproximan muy bien estos datos, y por lo tanto explican lo que se ve en esta imagen.

Volvemos al pizarrón. El esquema muestra, de perfil, la posición del Observatorio Fabra y Mallorca sobre la superficie de la Tierra. La línea punteada en verde pasa inmediatamente por encima del horizonte, y marca el límite inferior de lo que podemos ver: Si miramos más arriba vemos el perfil montañoso, y si miramos más abajo vemos solo agua. La distancia s1 es la distancia al horizonte visto desde el Fabra a una altura h1=0.415km, que podemos calcular con nuestra ecuación. La distancia s2 es la distancia desde el horizonte hasta la la sierra, y como la distancia total es 186km, podemos calcularla a partir de s1. La altura h2 marca el punto a partir del cual empezamos a ver Mallorca, asomándose desde atrás de la curvatura. Esta altura es lo que queremos determinar, y podemos hacerlo invirtiendo nuestra ecuación para encontrar a h2 como función de s2, y reemplazando s2=s-s1

fig5

En la figura se muestra la ecuación para determinar h2, sabiendo que el radio efectivo de la Tierra (corregido para tener en cuenta la refracción) es de 8500km y que la altura del Fabra es de 0.415km. El resultado es h2=0.613km, que comparado con los 0.64km que estimamos de la foto nos da un error relativo del 4%. Si tenemos en cuenta que esos 0.64km ya tienen un error de al menos un 3% (+/- un píxel), y que el cálculo considera una atmósfera muy simplificada y con refracción estándar, el resultado es bastante bueno. Es decir, en la foto se ve lo que la geometría y la física dicen que debería verse.

Llegado este punto, solamente queda una cosa para decir: IT WORKS, BITCHES!

Homero y el mago de Oz

Blog, sé que digo esto cada siglo pero… Prometo no volver a dejarte.

Es sabido por todos (y si no lo saben hay algo muy mal con uds.) que, en el capítulo 10 de la quinta temporada de Los Simpson, Homero encuentra en el inodoro los anteojos “extraviados” por Henry Kissinger, que por alguna razón andaba por la planta de alegría nuclear de Springfield.

En el momento en el que encuentra las gafas, se lleva el dedo a la sien y dice

“La suma de las raíces cuadradas de dos lados cualquiera de un triángulo isóceles es igual a la raíz cuadrada del lado restante”

vlcsnap-error314

Desde una de las puertas de atrás alguien, aparentemente con mayor urgencia por corregir a otros que por continuar haciendo del  número dos, responde “Eso es un triángulo rectángulo, idiota” (en el doblaje latino, vaya uno a saber por qué, dicen equilátero). La corrección viene a cuento, como cualquiera se imagina, porque lo enunciado suena bastante al Teorema de Pitágoras, cuya demostración ya revisé antes:

“La suma de los cuadrados de los catetos de un triángulo rectángulo es igual al cuadrado de su hipotenusa”.

Ahora ud. estará diciendo: “Eso ya lo sabíamos, no me estás contando nada nuevo“. ¡Pues qué actitud, joven! Y se equivoca. Porque siempre hay un tocapelotas quisquilloso por ahí que podría decir

vlcsnap-error615

 

A lo mejor Homero hablaba de otro resultado, y no se equivoca. Podría ser cierto lo que él dice aunque no sea el teorema de Pitágoras“.

 

Lo que vengo a ofreceros entonces es una respuesta para ese que objeta solamente por molestar, y eventualmente algún dato desconocido. Así que empecemos con lo que dice Homero. Tomemos un triángulo isósceles como el del dibujo (mi esfuerzo compensa mi falta de talento):

triang1

Para “dos lados cualquiera” hay solo dos opciones: si tomamos  b  y  c, debe valer entonces

\sqrt{b}+\sqrt{c}=\sqrt{c}\rightarrow\sqrt{b}=0

Y sí, en el límite en el que la base desaparece es cierto, pero ya no tenemos un triángulo. Así que lo de “dos lados cualquiera” ya vemos que no.

triang2

La otra posibilidad es tomar  c  y  c. En ese caso será  \sqrt{c}+\sqrt{c}=\sqrt{b}, y entonces  b=4c, que tendrá tres líneas pero sigue sin ser un triángulo. Así que de nuevo no.

A lo mejor el problema es que es isósceles… Bueno, veamos si podemos dar con un triángulo  a,b,c  para el que el enunciado sea correcto. Lo que debe valer es, para cualquier asignación de nombres  a,b,c ,

\sqrt{a}+\sqrt{b}=\sqrt{c} ,

o sea

a+b+2\sqrt{a}\sqrt{b}=c ,

Lo que quiere decir que el lado  c  debe ser más grande que la suma de los otros dos lados, lo que es imposible para cualquier asignación de etiquetas sin importar cómo es el triángulo, porque si  a+b<c  y  a+c<b  entonces  b-c<c-b\rightarrow b<c, con lo que  b<a+c. Todavía peor, no es cierto siquiera para una elección particular de etiquetas, porque la condición  a+b<c  contradice la desigualdad triangular, que sabemos que sí vale. De manera que no hay triángulo que verifique el enunciado, por lo que Homero está equivocado, y de paso también el que deja de cagar para corregirlo.

des_triang

¿Cometieron los guionistas de Los Simpson un error? No. Cualquiera puede equivocarse, obviamente, pero los que escribieron el guión saben lo suficiente de matemática como para no cometer nunca un error así. Homero en realidad cita al espantapájaros de la película El mago de Oz (1939):

De manera que la pifia fue en la pelicula, y los guionistas de Los Simpson cuelan un chiste citando el error de esta escena. Pero ya que estamos, déjenme divagar un rato: Si descartamos un error de los guionistas de los Simpson. ¿Podría descartarse también un error de los creadores de la película? Después de todo es geometría elemental. Es raro que nadie, entre todos los que leyeron el libreto, haya notado el equívoco. Pero si es intencionado ¿Por qué pondrían eso en el diálogo?

Si realmente todo era un sueño de Dorothy, entonces los personajes son simples creaciones de su mente. Lo que dice el espantapájaros entonces podría ser nada más un indicador de que Dorothy no tiene ni idea de geometría. Suena razonable, aunque demasiado sutil. También podría ser que, simplemente, el espantapájaros sea real y no sepa nada de geometría. Después de todo el no-mago de Oz no es más que un charlatán de feria, el hombre detrás de la cortina que al verse descubierto se saca de la manga un par de trucos que le permiten escapar ileso de Oz. Así, lo que le da al espantapájaros no es un cerebro sino un diploma de “Doctor Honorario en Piensología“, que sería más o menos como una especialización en homeopatía. El espantapájaros no es más inteligente ni más sabio, pero ahora que tiene un diploma se siente autorizado para afirmar como verdad incontestable cualquier pavada que se le cruce por la cabeza. Finalmente, y “por completitud”, habría que plantear la posibilidad de que el espantapájaros esté en lo correcto, lo que necesariamente implica que la desigualdad triangular no vale. Es dificil de imaginar algo así porque si hablamos de la longitud de los lados de un triángulo, necesariamente estamos hablando de distancias, y la desigualdad triangular (si me equivoco me corrigen, por favor) es inherente a la noción misma de distancia. No obstante, si relajamos un poco esto y usamos una métrica pseudo-euclídea… Pero será para otra entrada.

Yapa: Al comienzo del capítulo 4 de la misma temporada, al que corresponde el diálogo con el que comencé la entrada, la escena de la guardia en la puerta de la mansión Burns alude a la marcha de los Winkies, escena de El mago de Oz.

Álgebra lineal: Base y dimensión

En las entradas anteriores nos ocupamos de identificar espacios vectoriales y subespacios vectoriales. Vamos a ocuparnos ahora, muy brevemente, de los conceptos de base y dimensión. Pero antes es necesario hablar de combinaciones lineales.

Combinación lineal

Supongamos un espacio vectorial {\{V,\oplus,K,+,\times,\star\}} y un subconjunto de {n} vectores vectores {B=\{\bf v_1,...,\bf v_n\}}. Una combinación lineal de los elementos de {B} es cualquier suma de productos de escalares arbitrarios de {K} por los vectores de {B}. Es decir, dados {B} y escalares arbitrarios en {K}, una combinación lineal de los vectores de {B} se escribe como:

\sum_i \alpha_i \bf v_i, \,\,\alpha_i\in K,

donde suprimimos el símbolo \star del producto de vectores por escalares (siempre que el contexto lo implique vamos a hacer esto, al igual que reemplazar el símbolo \oplus por +). Como por definición el producto \star tiene por imagen  a V, una combinación lineal de vectores de V es un vector en V. En particular, dado un subconjunto finito {B=\{\bf v_1,...,\bf v_n\}} en V, decimos que un vector \bf u de V es una combinación lineal de los vectores en B si y sólo si existen escalares en K tales que

\bf u=\sum_i \alpha_i \bf v_i, \,\,\alpha_i\in K,

Tomemos ahora el vector nulo \bf 0 en V. Es claro que siempre podemos escribirlo como combinación lineal de cualquier subconjunto B, pues en ese caso la ecuación de arriba siempre admite una solución trivial, a saber, que todos los coeficientes \alpha sean simultáneamente cero. Si esta es la única solución, entonces se dice que el conjunto B es linealmente independiente (L.I.). Caso contrario, el conjunto es linealmente dependiente (L.D.).

Ejemplo: El conjunto B=\{ sen, cos \} está incluido en el espacio de funciones (\mathbb{R}^I,+,\mathbb{R},.), donde I es algún intervalo real. Si queremos escribir al vector nulo como combinación lineal de estas funciones deben existir escalares reales \alpha,\beta tales que

\alpha sen+\beta cos=\bf 0

Ahora, como el vector nulo satisface por definición {\bf 0}(t)=0\forall t, podemos evaluar la ecuación de arriba en t y derivarla. Esto deja el sistema

\begin{pmatrix} sen(t)&cos(t) \\ cos(t)&-sen(t) \end{pmatrix}\begin{pmatrix} \alpha \\ \beta \end{pmatrix}=\begin{pmatrix} 0 \\ 0 \end{pmatrix},

Que tiene como única solución \alpha=\beta=0, puesto que el determinante de la matriz de coeficientes es -1. Resulta entonces que el conjunto \{sen,cos\} es L.I.

Generadores, base y dimensión

Podemos pensar ahora en el conjunto S de todas las combinaciones lineales de BV. Es fácil ver que este conjunto es un espacio vectorial: Primero, es evidente que se trata de un subconjunto de V, pues al ser V un espacio vectorial, cualquier combinación lineal de un número finito de sus elementos pertenece a éste (V es cerrado para la suma de vectores y el producto por escalar). Supongamos ahora que tenemos 2 vectores u1 y u2 en el conjunto, y construyamos una combinación lineal c de estos:

\bf c=\gamma_1 \bf u_1+\gamma_2 \bf u_2\\c=\gamma_1(\sum_i\alpha_{i1}\bf v_i)+\gamma_2(\sum_i\alpha_{i2}\bf v_i)\\ c=\sum_i(\gamma_1\alpha_{i1}+\gamma_2\alpha_{i,2})\bf v_i

Vemos que c es también un vector de S, por lo que S es cerrado para la suma de vectores y el producto por escalares. Luego, por definición, S es un subespacio de V. Decimos entonces que el espacio S está generado por los vectores de B, o bien que B es un conjunto de generadores de S. Si, además de generar SB es un conjunto de vectores L.I., entonces decimos que B es una base de S.

Ejemplo: Una base para el espacio (K^n,+,K,.) (K es un cuerpo) está dada por los vectores

\begin{matrix} \bf e_1=(1,0,0\cdots 0)\\ {\bf e_2=(0,1,0\cdots 0)}\\ \vdots \\ {\bf e_n=(0,0,0\cdots 1)}\end{matrix}

Es evidente que cualquier n-upla de coeficientes en K puede escribirse como combinación lineal de estos vectores, por lo que el conjunto genera a (K^n,+,K,.), y es muy fácil también verificar que es un conjunto linealmente independiente. Luego es una base.

Finalmente, definimos la dimensión de un espacio vectorial como el número de elementos que hay en una base cualquiera del mismo. Si volvemos al espacio del ejemplo anterior, vemos que el número de vectores en la base dada es precisamente n, por lo que (K^n,+,K,.) es un espacio de dimensión n.

Para ir terminando, un resultado útil: Sea V un espacio vectorial de dimensión n, y B un conjunto de n vectores. Si B es L.I., entonces B es una base de V:

En efecto, supongamos que B no genera a V. Luego genera algún subespacio de V. Podemos entonces armar una base para V completando a B con vectores L.I. adicionales hasta generar V completamente. Este nuevo conjunto será L.I. y generador por construcción, o sea, una base de V. Pero como B tiene n elementos esta base debe tener m>n elementos, por lo que la dimensión de V deberá ser m, lo que es absurdo.

Relatividad y GPS

Al día de hoy la tecnología GPS forma parte de nuestra vida diaria. Encontramos receptores GPS en los aviones, barcos, en nuestros autos, e incluso en nuestros teléfonos. ¿Pero cómo funciona esta tecnología, y qué relación tiene con la teoría de la relatividad?

Sistema de Posicionamiento Global

La sigla GPS hace referencia a los términos en inglés Global Position System, lo que en español significa Sistema de Posicionamiento Global. Originalmente se trataba de una red de 24 satélites (llamada constelación GPS) orbitando nuestro planeta a unos 20000 km de altura, tardando 12hs en dar una vuelta completa. Estos satélites están uniformemente distribuidos en 6 órbitas prácticamente circulares, en una inclinación de 55º respecto del ecuador terrestre. Actualmente la constelación cuenta con 32 satélites. Los satélites adicionales proveen medidas redundantes, lo que ayuda a mejorar los cálculos realizados por los receptores.

El objetivo de la constelación es permitir la ubicación (coordenadas sobre la superficie de la Tierra) de un receptor particular con una precisión aceptable. Dadas las características de las órbitas sucede que en cualquier punto de la superficie siempre hay, por lo menos, 5 satélites sobre el horizonte, lo que permite realizar el posicionamiento mediante trilateración. La trilateración es un método geométrico que permite calcular las coordenadas de un punto en el espacio si es que se conoce la distancia del punto en cuestión a otros 3 puntos de referencia, que en este caso corresponden a las posiciones de 3 satélites GPS. El método consiste en construir, alrededor de cada uno de los puntos de referencia, una esfera de radio igual a la distancia entre el punto de referencia y el punto que se quiere ubicar. La solución es precisamente el punto de intersección de las 3 esferas.

trilateracion

Para que la ubicación sea posible, entonces, es necesario tener la información correspondiente a la posición de cada satélite y la distancia de este al receptor en cuestión. Tanto los satélites como los receptores están equipados con relojes que están sincronizados. Cuando se comunican, cada satélite envía al receptor su posición y la hora de su reloj interno. El receptor calcula la diferencia entre la hora a la que recibe la señal y la hora a la que fue enviada, y obtiene la distancia al satélite como el producto entre esta diferencia y la velocidad de propagación de la señal, que es la velocidad de la luz.

Es claro que la precisión en el posicionamiento depende fuertemente de la habilidad para sincronizar los relojes. Dado que las distancias son muy grandes, pequeños errores en la sincronización pueden llevar a errores del orden de 10km en la posición del receptor. Una precisión aceptable requiere una sincronización con error del orden del nanosegundo, posible solo con el uso de relojes atómicos. Si bien los satélites están equipados con relojes atómicos, el uso de estos en los receptores no es ni práctico ni rentable. El problema de la sincronización se resuelve en la práctica utilizando relojes de cuarzo en receptores que se comunican con 4 o más satélites, lo que permite corregir los errores en la medición del tiempo.

La necesidad de incluir correcciones relativistas

Relatividad especial

La teoría especial de la relatividad nos dice que observadores en movimiento relativo asignarán, en general, tiempos diferentes a un mismo evento. Este fenómeno se conoce como dilatación temporal, y puede demostrarse que la diferencia en el tiempo marcado por dos relojes en sistemas de referencia distintos depende de la velocidad relativa entre estos. En general no notamos la dilatación temporal en los fenómenos cotidianos, porque su efecto es despreciable a velocidades bajas (en comparación a la velocidad de la luz).

El efecto, sin embargo, se vuelve importante en el problema de sincronización del sistema GPS: La velocidad de los satélites relativa a un receptor en tierra es de aproximadamente 4 km/s, lo que implica que los relojes en órbita van a atrasar respecto al reloj en la Tierra unos 7 microsegundos por día. Esta diferencia puede parecer pequeña, pero el posicionamiento requiere una precisión del orden del nanosegundo, y 7 microsegundos son 7000 nanosegundos. A lo largo de un día el error acumulado en la determinación de la distancia del receptor a cada satélite es de aproximadamente 2 km.

Relatividad general

Sabemos gracias a la teoría general de la relatividad que para relojes inmersos en un campo gravitatorio el tiempo pasa más o menos lento, dependiendo de la intensidad del campo en la región en la que se encuentra el reloj en cuestión. El campo gravitacional de la Tierra se hace menos intenso a medida que nos alejamos radialmente, por lo que al aumentar la altura sobre la superficie el tiempo medido por nuestro reloj corre cada vez más lento. No notamos este efecto en el día a día cuando estamos en lo alto de un edificio o incluso al viajar en avión, porque la dilatación es muy pequeña.

A 20000 km de altura, que es la zona en la que se encuentran la constelación de satélites GPS, el efecto es bastante más importante. Los relojes dentro de los satélites van a adelantar respecto del reloj del receptor en tierra, de manera que a lo largo de un día la discrepancia acumulada en la hora de estos relojes llega a los 45 microsegundos, lo que implica un error en la medición de la distancia de aproximadamente 13.5 km.

El efecto combinado de la dilatación temporal por movimiento relativo, y la correspondiente dilatación debida a la acción del campo gravitatorio implica un error neto, acumulado a lo largo de un día, de unos 38 (45-7) microsegundos, lo que equivale a un error de unos 11.5 km en la determinación de la distancia. Los ingenieros que diseñaron el sistema GPS tuvieron en cuenta la dilatación temporal, y compensaron los 38 microsegundos diarios calibrando adecuadamente los relojes atómicos antes de poner los satélites en órbita. De no haberlo hecho, el sistema se habría vuelto inútil casi inmediatamente después ponerlo en funcionamiento.

La teoría de la relatividad parece una construcción abstracta y puramente matemática, sin relación directa con nuestra vida diaria. Pero el funcionamiento del sistema de posicionamiento GPS nos demuestra lo contrario.

Tiempo y simultaneidad

Decía en la entrada anterior que, con el fin de reconciliar el electromagnetismo con el principio de relatividad, Einstein tendría que enfrentar el problema de la no invariancia de las ecuaciones de Maxwell frente a las transformaciones galileanas, lo que requeriría el abandono de la visión Newtoniana del espacio y el tiempo. Sobre este último pretendo hacer algún comentario ahora.

La conveniencia de un tiempo absoluto

Si se reflexiona un poco sobre la posibilidad de la existencia de un tiempo absoluto como el propuesto por Newton no cuesta mucho convencerse de que, si es que existe, no es cosa fácil de conocer. Hume (a quien, junto con Mach, Einstein reconociera como influyente en su trabajo) ya mencionaba esto con bastante claridad en su Tratado de la naturaleza humana:

De igual modo que de la disposición de los objetos visibles y tangibles recibimos la idea de espacio, formamos la del tiempo en base a la sucesión de ideas e impresiones; el tiempo, por sí solo, no puede manifestarse ante la mente ni ser conocido por ella… Allí donde no tengamos percepciones sucesivas no tendremos noción del tiempo, aunque haya una sucesión real en los objetos. A partir de estos fenómenos, así como de otros muchos, podemos concluir que el tiempo no puede aparecer ante la mente, ni aislado, ni acompañado por un objeto constantemente inmutable, sino que se presenta siempre mediante una sucesión perceptible de objetos mudables

y al menos en parte, Newton parecía al estar tanto de este problema. De hecho, en sus postulados él mismo distingue entre el “tiempo absoluto” y el “tiempo relativo”, siendo el “tiempo relativo” aquél al que nos referimos como tiempo cuando hacemos experimentos.

La pregunta obligada, entonces, es: ¿Por qué suponer la existencia de un tiempo absoluto si en nuestros experimentos solo importa el tiempo relativo? No sé qué habría contestado Newton a esto. Probablemente hubiese esgrimido algún argumento que hoy sería considerado “demasiado zen” para un físico. No obstante, a mí se me ocurre una razón un poco más práctica. Nuestra experiencia cotidiana sugiere que el intervalo de tiempo medido entre dos eventos es el mismo para todos los observadores, independientemente de su estado de movimiento. Hay una enorme variedad de experimentos que, incluso con buena precisión, dan resultados compatibles con esta hipótesis (basta notar que, si no fuese así, los problemas con las transformaciones galileanas habrían aparecido bastante antes en la historia). En el marco de un tiempo absoluto esto queda inmediatamente justificado; nuestros relojes nos sirven para cuantificar cuánto tiempo absoluto transcurre entre 2 eventos, y en su carácter absoluto, este es el mismo “para todo el mundo”. Sin un tiempo absoluto como referencia hemos de considerar, a priori, que los relojes de distintos observadores son independientes entre sí, por lo que no tienen por qué marcar el mismo tiempo. Tendríamos entonces que diseñar un método para comparar el tiempo medido por un observador S con el tiempo medido por otro observador S’, y utilizarlo para mostrar que, efectivamente, el tiempo de S y S’ “coinciden”, como sugieren los experimentos.

Ciertamente la propuesta de un tiempo absoluto ahorra unos cuantos problemas. Pero es un arma de doble filo, ya que su validez depende de qué tan cierto es que todos los observadores miden el mismo intervalo de tiempo entre dos eventos. De no ser cierto esto, aceptar el postulado no solo implica incurrir en un error, sino también hace más difícil identificarlo y corregirlo.

Revisión del concepto de tiempo y simultaneidad

Seguramente sin quererlo, tal vez restringido por sus circunstancias, con su postulado sobre el carácter absoluto del tiempo Newton propició una zona de confort en la que uno se instala cuando empieza a estudiar mecánica, y que puede ser difícil de abandonar. Sigamos a Hume, no obstante, y aceptemos que lo único que tenemos es eso que Newton denomina “tiempo relativo”. Tiempo es, entonces, la posición de las agujas de mi reloj, y asignar un instante t a un evento consiste en reconocer que el evento ocurre simultáneamente al paso de la aguja de mi reloj por la marca t. Esta concepción está muy bien pero, como notara Einstein, solo es útil localmente, i.e., ya no sería suficiente en cuanto se trate de relacionar cronológicamente series de eventos que ocurren en lugares diferentes.

El primer problema entonces radica en saber cómo sincronizar relojes distantes, pues el uso de relojes sincronizados nos permitiría asignar instantes de tiempo a eventos distantes. Alguien podría decir que en realidad la sincronización es cosa simple, puesto que solo hay que tomar un reloj patrón y llevarlo a uno y otro punto del espacio para sincronizar cada reloj localmente. El problema con este método es que se asume tácitamente que el tiempo medido por el reloj patrón transcurre siempre igual para el observador en reposo respecto a los relojes a sincronizar, lo que no es más que asumir nuevamente un tiempo absoluto. Lo mismo sucede si juntamos los relojes para sincronizarlos y luego llevarlos a sus respectivas posiciones. Simplemente no sabemos (todavía) cómo comparar el tiempo medido por relojes en movimiento relativo, por lo que no podemos hacer nada que implique el desplazamiento de relojes. ¿Cómo llevar a cabo la sincronización entonces? Esta es la propuesta de Einstein:

Supongamos dos relojes ubicados en dos puntos distantes A y B. En un instante dado tA (en el reloj de A) parte una señal luminosa desde A hacia B. La señal llega y se refleja en el instante tB (en el reloj de B), llegando de nuevo a A en el instante tA’. Los dos relojes estarán sincronizados si

tB-tA=tA’-tB.

Lo que esto implica es que el tiempo que tarda la luz en ir desde A hasta B y viceversa es el mismo, medido por los dos relojes. Hasta acá bien, pero hay un detalle a tener en cuenta: la sincronización debe ser compatible con el principio de relatividad, lo quiere decir que el proceso de sincronización no debe permitirnos diferenciar distintos lugares del espacio ni saber si nuestros relojes están o no en movimiento. Einstein asegura la compatibilidad al definir a la sincronización como una relación de equivalencia entre relojes, y considerando que la velocidad de la luz en el vacío es la misma para todos los observadores en movimiento relativo uniforme. Con esta definición de sincronización ganamos también una definición de simultaneidad para eventos distantes:

Dos eventos en los puntos A y B serán simultáneos si la lectura del reloj en A para el evento en A y la lectura del reloj en B para el evento en B coinciden, asumiendo que dichos relojes fueron previamente sincronizados.

La sincronización permite volver a tener un sistema de referencia desde el cual observar eventos, estén en el lugar del espacio que estén, asignándoles el instante de tiempo que marque el reloj ubicado en el lugar en el que el evento ocurre (la imagen en la portada de este blog ilustra bien esta idea). Habiendo entendido cómo es nuestro sistema de referencia en ausencia del tiempo absoluto, podemos comparar lo que miden diferentes observadores en movimiento relativo uniforme, lo que llevará a la deducción de las transformaciones de Lorentz. No queda espacio para hablar de eso en esta entrada, pero sí para ver qué pasa con los relojes sincronizados cuando están en movimiento relativo uniforme.

Volvamos a los relojes en A y B. Supongamos que, mediante algún mecanismo, cada reloj emite una señal luminosa hacia el otro cada vez que la aguja marca el doce. Pongamos los relojes sobre una barra rígida, un gatito (no son de uso exclusivo en mecánica cuántica) a mitad de camino entre los relojes y otro, en reposo con el conjunto, en algún punto fuera de la barra. Estando los relojes sincronizados, los dos gatitos van a ver que las señales se originan simultáneamente en ambos relojes, viajan una distancia igual y llegan simultáneamente al punto medio de la barra.

Veamos ahora el caso en que los gatitos están en movimiento relativo, en dirección paralela a la barra. Para poder inferir lo que ve un observador en movimiento relativo, recordemos que la limitación está en saber qué instantes asignar a eventos distantes. Por lo tanto sabemos que, para cualquier observador, las señales que emiten los relojes van a llegar simultáneamente al punto medio de la barra. Por la misma razón, también vemos que el gatito fuera de la barra deberá observar que cada reloj emite la señal cuando su aguja llega al doce.

Ahora bien, el punto medio de la barra está en movimiento, lo que implica que los flashes recorren distancias diferentes antes de encontrarse en este punto. Pero eso implica, por el principio de invariacia de la velocidad de la luz, que la señal que recorre la mayor distancia debe haberse emitido antes que la otra. Luego, vemos que el gatito en movimiento relativo observa que la emisión de las señales por los relojes no es simultánea, lo que obviamente implica que los relojes, para él, no están sincronizados, porque cada señal se emite cuando el respectivo reloj marca las 12. Por extraño que suene, que dos eventos distantes sean simultáneos o no depende del estado de movimiento de quien observe dichos eventos.

Álgebra lineal: Subespacios

Después de un par de ejemplos, lo que seguramente quedó claro (me gustaría pensar que no es lo único) es que probar que algo es un espacio vectorial requiere un poco de trabajo. La buena noticia (?) que traigo ahora es que en muchas ocasiones se puede tomar un atajo.

Consideremos un espacio vectorial V sobre un cuerpo K. Es decir, {V, ⊕, K, +, ×, ★}, y un subconjunto SV. ¿Bajo qué condiciones es S un espacio vectorial sobre K? La definición de espacio vectorial ya está dada, por lo que es obvio que S será un espacio vectorial si y solo si cumple con la definición, por lo tanto lo que nos preguntamos es cómo usar el hecho de que V es un espacio vectorial para determinar si S también lo es. Y es más o menos fácil ver que, sabiendo que V es un espacio vectorial, no queda mucho por hacer: {K, +, ×} es un cuerpo independientemente del conjunto en el que vivan los elementos que llamamos vectores. Por otra parte la definición de ⊕ en S es simplemente la restricción de la definición para V al subconjunto S ⊆ V, lo que asegura dos cosas: Que las propiedades necesarias en ★ se verifican si solo consideramos S como el conjunto de vectores, pues son heredadas de V, y que las condiciones para que {S, ⊕} sea un grupo abeliano se satisfacen, puesto que se satisfacen en V.

¿Es, entonces, {S, ⊕, K, +, ×, ★} un espacio vectorial para cualquier S ⊆ V? La respuesta es no. Si bien las propiedades se heredan y todo el trabajo parece estar ya hecho, hay algo que previene que cualquier subconjunto de un espacio vectorial sea también un espacio vectorial, y es que las restricciones de ⊕ y ★ al subconjunto S deben estar bien definidas. Es decir, para vectores en S debe valer ★: S×KS, y la restricción de ⊕ a S debe ser una ley de composición interna. Resumimos estas condiciones diciendo que S es “cerrado” para la suma y el producto por escalares.

Condición suficiente:

Sea V un espacio vectorial sobre un cuerpo K y S ⊆ V un conjunto no vacío. Si se verifica:

i) ∊  Λ  ∊ S → x∊ S.

ii)  Λ  ∊ S → a S.

Entonces S es un espacio vectorial sobre K.

Vamos a ver cómo funciona esto con algún ejemplo. Habíamos mostrado que el espacio real de dimensión 3 (ℝ3) es un espacio vectorial sobre el cuerpo de reales. Tomemos ahora como subconjunto S al plano definido por la ecuación z=x+y, y veamos si es un espacio vectorial sobre ℝ.

i) Sean u=(x,y,z) ∊ S Λ v=(u,v,w) ∊ S (y por lo tanto en ℝ3). La suma en ℝ3 es la suma usual en el conjunto de matrices, por lo que uv=(x+u,y+v,z+w). Ahora bien, como u y v están en S vale z=x+y Λ w=u+v, por lo que uv=(x+u,y+v,(x+y)+(u+w))=(x+u,y+v,(x+u)+(y+w)), donde la última igualdad resulta de la asociatividad de la suma en ℝ. Vemos entonces que la suma de dos elementos de S es un elemento de S, puesto que verifica la ecuación del plano.

ii) Por la definición de ★ y de S,

au=a(x,y,z)=(a.x,a.y,a.z)=(a.x,a.y,a.(x+y))=(a.x,a.y,a.x+a.y),

Por lo que a∊ S, ya que verifica la ecuación del plano.

Por i) y ii), entonces, el plano definido por la ecuación z=x+y es un espacio vectorial. Fácil, ¿No?. También es fácil mostrar que cualquier subconjunto del espacio real que contenga al 0 (el origen) es también un espacio vectorial. Pero eso para más adelante.

Quiero mostrar, para terminar, un ejemplo dentro del espacio de funciones. Consideremos el conjunto S de funciones de variable real, derivables en cierto intervalo abierto (a,b). Este es, claramente, un subconjunto del conjunto de funciones continuas en [a,b], pues la derivabilidad implica continuidad, y sabemos que este conjunto, F={f:I⊆ℝ → ℝ / f es continua en [a,b]}, es un espacio vectorial sobre ℝ. Vemos entonces que S es un espacio vectorial sobre ℝ, por el solo hecho de que la derivada es lineal:

Sean f y g elementos de S, y c un punto cualquiera de (a,b). Denotemos con Dc a la derivada en el punto c.

i) Dc [(fg)(x)]= D[f(x)+g(x)]= Df(x)+Dg(x). Como f y g son derivables por hipótesis se tiene que fg también lo es, siendo por lo tanto S cerrado para la suma.

ii) D[(af)(x)]= D[a.f(x)]= a.Df(x). Nuevamente, la derivabilidad de f asegura la derivabilidad de af, por lo que S es también cerrado para el producto por escalares.

Luego S es un espacio vectorial. Más interesante aún, básicamente con la misma idea podemos mostrar que el conjunto de soluciones de una ecuación diferencial lineal homogénea es también un espacio vectorial: Supongamos ahora que S es el conjunto de soluciones de una ecuación diferencial lineal homogénea. Es decir,

fS ↔ a1.Dcf(x)+a2.Dc2f(x)+…+anDcnf(x)=0,

donde Dcnf(x) es la derivada n-ésima de f(x) en c y ai, i=0…n, son coeficientes reales que pueden depender de x. Usando la linealidad de la derivada, es inmediato ver que si dos funciones f y g están en S, i.e., satisfacen la ecuación diferencial, entonces la función (af)⊕(bg) también son solución de la ecuación. Esta propiedad es lo que en física conocemos como principio de superposición, y es la razón por la que podemos hablar de “fuerza resultante” dentro de la mecánica newtoniana, o de esa “superposición de estados” que hace (en parte) extraña a la mecánica cuántica.

Nota: hasta ahora vengo usando una notación que puede resultar un poco quisquillosa, y que en general no se usa en los libros. La diferencia radica en que se hace un abuso de la notación, y se utilizan los mismos símbolos para diferentes operaciones. Así, para la suma de vectores () y la suma de escalares (+) el símbolo usado es el mismo, y lo mismo pasa para el caso del producto entre escalares (× ó .) y el producto entre vectores y escalares (). Esto no es por ser un fanático del rigor ni mucho menos, sino porque creo que al menos al principio (cuando uno se entrena en probar quién es un espacio vectorial y quién no) es sano diferenciar bien las operaciones, para evitar confusiones que dificulten las demostraciones (que, en realidad, son bastante simples).

Álgebra lineal: Espacios vectoriales II

En la entrada anterior probamos que ℝ2 (con extensión inmediata a ℝn) es un espacio vectorial. Esta entrada va a estar dedicada a probar lo mismo para otro conjunto muy importante.

Espacio de funciones continuas

Consideremos ahora el conjunto F de todas las funciones de variable real, continuas en un dado intervalo real I. Es decir, F={f:I → ℝ / f es continua}. Definamos 2 operaciones:

1.- Sean f,gF, y x ∊ I. Llamamos suma de funciones a la operación ⊕:ℝ×ℝ → ℝ definida por (fg)(x)=f(x)+g(x), donde evidentemente el símbolo + representa la suma en ℝ, codominio de f.

2.- Sean f ∊ F, α ∊ ℝ y x ∊ I. Llamamos producto de una función por un número real a la operación ★:ℝ×FF definida por (αf)(x)=α.(f(x))

Con estas definiciones podemos analizar si F tiene estructura de espacio vectorial (EV) sobre el cuerpo de los números reales, o sea, si {F, ⊕, ℝ, +, ×, ★} es un EV. Acá podemos apreciar la ventaja de pensar a un EV como un par de estructuras vinculadas por una operación: Ya probamos para el caso de ℝ2 que {ℝ, +, ×} es un cuerpo, por lo que ya tenemos una parte lista. Nos queda probar que {F, ⊕} es un grupo abeliano, y que  ★:ℝ×F → F  verifica las propiedades 1-4 que establecimos anteriormente [1].

{F, ⊕} es un grupo abeliano:

Sean f, g y h elementos de F. Entonces

((fg)⊕h)(x) = (fg)(x)+h(x) = (f(x)+g(x))+h(x) = f(x)+(g(x)+h(x)) = f(x)+(gh)(x) = (f(gh))(x)

Por lo que ⊕ es asociativa.

Denotemos con e a la función idénticamente nula, definida por e(x)=0 ∀ I. Es evidente que esta función es el elemento neutro de F respecto de ⊕, pues para cualquier f en F vale (fe)(x)=f(x)+e(x)=f(x)+0=f(x). También es fácil ver que para todo elemento de F existe un inverso respecto de ⊕, ya que si f ∊ F entonces f(x) ∊ ℝ, cuyo inverso –f(x)= existe siempre por ser {ℝ, +, ×} un cuerpo. Luego, definiendo f -1(x)=(-1)f(x) se tiene

e(x)=0= f(x)+(-f(x))=(ff -1)(x),

por lo que f -1 es el inverso de f respecto de ⊕. Por último, la conmutatividad de ⊕ es inmediata, pues (fg)(x)=f(x)+g(x)=g(x)+f(x)=(gf)(x), con lo que queda probado que {F, ⊕} es un grupo abeliano.

★ verifica las propiedades 1-4

Sean a,b ∊ ℝ y f, g ∊ F.

1. El producto por escalares se distribuye en la suma de funciones, pues

 [a★(fg)](x) = a.(fg)(x) = a.(f(x)+g(x)) = a.f(x)+a.g(x) = (af)(x)+(ag)(x) =  [(af)⊕(ag)](x)

2. También hay distributividad respecto a la suma de escalares:

[(a+b)★f](x) = (a+b).f(x) = a.f(x)+b.f(x) = (af)(x)+(bf)(x) = [(af)⊕(bf)](x)

3. Asociatividad mixta:

[(a.b)★f](x) = (a.b).f(x) = a.(b.f(x))=a.[(bf)(x)]=[a★(bf)](x)

4. El elemento neutro del producto entre reales es también elemento neutro respcto del producto de funciones por escalares, pues (1★f)(x)=1.f(x)=f(x).

Con todo esto, queda probado que {F, ⊕, ℝ, +, ×, ★} es un espacio vectorial. Vale la pena llamar la atención sobre  un detalle particular: cuando probamos la existencia de elemento neutro respecto a ⊕ en F definimos f -1(x)=(-1)f(x). Usando la definición del producto por escalares, vemos que vale f -1(x)=((-1)★f)(x). Esto vale para todo espacio vectorial, independientemente del cuerpo en el que vivan los escalares. También es fácil ver que 0★f=e y ae=e, de donde se deduce también que af=e → a=0 ó f=e.

Una demostración elegante

El teorema de Pitágoras es una de esas cosas que “todo el mundo sabe”. Lo que, a lo mejor, no todo el mundo sabe es cómo demostrarlo. Hay varios caminos para alcanzar una demostración, que se pueden leer en el artículo de Wikipedia al respecto. Creo que ninguna de estas demostraciones es particularmente difícil de entender, pero sí se ve que algunas dan más trabajo que otras, siendo la más simple (en mi opinión) la demostración de Bhaskara. Pero existe otro camino para demostrar el teorema (obra de Einstein cuando era chico, según dicen), que no aparece en el artículo de wikipedia y que vale la pena conocer por su simplicidad.

Para la demostración es necesario utilizar un resultado adicional, que si bien no es evidente, tampoco es difícil de ilustrar:

Empecemos con el primer paso de la demostración de Bhaskara. Con un triángulo rectángulo abc y tres copias más del mismo formamos un cuadrado de lado c, la hipotenusa del triángulo.

02-bhaskara

Ahora, en lugar de seguir con el procedimiento de Bhaskara, miremos el dibujo un momento. Cualquier triángulo cuya hipotenusa sea c puede usarse para formar un cuadrado con el mismo perímetro (4c), pero distintos triángulos van a dar distintas áreas para el cuadrado coloreado en el interior. De hecho, no cuesta mucho ver que el área de este cuadrado interior depende únicamente del ángulo φ entre la hipotenusa c y el cateto menor de abc (puede elegirse el otro también). Y acá aparece un resultado lindo: El área A del triángulo es una fracción del área total del cuadrado de lado c, y esta fracción es función únicamente del ángulo φ. O sea que para cualquier triángulo rectángulo de hipotenusa c puede escribirse su área como: Ac2ƒ(φ).

La demostración:

Miremos ahora el triángulo, y notemos puede descomponerse en otros dos triángulos similares de hipotenusas a y b.

triangulo

Usando el resultado de arriba podemos escribir las áreas de estos dos triángulos como a2ƒ(φ) y b2ƒ(φ), y como el área del triángulo mayor es igual a la suma de las áreas de estos dos, tenemos que

c2ƒ(φ)=a2ƒ(φ) + b2ƒ(φ)

Dividiendo todo por ƒ(φ) resulta

ca2 + b2

que es lo que dice el teorema de Pitágoras.