Principio de relatividad

La teoría de la relatividad es, junto con la mecánica cuántica, uno de los dos pilares de la física moderna. En esta entrada voy intentar hacer un repaso (muy breve) por la génesis de la teoría.

el espacio y tiempo absolutos de la mecánica newtoniana

En su famosa obra Principia [1] Newton presenta sus 3 leyes del movimiento y la ley de gravitación universal, sentando las bases de la mecánica clásica. Es también en Principia donde Newton postula el carácter absoluto del espacio y el tiempo.

Sobre el espacio absoluto y relativo:

El espacio absoluto, por su propia naturaleza y sin relación alguna con nada externo, permanece similar e inmóvil. El espacio relativo es una dimensión o medida movible de los espacios absolutos que nuestros sentidos determinan de acuerdo con su posición con respecto a los cuerpos y que por lo común se toma como espacio inmóvil; tal es la dimensión de un espacio subterráneo, aéreo o celeste, determinada través de su posición con respecto a la Tierra. El espacio absoluto y el relativo son iguales en forma y magnitud, pero no siempre coinciden numéricamente, un espacio cualquiera de nuestro aire, que relativamente a la Tierra y con respecto a la Tierra permanece siempre igual, en un momento dado ocupa una cierta parte del espacio absoluto por el que atraviesa el aire; en otra parte ocupará otra parte distinta del mismo y así entendido su sentido absoluto, irá modificándose continuamente.

Sobre el tiempo absoluto y relativo:

El tiempo absoluto, verdadero y matemático, en sí mismo por su propia naturaleza, fluye de una manera ecuable y sin relación alguna con nada externo y, se conoce también con el nombre de duración; el tiempo relativo, aparente y común es una medida sensible y externa (ya sea exacta e inecuable) de la duración por medio del movimiento, y se utiliza corrientemente en lugar del tiempo verdadero; ejemplo de ello son la hora, el día, el mes el año.

Puede no resultar obvio, pero lo que estos postulados [2] implican es que los intervalos de tiempo y espacio entre dos eventos dados son los mismos para todos los observadores en movimiento relativo, y por lo tanto, que eventos que son simultáneos para un dado observador también han de serlo para todos los demás. Estas consecuencias están en acuerdo con nuestra experiencia cotidiana: Nuestros relojes no parecen adelantar o atrasar por el solo hecho de estar viajando en auto, por ejemplo, ni tampoco observamos que la graduación de una regla cambie mientras la movemos de un lado a otro. No obstante la naturaleza del espacio y el tiempo newtonianos sería cuestionada por físicos y filósofos, hasta ser “abolida” por Einstein en su trabajo de 1905.

El principio de relatividad de Galileo

Por extraño que pueda parecer, uno de los postulados de la teoría de la relatividad de Einstein, conocido como principio de relatividad, se remonta a los trabajos de Galileo Galilei. Basándose en los resultados de sus observaciones,  en 1632 Galileo escribía en su obra Diálogos sobre los dos máximos sistemas del mundo [3]:

Encerraos con un amigo en la cabina principal bajo la cubierta de un barco grande, y llevad con vosotros moscas, mariposas, y otros pequeños animales voladores… colgad una botella que se vacíe gota a gota en un amplio recipiente colocado por debajo de la misma… haced que el barco vaya con la velocidad que queráis, siempre que el movimiento sea uniforme y no haya fluctuaciones en un sentido u otro…. Las gotas caerán… en el recipiente inferior sin desviarse a la popa, aunque el barco haya avanzado mientras las gotas están en el aire… las mariposas y las moscas seguirán su vuelo por igual hacia cada lado, y no sucederá que se concentren en la popa, como si cansaran de seguir el curso del barco…|Galileo Galilei

Lo que Galileo dice es que, mientras el movimiento del barco sea uniforme (es decir, su velocidad respecto a tierra sea constante), los resultados de los experimentos realizados en el barco deberían coincidir con los de aquellos realizados en tierra firme. Supongamos ahora que tenemos un conjunto de “leyes” que nos permiten describir los fenómenos físicos, y predecir resultados de experimentos. Vemos que la observación de Galileo implica que estas leyes deben ser las mimas en Tierra y sobre el barco, puesto que las descripciones y predicciones han de coincidir. Podemos utilizar esta idea para convertir la propuesta de Galileo en un enunciado general: El principio de relatividad.

Las leyes que describen los fenómenos físicos son las mismas para todos los observadores en movimiento relativo uniforme.

Podemos ir todavía un poco más lejos. Dado que las leyes físicas se expresan mediante ecuaciones, el principio de relatividad implica que estas ecuaciones deben ser las mismas para todos los observadores en movimiento relativo uniforme. Veamos como se expresa esto matemáticamente:

Imaginemos dos observadores S y S’ en movimiento relativo con velocidad v, esto es, S’ se mueve respecto a S con velocidad v. Estos observadores miden la posición de un objeto usando coordenadas x y x’ respectivamente. Dado que suponemos tiempo absoluto, una vez sincronizados (S y S’ están en el mismo lugar cuando empiezan a medir el tiempo) los relojes de S y S’ marcan siempre lo mismo, lo que expresamos escribiendo t=t’. ¿Cómo se relacionan las coordenadas x y x’?

500px-Special_Relativity_Fig1

Como se ve en la figura, siempre podemos escribir la distancia del objeto a S (el valor de x) como la suma de la distancia entre S y S’ y la distancia del objeto a S’ (el valor de x’). Además, sabemos que S’ se mueve con velocidad v respecto a S, por lo que en cualquier instante t la distancia de S a S’ es v.t. Podemos escribir entonces

x=x’+v.t ó x’=x-v.t

Esta regla para “pasar” de las coordenadas de S a las de S’ y viceversa se conoce como transformación de coordenadas, y nos permite comparar lo que “ven” distintos observadores en movimiento relativo uniforme. Lo que dice el principio de relatividad, entonces, es que las ecuaciones deben mantener su forma cuando cambiamos de x a x’. La segunda ley de Newton [4], por ejemplo, es la misma para todos los observadores en movimiento relativo uniforme. Es decir, si vale F=m.a para el observador S, entonces también vale F’=m.a’ para S’. La mecánica clásica es compatible con el principio de relatividad, es decir, las ecuaciones de movimiento de los sistemas mecánicos son invariantes frente a las transformaciones de Galileo.

post-23594-skateboard-backflip-gif-UuKQ

En este punto conviene llamar la atención sobre algo que puede haber pasado inadvertido. Para llevar el principio enunciado por Galileo al ámbito de las ecuaciones tuvimos que establecer las transformaciones de coordenadas (transformaciones de Galileo, de ahora en más), y estas dependen del tiempo absoluto postulado por Newton. Si cambiáramos nuestra forma de entender el tiempo y el espacio (como haría Einstein al formular su teoría) estas transformaciones serían diferentes, y las ecuaciones que describen las leyes físicas deberían adaptarse a estas nuevas transformaciones, si se pretende que sean las mismas para todos los observadores en movimiento relativo uniforme.

electromagnetismo y óptica

Gracias a los experimentos realizados por Young [5] y Fresnel [6], entre otros, durante la primera mitad del siglo XIX los físicos llegaron a convencerse de la naturaleza ondulatoria de la luz. En analogía con las ondas mecánicas, que consisten en vibración de un medio elástico, se propuso un medio para la propagación de las ondas electromagnéticas: El éter luminífero. Este medio debía ser, por fuerza, algo especial. Debía tratarse de un sólido elástico y no dispersivo, de manera que la propagación de la luz pudiese entenderse como el resto de las ondas mecánicas, pero también debía tener la capacidad de penetrar otros medios materiales interactuando con estos en alguna manera, de forma que fuera posible explicar la propagación de la luz en medios como el aire, la luz y el vidrio y  sus respectivos índices de refracción [7]. Más importante aún, dado que el éter debía llenar todo el espacio para hacer posible la propagación de la luz, éste debía estar en reposo respecto al espacio absoluto. Podría decirse que el éter era la materialización del espacio absoluto propuesto por Newton.

En 1873 Maxwell [8] publica su conocida obra,  A treatise on electricity and magnetism, en la que presenta una teoría que unifica los fenómenos eléctricos y magnéticos. Una predicción de esta teoría es la existencia de ondas electromagnéticas, lo que quiere decir que en ausencia de fuentes de carga [9] y corriente [10] la solución de las Ecuaciones de Maxwell [11] lleva a que los campos eléctrico y magnético deben ser solución de una ecuación de ondas [12]. Cuando Maxwell encontró estas soluciones notó que la velocidad a la que deberían propagarse estas ondas electromagnéticas, según la teoría, era muy similar a la velocidad medida para la propagación de la luz, por lo que conjeturó que la luz era un caso especial de onda electromagnética. Esta conjetura fue posteriormente confirmada por los experimentos realizados por Hertz [13]Así la óptica quedaba integrada como parte del electromagnetismo, y el éter luminífero pasó a coincidir con el medio que Maxwell postulara para la propagación de las ondas electromagnéticas. Las consecuencias de esto no son menores: La existencia de las ondas electromagnéticas llevó a proponer la existencia de un medio en el que los campos “viven”, lo que implica que la teoría de Maxwell consiste en un conjunto de leyes que describe los fenómenos electromagnéticos para observadores en reposo respecto a este medio, por lo que el principio de relatividad deja de valer en el reino de los fenómenos electromagnéticos. La identificación de dicho medio con el éter luminífero implica que el sistema de referencia en el que vale la teoría electromagnética está en reposo absoluto.

La teoría de Maxwell fue muy exitosa explicando fenómenos electromagnéticos conocidos, y además proporcionó predicciones que luego fueron confirmadas experimentalmente. Los problemas empezaron cuando los físicos se propusieron conocer cuál era el estado de movimiento de la Tierra respecto al éter. Resolver este problema era de importancia porque, supuesta la existencia del éter, es claro que las ecuaciones de Maxwell permiten conocer los campos eléctrico y magnético en un sistema de referencia en reposo respecto al éter, y para saber qué es lo que ve un observador en movimiento respecto al mismo es necesario conocer su velocidad relativa (de la que dependen las transformaciones de Galileo). Dicho de otra manera: la velocidad de la luz que predice la teoría de Maxwell sería solo la que mediría un observador en reposo respecto al éter, y otros observadores en movimiento relativo medirían otra, tal y como pasa con las ondas mecánicas. Entre los varios intentos de resolver esta cuestión destaca el experimento de Michelson y Morley.

el experimento de michelson y morley

Michelson [14] diseñó un experimento para determinar la velocidad relativa de la Tierra respecto al éter. La idea es relativamente sencilla: Tenemos el éter llenando todo el espacio y la tierra moviéndose a través de este en alguna dirección dada. Podemos imaginarnos que, mediante algún dispositivo, nos es posible generar dos pulsos luminosos que se propaguen en direcciones distintas: Uno de ellos en la dirección del movimiento de la Tierra respecto al éter, y el otro en dirección perpendicular a este.  En un sistema de referencia en reposo respecto del éter los dos pulsos viajarían a la misma velocidad, esos casi 3×10^8 m.s^-1 que predice la teoría de Maxwell. Pero en un sistema en reposo respecto a la Tierra las velocidades serían distintas, debido a que las transformaciones galileanas dicen que las velocidades se suman. Así, el pulso luminoso que se propaga en la dirección normal al movimiento de la Tierra respecto al éter debería propagarse a la misma velocidad que en el éter (dado que la velocidad relativa es nula), pero el otro pulso debería propagarse a una velocidad c’ un poco menor, resultado de la diferencia entre la velocidad medida en el éter y la velocidad relativa entre la Tierra y dicho medio, es decir c’= (3×10^8 – v) m.s^-1. Una medida de la velocidad de estos pulsos permitiría, entonces, conocer la velocidad con la que la Tierra se mueve en el éter.

Como muchas ideas simples, llevar esto a un dispositivo real resultó complicado. ¿Como generar dos pulsos de luz simultáneos, y además medir su velocidad? La solución de Michelson llegó con la construcción de su interferómetro, convirtiendo el problema de los pulsos de luz en un problema de interferencia [15] . Este es un esquema simplificado que muestra como funciona.

mm_esquema

La fuente emite un haz de luz monocromática que al llegar al semiespejo se divide en dos haces perpendiculares. Estos haces se reflejan en espejos diferentes y vuelven hacia el semiespejo para reflejarse nuevamente en dirección hacia una pantalla (representada por un ojo en la figura) en la que se forma un patrón de interferencia, debido a una diferencia de fase entre los dos haces. La idea entonces era la siguiente: Mientras el interferómetro estuviese en reposo respecto al éter, el patrón de interferencia sería siempre el mismo. Si, en cambio, el interferómetro se moviera respecto al éter en dirección paralela a alguno de sus brazos, entonces para un observador en reposo respecto al interferómetro la velocidad de la luz tendría un valor diferente en esa dirección. Debido a este cambio en la velocidad en una sola de las direcciones, la fase relativa de los haces de luz en el semiespejo también cambia, provocando un patrón de interferencia diferente en la pantalla. Hasta acá muy bien, pero hay un problema: El interferómetro está sobre la Tierra, por lo que se puede observar el patrón de interferencia debido a las diferentes velocidades en las dos direcciones de los brazos del interferómetro, pero no hay manera de compararlo con el patrón correspondiente al estado de reposo respecto al éter. La solución a este problema fue medir en una posición, y luego rotar el interferómetro 90º. El desplazamiento en el patrón de interferencia en esta comparación, sería el doble del que se quiere observar.

On_the_Relative_Motion_of_the_Earth_and_the_Luminiferous_Ether_-_Fig_3

Dibujo del interferómetro utilizado por Michelson y Morley en su experimento.

Para el momento en que Michelson, en colaboración con Morley [16] realizó su experimento ya se había descartado la posibilidad de que la Tierra “arrastrara” al éter, como si este fuese un fluido viscoso, por lo que necesariamente debía detectarse una velocidad no nula del planeta respecto al éter. Sin embargo el resultado del experimento fue nulo, es decir, no se detecto movimiento de la Tierra respecto al éter.

¿Qué falló?

La interpretación rápida de los resutados de este experimento sería El desplazamiento observado es nulo, luego la velocidad relativa de la Tierra respecto al éter es nula. Pero esta interpretación ya en ese entonces se sabía imposible. Una posible explicación a este resultado fue provista por Lorentz [17] en 1892 quien introdujo como hipótesis que los cuerpos en movimiento relativo respecto al éter debían contraerse en un factor dependiente de la velocidad de desplazamiento. La hipótesis se introduce ad hoc: Lorentz compensa la variación que debería observarse en la velocidad de la luz con un acortamiento en la longitud del brazo en la dirección de movimiento, de manera que el efecto neto del desplazamiento a través del éter sea nulo.

Si bien la solución propuesta no resulta muy agradable (lo sería si la contracción propuesta pudiese deducirse en lugar de introducirse a la fuerza) la teoría de Lorentz resultó exitosa, puesto que eliminaba las inconsistencias que surgían de los resultados nulos en los experimentos como el de Michelson y Morley, que intentaban medir el desplazamiento respecto al éter.

einstein y una teoría alternativa

El primer artículo de Einstein sobre la teoría de la relatividad fue publicado en 1905, año conocido como annus mirabilis. La siguiente cita es de la introducción del artículo:

Se sabe que cuando la electrodinámica de Maxwell – tal como se suele entender actualmente – se aplica a cuerpos en movimiento, aparecen asimetrías que no parecen estar en correspondencia con los fenómenos observados. Pensemos, por ejemplo, en la interacción electrodinámica entre un imán y un conductor. En este caso, el fenómeno que se observa depende solamente del movimiento relativo entre el conductor y el imán, mientras que de acuerdo a la interpretación común se deben distinguir claramente dos casos muy diferentes, dependiendo de cuál de los dos cuerpos se mueva. Si se mueve el imán mientras que el conductor se encuentra en reposo, al rededor del imán aparece un campo eléctrico con cierto valor para su energía. Este campo eléctrico genera una corriente en el lugar donde se encuentre el conductor. Pero si el imán está en reposo y el conductor se mueve, al rededor del imán no aparece ningún campo eléctrico sino que en el conductor se produce una fuerza electromotriz que en sí no corresponde a ninguna energía pero da lugar a corrientes eléctricas que coinciden en magnitud y dirección con las del primer caso, suponiendo que el movimiento relativo es igual en cada uno de los casos bajo consideración.

Otros ejemplos de esta índole así como los intentos infructuosos para constatar un movimiento de la Tierra con respecto al “medio de propagación de la luz” permiten suponer que no solamente en mecánica sino también en electrodinámica ninguna de las propiedades de los fenómenos corresponde al concepto de reposo absoluto.

Lo que parece molestar a Einstein es que un fenómeno único desde el punto de vista de la mecánica tenga 2 descripciones diferentes en el electromagnetismo. Dicho de otra manera, el principio de relatividad parece ser válido en el ámbito de la mecánica, pero no así en el reino de los fenómenos electromagnéticos.

Ahora bien, esta asimetría, por si misma, no necesariamente constituye un problema. Recordemos que los campos electromagnéticos viven en el éter, y que la teoría desarrollada por Maxwell consiste en un conjunto de leyes que describen los fenómenos electromagnéticos respecto a un observador en reposo respecto al éter, es decir, en reposo absoluto. La asimetría de la que habla Einstein, entonces, no es más que una consecuencia de este hecho. El principio de relatividad deja de valer en el electromagnetismo porque, a diferencia de lo que pasa dentro de la mecánica, los fenómenos electromagnéticos sí distinguen el reposo absoluto. Matemáticamente, además, esto se refleja en el hecho de que las ecuaciones del electromagnetismo no conservan su forma frente a las transformaciones galileanas.

Sin embargo, como deja entrever Einstein en el segundo párrafo citado, esta explicación puede objetarse. Si es cierto que estas asimetrías quedan explicadas por la capacidad del electromagnetismo de distinguir el reposo absoluto: ¿Por qué fallan los experimentos que intentan medir desplazamiento respecto al éter?

Hipótesis

Einstein propone una teoría alternativa partiendo de 2 hipótesis:

1) En todos los sistemas de coordenadas en los que tienen validez las ecuaciones de la mecánica, tienen también validez las mismas leyes de la electrodinámica.

2) La luz puede propagarse en el vacío, y lo hace de manera tal que su velocidad de propagación no depende de la velocidad de la fuente.

En la primer hipótesis extiende el principio de relatividad galileano al electromagnetismo: Todos los observadores en movimiento relativo uniforme describen los fenómenos de la misma manera, es decir, con las mismas ecuaciones. Esto implica que las ecuaciones deben tener una forma invariante frente a transformaciones de coordenadas (covariancia). La hipótesis en 2) sobre la velocidad de la luz es, en realidad, una característica común a todos los fenómenos ondulatorios. Lo novedoso es la idea de que la luz puede propagarse en el vacío, eliminando el éter.

Al sacar al éter del escenario Einstein enfrenta el problema de fondo: La incompatibilidad de las transformaciones de galileo con la teoría electromagnética. En efecto, para que las ecuaciones del electromagnetismo sean compatibles con el principio de relatividad, las transformaciones de coordenadas deben cambiar a otras, que dejen invariantes no solo a las ecuaciones de la mecánica, sino también a las ecuaciones de Maxwell. Esto requerirá el abandono del espacio y el tiempo absolutos de Newton…

Anuncios

Álgebra lineal: Espacios vectoriales I

En la entrada anterior comenté que un espacio vectorial es una estructura algebraica, y dediqué la entrada a explicar muy someramente qué cosa es una estructura algebraica. El objetivo en esta entrada es definir qué tipo de estructura es un espacio vectorial, y explicar con un ejemplo simple cómo probar que un objeto dado tiene esta estructura o no.

Definición

En algunos textos, la definición de espacio vectorial consiste en una lista con unos 10 axiomas, en los que en ocasiones se observan abusos de notación no aclarados. A mi entender, la manera más simple de pensar un espacio vectorial es como un par de estructuras vinculadas por una operación binaria (no es que esté diciendo nada nuevo, claro). Voy a ser un poco más preciso: Supongamos que tenemos un grupo abeliano {V, ⊕} (cuyos elementos denominamos vectores), un cuerpo {K, +, ×} (cuyos elementos denominamos escalares), y una ley de composición externa ★:V×K→V. Decimos que el objeto {V, ⊕, K, +, ×, ★} es un espacio vectorial si se verifican las siguientes condiciones para cualesquiera elementos en V y en K.

∀ α, β ∊ K, y ∀ u, v ∊ V:

1. α★(vw)=(αv)⊕(αw). Esto es, la operación ★ , de ahora en más producto de un vector por un escalar, se distribuye en la suma (⊕) de vectores.

2. (α+β)★v=(αv)⊕(βv). En este caso, pedimos al producto ★ que sea distributivo respecto de la suma de escalares. Un detalle que merece atención es el siguiente: A la izquierda del igual, la suma es la de escalares +, mientras que a la derecha, la suma es la de vectores ⊕. El por qué de esto está en la definición del producto entre vectores y escalares, ★:V×K→V, que da como resultado un vector, y no un escalar.

3. (α × β)★v=αβv). Esta propiedad se denomina asociatividad mixta.

4. 1★v=v. Con el símbolo 1 representamos al elemento neutro de K respecto del producto. Si K fuera el conjunto real ℝ, por ejemplo, entonces 1 representaría al número real 1, que es el elemento neutro respecto del producto, ya que todo número real x verifica 1.x=x.

“ℝ2” es un espacio vectorial

Hasta acá la definición. Veamos con un ejemplo cómo identificar si un dado objeto tiene estructura de espacio vectorial. Tomemos el conjunto ℝ, con la suma y producto ordinarios (denotados con + y × respectivamente), y el conjunto de pares ordenados de números reales ℝ2 (cuyos elementos son de la forma (a, b), con a,b ∊ ℝ), con una operación suma definida como (a, b)⊕(a’, b’)=(a+a’, b+b’). Definamos ahora el producto ★:ℝ×ℝ2→ℝ2 de pares por números reales de la siguiente manera: Si x ∊ ℝ y (a,b) ∊ ℝ2, entonces x★(a,b)=(× a× b).

¿Cómo probamos que el objeto {ℝ2, ⊕, ℝ, +, ×, ★} es un espacio vectorial? Usemos la definición. Tenemos que probar que {ℝ, +, ×} es un cuerpo, que {ℝ2, ⊕} es un grupo abeliano, y que ★ verifica las propiedades 1-4.

{ℝ, +, ×} es un cuerpo

Sabemos que la suma de números reales es asociativa, es decir que (x+y)+z=x+(y+z) ∀ x,y,z ∊ ℝ. También existe en ℝ un elemento neutro respecto de +, y es el número 0, ya que 0+x=x ∀ x ∊ ℝ. Además, sabemos que para cualquier elemento x ∊ ℝ podemos encontrar el elemento –x ∊ ℝ tal que x+(-x)=0, es decir, para todo número real podemos encontrar un inverso respecto de la suma. Por último, la suma es una operación conmutativa x+y=y+x ∀ x,y ∊ ℝ.

Por todo esto, podemos asegurar que {ℝ, +} es un grupo abeliano. Sin mucho esfuerzo, podemos ver que lo mismo pasa en el caso de {ℝ-{0}, ×}. Y dado que conocemos la propiedad distributiva de la multiplicación de números reales en la suma, vemos que {ℝ, +, ×} cumple con la definición de cuerpo.

{ℝ2, ⊕} es un grupo abeliano

i) Asociatividad: Supongamos que tenemos tres elementos cualesquiera de ℝ2, x=(x, y), x’=(x’, y’) y x”=(x”, y”). Queremos probar que x⊕(x’x”)=(xx’)⊕x”:

x⊕(x’x”)=

=(x, y)⊕((x’, y’)⊕(x”, y”))

=(x, y)⊕(x’+x”, y’+y”) Por definición de ⊕.

=(x+(x’+x”), y+(y’+y”)) Por definición de ⊕.

=((x+x’)+x”, (y+y’)+y”) Por asociatividad de + en ℝ.

=(x+x’, y+y’)⊕(x”y”) Por definición de ⊕.

=((x, y)⊕(x’y’))⊕(x”y”) Por definición de ⊕.

=x⊕(x’x”).

ii) Existencia de elemento neutro. Queremos probar que existe en ℝ2 un elemento e=(e1, e2) tal que ex=x, ∀ x=(x, y) ∊ ℝ2:

ex=(e1, e2)⊕(x, y)=(e1+x, e2+y) Por definición de ⊕. Para verificar la condición exigida, entonces, debe valer que (e1+x, e2+y)=(x, y), lo que implica e1+x=x y e2+y=y. Vemos que la única manera de satisfacer la ecuación es haciendo a e1 y e2 iguales al elemento neutro respecto de la suma en el conjunto real (y por transitividad iguales entre sí), esto es e1=e2=0. Por lo tanto existe un elemento neutro respecto de ⊕ en ℝ2, y es el par (0, 0).

iii) Existencia de inverso. En este caso lo que buscamos mostrar es que, para todo elemento x en ℝ2, existe en el mismo conjunto un elemento x-1=(x-1, y-1), tal que xx-1=e. La estrategia a adoptar es básicamente la misma que en el caso anterior:

xx-1=(x, y)⊕(x-1, y-1)=(x+x-1,y+y-1)=(0, 0). Luego, vemos que x-1=-x, el inverso de x respecto de la suma en ℝ, y-1=-y, el inverso de y.

iv) Conmutatividad: Ahora queremos mostrar que, para cualquier par x, x’ ∊ ℝ2 vale que xx’=x’x. La prueba es directa, y se apoya en la conmutatividad de la suma de números reales.

xx’=(x, y)⊕(x’, y’)=(x+x’, y+y’)=(x’+x, y’+y)=(x’, y’)⊕(x, y)=x’x.

Por i), ii), iii) y iv) tenemos que {ℝ2, ⊕} es un grupo abeliano.

★ verifica las propiedades 1-4

Sean a,b ∊ ℝ y xx’ ∊ ℝ2.

1. a★(xx’)=a★((x, y)⊕(x’, y’))=a★(x+x’, y+y’)

=(× (x+x’), × (y+y’)) Por definición de ★.

=(× x+× x’, × y+× y’) Por distributividad de × en +.

=(× x, × y)⊕(× x’, × y’) Por definición de ⊕.

=a★(x, y)⊕a★(x’, y’)=(ax)⊕(ax’).

2. (a+b)★x=(a+b)★(x, y)=((a+b× x, (a+b× y) Por definición de ★.

=(× x+b × x, a × y+b × y) Por distributividad de × en +.

=(× x, × y)⊕(× x, b × y) Por definición de ⊕.

=(ax)⊕(b★x)  Por definición de ★.

3.  (× b)★x=(× b)★(x, y)=((a × b) × x, (× b× y) Por definición de ★.

=(× (× x)× (× y)) Por asociatividad de ×.

=a★(× x× y)=a★(bx).

4. 1x=1★(x, y)=(1× x, 1× y)=(x, y)=x.

Vemos con esto que {ℝ2, ⊕, ℝ, +, ×, ★} es un espacio vectorial. No es difícil darse cuenta de que las demostraciones que hicimos para los pares de números reales se extienden directamente a n-uplas de números reales. Luego, es fácil demostrar que {ℝn, ⊕, ℝ, +, ×, ★}, con n natural, es un espacio vectorial. Un caso familiar de estos espacios es el de n=3, que es el espacio real tridimensional en el que se desarrolla la mecánica newtoniana.

Hay varios otros ejemplos importantes de espacios vectoriales, que voy a comentar en las próximas entradas.

Álgebra lineal: ¿Qué es una estructura algebraica?

La base del álgebra lineal está en el concepto de espacio vectorial. Un espacio vectorial es una estructura algebraica. ¿Y qué es una estructura algebraica?

Podemos empezar a contestar esa pregunta hablando sobre operaciones binarias. Supongamos tenemos 3 conjuntos A, B y C. Una operación binaria es aquella que a un par de elementos formado, por ejemplo, por un elemento de A y otro B, le asigna un elemento de C. Dicho de una manera más útil, la operación binaria es una aplicación del producto cartesiano de A y B en el conjunto C. Podemos escribir esto como ⊙:A × B→C, donde ⊙ representa a la operación. Así, si a es un elemento de A, b un elemento de B, y c el elemento de C asignado al par (a,b) de A × B, tenemos ⊙(a,b)=ab=c. Esto es cosa de todos los días, aunque no parezca. Por ejemplo, la suma 1+1=2 puede escribirse como +(1,1)=2. La operación +:N × N→N es una operación binaria.

De todas las posibles operaciones binarias nos interesa un subconjunto, denominado leyes de composición. Básicamente, son aquellas operaciones binarias en las que solo intervienen dos conjuntos o uno solo. En el primer caso hablamos de una ley de composición externa, y en el segundo, de una ley de composición interna. Esta imagen de Wikipedia es bastante clara:

ley de composicion

Vemos que la operación suma, mencionado arriba, es una ley de composición interna.

Con esto, ya podemos hablar de estructuras. Una estructura algebraica es, en el caso más simple, un objeto compuesto por un conjunto (no vacío) y una ley de composición interna. En casos más complicados, podemos tener más de una ley de composición interna, o también leyes de composición externa. Veamos algunos ejemplos, que nos van a servir para definir más adelante qué es un espacio vectorial.

Monoide

La estructura más simple es un monoide. Un monoide es simplemente un par (M,⊙), donde M es un conjunto no vacío y ⊙ es una ley de composición interna en M, es decir, ⊙: M×M→M, a la que exigimos dos propiedades: Asociatividad, y existencia de elemento neutro en el conjunto. Con asociatividad, lo que queremos decir es que si a, b, y c son 3 elementos cualquiera en M, entonces (ab)⊙c=a⊙(bc). La segunda condición, implica exigir la existenca de eM, tal que para cualquier aM vale que ae=ea=a. Ejemplo de monoide es el conjunto de números naturales con la operación producto: (ℕ,×).

Grupo

Un grupo es un par (G,⊙), donde G es un conjunto no vacío y ⊙ es una ley de composición interna a la que, además de asociatividad y existencia de elemento neutro, le exigimos también, para todo elemento de G, la existencia de un inverso respecto de ⊙. Precisemos lo que queremos decir con inverso: Dado un elemento a en G, existe otro elemento a^-1, tal que aa^-1=a^-1a=e. Ejemplos de esta estructura podemos encontrar en el conjunto de los números reales junto con el producto, (ℝ,×) o el conjunto de los números enteros con la suma (ℤ,+). Si además de cumplir las condiciones mencionadas, la operación es conmutativa, esto es, ab=baa,b ∊ G, el grupo se denomina abeliano.

Cuerpo

A diferencia de los ejemplos anteriores, un cuerpo es una terna. En este caso tenemos un conjunto K, y dos leyes de composición interna, ⊕ y ⊗. Decimos que la terna (K,⊕,⊗) es un grupo si:

1.(K,⊕) es un grupo abeliano

2.(K-{0},⊗) es un grupo abeliano.

3.a⊗(b⊕c)=(a⊗b)⊕(a⊗c) ∀a, b, c ∊ K.

donde 0 denota el elemento neutro respecto de la operación ⊕ y la condición 3 es simplemente la distributividad de ⊗ respecto de ⊕.

Nuevamente tenemos un ejemplo familiar de cuerpo en el conjunto de los números reales, tomando ⊕ como la suma y ⊗ como el producto. Es decir, (ℝ,+,×) es un grupo.

Y acá lo dejo. De más está decir que esta pequeña mención a las estructuras algebraicas es apenas una mirada a la superficie del tema, que como tantos otros puede volverse tan complejo y sofisticado (e interesante) como se quiera. No obstante, alcanza para empezar a definir de forma simple y precisa lo que es un espacio vectorial, objeto de estudio del álgebra lineal.

El experimento de Young

No, no voy a explicar de qué va el experimento de Young, las descripciones/explicaciones de este experimento abundan, y las hay muy buenas. Lo que no abunda entre las reproducciones caseras, son ejemplos en los que la fuente entregue luz blanca (incluso hay quien asegura que solamente se puede hacer con luz monocromática), cosa un tanto paradójica ya que el mismo Young lo hizo con luz natural. En este video muestro mi intento ( un poco vago) de recrear el experimento con lo que tengo a mano en casa, y como Young lo hizo.

young

Bueno, casi. En 1801 Young utilizó un haz de luz natural proveniente de un pequeño agujero en la ventana. El haz se reflejaba en un espejo, dirigido hacia una tarjeta de espesor ligeramente menor al diámetro del haz. Detrás de la tarjeta puso una pantalla, donde observó las franjas de interferencia. A diferencia de Young, en lugar de usar una tarjeta me fabriqué un par de rendijas con un poco de cartón fino, y para hacerme de un haz de luz dejé la persiana entreabierta. Si bien la oscuridad en la habitación está lejos de ser óptima, se llegan a apreciar un par de franjas a los lados del máximo de intensidad.

Misconceptions

Hoy leí Osmosis Confusion: 60 Years and counting, una entrada publicada en uno de los blogs de Scientific American, que trata sobre una explicación incorrecta para el fenómeno de la ósmosis, al parecer, particularmente difícil de erradicar. Sinceramente, no recuerdo haber estudiado a la ósmosis como un fenómeno difusivo. De hecho, si bien conocía el fenómeno, hasta hoy su explicación era una más entre las tantas cosas que ignoro. Todo esto viene a cuento porque la lectura me hizo recordar algunas explicaciones que en su momento creí entender, y tiempo después descubrí erróneas.  Acá van:

Sustentación en perfiles alares

En la escuela tuve “aerodinámica”. Ahí aprendí que la sustentación en los perfiles alares tiene lugar porque las moléculas de aire, cercanas  al llegar al borde de ataque, deben reencontrarse al pasar el borde de fuga. Al ser el recorrido por el extradós más largo que el correspondiente al intradós, necesariamente la velocidad del aire por encima del perfil ha de ser mayor que la velocidad debajo del mismo. Invocando entonces el principio de Bernoulli, encontramos que la presión en el intradós es mayor a la presión en el extradós, y así aparece una fuerza neta hacia arriba sobre el perfil. Esa fuerza sería la sustentación.

bernoulli

Bueno, resulta que esto está mal. No es cierto que moléculas cercanas en la zona del borde de ataque tengan que seguir siendo cercanas al pasar por el borde de fuga (simplemente no tienen por qué serlo), y de hecho no sucede. Es claro entonces que tampoco es necesario que la distancia a recorrer en el extradós sea mayor que en el intradós. ¿Cómo se produce entonces la sustentación?

Más que la forma del perfil, la responsabilidad por la sustentación recae sobre el ángulo de ataque.

En el .gif de arriba (Wikipedia) el perfil tiene un ángulo de ataque de 8º. Lo primero a notar es que las partículas que llegan juntas al borde de ataque no se encuentran en el borde de fuga, como supone el argumento basado en el principio de Bernoulli. Lo siguiente es la dirección del flujo: Los diferentes colores representan diferentes líneas de corriente. A simple vista se ve que el fluido, que llega con velocidad horizontal al borde de ataque, sale deflectado hacia abajo en el borde de fuga, es decir, la circulación alrededor del perfil tiene como consecuencia una variación en el momento del fluido. Por la segunda ley de Newton, se deduce que el perfil ejerce una fuerza hacia abajo sobre el fluido, y por la tercera ley de Newton, el fluido ejerce sobre el perfil una fuerza de igual intensidad, en sentido contrario. Esta fuerza, es la sustentación.

Carácter adiabático de la propagación de ondas de presión

Este ejemplo fue el primero que se me vino a la cabeza cuando leí la nota en Scientific American, ya que implica un fenómeno difusivo. Cuando estudié ondas sonoras en uno de los cursos de física general, acepté como argumento válido el que la propagación de ondas sonoras en un gas es un proceso adiabático, porque la frecuencia de la variación local en la presión y temperatura del aire es demasiado rápida como para que tenga lugar una transferencia de calor apreciable. Esta vez no me lo contaron, sino que lo leí de un libro, probablemente una edición vieja del Resnick.

No es obvio que el argumento esté mal, y de hecho hasta es intuitivo. En las zonas de máxima presión la temperatura es más alta, por lo que es esperable que tenga lugar una transferencia de calor hacia la zona de menor presión. Pero para que la transferencia suceda, el calor debe propagarse a una distancia de media longitud de onda (λ) en un tiempo menor a la mitad del período. No cuesta mucho convencerse de que a altas frecuencias la transferencia de calor no puede tener lugar por “falta de tiempo”… y sin embargo esta justificación es incorrecta.

La falla está en que nunca se dijo cómo es que la transferencia de calor se produce. A temperaturas normales la transferencia de calor es esencialmente debida a la conducción, por lo que el tiempo requerido para la transferencia de calor va como el cuadrado de la distancia. Así, si bien el tiempo disponible para que la transferencia de calor tenga lugar decrece al aumentar la frecuencia, la longitud de onda decrece más rápido, por lo que aumentar la frecuencia no nos acerca al régimen adiabático, sino que nos aleja.

La explicación correcta es exactamente la contraria: el proceso es adiabático porque los cambios en la presión, y por lo tanto en la temperatura, son tan lentos que no es posible una transferencia de calor apreciable.

El punte de Tacoma Narrows

Esto no me acuerdo de dónde lo saqué, probablemente lo haya visto en la tele. Para contar por qué la explicación más difundida es incorrecta, este video de minutephysics (con mención al caso de las “hamacas de Firmat”).

Seguro hay varias otras cosas que creo entender, y resultan estar mal. Ya me voy a enterar.