Tiempo y simultaneidad

Decía en la entrada anterior que, con el fin de reconciliar el electromagnetismo con el principio de relatividad, Einstein tendría que enfrentar el problema de la no invariancia de las ecuaciones de Maxwell frente a las transformaciones galileanas, lo que requeriría el abandono de la visión Newtoniana del espacio y el tiempo. Sobre este último pretendo hacer algún comentario ahora.

La conveniencia de un tiempo absoluto

Si se reflexiona un poco sobre la posibilidad de la existencia de un tiempo absoluto como el propuesto por Newton no cuesta mucho convencerse de que, si es que existe, no es cosa fácil de conocer. Hume (a quien, junto con Mach, Einstein reconociera como influyente en su trabajo) ya mencionaba esto con bastante claridad en su Tratado de la naturaleza humana:

De igual modo que de la disposición de los objetos visibles y tangibles recibimos la idea de espacio, formamos la del tiempo en base a la sucesión de ideas e impresiones; el tiempo, por sí solo, no puede manifestarse ante la mente ni ser conocido por ella… Allí donde no tengamos percepciones sucesivas no tendremos noción del tiempo, aunque haya una sucesión real en los objetos. A partir de estos fenómenos, así como de otros muchos, podemos concluir que el tiempo no puede aparecer ante la mente, ni aislado, ni acompañado por un objeto constantemente inmutable, sino que se presenta siempre mediante una sucesión perceptible de objetos mudables

y al menos en parte, Newton parecía al estar tanto de este problema. De hecho, en sus postulados él mismo distingue entre el “tiempo absoluto” y el “tiempo relativo”, siendo el “tiempo relativo” aquél al que nos referimos como tiempo cuando hacemos experimentos.

La pregunta obligada, entonces, es: ¿Por qué suponer la existencia de un tiempo absoluto si en nuestros experimentos solo importa el tiempo relativo? No sé qué habría contestado Newton a esto. Probablemente hubiese esgrimido algún argumento que hoy sería considerado “demasiado zen” para un físico. No obstante, a mí se me ocurre una razón un poco más práctica. Nuestra experiencia cotidiana sugiere que el intervalo de tiempo medido entre dos eventos es el mismo para todos los observadores, independientemente de su estado de movimiento. Hay una enorme variedad de experimentos que, incluso con buena precisión, dan resultados compatibles con esta hipótesis (basta notar que, si no fuese así, los problemas con las transformaciones galileanas habrían aparecido bastante antes en la historia). En el marco de un tiempo absoluto esto queda inmediatamente justificado; nuestros relojes nos sirven para cuantificar cuánto tiempo absoluto transcurre entre 2 eventos, y en su carácter absoluto, este es el mismo “para todo el mundo”. Sin un tiempo absoluto como referencia hemos de considerar, a priori, que los relojes de distintos observadores son independientes entre sí, por lo que no tienen por qué marcar el mismo tiempo. Tendríamos entonces que diseñar un método para comparar el tiempo medido por un observador S con el tiempo medido por otro observador S’, y utilizarlo para mostrar que, efectivamente, el tiempo de S y S’ “coinciden”, como sugieren los experimentos.

Ciertamente la propuesta de un tiempo absoluto ahorra unos cuantos problemas. Pero es un arma de doble filo, ya que su validez depende de qué tan cierto es que todos los observadores miden el mismo intervalo de tiempo entre dos eventos. De no ser cierto esto, aceptar el postulado no solo implica incurrir en un error, sino también hace más difícil identificarlo y corregirlo.

Revisión del concepto de tiempo y simultaneidad

Seguramente sin quererlo, tal vez restringido por sus circunstancias, con su postulado sobre el carácter absoluto del tiempo Newton propició una zona de confort en la que uno se instala cuando empieza a estudiar mecánica, y que puede ser difícil de abandonar. Sigamos a Hume, no obstante, y aceptemos que lo único que tenemos es eso que Newton denomina “tiempo relativo”. Tiempo es, entonces, la posición de las agujas de mi reloj, y asignar un instante t a un evento consiste en reconocer que el evento ocurre simultáneamente al paso de la aguja de mi reloj por la marca t. Esta concepción está muy bien pero, como notara Einstein, solo es útil localmente, i.e., ya no sería suficiente en cuanto se trate de relacionar cronológicamente series de eventos que ocurren en lugares diferentes.

El primer problema entonces radica en saber cómo sincronizar relojes distantes, pues el uso de relojes sincronizados nos permitiría asignar instantes de tiempo a eventos distantes. Alguien podría decir que en realidad la sincronización es cosa simple, puesto que solo hay que tomar un reloj patrón y llevarlo a uno y otro punto del espacio para sincronizar cada reloj localmente. El problema con este método es que se asume tácitamente que el tiempo medido por el reloj patrón transcurre siempre igual para el observador en reposo respecto a los relojes a sincronizar, lo que no es más que asumir nuevamente un tiempo absoluto. Lo mismo sucede si juntamos los relojes para sincronizarlos y luego llevarlos a sus respectivas posiciones. Simplemente no sabemos (todavía) cómo comparar el tiempo medido por relojes en movimiento relativo, por lo que no podemos hacer nada que implique el desplazamiento de relojes. ¿Cómo llevar a cabo la sincronización entonces? Esta es la propuesta de Einstein:

Supongamos dos relojes ubicados en dos puntos distantes A y B. En un instante dado tA (en el reloj de A) parte una señal luminosa desde A hacia B. La señal llega y se refleja en el instante tB (en el reloj de B), llegando de nuevo a A en el instante tA’. Los dos relojes estarán sincronizados si

tB-tA=tA’-tB.

Lo que esto implica es que el tiempo que tarda la luz en ir desde A hasta B y viceversa es el mismo, medido por los dos relojes. Hasta acá bien, pero hay un detalle a tener en cuenta: la sincronización debe ser compatible con el principio de relatividad, lo quiere decir que el proceso de sincronización no debe permitirnos diferenciar distintos lugares del espacio ni saber si nuestros relojes están o no en movimiento. Einstein asegura la compatibilidad al definir a la sincronización como una relación de equivalencia entre relojes, y considerando que la velocidad de la luz en el vacío es la misma para todos los observadores en movimiento relativo uniforme. Con esta definición de sincronización ganamos también una definición de simultaneidad para eventos distantes:

Dos eventos en los puntos A y B serán simultáneos si la lectura del reloj en A para el evento en A y la lectura del reloj en B para el evento en B coinciden, asumiendo que dichos relojes fueron previamente sincronizados.

La sincronización permite volver a tener un sistema de referencia desde el cual observar eventos, estén en el lugar del espacio que estén, asignándoles el instante de tiempo que marque el reloj ubicado en el lugar en el que el evento ocurre (la imagen en la portada de este blog ilustra bien esta idea). Habiendo entendido cómo es nuestro sistema de referencia en ausencia del tiempo absoluto, podemos comparar lo que miden diferentes observadores en movimiento relativo uniforme, lo que llevará a la deducción de las transformaciones de Lorentz. No queda espacio para hablar de eso en esta entrada, pero sí para ver qué pasa con los relojes sincronizados cuando están en movimiento relativo uniforme.

Volvamos a los relojes en A y B. Supongamos que, mediante algún mecanismo, cada reloj emite una señal luminosa hacia el otro cada vez que la aguja marca el doce. Pongamos los relojes sobre una barra rígida, un gatito (no son de uso exclusivo en mecánica cuántica) a mitad de camino entre los relojes y otro, en reposo con el conjunto, en algún punto fuera de la barra. Estando los relojes sincronizados, los dos gatitos van a ver que las señales se originan simultáneamente en ambos relojes, viajan una distancia igual y llegan simultáneamente al punto medio de la barra.

Veamos ahora el caso en que los gatitos están en movimiento relativo, en dirección paralela a la barra. Para poder inferir lo que ve un observador en movimiento relativo, recordemos que la limitación está en saber qué instantes asignar a eventos distantes. Por lo tanto sabemos que, para cualquier observador, las señales que emiten los relojes van a llegar simultáneamente al punto medio de la barra. Por la misma razón, también vemos que el gatito fuera de la barra deberá observar que cada reloj emite la señal cuando su aguja llega al doce.

Ahora bien, el punto medio de la barra está en movimiento, lo que implica que los flashes recorren distancias diferentes antes de encontrarse en este punto. Pero eso implica, por el principio de invariacia de la velocidad de la luz, que la señal que recorre la mayor distancia debe haberse emitido antes que la otra. Luego, vemos que el gatito en movimiento relativo observa que la emisión de las señales por los relojes no es simultánea, lo que obviamente implica que los relojes, para él, no están sincronizados, porque cada señal se emite cuando el respectivo reloj marca las 12. Por extraño que suene, que dos eventos distantes sean simultáneos o no depende del estado de movimiento de quien observe dichos eventos.

Anuncios

Una demostración elegante

El teorema de Pitágoras es una de esas cosas que “todo el mundo sabe”. Lo que, a lo mejor, no todo el mundo sabe es cómo demostrarlo. Hay varios caminos para alcanzar una demostración, que se pueden leer en el artículo de Wikipedia al respecto. Creo que ninguna de estas demostraciones es particularmente difícil de entender, pero sí se ve que algunas dan más trabajo que otras, siendo la más simple (en mi opinión) la demostración de Bhaskara. Pero existe otro camino para demostrar el teorema (obra de Einstein cuando era chico, según dicen), que no aparece en el artículo de wikipedia y que vale la pena conocer por su simplicidad.

Para la demostración es necesario utilizar un resultado adicional, que si bien no es evidente, tampoco es difícil de ilustrar:

Empecemos con el primer paso de la demostración de Bhaskara. Con un triángulo rectángulo abc y tres copias más del mismo formamos un cuadrado de lado c, la hipotenusa del triángulo.

02-bhaskara

Ahora, en lugar de seguir con el procedimiento de Bhaskara, miremos el dibujo un momento. Cualquier triángulo cuya hipotenusa sea c puede usarse para formar un cuadrado con el mismo perímetro (4c), pero distintos triángulos van a dar distintas áreas para el cuadrado coloreado en el interior. De hecho, no cuesta mucho ver que el área de este cuadrado interior depende únicamente del ángulo φ entre la hipotenusa c y el cateto menor de abc (puede elegirse el otro también). Y acá aparece un resultado lindo: El área A del triángulo es una fracción del área total del cuadrado de lado c, y esta fracción es función únicamente del ángulo φ. O sea que para cualquier triángulo rectángulo de hipotenusa c puede escribirse su área como: Ac2ƒ(φ).

La demostración:

Miremos ahora el triángulo, y notemos puede descomponerse en otros dos triángulos similares de hipotenusas a y b.

triangulo

Usando el resultado de arriba podemos escribir las áreas de estos dos triángulos como a2ƒ(φ) y b2ƒ(φ), y como el área del triángulo mayor es igual a la suma de las áreas de estos dos, tenemos que

c2ƒ(φ)=a2ƒ(φ) + b2ƒ(φ)

Dividiendo todo por ƒ(φ) resulta

ca2 + b2

que es lo que dice el teorema de Pitágoras.

Principio de relatividad

La teoría de la relatividad es, junto con la mecánica cuántica, uno de los dos pilares de la física moderna. En esta entrada voy intentar hacer un repaso (muy breve) por la génesis de la teoría.

el espacio y tiempo absolutos de la mecánica newtoniana

En su famosa obra Principia [1] Newton presenta sus 3 leyes del movimiento y la ley de gravitación universal, sentando las bases de la mecánica clásica. Es también en Principia donde Newton postula el carácter absoluto del espacio y el tiempo.

Sobre el espacio absoluto y relativo:

El espacio absoluto, por su propia naturaleza y sin relación alguna con nada externo, permanece similar e inmóvil. El espacio relativo es una dimensión o medida movible de los espacios absolutos que nuestros sentidos determinan de acuerdo con su posición con respecto a los cuerpos y que por lo común se toma como espacio inmóvil; tal es la dimensión de un espacio subterráneo, aéreo o celeste, determinada través de su posición con respecto a la Tierra. El espacio absoluto y el relativo son iguales en forma y magnitud, pero no siempre coinciden numéricamente, un espacio cualquiera de nuestro aire, que relativamente a la Tierra y con respecto a la Tierra permanece siempre igual, en un momento dado ocupa una cierta parte del espacio absoluto por el que atraviesa el aire; en otra parte ocupará otra parte distinta del mismo y así entendido su sentido absoluto, irá modificándose continuamente.

Sobre el tiempo absoluto y relativo:

El tiempo absoluto, verdadero y matemático, en sí mismo por su propia naturaleza, fluye de una manera ecuable y sin relación alguna con nada externo y, se conoce también con el nombre de duración; el tiempo relativo, aparente y común es una medida sensible y externa (ya sea exacta e inecuable) de la duración por medio del movimiento, y se utiliza corrientemente en lugar del tiempo verdadero; ejemplo de ello son la hora, el día, el mes el año.

Puede no resultar obvio, pero lo que estos postulados [2] implican es que los intervalos de tiempo y espacio entre dos eventos dados son los mismos para todos los observadores en movimiento relativo, y por lo tanto, que eventos que son simultáneos para un dado observador también han de serlo para todos los demás. Estas consecuencias están en acuerdo con nuestra experiencia cotidiana: Nuestros relojes no parecen adelantar o atrasar por el solo hecho de estar viajando en auto, por ejemplo, ni tampoco observamos que la graduación de una regla cambie mientras la movemos de un lado a otro. No obstante la naturaleza del espacio y el tiempo newtonianos sería cuestionada por físicos y filósofos, hasta ser “abolida” por Einstein en su trabajo de 1905.

El principio de relatividad de Galileo

Por extraño que pueda parecer, uno de los postulados de la teoría de la relatividad de Einstein, conocido como principio de relatividad, se remonta a los trabajos de Galileo Galilei. Basándose en los resultados de sus observaciones,  en 1632 Galileo escribía en su obra Diálogos sobre los dos máximos sistemas del mundo [3]:

Encerraos con un amigo en la cabina principal bajo la cubierta de un barco grande, y llevad con vosotros moscas, mariposas, y otros pequeños animales voladores… colgad una botella que se vacíe gota a gota en un amplio recipiente colocado por debajo de la misma… haced que el barco vaya con la velocidad que queráis, siempre que el movimiento sea uniforme y no haya fluctuaciones en un sentido u otro…. Las gotas caerán… en el recipiente inferior sin desviarse a la popa, aunque el barco haya avanzado mientras las gotas están en el aire… las mariposas y las moscas seguirán su vuelo por igual hacia cada lado, y no sucederá que se concentren en la popa, como si cansaran de seguir el curso del barco…|Galileo Galilei

Lo que Galileo dice es que, mientras el movimiento del barco sea uniforme (es decir, su velocidad respecto a tierra sea constante), los resultados de los experimentos realizados en el barco deberían coincidir con los de aquellos realizados en tierra firme. Supongamos ahora que tenemos un conjunto de “leyes” que nos permiten describir los fenómenos físicos, y predecir resultados de experimentos. Vemos que la observación de Galileo implica que estas leyes deben ser las mimas en Tierra y sobre el barco, puesto que las descripciones y predicciones han de coincidir. Podemos utilizar esta idea para convertir la propuesta de Galileo en un enunciado general: El principio de relatividad.

Las leyes que describen los fenómenos físicos son las mismas para todos los observadores en movimiento relativo uniforme.

Podemos ir todavía un poco más lejos. Dado que las leyes físicas se expresan mediante ecuaciones, el principio de relatividad implica que estas ecuaciones deben ser las mismas para todos los observadores en movimiento relativo uniforme. Veamos como se expresa esto matemáticamente:

Imaginemos dos observadores S y S’ en movimiento relativo con velocidad v, esto es, S’ se mueve respecto a S con velocidad v. Estos observadores miden la posición de un objeto usando coordenadas x y x’ respectivamente. Dado que suponemos tiempo absoluto, una vez sincronizados (S y S’ están en el mismo lugar cuando empiezan a medir el tiempo) los relojes de S y S’ marcan siempre lo mismo, lo que expresamos escribiendo t=t’. ¿Cómo se relacionan las coordenadas x y x’?

500px-Special_Relativity_Fig1

Como se ve en la figura, siempre podemos escribir la distancia del objeto a S (el valor de x) como la suma de la distancia entre S y S’ y la distancia del objeto a S’ (el valor de x’). Además, sabemos que S’ se mueve con velocidad v respecto a S, por lo que en cualquier instante t la distancia de S a S’ es v.t. Podemos escribir entonces

x=x’+v.t ó x’=x-v.t

Esta regla para “pasar” de las coordenadas de S a las de S’ y viceversa se conoce como transformación de coordenadas, y nos permite comparar lo que “ven” distintos observadores en movimiento relativo uniforme. Lo que dice el principio de relatividad, entonces, es que las ecuaciones deben mantener su forma cuando cambiamos de x a x’. La segunda ley de Newton [4], por ejemplo, es la misma para todos los observadores en movimiento relativo uniforme. Es decir, si vale F=m.a para el observador S, entonces también vale F’=m.a’ para S’. La mecánica clásica es compatible con el principio de relatividad, es decir, las ecuaciones de movimiento de los sistemas mecánicos son invariantes frente a las transformaciones de Galileo.

post-23594-skateboard-backflip-gif-UuKQ

En este punto conviene llamar la atención sobre algo que puede haber pasado inadvertido. Para llevar el principio enunciado por Galileo al ámbito de las ecuaciones tuvimos que establecer las transformaciones de coordenadas (transformaciones de Galileo, de ahora en más), y estas dependen del tiempo absoluto postulado por Newton. Si cambiáramos nuestra forma de entender el tiempo y el espacio (como haría Einstein al formular su teoría) estas transformaciones serían diferentes, y las ecuaciones que describen las leyes físicas deberían adaptarse a estas nuevas transformaciones, si se pretende que sean las mismas para todos los observadores en movimiento relativo uniforme.

electromagnetismo y óptica

Gracias a los experimentos realizados por Young [5] y Fresnel [6], entre otros, durante la primera mitad del siglo XIX los físicos llegaron a convencerse de la naturaleza ondulatoria de la luz. En analogía con las ondas mecánicas, que consisten en vibración de un medio elástico, se propuso un medio para la propagación de las ondas electromagnéticas: El éter luminífero. Este medio debía ser, por fuerza, algo especial. Debía tratarse de un sólido elástico y no dispersivo, de manera que la propagación de la luz pudiese entenderse como el resto de las ondas mecánicas, pero también debía tener la capacidad de penetrar otros medios materiales interactuando con estos en alguna manera, de forma que fuera posible explicar la propagación de la luz en medios como el aire, la luz y el vidrio y  sus respectivos índices de refracción [7]. Más importante aún, dado que el éter debía llenar todo el espacio para hacer posible la propagación de la luz, éste debía estar en reposo respecto al espacio absoluto. Podría decirse que el éter era la materialización del espacio absoluto propuesto por Newton.

En 1873 Maxwell [8] publica su conocida obra,  A treatise on electricity and magnetism, en la que presenta una teoría que unifica los fenómenos eléctricos y magnéticos. Una predicción de esta teoría es la existencia de ondas electromagnéticas, lo que quiere decir que en ausencia de fuentes de carga [9] y corriente [10] la solución de las Ecuaciones de Maxwell [11] lleva a que los campos eléctrico y magnético deben ser solución de una ecuación de ondas [12]. Cuando Maxwell encontró estas soluciones notó que la velocidad a la que deberían propagarse estas ondas electromagnéticas, según la teoría, era muy similar a la velocidad medida para la propagación de la luz, por lo que conjeturó que la luz era un caso especial de onda electromagnética. Esta conjetura fue posteriormente confirmada por los experimentos realizados por Hertz [13]Así la óptica quedaba integrada como parte del electromagnetismo, y el éter luminífero pasó a coincidir con el medio que Maxwell postulara para la propagación de las ondas electromagnéticas. Las consecuencias de esto no son menores: La existencia de las ondas electromagnéticas llevó a proponer la existencia de un medio en el que los campos “viven”, lo que implica que la teoría de Maxwell consiste en un conjunto de leyes que describe los fenómenos electromagnéticos para observadores en reposo respecto a este medio, por lo que el principio de relatividad deja de valer en el reino de los fenómenos electromagnéticos. La identificación de dicho medio con el éter luminífero implica que el sistema de referencia en el que vale la teoría electromagnética está en reposo absoluto.

La teoría de Maxwell fue muy exitosa explicando fenómenos electromagnéticos conocidos, y además proporcionó predicciones que luego fueron confirmadas experimentalmente. Los problemas empezaron cuando los físicos se propusieron conocer cuál era el estado de movimiento de la Tierra respecto al éter. Resolver este problema era de importancia porque, supuesta la existencia del éter, es claro que las ecuaciones de Maxwell permiten conocer los campos eléctrico y magnético en un sistema de referencia en reposo respecto al éter, y para saber qué es lo que ve un observador en movimiento respecto al mismo es necesario conocer su velocidad relativa (de la que dependen las transformaciones de Galileo). Dicho de otra manera: la velocidad de la luz que predice la teoría de Maxwell sería solo la que mediría un observador en reposo respecto al éter, y otros observadores en movimiento relativo medirían otra, tal y como pasa con las ondas mecánicas. Entre los varios intentos de resolver esta cuestión destaca el experimento de Michelson y Morley.

el experimento de michelson y morley

Michelson [14] diseñó un experimento para determinar la velocidad relativa de la Tierra respecto al éter. La idea es relativamente sencilla: Tenemos el éter llenando todo el espacio y la tierra moviéndose a través de este en alguna dirección dada. Podemos imaginarnos que, mediante algún dispositivo, nos es posible generar dos pulsos luminosos que se propaguen en direcciones distintas: Uno de ellos en la dirección del movimiento de la Tierra respecto al éter, y el otro en dirección perpendicular a este.  En un sistema de referencia en reposo respecto del éter los dos pulsos viajarían a la misma velocidad, esos casi 3×10^8 m.s^-1 que predice la teoría de Maxwell. Pero en un sistema en reposo respecto a la Tierra las velocidades serían distintas, debido a que las transformaciones galileanas dicen que las velocidades se suman. Así, el pulso luminoso que se propaga en la dirección normal al movimiento de la Tierra respecto al éter debería propagarse a la misma velocidad que en el éter (dado que la velocidad relativa es nula), pero el otro pulso debería propagarse a una velocidad c’ un poco menor, resultado de la diferencia entre la velocidad medida en el éter y la velocidad relativa entre la Tierra y dicho medio, es decir c’= (3×10^8 – v) m.s^-1. Una medida de la velocidad de estos pulsos permitiría, entonces, conocer la velocidad con la que la Tierra se mueve en el éter.

Como muchas ideas simples, llevar esto a un dispositivo real resultó complicado. ¿Como generar dos pulsos de luz simultáneos, y además medir su velocidad? La solución de Michelson llegó con la construcción de su interferómetro, convirtiendo el problema de los pulsos de luz en un problema de interferencia [15] . Este es un esquema simplificado que muestra como funciona.

mm_esquema

La fuente emite un haz de luz monocromática que al llegar al semiespejo se divide en dos haces perpendiculares. Estos haces se reflejan en espejos diferentes y vuelven hacia el semiespejo para reflejarse nuevamente en dirección hacia una pantalla (representada por un ojo en la figura) en la que se forma un patrón de interferencia, debido a una diferencia de fase entre los dos haces. La idea entonces era la siguiente: Mientras el interferómetro estuviese en reposo respecto al éter, el patrón de interferencia sería siempre el mismo. Si, en cambio, el interferómetro se moviera respecto al éter en dirección paralela a alguno de sus brazos, entonces para un observador en reposo respecto al interferómetro la velocidad de la luz tendría un valor diferente en esa dirección. Debido a este cambio en la velocidad en una sola de las direcciones, la fase relativa de los haces de luz en el semiespejo también cambia, provocando un patrón de interferencia diferente en la pantalla. Hasta acá muy bien, pero hay un problema: El interferómetro está sobre la Tierra, por lo que se puede observar el patrón de interferencia debido a las diferentes velocidades en las dos direcciones de los brazos del interferómetro, pero no hay manera de compararlo con el patrón correspondiente al estado de reposo respecto al éter. La solución a este problema fue medir en una posición, y luego rotar el interferómetro 90º. El desplazamiento en el patrón de interferencia en esta comparación, sería el doble del que se quiere observar.

On_the_Relative_Motion_of_the_Earth_and_the_Luminiferous_Ether_-_Fig_3

Dibujo del interferómetro utilizado por Michelson y Morley en su experimento.

Para el momento en que Michelson, en colaboración con Morley [16] realizó su experimento ya se había descartado la posibilidad de que la Tierra “arrastrara” al éter, como si este fuese un fluido viscoso, por lo que necesariamente debía detectarse una velocidad no nula del planeta respecto al éter. Sin embargo el resultado del experimento fue nulo, es decir, no se detecto movimiento de la Tierra respecto al éter.

¿Qué falló?

La interpretación rápida de los resutados de este experimento sería El desplazamiento observado es nulo, luego la velocidad relativa de la Tierra respecto al éter es nula. Pero esta interpretación ya en ese entonces se sabía imposible. Una posible explicación a este resultado fue provista por Lorentz [17] en 1892 quien introdujo como hipótesis que los cuerpos en movimiento relativo respecto al éter debían contraerse en un factor dependiente de la velocidad de desplazamiento. La hipótesis se introduce ad hoc: Lorentz compensa la variación que debería observarse en la velocidad de la luz con un acortamiento en la longitud del brazo en la dirección de movimiento, de manera que el efecto neto del desplazamiento a través del éter sea nulo.

Si bien la solución propuesta no resulta muy agradable (lo sería si la contracción propuesta pudiese deducirse en lugar de introducirse a la fuerza) la teoría de Lorentz resultó exitosa, puesto que eliminaba las inconsistencias que surgían de los resultados nulos en los experimentos como el de Michelson y Morley, que intentaban medir el desplazamiento respecto al éter.

einstein y una teoría alternativa

El primer artículo de Einstein sobre la teoría de la relatividad fue publicado en 1905, año conocido como annus mirabilis. La siguiente cita es de la introducción del artículo:

Se sabe que cuando la electrodinámica de Maxwell – tal como se suele entender actualmente – se aplica a cuerpos en movimiento, aparecen asimetrías que no parecen estar en correspondencia con los fenómenos observados. Pensemos, por ejemplo, en la interacción electrodinámica entre un imán y un conductor. En este caso, el fenómeno que se observa depende solamente del movimiento relativo entre el conductor y el imán, mientras que de acuerdo a la interpretación común se deben distinguir claramente dos casos muy diferentes, dependiendo de cuál de los dos cuerpos se mueva. Si se mueve el imán mientras que el conductor se encuentra en reposo, al rededor del imán aparece un campo eléctrico con cierto valor para su energía. Este campo eléctrico genera una corriente en el lugar donde se encuentre el conductor. Pero si el imán está en reposo y el conductor se mueve, al rededor del imán no aparece ningún campo eléctrico sino que en el conductor se produce una fuerza electromotriz que en sí no corresponde a ninguna energía pero da lugar a corrientes eléctricas que coinciden en magnitud y dirección con las del primer caso, suponiendo que el movimiento relativo es igual en cada uno de los casos bajo consideración.

Otros ejemplos de esta índole así como los intentos infructuosos para constatar un movimiento de la Tierra con respecto al “medio de propagación de la luz” permiten suponer que no solamente en mecánica sino también en electrodinámica ninguna de las propiedades de los fenómenos corresponde al concepto de reposo absoluto.

Lo que parece molestar a Einstein es que un fenómeno único desde el punto de vista de la mecánica tenga 2 descripciones diferentes en el electromagnetismo. Dicho de otra manera, el principio de relatividad parece ser válido en el ámbito de la mecánica, pero no así en el reino de los fenómenos electromagnéticos.

Ahora bien, esta asimetría, por si misma, no necesariamente constituye un problema. Recordemos que los campos electromagnéticos viven en el éter, y que la teoría desarrollada por Maxwell consiste en un conjunto de leyes que describen los fenómenos electromagnéticos respecto a un observador en reposo respecto al éter, es decir, en reposo absoluto. La asimetría de la que habla Einstein, entonces, no es más que una consecuencia de este hecho. El principio de relatividad deja de valer en el electromagnetismo porque, a diferencia de lo que pasa dentro de la mecánica, los fenómenos electromagnéticos sí distinguen el reposo absoluto. Matemáticamente, además, esto se refleja en el hecho de que las ecuaciones del electromagnetismo no conservan su forma frente a las transformaciones galileanas.

Sin embargo, como deja entrever Einstein en el segundo párrafo citado, esta explicación puede objetarse. Si es cierto que estas asimetrías quedan explicadas por la capacidad del electromagnetismo de distinguir el reposo absoluto: ¿Por qué fallan los experimentos que intentan medir desplazamiento respecto al éter?

Hipótesis

Einstein propone una teoría alternativa partiendo de 2 hipótesis:

1) En todos los sistemas de coordenadas en los que tienen validez las ecuaciones de la mecánica, tienen también validez las mismas leyes de la electrodinámica.

2) La luz puede propagarse en el vacío, y lo hace de manera tal que su velocidad de propagación no depende de la velocidad de la fuente.

En la primer hipótesis extiende el principio de relatividad galileano al electromagnetismo: Todos los observadores en movimiento relativo uniforme describen los fenómenos de la misma manera, es decir, con las mismas ecuaciones. Esto implica que las ecuaciones deben tener una forma invariante frente a transformaciones de coordenadas (covariancia). La hipótesis en 2) sobre la velocidad de la luz es, en realidad, una característica común a todos los fenómenos ondulatorios. Lo novedoso es la idea de que la luz puede propagarse en el vacío, eliminando el éter.

Al sacar al éter del escenario Einstein enfrenta el problema de fondo: La incompatibilidad de las transformaciones de galileo con la teoría electromagnética. En efecto, para que las ecuaciones del electromagnetismo sean compatibles con el principio de relatividad, las transformaciones de coordenadas deben cambiar a otras, que dejen invariantes no solo a las ecuaciones de la mecánica, sino también a las ecuaciones de Maxwell. Esto requerirá el abandono del espacio y el tiempo absolutos de Newton…