Tiempo y simultaneidad

Etiquetas

, , ,

Decía en la entrada anterior que, con el fin de reconciliar el electromagnetismo con el principio de relatividad, Einstein tendría que enfrentar el problema de la no invariancia de las ecuaciones de Maxwell frente a las transformaciones galileanas, lo que requeriría el abandono de la visión Newtoniana del espacio y el tiempo. Sobre este último pretendo hacer algún comentario ahora.

La conveniencia de un tiempo absoluto

Si se reflexiona un poco sobre la posibilidad de la existencia de un tiempo absoluto como el propuesto por Newton no cuesta mucho convencerse de que, si es que existe, no es cosa fácil de conocer. Hume (a quien, junto con Mach, Einstein reconociera como influyente en su trabajo) ya mencionaba esto con bastante claridad en su Tratado de la naturaleza humana:

De igual modo que de la disposición de los objetos visibles y tangibles recibimos la idea de espacio, formamos la del tiempo en base a la sucesión de ideas e impresiones; el tiempo, por sí solo, no puede manifestarse ante la mente ni ser conocido por ella… Allí donde no tengamos percepciones sucesivas no tendremos noción del tiempo, aunque haya una sucesión real en los objetos. A partir de estos fenómenos, así como de otros muchos, podemos concluir que el tiempo no puede aparecer ante la mente, ni aislado, ni acompañado por un objeto constantemente inmutable, sino que se presenta siempre mediante una sucesión perceptible de objetos mudables

y al menos en parte, Newton parecía al estar tanto de este problema. De hecho, en sus postulados él mismo distingue entre el “tiempo absoluto” y el “tiempo relativo”, siendo el “tiempo relativo” aquél al que nos referimos como tiempo cuando hacemos experimentos.

La pregunta obligada, entonces, es: ¿Por qué suponer la existencia de un tiempo absoluto si en nuestros experimentos solo importa el tiempo relativo? No sé qué habría contestado Newton a esto. Probablemente hubiese esgrimido algún argumento que hoy sería considerado “demasiado zen” para un físico. No obstante, a mí se me ocurre una razón un poco más práctica. Nuestra experiencia cotidiana sugiere que el intervalo de tiempo medido entre dos eventos es el mismo para todos los observadores, independientemente de su estado de movimiento. Hay una enorme variedad de experimentos que, incluso con buena precisión, dan resultados compatibles con esta hipótesis (basta notar que, si no fuese así, los problemas con las transformaciones galileanas habrían aparecido bastante antes en la historia). En el marco de un tiempo absoluto esto queda inmediatamente justificado; nuestros relojes nos sirven para cuantificar cuánto tiempo absoluto transcurre entre 2 eventos, y en su carácter absoluto, este es el mismo “para todo el mundo”. Sin un tiempo absoluto como referencia hemos de considerar, a priori, que los relojes de distintos observadores son independientes entre sí, por lo que no tienen por qué marcar el mismo tiempo. Tendríamos entonces que diseñar un método para comparar el tiempo medido por un observador S con el tiempo medido por otro observador S’, y utilizarlo para mostrar que, efectivamente, el tiempo de S y S’ “coinciden”, como sugieren los experimentos.

Ciertamente la propuesta de un tiempo absoluto ahorra unos cuantos problemas. Pero es un arma de doble filo, ya que su validez depende de qué tan cierto es que todos los observadores miden el mismo intervalo de tiempo entre dos eventos. De no ser cierto esto, aceptar el postulado no solo implica incurrir en un error, sino también hace más difícil identificarlo y corregirlo.

Revisión del concepto de tiempo y simultaneidad

Seguramente sin quererlo, tal vez restringido por sus circunstancias, con su postulado sobre el carácter absoluto del tiempo Newton propició una zona de confort en la que uno se instala cuando empieza a estudiar mecánica, y que puede ser difícil de abandonar. Sigamos a Hume, no obstante, y aceptemos que lo único que tenemos es eso que Newton denomina “tiempo relativo”. Tiempo es, entonces, la posición de las agujas de mi reloj, y asignar un instante t a un evento consiste en reconocer que el evento ocurre simultáneamente al paso de la aguja de mi reloj por la marca t. Esta concepción está muy bien pero, como notara Einstein, solo es útil localmente, i.e., ya no sería suficiente en cuanto se trate de relacionar cronológicamente series de eventos que ocurren en lugares diferentes.

El primer problema entonces radica en saber cómo sincronizar relojes distantes, pues el uso de relojes sincronizados nos permitiría asignar instantes de tiempo a eventos distantes. Alguien podría decir que en realidad la sincronización es cosa simple, puesto que solo hay que tomar un reloj patrón y llevarlo a uno y otro punto del espacio para sincronizar cada reloj localmente. El problema con este método es que se asume tácitamente que el tiempo medido por el reloj patrón transcurre siempre igual para el observador en reposo respecto a los relojes a sincronizar, lo que no es más que asumir nuevamente un tiempo absoluto. Lo mismo sucede si juntamos los relojes para sincronizarlos y luego llevarlos a sus respectivas posiciones. Simplemente no sabemos (todavía) cómo comparar el tiempo medido por relojes en movimiento relativo, por lo que no podemos hacer nada que implique el desplazamiento de relojes. ¿Cómo llevar a cabo la sincronización entonces? Esta es la propuesta de Einstein:

Supongamos dos relojes ubicados en dos puntos distantes A y B. En un instante dado tA (en el reloj de A) parte una señal luminosa desde A hacia B. La señal llega y se refleja en el instante tB (en el reloj de B), llegando de nuevo a A en el instante tA’. Los dos relojes estarán sincronizados si

tB-tA=tA’-tB.

Lo que esto implica es que el tiempo que tarda la luz en ir desde A hasta B y viceversa es el mismo, medido por los dos relojes. Hasta acá bien, pero hay un detalle a tener en cuenta: la sincronización debe ser compatible con el principio de relatividad, lo quiere decir que el proceso de sincronización no debe permitirnos diferenciar distintos lugares del espacio ni saber si nuestros relojes están o no en movimiento. Einstein asegura la compatibilidad al definir a la sincronización como una relación de equivalencia entre relojes, y considerando que la velocidad de la luz en el vacío es la misma para todos los observadores en movimiento relativo uniforme. Con esta definición de sincronización ganamos también una definición de simultaneidad para eventos distantes:

Dos eventos en los puntos A y B serán simultáneos si la lectura del reloj en A para el evento en A y la lectura del reloj en B para el evento en B coinciden, asumiendo que dichos relojes fueron previamente sincronizados.

La sincronización permite volver a tener un sistema de referencia desde el cual observar eventos, estén en el lugar del espacio que estén, asignándoles el instante de tiempo que marque el reloj ubicado en el lugar en el que el evento ocurre (la imagen en la portada de este blog ilustra bien esta idea). Habiendo entendido cómo es nuestro sistema de referencia en ausencia del tiempo absoluto, podemos comparar lo que miden diferentes observadores en movimiento relativo uniforme, lo que llevará a la deducción de las transformaciones de Lorentz. No queda espacio para hablar de eso en esta entrada, pero sí para ver qué pasa con los relojes sincronizados cuando están en movimiento relativo uniforme.

Volvamos a los relojes en A y B. Supongamos que, mediante algún mecanismo, cada reloj emite una señal luminosa hacia el otro cada vez que la aguja marca el doce. Pongamos los relojes sobre una barra rígida, un gatito (no son de uso exclusivo en mecánica cuántica) a mitad de camino entre los relojes y otro, en reposo con el conjunto, en algún punto fuera de la barra. Estando los relojes sincronizados, los dos gatitos van a ver que las señales se originan simultáneamente en ambos relojes, viajan una distancia igual y llegan simultáneamente al punto medio de la barra.

Veamos ahora el caso en que los gatitos están en movimiento relativo, en dirección paralela a la barra. Para poder inferir lo que ve un observador en movimiento relativo, recordemos que la limitación está en saber qué instantes asignar a eventos distantes. Por lo tanto sabemos que, para cualquier observador, las señales que emiten los relojes van a llegar simultáneamente al punto medio de la barra. Por la misma razón, también vemos que el gatito fuera de la barra deberá observar que cada reloj emite la señal cuando su aguja llega al doce.

Ahora bien, el punto medio de la barra está en movimiento, lo que implica que los flashes recorren distancias diferentes antes de encontrarse en este punto. Pero eso implica, por el principio de invariacia de la velocidad de la luz, que la señal que recorre la mayor distancia debe haberse emitido antes que la otra. Luego, vemos que el gatito en movimiento relativo observa que la emisión de las señales por los relojes no es simultánea, lo que obviamente implica que los relojes, para él, no están sincronizados, porque cada señal se emite cuando el respectivo reloj marca las 12. Por extraño que suene, que dos eventos distantes sean simultáneos o no depende del estado de movimiento de quien observe dichos eventos.

Álgebra lineal: Subespacios

Etiquetas

,

Después de un par de ejemplos, lo que seguramente quedó claro (me gustaría pensar que no es lo único) es que probar que algo es un espacio vectorial requiere un poco de trabajo. La buena noticia (?) que traigo ahora es que en muchas ocasiones se puede tomar un atajo.

Consideremos un espacio vectorial V sobre un cuerpo K. Es decir, {V, ⊕, K, +, ×, ★}, y un subconjunto SV. ¿Bajo qué condiciones es S un espacio vectorial sobre K? La definición de espacio vectorial ya está dada, por lo que es obvio que S será un espacio vectorial si y solo si cumple con la definición, por lo tanto lo que nos preguntamos es cómo usar el hecho de que V es un espacio vectorial para determinar si S también lo es. Y es más o menos fácil ver que, sabiendo que V es un espacio vectorial, no queda mucho por hacer: {K, +, ×} es un cuerpo independientemente del conjunto en el que vivan los elementos que llamamos vectores. Por otra parte la definición de ⊕ en S es simplemente la restricción de la definición para V al subconjunto S ⊆ V, lo que asegura dos cosas: Que las propiedades necesarias en ★ se verifican si solo consideramos S como el conjunto de vectores, pues son heredadas de V, y que las condiciones para que {S, ⊕} sea un grupo abeliano se satisfacen, puesto que se satisfacen en V.

¿Es, entonces, {S, ⊕, K, +, ×, ★} un espacio vectorial para cualquier S ⊆ V? La respuesta es no. Si bien las propiedades se heredan y todo el trabajo parece estar ya hecho, hay algo que previene que cualquier subconjunto de un espacio vectorial sea también un espacio vectorial, y es que las restricciones de ⊕ y ★ al subconjunto S deben estar bien definidas. Es decir, para vectores en S debe valer ★: S×KS, y la restricción de ⊕ a S debe ser una ley de composición interna. Resumimos estas condiciones diciendo que S es “cerrado” para la suma y el producto por escalares.

Condición suficiente:

Sea V un espacio vectorial sobre un cuerpo K y S ⊆ V un conjunto no vacío. Si se verifica:

i) ∊  Λ  ∊ S → x∊ S.

ii)  Λ  ∊ S → a S.

Entonces S es un espacio vectorial sobre K.

Vamos a ver cómo funciona esto con algún ejemplo. Habíamos mostrado que el espacio real de dimensión 3 (ℝ3) es un espacio vectorial sobre el cuerpo de reales. Tomemos ahora como subconjunto S al plano definido por la ecuación z=x+y, y veamos si es un espacio vectorial sobre ℝ.

i) Sean u=(x,y,z) ∊ S Λ v=(u,v,w) ∊ S (y por lo tanto en ℝ3). La suma en ℝ3 es la suma usual en el conjunto de matrices, por lo que uv=(x+u,y+v,z+w). Ahora bien, como u y v están en S vale z=x+y Λ w=u+v, por lo que uv=(x+u,y+v,(x+y)+(u+w))=(x+u,y+v,(x+u)+(y+w)), donde la última igualdad resulta de la asociatividad de la suma en ℝ. Vemos entonces que la suma de dos elementos de S es un elemento de S, puesto que verifica la ecuación del plano.

ii) Por la definición de ★ y de S,

au=a(x,y,z)=(a.x,a.y,a.z)=(a.x,a.y,a.(x+y))=(a.x,a.y,a.x+a.y),

Por lo que a∊ S, ya que verifica la ecuación del plano.

Por i) y ii), entonces, el plano definido por la ecuación z=x+y es un espacio vectorial. Fácil, ¿No?. También es fácil mostrar que cualquier subconjunto del espacio real que contenga al 0 (el origen) es también un espacio vectorial. Pero eso para más adelante.

Quiero mostrar, para terminar, un ejemplo dentro del espacio de funciones. Consideremos el conjunto S de funciones de variable real, derivables en cierto intervalo abierto (a,b). Este es, claramente, un subconjunto del conjunto de funciones continuas en [a,b], pues la derivabilidad implica continuidad, y sabemos que este conjunto, F={f:I⊆ℝ → ℝ / f es continua en [a,b]}, es un espacio vectorial sobre ℝ. Vemos entonces que S es un espacio vectorial sobre ℝ, por el solo hecho de que la derivada es lineal:

Sean f y g elementos de S, y c un punto cualquiera de (a,b). Denotemos con Dc a la derivada en el punto c.

i) Dc [(fg)(x)]= D[f(x)+g(x)]= Df(x)+Dg(x). Como f y g son derivables por hipótesis se tiene que fg también lo es, siendo por lo tanto S cerrado para la suma.

ii) D[(af)(x)]= D[a.f(x)]= a.Df(x). Nuevamente, la derivabilidad de f asegura la derivabilidad de af, por lo que S es también cerrado para el producto por escalares.

Luego S es un espacio vectorial. Más interesante aún, básicamente con la misma idea podemos mostrar que el conjunto de soluciones de una ecuación diferencial lineal homogénea es también un espacio vectorial: Supongamos ahora que S es el conjunto de soluciones de una ecuación diferencial lineal homogénea. Es decir,

fS ↔ a1.Dcf(x)+a2.Dc2f(x)+…+anDcnf(x)=0,

donde Dcnf(x) es la derivada n-ésima de f(x) en c y ai, i=0…n, son coeficientes reales que pueden depender de x. Usando la linealidad de la derivada, es inmediato ver que si dos funciones f y g están en S, i.e., satisfacen la ecuación diferencial, entonces la función (af)⊕(bg) también son solución de la ecuación. Esta propiedad es lo que en física conocemos como principio de superposición, y es la razón por la que podemos hablar de “fuerza resultante” dentro de la mecánica newtoniana, o de esa “superposición de estados” que hace (en parte) extraña a la mecánica cuántica.

Nota: hasta ahora vengo usando una notación que puede resultar un poco quisquillosa, y que en general no se usa en los libros. La diferencia radica en que se hace un abuso de la notación, y se utilizan los mismos símbolos para diferentes operaciones. Así, para la suma de vectores () y la suma de escalares (+) el símbolo usado es el mismo, y lo mismo pasa para el caso del producto entre escalares (× ó .) y el producto entre vectores y escalares (). Esto no es por ser un fanático del rigor ni mucho menos, sino porque creo que al menos al principio (cuando uno se entrena en probar quién es un espacio vectorial y quién no) es sano diferenciar bien las operaciones, para evitar confusiones que dificulten las demostraciones (que, en realidad, son bastante simples).

Álgebra lineal: Espacios vectoriales II

Etiquetas

,

En la entrada anterior probamos que ℝ2 (con extensión inmediata a ℝn) es un espacio vectorial. Esta entrada va a estar dedicada a probar lo mismo para otro conjunto muy importante.

Espacio de funciones continuas

Consideremos ahora el conjunto F de todas las funciones de variable real, continuas en un dado intervalo real I. Es decir, F={f:I → ℝ / f es continua}. Definamos 2 operaciones:

1.- Sean f,gF, y x ∊ I. Llamamos suma de funciones a la operación ⊕:ℝ×ℝ → ℝ definida por (fg)(x)=f(x)+g(x), donde evidentemente el símbolo + representa la suma en ℝ, codominio de f.

2.- Sean f ∊ F, α ∊ ℝ y x ∊ I. Llamamos producto de una función por un número real a la operación ★:ℝ×FF definida por (αf)(x)=α.(f(x))

Con estas definiciones podemos analizar si F tiene estructura de espacio vectorial (EV) sobre el cuerpo de los números reales, o sea, si {F, ⊕, ℝ, +, ×, ★} es un EV. Acá podemos apreciar la ventaja de pensar a un EV como un par de estructuras vinculadas por una operación: Ya probamos para el caso de ℝ2 que {ℝ, +, ×} es un cuerpo, por lo que ya tenemos una parte lista. Nos queda probar que {F, ⊕} es un grupo abeliano, y que  ★:ℝ×F → F  verifica las propiedades 1-4 que establecimos anteriormente [1].

{F, ⊕} es un grupo abeliano:

Sean f, g y h elementos de F. Entonces

((fg)⊕h)(x) = (fg)(x)+h(x) = (f(x)+g(x))+h(x) = f(x)+(g(x)+h(x)) = f(x)+(gh)(x) = (f(gh))(x)

Por lo que ⊕ es asociativa.

Denotemos con e a la función idénticamente nula, definida por e(x)=0 ∀ I. Es evidente que esta función es el elemento neutro de F respecto de ⊕, pues para cualquier f en F vale (fe)(x)=f(x)+e(x)=f(x)+0=f(x). También es fácil ver que para todo elemento de F existe un inverso respecto de ⊕, ya que si f ∊ F entonces f(x) ∊ ℝ, cuyo inverso -f(x)= existe siempre por ser {ℝ, +, ×} un cuerpo. Luego, definiendo f -1(x)=(-1)f(x) se tiene

e(x)=0= f(x)+(-f(x))=(ff -1)(x),

por lo que f -1 es el inverso de f respecto de ⊕. Por último, la conmutatividad de ⊕ es inmediata, pues (fg)(x)=f(x)+g(x)=g(x)+f(x)=(gf)(x), con lo que queda probado que {F, ⊕} es un grupo abeliano.

★ verifica las propiedades 1-4

Sean a,b ∊ ℝ y f, g ∊ F.

1. El producto por escalares se distribuye en la suma de funciones, pues

 [a★(fg)](x) = a.(fg)(x) = a.(f(x)+g(x)) = a.f(x)+a.g(x) = (af)(x)+(ag)(x) =  [(af)⊕(ag)](x)

2. También hay distributividad respecto a la suma de escalares:

[(a+b)★f](x) = (a+b).f(x) = a.f(x)+b.f(x) = (af)(x)+(bf)(x) = [(af)⊕(bf)](x)

3. Asociatividad mixta:

[(a.b)★f](x) = (a.b).f(x) = a.(b.f(x))=a.[(bf)(x)]=[a★(bf)](x)

4. El elemento neutro del producto entre reales es también elemento neutro respcto del producto de funciones por escalares, pues (1★f)(x)=1.f(x)=f(x).

Con todo esto, queda probado que {F, ⊕, ℝ, +, ×, ★} es un espacio vectorial. Vale la pena llamar la atención sobre  un detalle particular: cuando probamos la existencia de elemento neutro respecto a ⊕ en F definimos f -1(x)=(-1)f(x). Usando la definición del producto por escalares, vemos que vale f -1(x)=((-1)★f)(x). Esto vale para todo espacio vectorial, independientemente del cuerpo en el que vivan los escalares. También es fácil ver que 0★f=e y ae=e, de donde se deduce también que af=e → a=0 ó f=e.

Una demostración elegante

Etiquetas

, , ,

El teorema de Pitágoras es una de esas cosas que “todo el mundo sabe”. Lo que, a lo mejor, no todo el mundo sabe es cómo demostrarlo. Hay varios caminos para alcanzar una demostración, que se pueden leer en el artículo de Wikipedia al respecto. Creo que ninguna de estas demostraciones es particularmente difícil de entender, pero sí se ve que algunas dan más trabajo que otras, siendo la más simple (en mi opinión) la demostración de Bhaskara. Pero existe otro camino para demostrar el teorema (obra de Einstein cuando era chico, según dicen), que no aparece en el artículo de wikipedia y que vale la pena conocer por su simplicidad.

Para la demostración es necesario utilizar un resultado adicional, que si bien no es evidente, tampoco es difícil de ilustrar:

Empecemos con el primer paso de la demostración de Bhaskara. Con un triángulo rectángulo abc y tres copias más del mismo formamos un cuadrado de lado c, la hipotenusa del triángulo.

02-bhaskara

Ahora, en lugar de seguir con el procedimiento de Bhaskara, miremos el dibujo un momento. Cualquier triángulo cuya hipotenusa sea c puede usarse para formar un cuadrado con el mismo perímetro (4c), pero distintos triángulos van a dar distintas áreas para el cuadrado coloreado en el interior. De hecho, no cuesta mucho ver que el área de este cuadrado interior depende únicamente del ángulo φ entre la hipotenusa c y el cateto menor de abc (puede elegirse el otro también). Y acá aparece un resultado lindo: El área A del triángulo es una fracción del área total del cuadrado de lado c, y esta fracción es función únicamente del ángulo φ. O sea que para cualquier triángulo rectángulo de hipotenusa c puede escribirse su área como: Ac2ƒ(φ).

La demostración:

Miremos ahora el triángulo, y notemos puede descomponerse en otros dos triángulos similares de hipotenusas a y b.

triangulo

Usando el resultado de arriba podemos escribir las áreas de estos dos triángulos como a2ƒ(φ) y b2ƒ(φ), y como el área del triángulo mayor es igual a la suma de las áreas de estos dos, tenemos que

c2ƒ(φ)=a2ƒ(φ) + b2ƒ(φ)

Dividiendo todo por ƒ(φ) resulta

ca2 + b2

que es lo que dice el teorema de Pitágoras.

Principio de relatividad

Etiquetas

, , , , , ,

La teoría de la relatividad es, junto con la mecánica cuántica, uno de los dos pilares de la física moderna. En esta entrada voy intentar hacer un repaso (muy breve) por la génesis de la teoría.

el espacio y tiempo absolutos de la mecánica newtoniana

En su famosa obra Principia [1] Newton presenta sus 3 leyes del movimiento y la ley de gravitación universal, sentando las bases de la mecánica clásica. Es también en Principia donde Newton postula el carácter absoluto del espacio y el tiempo.

Sobre el espacio absoluto y relativo:

El espacio absoluto, por su propia naturaleza y sin relación alguna con nada externo, permanece similar e inmóvil. El espacio relativo es una dimensión o medida movible de los espacios absolutos que nuestros sentidos determinan de acuerdo con su posición con respecto a los cuerpos y que por lo común se toma como espacio inmóvil; tal es la dimensión de un espacio subterráneo, aéreo o celeste, determinada través de su posición con respecto a la Tierra. El espacio absoluto y el relativo son iguales en forma y magnitud, pero no siempre coinciden numéricamente, un espacio cualquiera de nuestro aire, que relativamente a la Tierra y con respecto a la Tierra permanece siempre igual, en un momento dado ocupa una cierta parte del espacio absoluto por el que atraviesa el aire; en otra parte ocupará otra parte distinta del mismo y así entendido su sentido absoluto, irá modificándose continuamente.

Sobre el tiempo absoluto y relativo:

El tiempo absoluto, verdadero y matemático, en sí mismo por su propia naturaleza, fluye de una manera ecuable y sin relación alguna con nada externo y, se conoce también con el nombre de duración; el tiempo relativo, aparente y común es una medida sensible y externa (ya sea exacta e inecuable) de la duración por medio del movimiento, y se utiliza corrientemente en lugar del tiempo verdadero; ejemplo de ello son la hora, el día, el mes el año.

Puede no resultar obvio, pero lo que estos postulados [2] implican es que los intervalos de tiempo y espacio entre dos eventos dados son los mismos para todos los observadores en movimiento relativo, y por lo tanto, que eventos que son simultáneos para un dado observador también han de serlo para todos los demás. Estas consecuencias están en acuerdo con nuestra experiencia cotidiana: Nuestros relojes no parecen adelantar o atrasar por el solo hecho de estar viajando en auto, por ejemplo, ni tampoco observamos que la graduación de una regla cambie mientras la movemos de un lado a otro. No obstante la naturaleza del espacio y el tiempo newtonianos sería cuestionada por físicos y filósofos, hasta ser “abolida” por Einstein en su trabajo de 1905.

El principio de relatividad de Galileo

Por extraño que pueda parecer, uno de los postulados de la teoría de la relatividad de Einstein, conocido como principio de relatividad, se remonta a los trabajos de Galileo Galilei. Basándose en los resultados de sus observaciones,  en 1632 Galileo escribía en su obra Diálogos sobre los dos máximos sistemas del mundo [3]:

Encerraos con un amigo en la cabina principal bajo la cubierta de un barco grande, y llevad con vosotros moscas, mariposas, y otros pequeños animales voladores… colgad una botella que se vacíe gota a gota en un amplio recipiente colocado por debajo de la misma… haced que el barco vaya con la velocidad que queráis, siempre que el movimiento sea uniforme y no haya fluctuaciones en un sentido u otro…. Las gotas caerán… en el recipiente inferior sin desviarse a la popa, aunque el barco haya avanzado mientras las gotas están en el aire… las mariposas y las moscas seguirán su vuelo por igual hacia cada lado, y no sucederá que se concentren en la popa, como si cansaran de seguir el curso del barco…|Galileo Galilei

Lo que Galileo dice es que, mientras el movimiento del barco sea uniforme (es decir, su velocidad respecto a tierra sea constante), los resultados de los experimentos realizados en el barco deberían coincidir con los de aquellos realizados en tierra firme. Supongamos ahora que tenemos un conjunto de “leyes” que nos permiten describir los fenómenos físicos, y predecir resultados de experimentos. Vemos que la observación de Galileo implica que estas leyes deben ser las mimas en Tierra y sobre el barco, puesto que las descripciones y predicciones han de coincidir. Podemos utilizar esta idea para convertir la propuesta de Galileo en un enunciado general: El principio de relatividad.

Las leyes que describen los fenómenos físicos son las mismas para todos los observadores en movimiento relativo uniforme.

Podemos ir todavía un poco más lejos. Dado que las leyes físicas se expresan mediante ecuaciones, el principio de relatividad implica que estas ecuaciones deben ser las mismas para todos los observadores en movimiento relativo uniforme. Veamos como se expresa esto matemáticamente:

Imaginemos dos observadores S y S’ en movimiento relativo con velocidad v, esto es, S’ se mueve respecto a S con velocidad v. Estos observadores miden la posición de un objeto usando coordenadas x y x’ respectivamente. Dado que suponemos tiempo absoluto, una vez sincronizados (S y S’ están en el mismo lugar cuando empiezan a medir el tiempo) los relojes de S y S’ marcan siempre lo mismo, lo que expresamos escribiendo t=t’. ¿Cómo se relacionan las coordenadas x y x’?

500px-Special_Relativity_Fig1

Como se ve en la figura, siempre podemos escribir la distancia del objeto a S (el valor de x) como la suma de la distancia entre S y S’ y la distancia del objeto a S’ (el valor de x’). Además, sabemos que S’ se mueve con velocidad v respecto a S, por lo que en cualquier instante t la distancia de S a S’ es v.t. Podemos escribir entonces

x=x’+v.t ó x’=x-v.t

Esta regla para “pasar” de las coordenadas de S a las de S’ y viceversa se conoce como transformación de coordenadas, y nos permite comparar lo que “ven” distintos observadores en movimiento relativo uniforme. Lo que dice el principio de relatividad, entonces, es que las ecuaciones deben mantener su forma cuando cambiamos de x a x’. La segunda ley de Newton [4], por ejemplo, es la misma para todos los observadores en movimiento relativo uniforme. Es decir, si vale F=m.a para el observador S, entonces también vale F’=m.a’ para S’. La mecánica clásica es compatible con el principio de relatividad, es decir, las ecuaciones de movimiento de los sistemas mecánicos son invariantes frente a las transformaciones de Galileo.

post-23594-skateboard-backflip-gif-UuKQ

En este punto conviene llamar la atención sobre algo que puede haber pasado inadvertido. Para llevar el principio enunciado por Galileo al ámbito de las ecuaciones tuvimos que establecer las transformaciones de coordenadas (transformaciones de Galileo, de ahora en más), y estas dependen del tiempo absoluto postulado por Newton. Si cambiáramos nuestra forma de entender el tiempo y el espacio (como haría Einstein al formular su teoría) estas transformaciones serían diferentes, y las ecuaciones que describen las leyes físicas deberían adaptarse a estas nuevas transformaciones, si se pretende que sean las mismas para todos los observadores en movimiento relativo uniforme.

electromagnetismo y óptica

Gracias a los experimentos realizados por Young [5] y Fresnel [6], entre otros, durante la primera mitad del siglo XIX los físicos llegaron a convencerse de la naturaleza ondulatoria de la luz. En analogía con las ondas mecánicas, que consisten en vibración de un medio elástico, se propuso un medio para la propagación de las ondas electromagnéticas: El éter luminífero. Este medio debía ser, por fuerza, algo especial. Debía tratarse de un sólido elástico y no dispersivo, de manera que la propagación de la luz pudiese entenderse como el resto de las ondas mecánicas, pero también debía tener la capacidad de penetrar otros medios materiales interactuando con estos en alguna manera, de forma que fuera posible explicar la propagación de la luz en medios como el aire, la luz y el vidrio y  sus respectivos índices de refracción [7]. Más importante aún, dado que el éter debía llenar todo el espacio para hacer posible la propagación de la luz, éste debía estar en reposo respecto al espacio absoluto. Podría decirse que el éter era la materialización del espacio absoluto propuesto por Newton.

En 1873 Maxwell [8] publica su conocida obra,  A treatise on electricity and magnetism, en la que presenta una teoría que unifica los fenómenos eléctricos y magnéticos. Una predicción de esta teoría es la existencia de ondas electromagnéticas, lo que quiere decir que en ausencia de fuentes de carga [9] y corriente [10] la solución de las Ecuaciones de Maxwell [11] lleva a que los campos eléctrico y magnético deben ser solución de una ecuación de ondas [12]. Cuando Maxwell encontró estas soluciones notó que la velocidad a la que deberían propagarse estas ondas electromagnéticas, según la teoría, era muy similar a la velocidad medida para la propagación de la luz, por lo que conjeturó que la luz era un caso especial de onda electromagnética. Esta conjetura fue posteriormente confirmada por los experimentos realizados por Hertz [13]Así la óptica quedaba integrada como parte del electromagnetismo, y el éter luminífero pasó a coincidir con el medio que Maxwell postulara para la propagación de las ondas electromagnéticas. Las consecuencias de esto no son menores: La existencia de las ondas electromagnéticas llevó a proponer la existencia de un medio en el que los campos “viven”, lo que implica que la teoría de Maxwell consiste en un conjunto de leyes que describe los fenómenos electromagnéticos para observadores en reposo respecto a este medio, por lo que el principio de relatividad deja de valer en el reino de los fenómenos electromagnéticos. La identificación de dicho medio con el éter luminífero implica que el sistema de referencia en el que vale la teoría electromagnética está en reposo absoluto.

La teoría de Maxwell fue muy exitosa explicando fenómenos electromagnéticos conocidos, y además proporcionó predicciones que luego fueron confirmadas experimentalmente. Los problemas empezaron cuando los físicos se propusieron conocer cuál era el estado de movimiento de la Tierra respecto al éter. Resolver este problema era de importancia porque, supuesta la existencia del éter, es claro que las ecuaciones de Maxwell permiten conocer los campos eléctrico y magnético en un sistema de referencia en reposo respecto al éter, y para saber qué es lo que ve un observador en movimiento respecto al mismo es necesario conocer su velocidad relativa (de la que dependen las transformaciones de Galileo). Dicho de otra manera: la velocidad de la luz que predice la teoría de Maxwell sería solo la que mediría un observador en reposo respecto al éter, y otros observadores en movimiento relativo medirían otra, tal y como pasa con las ondas mecánicas. Entre los varios intentos de resolver esta cuestión destaca el experimento de Michelson y Morley.

el experimento de michelson y morley

Michelson [14] diseñó un experimento para determinar la velocidad relativa de la Tierra respecto al éter. La idea es relativamente sencilla: Tenemos el éter llenando todo el espacio y la tierra moviéndose a través de este en alguna dirección dada. Podemos imaginarnos que, mediante algún dispositivo, nos es posible generar dos pulsos luminosos que se propaguen en direcciones distintas: Uno de ellos en la dirección del movimiento de la Tierra respecto al éter, y el otro en dirección perpendicular a este.  En un sistema de referencia en reposo respecto del éter los dos pulsos viajarían a la misma velocidad, esos casi 3×10^8 m.s^-1 que predice la teoría de Maxwell. Pero en un sistema en reposo respecto a la Tierra las velocidades serían distintas, debido a que las transformaciones galileanas dicen que las velocidades se suman. Así, el pulso luminoso que se propaga en la dirección normal al movimiento de la Tierra respecto al éter debería propagarse a la misma velocidad que en el éter (dado que la velocidad relativa es nula), pero el otro pulso debería propagarse a una velocidad c’ un poco menor, resultado de la diferencia entre la velocidad medida en el éter y la velocidad relativa entre la Tierra y dicho medio, es decir c’= (3×10^8 – v) m.s^-1. Una medida de la velocidad de estos pulsos permitiría, entonces, conocer la velocidad con la que la Tierra se mueve en el éter.

Como muchas ideas simples, llevar esto a un dispositivo real resultó complicado. ¿Como generar dos pulsos de luz simultáneos, y además medir su velocidad? La solución de Michelson llegó con la construcción de su interferómetro, convirtiendo el problema de los pulsos de luz en un problema de interferencia [15] . Este es un esquema simplificado que muestra como funciona.

mm_esquema

La fuente emite un haz de luz monocromática que al llegar al semiespejo se divide en dos haces perpendiculares. Estos haces se reflejan en espejos diferentes y vuelven hacia el semiespejo para reflejarse nuevamente en dirección hacia una pantalla (representada por un ojo en la figura) en la que se forma un patrón de interferencia, debido a una diferencia de fase entre los dos haces. La idea entonces era la siguiente: Mientras el interferómetro estuviese en reposo respecto al éter, el patrón de interferencia sería siempre el mismo. Si, en cambio, el interferómetro se moviera respecto al éter en dirección paralela a alguno de sus brazos, entonces para un observador en reposo respecto al interferómetro la velocidad de la luz tendría un valor diferente en esa dirección. Debido a este cambio en la velocidad en una sola de las direcciones, la fase relativa de los haces de luz en el semiespejo también cambia, provocando un patrón de interferencia diferente en la pantalla. Hasta acá muy bien, pero hay un problema: El interferómetro está sobre la Tierra, por lo que se puede observar el patrón de interferencia debido a las diferentes velocidades en las dos direcciones de los brazos del interferómetro, pero no hay manera de compararlo con el patrón correspondiente al estado de reposo respecto al éter. La solución a este problema fue medir en una posición, y luego rotar el interferómetro 90º. El desplazamiento en el patrón de interferencia en esta comparación, sería el doble del que se quiere observar.

On_the_Relative_Motion_of_the_Earth_and_the_Luminiferous_Ether_-_Fig_3

Dibujo del interferómetro utilizado por Michelson y Morley en su experimento.

Para el momento en que Michelson, en colaboración con Morley [16] realizó su experimento ya se había descartado la posibilidad de que la Tierra “arrastrara” al éter, como si este fuese un fluido viscoso, por lo que necesariamente debía detectarse una velocidad no nula del planeta respecto al éter. Sin embargo el resultado del experimento fue nulo, es decir, no se detecto movimiento de la Tierra respecto al éter.

¿Qué falló?

La interpretación rápida de los resutados de este experimento sería El desplazamiento observado es nulo, luego la velocidad relativa de la Tierra respecto al éter es nula. Pero esta interpretación ya en ese entonces se sabía imposible. Una posible explicación a este resultado fue provista por Lorentz [17] en 1892 quien introdujo como hipótesis que los cuerpos en movimiento relativo respecto al éter debían contraerse en un factor dependiente de la velocidad de desplazamiento. La hipótesis se introduce ad hoc: Lorentz compensa la variación que debería observarse en la velocidad de la luz con un acortamiento en la longitud del brazo en la dirección de movimiento, de manera que el efecto neto del desplazamiento a través del éter sea nulo.

Si bien la solución propuesta no resulta muy agradable (lo sería si la contracción propuesta pudiese deducirse en lugar de introducirse a la fuerza) la teoría de Lorentz resultó exitosa, puesto que eliminaba las inconsistencias que surgían de los resultados nulos en los experimentos como el de Michelson y Morley, que intentaban medir el desplazamiento respecto al éter.

einstein y una teoría alternativa

El primer artículo de Einstein sobre la teoría de la relatividad fue publicado en 1905, año conocido como annus mirabilis. La siguiente cita es de la introducción del artículo:

Se sabe que cuando la electrodinámica de Maxwell – tal como se suele entender actualmente – se aplica a cuerpos en movimiento, aparecen asimetrías que no parecen estar en correspondencia con los fenómenos observados. Pensemos, por ejemplo, en la interacción electrodinámica entre un imán y un conductor. En este caso, el fenómeno que se observa depende solamente del movimiento relativo entre el conductor y el imán, mientras que de acuerdo a la interpretación común se deben distinguir claramente dos casos muy diferentes, dependiendo de cuál de los dos cuerpos se mueva. Si se mueve el imán mientras que el conductor se encuentra en reposo, al rededor del imán aparece un campo eléctrico con cierto valor para su energía. Este campo eléctrico genera una corriente en el lugar donde se encuentre el conductor. Pero si el imán está en reposo y el conductor se mueve, al rededor del imán no aparece ningún campo eléctrico sino que en el conductor se produce una fuerza electromotriz que en sí no corresponde a ninguna energía pero da lugar a corrientes eléctricas que coinciden en magnitud y dirección con las del primer caso, suponiendo que el movimiento relativo es igual en cada uno de los casos bajo consideración.

Otros ejemplos de esta índole así como los intentos infructuosos para constatar un movimiento de la Tierra con respecto al “medio de propagación de la luz” permiten suponer que no solamente en mecánica sino también en electrodinámica ninguna de las propiedades de los fenómenos corresponde al concepto de reposo absoluto.

Lo que parece molestar a Einstein es que un fenómeno único desde el punto de vista de la mecánica tenga 2 descripciones diferentes en el electromagnetismo. Dicho de otra manera, el principio de relatividad parece ser válido en el ámbito de la mecánica, pero no así en el reino de los fenómenos electromagnéticos.

Ahora bien, esta asimetría, por si misma, no necesariamente constituye un problema. Recordemos que los campos electromagnéticos viven en el éter, y que la teoría desarrollada por Maxwell consiste en un conjunto de leyes que describen los fenómenos electromagnéticos respecto a un observador en reposo respecto al éter, es decir, en reposo absoluto. La asimetría de la que habla Einstein, entonces, no es más que una consecuencia de este hecho. El principio de relatividad deja de valer en el electromagnetismo porque, a diferencia de lo que pasa dentro de la mecánica, los fenómenos electromagnéticos sí distinguen el reposo absoluto. Matemáticamente, además, esto se refleja en el hecho de que las ecuaciones del electromagnetismo no conservan su forma frente a las transformaciones galileanas.

Sin embargo, como deja entrever Einstein en el segundo párrafo citado, esta explicación puede objetarse. Si es cierto que estas asimetrías quedan explicadas por la capacidad del electromagnetismo de distinguir el reposo absoluto: ¿Por qué fallan los experimentos que intentan medir desplazamiento respecto al éter?

Hipótesis

Einstein propone una teoría alternativa partiendo de 2 hipótesis:

1) En todos los sistemas de coordenadas en los que tienen validez las ecuaciones de la mecánica, tienen también validez las mismas leyes de la electrodinámica.

2) La luz puede propagarse en el vacío, y lo hace de manera tal que su velocidad de propagación no depende de la velocidad de la fuente.

En la primer hipótesis extiende el principio de relatividad galileano al electromagnetismo: Todos los observadores en movimiento relativo uniforme describen los fenómenos de la misma manera, es decir, con las mismas ecuaciones. Esto implica que las ecuaciones deben tener una forma invariante frente a transformaciones de coordenadas (covariancia). La hipótesis en 2) sobre la velocidad de la luz es, en realidad, una característica común a todos los fenómenos ondulatorios. Lo novedoso es la idea de que la luz puede propagarse en el vacío, eliminando el éter.

Al sacar al éter del escenario Einstein enfrenta el problema de fondo: La incompatibilidad de las transformaciones de galileo con la teoría electromagnética. En efecto, para que las ecuaciones del electromagnetismo sean compatibles con el principio de relatividad, las transformaciones de coordenadas deben cambiar a otras, que dejen invariantes no solo a las ecuaciones de la mecánica, sino también a las ecuaciones de Maxwell. Esto requerirá el abandono del espacio y el tiempo absolutos de Newton…

Álgebra lineal: Espacios vectoriales I

En la entrada anterior comenté que un espacio vectorial es una estructura algebraica, y dediqué la entrada a explicar muy someramente qué cosa es una estructura algebraica. El objetivo en esta entrada es definir qué tipo de estructura es un espacio vectorial, y explicar con un ejemplo simple cómo probar que un objeto dado tiene esta estructura o no.

Definición

En algunos textos, la definición de espacio vectorial consiste en una lista con unos 10 axiomas, en los que en ocasiones se observan abusos de notación no aclarados. A mi entender, la manera más simple de pensar un espacio vectorial es como un par de estructuras vinculadas por una operación binaria (no es que esté diciendo nada nuevo, claro). Voy a ser un poco más preciso: Supongamos que tenemos un grupo abeliano {V, ⊕} (cuyos elementos denominamos vectores), un cuerpo {K, +, ×} (cuyos elementos denominamos escalares), y una ley de composición externa ★:V×K→V. Decimos que el objeto {V, ⊕, K, +, ×, ★} es un espacio vectorial si se verifican las siguientes condiciones para cualesquiera elementos en V y en K.

∀ α, β ∊ K, y ∀ u, v ∊ V:

1. α★(vw)=(αv)⊕(αw). Esto es, la operación ★ , de ahora en más producto de un vector por un escalar, se distribuye en la suma (⊕) de vectores.

2. (α+β)★v=(αv)⊕(βv). En este caso, pedimos al producto ★ que sea distributivo respecto de la suma de escalares. Un detalle que merece atención es el siguiente: A la izquierda del igual, la suma es la de escalares +, mientras que a la derecha, la suma es la de vectores ⊕. El por qué de esto está en la definición del producto entre vectores y escalares, ★:V×K→V, que da como resultado un vector, y no un escalar.

3. (α × β)★v=αβv). Esta propiedad se denomina asociatividad mixta.

4. 1★v=v. Con el símbolo 1 representamos al elemento neutro de K respecto del producto. Si K fuera el conjunto real ℝ, por ejemplo, entonces 1 representaría al número real 1, que es el elemento neutro respecto del producto, ya que todo número real x verifica 1.x=x.

“ℝ2” es un espacio vectorial

Hasta acá la definición. Veamos con un ejemplo cómo identificar si un dado objeto tiene estructura de espacio vectorial. Tomemos el conjunto ℝ, con la suma y producto ordinarios (denotados con + y × respectivamente), y el conjunto de pares ordenados de números reales ℝ2 (cuyos elementos son de la forma (a, b), con a,b ∊ ℝ), con una operación suma definida como (a, b)⊕(a’, b’)=(a+a’, b+b’). Definamos ahora el producto ★:ℝ×ℝ2→ℝ2 de pares por números reales de la siguiente manera: Si x ∊ ℝ y (a,b) ∊ ℝ2, entonces x★(a,b)=(× a× b).

¿Cómo probamos que el objeto {ℝ2, ⊕, ℝ, +, ×, ★} es un espacio vectorial? Usemos la definición. Tenemos que probar que {ℝ, +, ×} es un cuerpo, que {ℝ2, ⊕} es un grupo abeliano, y que ★ verifica las propiedades 1-4.

{ℝ, +, ×} es un cuerpo

Sabemos que la suma de números reales es asociativa, es decir que (x+y)+z=x+(y+z) ∀ x,y,z ∊ ℝ. También existe en ℝ un elemento neutro respecto de +, y es el número 0, ya que 0+x=x ∀ x ∊ ℝ. Además, sabemos que para cualquier elemento x ∊ ℝ podemos encontrar el elemento -x ∊ ℝ tal que x+(-x)=0, es decir, para todo número real podemos encontrar un inverso respecto de la suma. Por último, la suma es una operación conmutativa x+y=y+x ∀ x,y ∊ ℝ.

Por todo esto, podemos asegurar que {ℝ, +} es un grupo abeliano. Sin mucho esfuerzo, podemos ver que lo mismo pasa en el caso de {ℝ-{0}, ×}. Y dado que conocemos la propiedad distributiva de la multiplicación de números reales en la suma, vemos que {ℝ, +, ×} cumple con la definición de cuerpo.

{ℝ2, ⊕} es un grupo abeliano

i) Asociatividad: Supongamos que tenemos tres elementos cualesquiera de ℝ2, x=(x, y), x’=(x’, y’) y x”=(x”, y”). Queremos probar que x⊕(x’x”)=(xx’)⊕x”:

x⊕(x’x”)=

=(x, y)⊕((x’, y’)⊕(x”, y”))

=(x, y)⊕(x’+x”, y’+y”) Por definición de ⊕.

=(x+(x’+x”), y+(y’+y”)) Por definición de ⊕.

=((x+x’)+x”, (y+y’)+y”) Por asociatividad de + en ℝ.

=(x+x’, y+y’)⊕(x”y”) Por definición de ⊕.

=((x, y)⊕(x’y’))⊕(x”y”) Por definición de ⊕.

=x⊕(x’x”).

ii) Existencia de elemento neutro. Queremos probar que existe en ℝ2 un elemento e=(e1, e2) tal que ex=x, ∀ x=(x, y) ∊ ℝ2:

ex=(e1, e2)⊕(x, y)=(e1+x, e2+y) Por definición de ⊕. Para verificar la condición exigida, entonces, debe valer que (e1+x, e2+y)=(x, y), lo que implica e1+x=x y e2+y=y. Vemos que la única manera de satisfacer la ecuación es haciendo a e1 y e2 iguales al elemento neutro respecto de la suma en el conjunto real (y por transitividad iguales entre sí), esto es e1=e2=0. Por lo tanto existe un elemento neutro respecto de ⊕ en ℝ2, y es el par (0, 0).

iii) Existencia de inverso. En este caso lo que buscamos mostrar es que, para todo elemento x en ℝ2, existe en el mismo conjunto un elemento x-1=(x-1, y-1), tal que xx-1=e. La estrategia a adoptar es básicamente la misma que en el caso anterior:

xx-1=(x, y)⊕(x-1, y-1)=(x+x-1,y+y-1)=(0, 0). Luego, vemos que x-1=-x, el inverso de x respecto de la suma en ℝ, y-1=-y, el inverso de y.

iv) Conmutatividad: Ahora queremos mostrar que, para cualquier par x, x’ ∊ ℝ2 vale que xx’=x’x. La prueba es directa, y se apoya en la conmutatividad de la suma de números reales.

xx’=(x, y)⊕(x’, y’)=(x+x’, y+y’)=(x’+x, y’+y)=(x’, y’)⊕(x, y)=x’x.

Por i), ii), iii) y iv) tenemos que {ℝ2, ⊕} es un grupo abeliano.

★ verifica las propiedades 1-4

Sean a,b ∊ ℝ y xx’ ∊ ℝ2.

1. a★(xx’)=a★((x, y)⊕(x’, y’))=a★(x+x’, y+y’)

=(× (x+x’), × (y+y’)) Por definición de ★.

=(× x+× x’, × y+× y’) Por distributividad de × en +.

=(× x, × y)⊕(× x’, × y’) Por definición de ⊕.

=a★(x, y)⊕a★(x’, y’)=(ax)⊕(ax’).

2. (a+b)★x=(a+b)★(x, y)=((a+b× x, (a+b× y) Por definición de ★.

=(× x+b × x, a × y+b × y) Por distributividad de × en +.

=(× x, × y)⊕(× x, b × y) Por definición de ⊕.

=(ax)⊕(b★x)  Por definición de ★.

3.  (× b)★x=(× b)★(x, y)=((a × b) × x, (× b× y) Por definición de ★.

=(× (× x)× (× y)) Por asociatividad de ×.

=a★(× x× y)=a★(bx).

4. 1x=1★(x, y)=(1× x, 1× y)=(x, y)=x.

Vemos con esto que {ℝ2, ⊕, ℝ, +, ×, ★} es un espacio vectorial. No es difícil darse cuenta de que las demostraciones que hicimos para los pares de números reales se extienden directamente a n-uplas de números reales. Luego, es fácil demostrar que {ℝn, ⊕, ℝ, +, ×, ★}, con n natural, es un espacio vectorial. Un caso familiar de estos espacios es el de n=3, que es el espacio real tridimensional en el que se desarrolla la mecánica newtoniana.

Hay varios otros ejemplos importantes de espacios vectoriales, que voy a comentar en las próximas entradas.

Álgebra lineal: ¿Qué es una estructura algebraica?

Etiquetas

, ,

La base del álgebra lineal está en el concepto de espacio vectorial. Un espacio vectorial es una estructura algebraica. ¿Y qué es una estructura algebraica?

Podemos empezar a contestar esa pregunta hablando sobre operaciones binarias. Supongamos tenemos 3 conjuntos A, B y C. Una operación binaria es aquella que a un par de elementos formado, por ejemplo, por un elemento de A y otro B, le asigna un elemento de C. Dicho de una manera más útil, la operación binaria es una aplicación del producto cartesiano de A y B en el conjunto C. Podemos escribir esto como ⊙:A × B→C, donde ⊙ representa a la operación. Así, si a es un elemento de A, b un elemento de B, y c el elemento de C asignado al par (a,b) de A × B, tenemos ⊙(a,b)=ab=c. Esto es cosa de todos los días, aunque no parezca. Por ejemplo, la suma 1+1=2 puede escribirse como +(1,1)=2. La operación +:N × N→N es una operación binaria.

De todas las posibles operaciones binarias nos interesa un subconjunto, denominado leyes de composición. Básicamente, son aquellas operaciones binarias en las que solo intervienen dos conjuntos o uno solo. En el primer caso hablamos de una ley de composición externa, y en el segundo, de una ley de composición interna. Esta imagen de Wikipedia es bastante clara:

ley de composicion

Vemos que la operación suma, mencionado arriba, es una ley de composición interna.

Con esto, ya podemos hablar de estructuras. Una estructura algebraica es, en el caso más simple, un objeto compuesto por un conjunto (no vacío) y una ley de composición interna. En casos más complicados, podemos tener más de una ley de composición interna, o también leyes de composición externa. Veamos algunos ejemplos, que nos van a servir para definir más adelante qué es un espacio vectorial.

Monoide

La estructura más simple es un monoide. Un monoide es simplemente un par (M,⊙), donde M es un conjunto no vacío y ⊙ es una ley de composición interna en M, es decir, ⊙: M×M→M, a la que exigimos dos propiedades: Asociatividad, y existencia de elemento neutro en el conjunto. Con asociatividad, lo que queremos decir es que si a, b, y c son 3 elementos cualquiera en M, entonces (ab)⊙c=a⊙(bc). La segunda condición, implica exigir la existenca de eM, tal que para cualquier aM vale que ae=ea=a. Ejemplo de monoide es el conjunto de números naturales con la operación producto: (ℕ,×).

Grupo

Un grupo es un par (G,⊙), donde G es un conjunto no vacío y ⊙ es una ley de composición interna a la que, además de asociatividad y existencia de elemento neutro, le exigimos también, para todo elemento de G, la existencia de un inverso respecto de ⊙. Precisemos lo que queremos decir con inverso: Dado un elemento a en G, existe otro elemento a^-1, tal que aa^-1=a^-1a=e. Ejemplos de esta estructura podemos encontrar en el conjunto de los números reales junto con el producto, (ℝ,×) o el conjunto de los números enteros con la suma (ℤ,+). Si además de cumplir las condiciones mencionadas, la operación es conmutativa, esto es, ab=baa,b ∊ G, el grupo se denomina abeliano.

Cuerpo

A diferencia de los ejemplos anteriores, un cuerpo es una terna. En este caso tenemos un conjunto K, y dos leyes de composición interna, ⊕ y ⊗. Decimos que la terna (K,⊕,⊗) es un grupo si:

1.(K,⊕) es un grupo abeliano

2.(K-{0},⊗) es un grupo abeliano.

3.a⊗(b⊕c)=(a⊗b)⊕(a⊗c) ∀a, b, c ∊ K.

donde 0 denota el elemento neutro respecto de la operación ⊕ y la condición 3 es simplemente la distributividad de ⊗ respecto de ⊕.

Nuevamente tenemos un ejemplo familiar de cuerpo en el conjunto de los números reales, tomando ⊕ como la suma y ⊗ como el producto. Es decir, (ℝ,+,×) es un grupo.

Y acá lo dejo. De más está decir que esta pequeña mención a las estructuras algebraicas es apenas una mirada a la superficie del tema, que como tantos otros puede volverse tan complejo y sofisticado (e interesante) como se quiera. No obstante, alcanza para empezar a definir de forma simple y precisa lo que es un espacio vectorial, objeto de estudio del álgebra lineal.

Seguir

Recibe cada nueva publicación en tu buzón de correo electrónico.

Únete a otros 242 seguidores