Fundamentos de la ecuación de Dirac#

Jose A. Hernando

Departamento de Física de Partículas. Universidade de Santiago de Compostela

Diciembre 2023

import time
print(' Last version ', time.asctime() )
 Last version  Wed Jan 17 16:48:30 2024
# general imports
%matplotlib inline
%reload_ext autoreload
%autoreload 2

# numpy and matplotlib
import numpy as np
import matplotlib
import matplotlib.pyplot as plt

Sobre la ecuación de Dirac#

Dirac propuso en los años 30 del siglo XX una ecuación que describe la dinámica de los fermiones libres.

Construyó su ecuación de tal forma que fuera invariente Lorentz, apareciesen linealmente los operadores de energía y momento de la mecánica cuántica, por ejemplo \(\hat{p} = -i \nabla\), y que contuviese implícitamente la ecuación de Einstein, \(E = m^2 + p^2\).

La solución de la ecuación de dirac, \(\Psi(x)\), contine un nuevo tipo de objeto físico, un espinor, que describe los fermiones libres, partículas con un momento angular intrínseco o espín de \(1/2\). \(\Psi(x)\) no es sólo una función de ondas, si no cuatro, puestas en forma de columna. Este nuevo objeto se transformará con una reglas específicas bajo transformaciones Lorentz, que veremos, se derivan de la invariancia Lorentz de la propia ecuación de Dirac. En particular un espinor bajo rotaciones regresa a a su forma original tras girar dos veces, \(4\pi\), esto es, un giro le afecta «la mitad», de ahí que su espín sea 1/2.

Inicialmente dos de las soluciones de Dirac tenían energía negativa. Dirac mismo propuso una interpretación muy iluminadora de su significado, indicando que las soluciones de energía negativa se correspondían con anti-partículas. Anti-partícula sería la ausencia de partícula, y por lo tanto tendría sus cargas opuestas. El descubrimiento del positrón supuso el espaldarazo de la existencia de las anti-partículas y de la ecuación de Dirac.

Las cuatro soluciones indenpendientes de Dirac corresponden a un fermión y sus dos componentes de espín, por ejemplo el electrón con carga \(-e\), y al anti-fermión, por ejemplo, el positrón, que tiene las cargas opuestas, \(+e\), y sus dos componentes de espín. La ecuación de Dirac introduce de forma natural el espín, el momento angular intrínsico de una partícula, y a las antipartículas. ¡Todo un logro!

En la ecuación aparecen ademas cuatro matrices, \(\gamma^\mu\) con \(\mu = 0, 1, 2, 3\), iguales en todos los sistemas inerciales, que aunque admiten diversas representaciones, cumplen unas reglas de conmutación que permiten como un engranaje, al asociarlas, al momento y la energía de la partícula, recuperar de nuevo la relación \(E^2 = m^2 + p^2\). Podemos decir que las matrices \(\gamma\) asociadas con los operadores energía y momento están codificando, encriptando, linealmente la famosa ecuación de Einstein.

La ecuación de Dirac es uno de los grandes logros de la Física Teórica, matemáticamente es de una simpleza sorprendente y al mismo tiempo de una riqueza física desbordante.

En lo siguiente desvelaremos algunos de sus secretos e intentaremos asociarlos a los elementos fundamentales de las interacciones.

Representación covariante de la ecuación de Dirac#

La representación covariante de la ecuación de Dirac es:

\[ (i \gamma^\mu \partial_\mu - m) \, \Psi = 0. \]

donde \(\partial_\mu\) es la derivada covariante:

\[ \partial_\mu = \left( \frac{\partial}{\partial t}, \frac{\partial}{\partial x}, \frac{\partial}{\partial y}, \frac{\partial}{\partial z} \right), \]

y \(\gamma^\mu\), con \(\mu = 0, 1, 2, 3\), son la matrices gamma.

Nota: entendemos la contracción de índices en \(\mu\) como un sumatorio:

\[ \gamma^\mu \, \partial_\mu \equiv \sum_{\nu= 0}^{3} \gamma^\nu \partial_\nu \]

En estos apuntes, y habitualmente en la literatura, los índices griegos, \(\mu, \nu = 0, 1,2, 3\), estarán asociados a las componente temporales y especiales, meintras que los índices latinos, \(i, j, k = 1, 2, 3\), representarán las componentes espaciales. En ambos caso si aparecen contraidos, implican un sumatorio.

Las matrices \(\gamma\)#

Las matrices-\(\gamma\) cumplen:

\[ (\gamma^0)^2 = I, \; (\gamma^k)^2 = - I, \;\; \gamma^\mu \gamma^\nu = - \gamma^\nu \gamma^\mu \, (\mu \neq \nu), \]

con \(k=1, 2, 3\), y \(\mu = 0, 1, 2, 3\).

De forma equivalente, cumplen las siguientes relaciones de anti-conmutación:

\[ \{ \gamma^\mu, \gamma^\nu \} \equiv \gamma^\mu \gamma^\nu + \gamma^\nu \gamma^\mu = 2 g^{\mu\nu} \]

Donde \(g_{\mu\nu}\) es la métrica de Minkowski.

\[\begin{split} g_{\mu\nu} = \begin{pmatrix} 1 & 0 & 0 & 0 \\ 0 & -1 & 0 & 0 \\ 0 & 0 & -1 & 0 \\ 0 & 0 & 0 & -1 \end{pmatrix} \end{split}\]

Vamos a deducir estas reglas de conmutación a partir de la asociación de los operadores momento y energía con la derivas lineal en espacio y tiempo.

Si hacemos la asociación habitual de mecánica cuántica:

\[ i\partial_0 \Psi(x) = E, \;\;\; -i\partial_i \Psi(x) = p_i, \]

y elevando al cuadro la ec. de Dirac, obtenemos:

\[\begin{split} E - p^2 = \left(\gamma^0 E - \sum_k \gamma^k p_k \right) \left(\gamma^0 E - \sum_i\gamma^i p_i\right) = \\ (\gamma^0)^2 E^2 + \sum_k (\gamma^k)^2 p^2_k +\\ \sum_{k, i, k \neq 1}(\gamma^k \gamma^i + \gamma^i \gamma^k) p_k p_i - \sum_k(\gamma^0 \gamma^k + \gamma^k \gamma^0) E p_k \end{split}\]

con \(k, i = 1, 2, 3\).

Nota: A partir de ahora no explicitaremos los sumatorios.

Si asociamos término a término, concluimos:

\[\begin{split} (\gamma^0)^2 = I, \;\, (\gamma^k)^2 = -I, \;\; \\ \{\gamma^k, \gamma^i\} = 0, \;\; \{\gamma^0, \gamma^k\} = 0, \end{split}\]

con \( i \neq k, \;\; i,k = 1, 2, 3\)

Esto es:

\[ \{\gamma^\mu, \gamma^\nu\} = 2 g^{\mu\nu}, \]

con \(\mu, \nu = 0, 1, 2, 3.\)

Veamos además que la matrix \(\gamma^0\) es hermítica y las \(\gamma^k\) anti-hermíticas:

\[ \gamma^{0\dagger} = \gamma^0, \;\; \gamma^{k \dagger} = - \gamma^{k} \]

Estas propiedades se derivan de que el hamiltoniano es hermítico, \(H^\dagger = H\), dado que sus autovalores debe ser reales.

Si escribimos:

\[\begin{split} H = i \partial_0 = \gamma^0 (m -i \gamma^k \partial_k) \\ E = \gamma^0 m + \gamma^0 \gamma^k p_k\\ E = (\gamma^0)^\dagger m + (\gamma^0 \gamma^k)^\dagger p_k, \\ \end{split}\]

obtenemos:

\[\begin{split} (\gamma^0)^\dagger = \gamma^0; \\ (\gamma^0 \gamma^k)^\dagger = \gamma^0 \gamma^k, \;\; (\gamma^k)^\dagger \gamma^0 = \gamma^0 \gamma^k, \\ (\gamma^k)^\dagger \gamma^0 = - \gamma^k \gamma^0, (\gamma^k)^\dagger = \gamma^k \end{split}\]

Esto es \(\gamma^0\) es una matriz hermítica y \(\gamma^k\), con \(k = 1, 2, 3\), anti-hermítica.

Matrix \(\gamma^5\)#

Vamos a introducir una quinta matriz, \(\gamma^5\), que va a estar muy relacionada con una propiedad que llamaremos quiralidad (ver al final del apéndice) y que juega un papel fundamental en la interacciones débiles.

La matriz \(\gamma^5\) se define:

\[ \gamma^5 \equiv i \gamma^0 \gamma^1 \gamma^2 \gamma^3, \]

Y tiene las siguientes propiedades:

\[ (\gamma^5)^2 = I, \;\; \gamma^{5\dagger} = \gamma^5, \;\; \gamma^5\gamma^\mu = - \gamma^\mu \gamma^5 \]

que se derivan de las propiedades de las matrices \(\gamma^\mu\).

Cuestión: Verifica las propiedades de \(\gamma^5\)

La matrices \(\gamma^\mu\) adimiten diversas representaciones, la más común, que usaremos aquí, es la representación de Pauli-Dirac, dada por:

\[\begin{split} \gamma^0 = \begin{pmatrix} I & 0 \\ 0 & -I \end{pmatrix}, \;\; \gamma^k = \begin{pmatrix} 0 & \sigma_k \\ -\sigma_k & 0 \end{pmatrix}, \;\; \gamma^5 = \begin{pmatrix} 0 & I \\ I & 0 \end{pmatrix}, \end{split}\]

donde \(I\) es la matriz identidad \(2\times2\), y \(\sigma_k\) son las matrices de Pauli:

\[\begin{split} \sigma_1 = \begin{pmatrix} 0 & 1 \\ 1 & 0 \end{pmatrix}, \;\; \sigma_2 = \begin{pmatrix} 0 & -i \\ i & 0 \end{pmatrix}, \;\; \sigma_3 = \begin{pmatrix} 1 & 0 \\ 0 & -1\end{pmatrix}. \end{split}\]

que recordemos cumplen:

\[ \{\sigma_i, \sigma_j\} = \delta_{ij}, \;\; [\sigma_i, \sigma_j] = 2i \, \epsilon_{ijk} \sigma_k \]

Cuestión: Comprueba que las \(\gamma^\mu\) cumplen las reglas de conmutación y sus propiedades de hermicidad.

Soluciones de la ecuación de Dirac#

La solución de la ecuación de Dirac para un fermión libre, \(\Psi(x)\), es un cuadri-spinor de Dirac:

\[\begin{split} \Psi(x) = \begin{pmatrix} \psi_1(x) \\ \psi_2(x) \\ \psi_3(x) \\ \psi_4(x)\end{pmatrix}, \end{split}\]

que tiene cuatro componentes, \(\psi_i(x)\) con \(i=1, 4\), complejas en forma vector columna.

Esto es, tiene cuatro soluciones complejas independientes.

Las cuatro soluciones se puede agrupar en dos:

  • las soluciones de los fermiones, \(\Psi_s(x)\),

  • y las de los anti-fermiones, \(\Phi_s(x)\),

cada una con dos posibilidades de espín arriba y abajo, \(s = 1, 2\) en una dirección.

Las soluciones admiten, como veremos en breve, la expresión:

\[ \Psi_s(x) = u_s(p) \, e^{-i \, x \cdot p}, \;\;\; \Phi_s(x) = v_s(p) \, e^{+i \, x \cdot p}. \]

Que tiene dos partes,

  • una parte de onda plana, \(e^{\mp i \, x \cdot p}\), que contiene toda la dependencia espacio-temporal,

  • y otra parte espinorial, 4 componentes puestas en forma columna, que corresponde al espinor del fermión \(u_s(p)\) y del antifermión \(v_s(p)\) con dos posibilidades de espín, \(s= 1, 2\), que dependen sólo del cuadrimomento \(p\).

Vamos a posponer la discusión de qué significan las antipartículas, y vamos a obtener primero las soluciones de la ec. de Dirac.

Espinores de los fermiones#

Las soluciones de los fermiones, \(\Psi(x) = u_s(x)\, e^{-i \, xp}\), tienen como energía:

\[\begin{split} i \partial_0 \, \Psi_s(x) = i \partial_o \, u_s(p) \, e^{-i \, xp} = u_s(p) \, i \partial_o \, e^{-i \, (Et - {\bf p} \cdot {\bf x})} = \\ u_s(p) i (-Ei)\, e^{-i\, xp} = E \, u_s(p) \, e^{-i\, xp} = E \, \Psi_s(x) \end{split}\]

y componentes del momento:

\[\begin{split} - i \partial_k \, \Psi_s(x) = -i \partial_k \, u_s(p) \, e^{-i \, xp} = - i u_s(p) \, \partial_k \, e^{-i \, (Et - {\bf p} \cdot {\bf x})} = \\ u_s(p) \, (-i) (ip_k) \, e^{-i\, xp} = p_k \, u_s(p) \, e^{-i\, xp} = p_k \, \Psi_s(x) \end{split}\]

A aplicar la ec. de Dirac sobre la solución \(\Psi(x)\) nos queda solo la ecuación de Dirac para el espinor, \(u_s(p)\), que veremos solo depende de \(p\):

\[\begin{split} (i \gamma^\mu \partial_\mu - m ) \, \Psi_s(x) = 0, \\ (i \gamma^\mu \partial_\mu - m ) \, u_s(p) \, e^{-i \, xp } = 0, \\ [i \gamma^\mu (-iE) + i \gamma^k (i p_k) - m] \, u_s(p) = 0 \\ (\gamma^0 E - p_k \gamma^k - m) \, u_s(p) = 0 \end{split}\]

donde \(k = 1, 2, 3\), y los índices contraidos indican sumatorio.

Esto es:

\[ (\gamma^\mu \, p_\mu - m) \, u_s(p) = 0 \]

Notar que en esta notación, donde se baja el índice, \(p_\mu\) corresponde a:

\[\begin{split} p_\mu \equiv g_{\mu\nu} \, p^\nu = \begin{pmatrix} E \\ -{\bf p} \end{pmatrix}, \;\;\; p^\mu = \begin{pmatrix} E \\ {\bf p} \end{pmatrix} \end{split}\]

Llamamos a \(p_\mu\) vector covariante y a \(p^\mu\) contra-variante.

Podemos dar las cuatro componenetes del espinor \(u_s(p)\) con dos bi-spinores, \(u^a_s(p), \, u^b_s(p)\), cada uno de ellos a su vez compuestos por dos componentes en vertical.

\[\begin{split} u_s(p) \equiv \begin{pmatrix} u^a_s(p) \\ u^b_s(p) \end{pmatrix} \end{split}\]

La ecuación de Dirac, en la representación Pauli-Dirac, sobre el espinor \(u_s(p)\) queda:

\[\begin{split} \left[ E \begin{pmatrix} I & 0 \\ 0 & -I \end{pmatrix} - \text{p} \begin{pmatrix} 0 & \hat{\bf v} \cdot \vec{\sigma} \\ -\hat{\bf v} \cdot \vec{\sigma} & 0 \end{pmatrix} - m \begin{pmatrix} I & 0 \\ 0 & I \end{pmatrix} \right] \begin{pmatrix} u^a_s(p) \\ u^b_s(p) \end{pmatrix} = 0 \end{split}\]

Donde estamos dando el momento \({\bf p} = \text{p} \, \hat{\bf v}\), a partir del módulo del momento \(\text{p} = |{\bf p}|\) y de su dirección \(\hat{\bf v}\).

Que nos da dos ecuaciones acopladas:

\[\begin{split} + E \, u^a_s(p) - \text{p} \, (\hat{\bf v} \cdot \vec{\sigma}) \, u^b_s(p) - m \, u^a_s(p) = 0 \\ - E \, u^b_s(p) + \text{p} \, (\hat{\bf v} \cdot \vec{\sigma}) \, u^a_s(p) - m \, u^b_s(p) = 0 \end{split}\]

De la segunda, podemos dar el bi-espinor de abajo \(u^b_s(p)\) en función del bi-espinor de arriba, \(u^a_s(p)\):

\[ u^b_s(p) = \frac{\text{p}}{E+m} (\hat{\bf v} \cdot \vec{\sigma}) \, u^a_s(p) \]

Si definimos el factor:

\[ \kappa \equiv \frac{\text{p}}{E+m} \]

Observamos que toma el valor:

  • \(\kappa = 0\) para el caso de la partícula en reposo, \(\text{p} = 0\),

  • \(\kappa = 1\) para el caso de una partícula ultra-relativista \(E \gg m\) o sin masa, \(m=0 \, (\text{p} = E)\).

La relación entre los dos bi-espinores queda simplemente:

\[ u^b_s(p) = \kappa \, (\hat{\bf v} \cdot \vec{\sigma}) \, u^a_s(p) \]

Podemos explicitar el factor \((\hat{\bf v} \cdot \vec{\sigma})\), donde, recordemos, \(\hat{\bf v}\) es la dirección del momento, \({\bf p}\):

\[\begin{split} (\vec{\sigma} \cdot \hat{\bf v}) = \begin{pmatrix} v_z & v_x - i v_y \\ v_x+iv_y & -v_z \end{pmatrix} = \begin{pmatrix} \cos\theta & \sin\theta e^{-i\phi} \\ \sin\theta e^{i\phi} & -\cos\theta \end{pmatrix} \end{split}\]

Dejamos como ejercicio comprobar a partir de las propiedades de las matrices \(\sigma_i\), que:

\[ (\vec{\sigma} \cdot \hat{\bf v})^2 = |{\hat{\bf v}}| \, I = I \]

Tomemos las posibilidades del bi-espinor de arriba, \(u^a_s(p)\), con \(s=1, 2\), como:

\[\begin{split} \chi_1 = \begin{pmatrix} 1 \\ 0 \end{pmatrix},\;\; \chi_2 = \begin{pmatrix} 0 \\ 1 \end{pmatrix} \end{split}\]

que como veremos corresponde a un espinor con el espín alineado hacia arriba o abajo en \(z\) respectivamente.

Las dos soluciones de los espinores de los fermiones son:

\[\begin{split} u_s(p) = N \begin{pmatrix} \chi_s \\ \kappa \, (\hat{\bf v} \cdot \vec{\sigma}) \, \chi_s \end{pmatrix} \end{split}\]

Donde \(N\) es una constante de normalización, cuyo origen es cinemático (ver apéndice), y que vale:

\[ N = \sqrt{E + m} \]

Para el caso de un fermión en reposo, los dos posibles espinores son:

\[\begin{split} u_s(m) = \sqrt{2m} \begin{pmatrix} \chi_s \\ 0 \end{pmatrix} \end{split}\]

Que podemos explicitar:

\[\begin{split} u_1(m) = \sqrt{2m} \begin{pmatrix} 1 \\ 0 \\ 0 \\ 0 \end{pmatrix}, \;\; u_2(m) = \sqrt{2m} \begin{pmatrix} 0 \\ 1 \\ 0 \\ 0 \end{pmatrix}, \end{split}\]

Introducimos ahora el operador espín, \({\bf S}\):

\[\begin{split} {\bf S} \equiv \frac{1}{2} {\bf \Sigma}, \;\; \Sigma_k \equiv \begin{pmatrix} \sigma_k & 0 \\ 0 & \sigma_k \end{pmatrix} \end{split}\]

Comprobamos que la tercera componente de espín del espinor en reposo, \(u_1(m)\) es hacia arriba, y de \(u_2(m)\) hacia abajo:

\[\begin{split} \text{S}_3 \, u_1(m)= \frac{1}{2} \Sigma_3 \, u_1(m)= +\frac{1}{2} \, u_1(m) \\ \text{S}_3 \, u_2(m)= \frac{1}{2} \Sigma_3 \, u_2(m)= -\frac{1}{2} \, u_2(m) \\ \end{split}\]

Nota: Este operador nos aparecerá cuando estudiemos cómo rotan los espinores. El espín será el generador de las rotaciones de los espines. El espín cumple las mismas reglas de conmutación que el momento angular, lo cual es fácil de comprobar a partir de las propiedades de las matrices \(\sigma_i\).

El espinor \(u_s(p)\), de un fermión que se mueve en la dirección \(z, (\hat{\bf v} = \hat{k})\), con momento \(\text{p}\) es:

\[\begin{split} u_s(p) = \sqrt{E+m} \begin{pmatrix} \chi_s \\ \kappa \, \sigma_3 \, \chi_s \end{pmatrix}; \end{split}\]

Que podemos explicitar:

\[\begin{split} u_1(p) = \sqrt{E+m} \begin{pmatrix} 1 \\ 0 \\ \kappa \\ 0 \end{pmatrix}, \;\; u_2(p) = \sqrt{E+m} \begin{pmatrix} 0 \\ 1 \\ 0 \\ - \kappa \end{pmatrix}, \end{split}\]

Definimos el operador helicidad, \(h\), como la componente (o proyección) del espín en la dirección del momento:

\[\begin{split} h = {\bf S} \cdot \hat{\bf v} = \frac{1}{2} \begin{pmatrix} (\hat{\bf v} \cdot \vec{\sigma}) & 0 \\ 0 & (\hat{\bf v} \cdot \vec{\sigma}) \end{pmatrix} \end{split}\]

Para el caso de espinor \(u_s(p)\) cuyo momento va en la dirección \(z\), la tercera componente de espín y helicidad, por definición, coinciden, \(\text{S}_3 = h\).

\[\begin{split} \text{S}_3 \, u_1(p) = +\frac{1}{2} \, u_1(p), \;\; h \, u_1(p) = +\frac{1}{2} \, u_1(p), \\ \text{S}_3 \, u_2(p) = -\frac{1}{2} \, u_2(p), \;\; h \, u_2(p) = -\frac{1}{2} \, u_2(p), \\ \end{split}\]

Los espinores \(u_s(p)\) con el momento en la dirección \(z\) son autoestados de helicidad, y podemos renombrarlos:

\[ u_+(p) = u_1(p), \;\; u_-(p) = u_2(p) \]

Así:

\[ h \, u_\pm (p) = \pm \frac{1}{2}\, u_\pm(p) \]

Nota El espinor \(u_s(m)\) y \(u_s(p)\) están relacionados entre sí. El espinor \(u(p)\) corresponde al espinor en reposo, \(u_s(m)\), después de hacerle un boost en \(z\) con \(\beta \, \hat{\bf v} =\frac{\bf p}{E}\). En la sección de transformaciones veremos cómo al aplicar un boost a un espinor.

Espinores de los anti-fermiones#

Las soluciones de los anti-fermiones, \(\Phi_s(x) = v_s(x)\, e^{+i \, xp}\), tiene como energía:

\[\begin{split} i \partial_0 \, \Phi_s(x) = i \partial_o \, v_s(p) \, e^{+i \, xp} = i \, v_s(p)\, \partial_o \, e^{+i \, (Et - {\bf p} \cdot {\bf x})} = \\ v_s(p) \, i \, (+Ei) e^{+i\, xp} = -E \, v_s(p) \, e^{+i\, xp} = - E \, \Phi_(x) \end{split}\]

Esto es, ¡son autoestados de energía negativa!

Y componentes del momento:

\[\begin{split} - i \partial_k \, \Phi(x) = -i \partial_k \, v_s(p) \, e^{+i \, xp} = v_s(p) \, (-i) \partial_k \, e^{+i \, (Et - {\bf p} \cdot {\bf x})} = \\ v_s(p) \, (-i) (-i p_k) \, e^{+i\, xp} = - p_k \, v_s(p) \, e^{+i\, xp} = - p_k \, \Phi(x) \end{split}\]

¡están invertidas!

Interpretación de las antipartículas#

Fue Feynman y Stückelberg quienes propusieron que las anti-partículas son «partículas que van hacia atrás en el tiempo».

Con esta interpretación, la inversion temporal implica cambiar \(t \to -t\), pero también \({\bf p} \to - {\bf p}\), con lo que:

\[ \Phi_s(t, {\bf x}) \to \Phi_s(-t, {\bf x}) = v_s(E, -{\bf p}) \, e^{-i (E t - {\bf p} \cdot {\bf x})} \]

es ahora un función de ondas de una partícula.

Notar que la parte espacio-temporal de la función de ondas cambia de signo, lo que recupera el signo adecuado de la energía y el momento. Veámoslo:

\[ i \partial_0 \, \Phi_s(-t,{\bf x}) = E \, \Phi_s(-t,{\bf x}), \;\; -i \partial_k \, \Phi_s(-t, {\bf x}) = p_k \, \Phi_s(-t, {\bf x}) \]

La anti-partícula proviene de una partícula que viaja «hacia atrás en el tiempo» y que tiene energía positiva.

En esta visión, no solo cambia de signo la energía, sino también el momento o el espín.

La interpretación de las anti-partículas de la ecuación de Dirac es controvertida, y su sentido aparece de forma natural cuando se cuantifica el campo de Dirac, esto es, en teoría cuántica de campos.

[ADD] Interpretación de Dirac

Ecuación de dirac para el espinor de los anti-fermiones#

La ecuación de Dirac aplicada ahora sobre las soluciones de las antipartículas, \(\Phi_s(x)\), queda:

\[\begin{split} (i\gamma^\mu \partial_\mu - m) \, \Phi_s(x) = 0 \\ (i\gamma^\mu \partial_\mu - m) \, v_s(p) \, e^{+i \, px} = 0 \\ [i \gamma^0 \, (iE) + i \gamma^k \, (-ip_k) - m] \, v_s(p) = 0 \\ (-\gamma^0 E + \gamma^k p_k - m) \, v_s(p) = 0 \end{split}\]

que traduce en una ecuación para los espinores \(v_s(p)\):

\[ (\gamma^\mu p_\mu + m) \, v_s(p) = 0 \]

Si escribimos \(v_s(p)\) también con dos bi-spinores, \(v^a_s(p), \, v^b_s(p)\), cada uno a su vez con dos componentes en vertical.

\[\begin{split} v_s(p) \equiv \begin{pmatrix} v^a_s(p) \\ v^b_s(p) \end{pmatrix}, \end{split}\]

la ecuación de Dirac del espinor \(v_s(p)\) en la representación Pauli-Dirac queda:

\[\begin{split} \left[ E \begin{pmatrix} I & 0 \\ 0 & -I \end{pmatrix} - \text{p} \begin{pmatrix} 0 & \hat{\bf v} \cdot \vec{\sigma} \\ -\hat{\bf v} \cdot \vec{\sigma} & 0 \end{pmatrix} + m \begin{pmatrix} I & 0 \\ 0 & I \end{pmatrix} \right] \begin{pmatrix} v^a_s(p) \\ v^b_s(p) \end{pmatrix} = 0 \end{split}\]

Donde estamos dando el momento \({\bf p} = \text{p} \, \hat{\bf v}\), a partir del módulo del momento \(\text{p} = |{\bf p}|\) y de su dirección \(\hat{\bf v}\).

Obtenemos de nuevo dos ecuaciones acopladas

\[\begin{split} + E \, v^a_s(p) - \text{p} \, (\hat{\bf v} \cdot \vec{\sigma}) \, v^b_s(p) + m \, v^a_s(p) = 0 \\ - E \, v^b_s(p) + \text{p} \, (\hat{\bf v} \cdot \vec{\sigma}) \, v^a_s(p) + m \, v^b_s(p) = 0 \end{split}\]

De la primera, podemos dar el bi-espinor de arriba \(v^a_s(p)\) en función del de abajo, \(v^a_s(p)\):

\[\begin{split} v^a_s(p) = \frac{\text{p}}{E+m} (\hat{\bf v} \cdot \vec{\sigma}) \, v^b_s(p) \\ v^a_s(p) = \kappa \, (\hat{\bf v} \cdot \vec{\sigma}) \, v^b_s(p) \end{split}\]

Tomamos las dos posibilidades del bi-espinor de abajo, \(v^b_s(p), \;\; s = 1, 2\), como:

\[\begin{split} \xi_1 = \begin{pmatrix} 0 \\ 1 \end{pmatrix},\;\; \xi_2 = \begin{pmatrix} 1 \\ 0 \end{pmatrix} \end{split}\]

Los espinores de los fermiones son:

\[\begin{split} v_s(p) = \sqrt{E+m} \begin{pmatrix} \kappa \, (\hat{\bf v} \cdot \vec{\sigma}) \, \xi_s \\ \xi_s \end{pmatrix} \end{split}\]

Para el caso de un anti-fermión en reposo:

\[\begin{split} v_s(m) = \sqrt{2m} \begin{pmatrix} 0 \\ \xi_s \end{pmatrix} \end{split}\]

De forma explícita:

\[\begin{split} v_1(m) = \sqrt{2m} \begin{pmatrix} 0 \\ 0 \\ 0 \\ 1 \end{pmatrix}, \;\; v_2(m) = \sqrt{2m} \begin{pmatrix} 0 \\ 0 \\ 1 \\ 0 \end{pmatrix}, \end{split}\]

En la imagen Feynman-Stückelberg en las que las antipartículas son partículas hacia atrás en el tiempo, la inversión temporal, implica también la inversión del momento angular.

Así la tercera componente del espín del espinor \(v_s(p)\) es:

\[ \text{S}_3 \, v_s(m) = - \frac{1}{2} \, \Sigma_3 \, v_s(m) \]

Luego, \(v_1(m)\) tiene tercera componente de espín \(+1/2\) y \(v_2(m)\), \(-1/2\).

\[ \text{S}_3 \, v_1(m) = \frac{1}{2} \, v_1(m), \;\;\; \text{S}_3 \, v_2(m) = - \frac{1}{2} \, v_2(m), \]

El espinor de un anti-fermión que se mueve en la dirección \(z, (\hat{\bf v} = \hat{k})\), es:

\[\begin{split} v_s(p) = \sqrt{E+m} \begin{pmatrix} \kappa \, \sigma_3 \, \xi_s \\ \xi_s \end{pmatrix}; \end{split}\]

Que podemos explicitar:

\[\begin{split} v_1(p) = \sqrt{E+m} \begin{pmatrix} 0 \\ -\kappa \\ 0 \\ 1 \end{pmatrix}, \;\; v_2(p) = \sqrt{E+m} \begin{pmatrix} \kappa \\ 0 \\ 0 \\ 1 \end{pmatrix}, \end{split}\]

En la interpretación Feynman-Stückelberg, la inversión temporal no afecta al operador helicidad, porque se produce un cambio de signo en el momento angular y el momento que se cancelan:

\[ h \, v_s(p) = \frac{1}{2} ((-{\bf \Sigma}) \cdot (- \hat{\bf v})) \, v_s(p) = \frac{1}{2} ({\bf \Sigma} \cdot \hat{\bf v}) \, v_s(p) \]

Luego en este caso \(v_+(p) = v_1(p)\) y \(v_-(p) = v_2(p)\)

Así pues, las cuatro soluciones generales de la ecuación de Dirac son:

\[\begin{split} \Psi_s(x) = \sqrt{E+m} \begin{pmatrix} \chi_s \\ \kappa \, (\hat{\bf v} \cdot \vec{\sigma}) \chi_s \end{pmatrix} \, e^{-i \, px}; \\ \Phi_s(x) = \sqrt{E+m} \begin{pmatrix} \kappa \, (\hat{\bf v} \cdot \vec{\sigma}) \, \xi_s \\ \xi_s \end{pmatrix} \, e^{+i \, px}, \end{split}\]

donde \(s = 1, 2\).

Soluciones autoestados de helicidad#

El operador helicidad corresponde por definición a la componente del espín en la dirección del movimiento, \(\hat{\bf v}\). De ahí que en el caso de una partícula moviéndose en \(z\), la componente \(z\) del espín y la helicidad coincidan.

Nos podemos preguntar ahora cuáles son las soluciones de la ec. de Dirac que son a su vez autoestados de helicidad, esto es que tienen su espín alineado con el momento.

Los autovalores de helicidad, como los de tercera componete de spín, son \(\pm 1/2\).

\[ h \, u_s(p) = \pm \frac{1}{2} u_s(p) \]

Lo que se traduce:

\[\begin{split} \frac{1}{2} \begin{pmatrix} (\vec{\sigma} \cdot \hat{\bf v}) & 0 \\ 0 & (\vec{\sigma} \cdot \hat{\bf v}) \end{pmatrix} \, \begin{pmatrix} \chi_r \\ \kappa (\vec{\sigma} \cdot \hat{\bf v}) \chi_r \end{pmatrix} = \pm \frac{1}{2} \, \begin{pmatrix} \chi_r \\ \kappa (\vec{\sigma} \cdot \hat{\bf v}) \chi_r\end{pmatrix} \end{split}\]

Que se traduce en dos ecuaciones, pero la segunda es una identidad si se cumple la primera:

\[\begin{split} (\sigma \cdot \hat{\bf v}) \, \chi_r(\hat{\bf v}) = \pm \, \chi_r(\hat{\bf v}) \\ \kappa \, (\sigma \cdot \hat{\bf v}) \left[ (\sigma \cdot \hat{\bf v}) \, \chi_r(\hat{\bf v}) \right]= \pm \kappa \, (\sigma \cdot \hat{\bf v}) \, \chi_r(\hat{\bf v}) \end{split}\]

Vamos a encontrar pues el bi-espinor, \(\chi_r(\hat{\bf v})\), que cumple

\[ (\sigma \cdot \hat{\bf v}) \, \chi_r(\hat{\bf v}) = \pm \, \chi_r(\hat{\bf v}) \]

que vemos que depende ahora de \(\hat{\bf v}\).

Si escribimos explícitamente:

\[\begin{split} (\vec{\sigma} \cdot \hat{\bf v}) = \begin{pmatrix} v_z & v_x - i v_y \\ v_x+iv_y & -v_z \end{pmatrix} = \begin{pmatrix} \cos\theta & \sin\theta e^{-i\phi} \\ \sin\theta e^{i\phi} & -\cos\theta \end{pmatrix} \end{split}\]

La condición de las dos componentes \(a, b\) de \(\chi_r(\hat{\bf v})\) es:

\[\begin{split} \begin{pmatrix} \cos\theta & \sin\theta e^{-i\phi} \\ \sin\theta e^{i\phi} & -\cos\theta \end{pmatrix} \begin{pmatrix} a \\ b \end{pmatrix} = \pm \begin{pmatrix} a \\ b \end{pmatrix} \end{split}\]

Esto es, con \(\lambda = \pm 1\):

\[\begin{split} a \cos \theta + b \sin \theta e^{-i\phi} = \lambda \, a, \\ b \sin \theta e^{-i\phi} = (\lambda - \cos\theta) \, a \\ \end{split}\]

Por lo tanto, las componentes \(a, b\) cumplen:

\[ \frac{b}{a} = \frac{\lambda -\cos \theta}{\sin\theta} e^{i\phi} \]

Para el caso de helicidad positiva \(\lambda = +1\), obtenemos:

\[ \frac{b}{a} = \frac{\lambda -\cos \theta}{\sin\theta} e^{i\phi} = e^{i\phi} \tan \frac{\theta}{2} \]

Resolviendo también para \(\lambda = -1\), imponiendo que tienen norma unidad, y haciendo uso que sin pérdida de generalidad podemos tomar la componente de arriba, \(a\), como real, los bi-espinores quedan:

\[\begin{split} \chi_+(\hat{\bf v}) = \begin{pmatrix} \cos \frac{\theta}{2} \\ e^{i\phi}\sin \frac{\theta}{2}\end{pmatrix}, \;\;\; \chi_-(\hat{\bf v}) = \begin{pmatrix} -\sin \frac{\theta}{2} \\ e^{i\phi}\cos \frac{\theta}{2}\end{pmatrix}, \;\;\; \end{split}\]

Notar que el bi-espinor definido antes, \(\chi_s\), es simplemente \(\chi_r(\hat{k})\), que corresponde a seleccionar como dirección \(\hat{\bf v} = \hat{k}\).

De forma similar, los bi-espinores de los anti-fermiones que son autoestados de helicidad quedan:

\[\begin{split} \xi_+(\hat{\bf v}) = \begin{pmatrix} -\sin \frac{\theta}{2} \\ e^{i\phi}\cos \frac{\theta}{2}\end{pmatrix}, \;\;\; \xi_-(\hat{\bf v}) = \begin{pmatrix} \cos \frac{\theta}{2} \\ e^{i\phi}\sin \frac{\theta}{2}\end{pmatrix}, \;\;\; \end{split}\]

Así pues, los espinores autoestados de helicidad que son soluciones de la ec. de Dirac son entonces:

\[\begin{split} u_r(p) = \begin{pmatrix} \chi_r(\hat{\bf v}) \\ \lambda_r \kappa \, \chi_r(\hat{\bf v}) \end{pmatrix}, \;\;\; v_r(p) = \begin{pmatrix} -\lambda_r \kappa \, \xi_r(\hat{\bf v}) \\ \xi_r(\hat{\bf v}) \end{pmatrix}, \;\;\; \end{split}\]

donde \(r = \pm, \, \lambda_\pm = \pm\).

Si reescribimos explícitamente los espinores de helicidad en la dirección \(z\), (\(\theta = \phi = 0\)), volvemos a obtener:

\[\begin{split} u_{+}(p) = N \begin{pmatrix} 1 \\ 0 \\ \kappa \\ 0 \end{pmatrix}, \; u_{-}(p) = N \begin{pmatrix} 0 \\ 1 \\ 0 \\ -\kappa \end{pmatrix}, \; v_{+}(p) = N \begin{pmatrix} 0 \\ -\kappa \\ 0 \\ 1 \end{pmatrix}, \; v_{-}(p) = N \begin{pmatrix} \kappa \\ 0 \\ 1 \\ 0 \end{pmatrix}. \end{split}\]

con el factor de normalización \(N = \sqrt{E+m}\)

Los espinores de quiralidad se suelen representar de forma gráfica con la siguientes figuras:

../_images/dirac_spinors_helicities.png

spín (flecha azul) y momento (negra) de los spinores de helicidad

\(u_\pm(p), v_\pm(p)\) son los espinores de las partículas y antipartículas respectivamente.

\(u_{+}(p), v_{+}(p)\) son espinores de helicidad positiva (el espín tiene el mismo sentido que el momento).

\(u_{-}(p), v_{-}(p)\) tienen helicidad negativa (el spín y momento tienen sentido opuesto).

Nota: Podemos reinterpretar el espinor \(u_+(p)\) como aquel que se obtiene de rotar un espinor inicialmente en \(u_1(p)\), con su espín alineado en la dirección hacia arriba en \(z\), hasta situar su espín alineado con \(\hat{\bf v}\), con la dirección y sentido del momento, \({\bf p}\).

En la sección sobre transformaciones Lorentz, trataremos de nuevo la rotación del espinor.

Espinores y transformaciones de Lorentz#

Recordatorio de las transformaciones de Lorentz#

Recordemos que las transformaciones de Lorentz son aquellas que conservan el producto escalar de los cuadri-vectores usando la métrica de Minkowski, y que se representan con matrices que denotamos como \(\Lambda\).

La transformación de un caudri-vector, \(x^\mu\), o de un cuadri-momento, \(p^\mu\), viene dada por:

\[\begin{split} x' = \Lambda \, x, \;\;\; x'^\mu = \Lambda^{\mu}_{\;\;\nu} \, x^\nu \\ p' = \Lambda \, p, \;\;\; p'^{\mu} = \Lambda^{\mu}_{\;\;\nu} \, p^{\nu} \end{split}\]

donde los índices \(\mu, \nu\) hacen referencia a las columnas y filas respectivamente de la matriz \(\Lambda\).

La conservación del producto escalar implica:

\[\begin{split} x' \cdot y' = x \cdot y, \\ (\Lambda^{\rho}_{\;\;\mu} \, x^\mu) \, g_{\rho\sigma} \, (\Lambda^{\sigma}_{\;\;\nu} \, y^\nu) = g_{\mu\nu} \, x^\mu y^\nu \end{split}\]

Esto es:

\[ g_{\rho\sigma} \Lambda^{\rho}_{\;\;\mu} \Lambda^{\sigma}_{\;\;\nu} = g_{\mu\nu} \]

O en forma matricial:

\[ \Lambda^{T} g \Lambda = g \]

Además existe la transformación inversa \(\Lambda^{-1}\)

\[ \Lambda \, \Lambda^{-1} = I, \;\; \Lambda^{\nu}_{\;\;\rho} (\Lambda^{-1})^{\rho}_{\;\; \mu} = \delta^{\nu}_{\;\;\mu} \]

Sabemos que las transformaciones propias de Lorentz corresponden a las rotaciones en el espacio y los boost.

Transformaciones activas y pasivas.#

Existen dos formas complementarias de tratar las transformaciones, de forma activa o pasiva.

Las transformaciones son pasivas cuando cambian el sistema de referencia dejando fijo el espacio físico. Mientras que las transformaciones activas son aquellas que cambian el espacio físico y mantienen el sistema de coordenadas.

Si hacemos una rotación activa un punto \({\bf x}\) se traslada a otro punto \({\bf x}'\), pero los dos los damos en el mismo sistema de coordenadas, \(\{{\bf e}_i\}\). Mientras que cuando hacemos una rotación pasiva, rotamos los ejes de coordenadas y expresamos un mismo punto \(x\) en el sistema inicial \(\{{\bf e}_i\}\) o rotado \(\{{\bf e}'_i\}\). En las transformaciones activas pensamos en que un punto se traslada en otro y no en un cambio de coordenadas.

Asi la rotación activa de un ángulo \(\theta\) alrededor de \(z\) en sentido anti-horario trasladaría el punto \((1, 0, 0) \to (\cos \theta, \sin \theta, 0)\). Mientras que una rotación pasiva expresaríamos el mismo punto como \((1, 0, 0)\) en el sistema original y \((\cos \theta, -\sin \theta, 0)\) en el nuevo sistema de coordenadas girado respecto al primero un ángulo \(\theta\) respecto al eje inicial \(z\) también en sentido anti-horario.

Es más natural introducir las transformaciones de Lorentz desde un punto de vista pasivo, como cambio de coordenadas, pero resulta más conveniente tomar un punto de vista activo cuando se trabaja con conceptos más abstractos como campos.

En la literatura aparecen las transformaciones activas y pasivas y a veces no se indica de cuál se trata. Es importante saber siempre con qué tipo de transformación se está trabajando. Nosotros, en este apéndice, usaremos siempre transformaciones activas.

La matriz acodiada a una rotación activa de \(\theta\) alrededor del eje \(z\) (en sentido antihorario) y un boost activo en z con velocidad \(\beta\) son respectivamente:

\[\begin{split} \Lambda(\theta) = \begin{pmatrix} 1 & 0 & 0 & 0 \\ 0 & \cos\theta & -\sin\theta & 0 \\ 0 & \sin\theta & \cos\theta & 0 \\ 1 & 0 & 0 & 1 \end{pmatrix} \;\;\; \Lambda(\beta) = \begin{pmatrix} \gamma & 0 & 0 & \gamma \beta \\ 0 & 1 & 0 & 0 \\ 0 & 0 & 1 & 0 \\ \gamma \beta & 0 & 0 & \gamma \end{pmatrix} \end{split}\]

En un boost activo convertimos una partícula en reposo, con cuadri-momento \(p = (m, {\bf 0})\), en una partícula en movimiento con velocidad \(\beta\) en dirección \(\hat{{\bf v}}\) cuyo cuadrimomento es \(p' = (E, {\bf p}) = (\gamma m, \gamma \beta \hat{{\bf v}}\)).

El cambio de una transformación activa a pasiva -y viceversa- implica cambiar \(\theta \to - \theta\) y \(\beta \to -\beta\) en las matrices de sus representaciones.

Ejercicio: Comprueba \(\Lambda^T g \Lambda = g, \;\; \Lambda^{-1} \Lambda = I\) con las representaciones de \(\Lambda(\theta)\) y \(\Lambda(\beta)\)

Generadores en el espacio-tiempo#

Las transformaciones de Lorentz se pueden construir a partir de la sucesión de transformaciones infinitesimales.

La rotación de un angulo infinitesimal \(\theta\) a lo largo del eje \(z\) viene dada por:

\[\begin{split} \Lambda(\theta) = \begin{pmatrix} 1 & 0 & 0 & 0 \\ 0 & 1 & -\theta & 0 \\ 0 & \theta & 1 & 0 \\ 0 & 0 & 0 & 1 \end{pmatrix} = \begin{pmatrix} 1 & 0 & 0 & 0 \\ 0 & 1 & 0 & 0 \\ 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 1 \end{pmatrix} + \theta \begin{pmatrix} 0 & 0 & 0 & 0 \\ 0 & 0 & -1 & 0 \\ 0 & 1 & 0 & 0 \\ 0 & 0 & 0 & 0 \end{pmatrix} \end{split}\]

Podemos dar la rotación anterior como:

\[ \Lambda(\theta) = e^{-i\theta J_3} \simeq I -i \theta J_{3}, \]

donde:

\[\begin{split} \;\; J_{3} \equiv i \begin{pmatrix} 0 & 0 & 0 & 0 \\ 0 & 0 & -1 & 0 \\ 0 & 1 & 0 & 0 \\ 0 & 0 & 0 & 0 \end{pmatrix} \end{split}\]

A \(J_3\) lo llamamos el generador de las rotaciones en torno al eje \(z\).

Nota: El factor -i que aparece en el exponente, \(e^{-i\theta J_3}\), es una convención. Sirve para facilitar los cálculos, nos recuerda expresiones conocidas de mecánica cuántica, y nos permite dar el momento angular y el espín como generadores de las rotaciones.

Podemos dar la rotación de un ángulo \(\theta\) en torno a \(z\) como una sucessión de rotaciones infinitesimales. La matriz que representa la rotación, \(\Lambda(\theta)\), la podemos dar como el producto de las matrices de rotaciones infinitesimales.

\[ \Lambda(\theta) = e^{-i \theta J_3} \equiv \sum_{k=0} \frac{(-i \theta)^k}{k!} (J_3)^k \]

Dado que:

\[ \Lambda(\theta) = \Lambda\left(\sum_N \frac{\theta}{N}\right) = \prod_{N} \Lambda\left(\frac{\theta}{N}\right) = \lim_{N \to \infty} \left(I + \frac{\theta}{N}J_3 \right)^N \]

Si separamos la serie en términos pares e impares:

\[\begin{split} I + \sum_{k=1} (-1)^{k} \frac{\theta^{2k}}{2k!} (J_3)^{2k} - i \sum_{k=1} (-1)^{k+1} \frac{\theta^{2k+1}}{(2k+1)!} (J_3)^{2k+1} = \\ \end{split}\]

y haciendo uso de:

\[\begin{split} (J_3)^{2k} = \begin{pmatrix} 0 & 0 & 0 & 0 \\ 0 & 1 & 0 & 0 \\ 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 0 \end{pmatrix} \equiv I_{12}, \;\; (J_3)^{2k+1} = J_3, \end{split}\]

Obtenemos:

\[ I + \cos \theta \, I_{12} - i \sin \theta \, J_3, \]

Y de forma explícita:

\[\begin{split} \Lambda(\theta) = \begin{pmatrix} 1 & 0 & 0 & 0 \\ 0 & \cos\theta & -\sin\theta & 0 \\ 0 & \sin\theta & \cos\theta & 0 \\ 0 & 0 & 0 & 1 \end{pmatrix}, \end{split}\]

Vamos a determinar ahora la matriz asociada a un boost, \(\Lambda(\eta)\).

Definimos primero el parámetro \(\eta\), llamado rapidez, como \(\beta = \tanh \eta\), lo que implica:

\[ \gamma = \cosh \eta, \;\; \beta = \tanh \eta, \;\; \gamma \beta = \sinh \eta. \]

Notar que el rango de \(\beta\), que es \((-1, 1)\), se traslada en \(\eta\) en \((-\infty, \infty)\).

La transformación de Lorentz de un boots en \(z\) con velocidad \(\beta\) o rapidez \(\eta\) queda:

\[\begin{split} \Lambda(\eta) = \begin{pmatrix} \cosh \eta & 0 & 0 & \sinh \eta \\ 0 & 1 & 0 & 0 \\ 0 & 0 & 1 & 0 \\ \sinh \eta & 0 & 0 & \cosh \eta \end{pmatrix} \end{split}\]

que podemos dar como sucesivos boost infinitesimales en la dirección \(z\)

\[\begin{split} \Lambda(\eta) = e^{-i \eta K_3}, \;\; K_3 = i \begin{pmatrix} 0 & 0 & 0 & 1 \\ 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 \\ 1 & 0 & 0 & 0 \end{pmatrix} \end{split}\]

donde \(K_3\) es el generador de los boost en \(z\).

A partir de:

\[ \Lambda(\eta) = e^{-i\eta K_3} \equiv \sum_{k} \frac{(-i\eta)^k}{k!} \, (K_3)^k \]

separando en términos pares e impares:

\[\begin{split} I + \sum_{k=1} (-1)^{k} \frac{\eta^{2k}}{2k!} (K_3)^{2k} - i \sum_{k=1} (-1)^{k+1} \frac{\eta^{2k+1}}{(2k+1)!} (K_3)^{2k+1} = \\ \end{split}\]

y dado que:

\[\begin{split} (K_3)^{2k} = (-1)^k \begin{pmatrix} 1 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 1 \end{pmatrix} \equiv (-1)^k I_{03}, \;\; (K_3)^{2k+1} = (-1)^{k+1} K_3 \end{split}\]

obtenemos

\[\begin{split} \Lambda(\eta) = I + \sum_{k=1} \frac{\eta^{2k}}{(2k)!} \, I_{03} - i \sum_{k=1} \frac{\eta^{2k+1}}{(2k+1)!} \, K_3 = \\ \cosh \frac{\eta}{2} - i \sinh \frac{\eta}{2} K_3 \end{split}\]

de forma explícita:

\[\begin{split} \Lambda(\eta) = \begin{pmatrix} \cosh \eta & 0 & 0 & \sinh \eta \\ 0 & 1 & 0 & 0 \\ 0 & 0 & 1 & 0 \\ \sinh \eta & 0 & 0 & \cosh \eta \end{pmatrix} \end{split}\]

Así pues, las transformaciones de Lorentz quedan definidas de forma genérica con un ángulo de rotación \(\theta\) alrededor de un eje \(\hat{{\bf n}}\) en sentido antihorario, y un boost de rapidez \(\eta\) en la dirección \(\hat{\bf v}\); y con sus correspondientes «vectores» de generadores \({\bf J}, {\bf K}\).

\[ \Lambda(\theta \, \hat{{\bf n}}+ \eta \, \hat{{\bf v}}) = e^{-i (\theta {\hat{\bf n}} \, {\bf J} + {\eta \hat{\bf v} \, {\bf K}})} \]

Las expresiones de los generadores son:

\[\begin{split} J_1 = i\begin{pmatrix} 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & -1 \\ 0 & 0 & 1 & 0 \end{pmatrix}, \;\; J_2 = i\begin{pmatrix} 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 1 \\ 0 & 0 & 0 & 0 \\ 0 & -1 & 0 & 0 \end{pmatrix}, \;\; J_3 = i\begin{pmatrix} 0 & 0 & 0 & 0 \\ 0 & 0 & -1 & 0 \\ 0 & 1 & 0 & 0 \\ 0 & 0 & 0 & 0 \end{pmatrix}, \\ K_1 = i\begin{pmatrix} 0 & 1 & 0 & 0 \\ 1 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 \end{pmatrix}, \;\; K_2 = i\begin{pmatrix} 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 0 \\ 1 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 \end{pmatrix}, \;\; K_3 = i\begin{pmatrix} 0 & 0 & 0 & 1 \\ 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 \\ 1 & 0 & 0 & 0 \end{pmatrix}. \end{split}\]

Ejercicio: Comprueba que:

\[ [J_i, J_j] = i\epsilon_{ijk} J_k, \; [K_i, K_j] = -i\epsilon_{ijk} J_k, \; [J_i, K_j] = i\epsilon_{ijk} K_k \]

Inversión de Paridad#

La inversión de paridad invierte la coordenadas especiales, \({\bf x } \to -{\bf x}\). Es una transformación de Lorentz porque preserva el producto escalar de cuadrivectores, pero es una transformación que llamamos impropia.

La matriz de la representación, \(\Lambda(P)\) debe invertir las coordenadas espaciales, esto es:

\[ x'^\mu = \Lambda^{\mu}_{\;\;\nu}(P) \, x^\nu \]

luego:

\[\begin{split} \Lambda(P) = \begin{pmatrix} 1 & 0 & 0 & 0 \\ 0 & -1 & 0 & 0 \\ 0 & 0 & -1 & 0 \\ 0 & 0 & 0 & -1 \end{pmatrix} \end{split}\]

Llamamos transformación impropia a aquellas cuyo

\[ \det(\Lambda) = -1 \]

como es el caso de la inversión por paridad.

Genéricamente el grupo de Lorentz son las matrices ortogonales que preservan la métrica de Minkowski, \(g_{\mu\nu}\), o en otras palabras, preservan el producto escalar de dos cuadrivectores, esto es, la matrices cumplen:

\[ \Lambda^T g \Lambda = g \]

El grupo de Lorentz se denota como \(O(1,3)\).

De la condición anterior se sigue:

\[ \det(\Lambda) = \pm 1 \]

Las matrices con \(\det(\Lambda) = +1\) forman un subgrupo, llamado \(SO(1, 3)\), el de transformaciones propias. Este subgrupo incluye las rotaciones y los boosts.

Las transformaciones con \(\det(\Lambda) = -1\) se llaman impropias, pero no forman un subgrupo porque no contienen el elemento identidad \(I\). La transformación de la inversión de paridad es impropia.

Transformacion activa de los campos#

Recordemos que si hacemos una transformación activa, esto es transformamos los campos manteniendo las coordenadas, un campo escalar, \(\phi(x)\), y otro vectorial, \(A^\mu(x)\), transforman de la siguiente manera:

\[\begin{split} \phi'(x) = \phi(\Lambda^{-1} x)\\ A'^\mu(x) = \Lambda^{\mu}_{\;\; \nu} \, A^{\nu} (\Lambda^{-1} x) \end{split}\]

Por ejemplo, el campo escalar transformado \(\phi'(x)\) vale en un punto \(x\) lo que vale el campo en el punto de origen antes de la transformación, \(\phi(\Lambda^{-1} x)\).

[ADD] Dibujo de la transformación activa de un campo escalar y vectorial

La cuestión ahora es ¿Cómo transforma el nuevo objeto, el espinor, que introduce la ec. de Dirac? ¿Cómo se transforma un campo espinorial, \(\Psi(x)\), frente a transformaciones Lorentz?

Como \(\Psi(x)\) tiene cuatro componentes complejas, la representación de la transformación de Lorentz en el espacio espinorial será una matriz compleja \(4\times4\) que dependera de \(\Lambda\), que denotamos \(S(\Lambda)\) y que transformará linealmente el campo:

\[ \Psi'(x) = S(\Lambda) \, \Psi( \Lambda^{-1}x) \]

De esta forma, la transformación que corresponde a dos transformaciones consecutivas \(\Lambda = \Lambda_2 \Lambda_1\) cumple:

\[ \Psi'(x) = S(\Lambda) \, \Psi( \Lambda^{-1} x) = S(\Lambda_2) S(\Lambda_1) \, \Psi(\Lambda_1^{-1} \Lambda_2^{-1} x) \]

Esto significa que las matrices \(S(\Lambda)\) forman una representación del grupo de Lorentz:

\[\begin{split} \Lambda \to S(\Lambda), \\ \Lambda =\Lambda_2 \,\Lambda_1 \to S(\Lambda) = S(\Lambda_2) \, S(\Lambda_1) \end{split}\]

A cada transformación de Lorentz le corresponde una matriz en el espacio espinorial que la representa, y la matriz que representa la sucesión de las dos transformaciones es el producto de las matrices de cada transformación por separado.

A partir de ahora no explicitaremos la dependencia de \(S\) con \(\Lambda\) por simplicidad.

Condiciones de las matrices \(S(\Lambda)\)#

Para establecer la condiciones de las matrices \(S\), utilizamos que la ec. de Dirac debe ser válida para los campos transformados.

Esto es:

\[ (i\gamma^\mu \partial_\mu - m) \, S \, \Psi(\Lambda^{-1} x) = 0 \]

Si definimos \(y = \Lambda^{-1} x, \; y^\mu = (\Lambda^{-1})^\mu_{\;\; \nu} x^{\nu}\), el término:

\[ \partial_\mu (S \Psi(y)) = S \frac{\partial \Psi(y)}{\partial x^\mu} = S \frac{\partial \Psi(y)}{\partial y^\nu} \frac{\partial y^\nu}{\partial x^\mu} = S \, \frac{\partial \Psi(y)}{\partial y^\nu} \, (\Lambda^{-1})^\nu_{\;\; \mu} \]

La ecuación de Dirac queda:

\[ i \gamma^\mu S (\Lambda^{-1})^\nu_{\;\;\mu} \frac{\partial \Psi(y)} {\partial y^\nu} - m S \Psi(y) = 0 \]

Si multiplicamos por \(S^{-1}\) por la izquierda.

\[ i S^{-1} \gamma^\mu S \; (\Lambda^{-1})^\nu_{\;\;\mu} \frac{\partial \Psi(y)}{\partial y^\nu} - m \Psi(y) = 0 \]

Si imponemos que \(\Psi(y)\) cumple la ecuación de Dirac en coordenadas \(y\), esto es:

\[ i \gamma^\nu \frac{\partial \Psi(y)}{\partial y^\nu} - m \Psi(y) = 0 \]

se cumple:

\[ S^{-1} \gamma^\mu S \; (\Lambda^{-1})^\nu_{\;\;\mu} = \gamma^\nu \]

Si multiplicamos por la derecha por \(\Lambda\), esto es por \(\Lambda^{\rho}_{\;\; \nu}\):

\[\begin{split} S^{-1} \gamma^\mu S \; (\Lambda^{-1})^\nu_{\;\;\mu} \Lambda^{\rho}_{\;\; \nu} = \gamma^\nu \, \Lambda^{\rho}_{\;\; \nu} \\ S^{-1} \gamma^\mu S \, \delta^\rho_{\;\;\mu} = \Lambda^{\rho}_{\;\; \nu} \, \gamma^\nu \\ \end{split}\]

Notar que los valores de \(\Lambda^{\rho}_{\;\;\nu}\) son coeficientes que multiplican a la matrices \(\gamma^\nu\), y así obtenemos finalmente:

\[ S^{-1} \gamma^\mu S = \Lambda^\mu_{\;\;\nu}\gamma^\nu \]

Esta ecuación nos dice las condiciones que deben cumplir las matrices \(S\) para ser la representación de las transformaciones de Lorentz \(\Lambda\).

Generadores de boost y rotaciones#

Vamos a determinar ahora los generadores de las transformaciones de Lorentz en el espacio de los espinores.

Podemos suponer que las matrices \(S\) se pueden generar a partir de sucesivas transformaciones infinitesimales. Cada una de ellas estará definida a partir de unos generadores asociados a las rotaciones o al boost, de forma similar a como sucede con el espacio espacio-temporal.

Consideremos un boost \(\eta\) infinitesimal en \(z\). La matriz de Lorentz asociada es:

\[ \Lambda(\eta) = I -i \eta K_3 \]

donde \(K_3\) es el generador del boost en \(z\) en el espacio espacio-temporal.

Y la representación de boost infinitesimal en el espacio de espinores será:

\[ S(\eta) = I -i \eta \, K^S_3 \]

donde \(K^S_3\) es el generador de los boost en el espacio de los espinores.

Las condiciones de las matrices \(S\) se traducen para esta caso en:

\[\begin{split} S^{-1} \gamma^0 S = \gamma^0 + \eta \, \gamma^3\\ S^{-1}\gamma^1 S = \gamma^1 \\ S^{-1}\gamma^2 S = \gamma^2 \\ S^{-1 }\gamma^3 S = \eta \, \gamma^0 + \gamma^3 \\ \end{split}\]

De la segunda y tercera condición deducimos que \(S\) y por lo tanto \(K^S_3\) conmutan con \(\gamma^1, \gamma^2\). Con lo que podemos proponer:

\[ K^S_3 = \alpha i \gamma^0 \gamma^3 \]

que conmuta con \(\gamma^2, \gamma^3\), y donde \(\alpha\) es una constante que vamos a determinar.

De la primera condición:

\[ (I - \eta \, \alpha \gamma^0\gamma^3) \gamma^0 (I + \eta \, \alpha \gamma^0 \gamma^3) = \gamma^0 + \gamma^3 \eta \]

Si en la parte de la izquierda de la ecuación trasladamos \(\gamma^0\) del centro a la izquierda, usando las propiedades de conmutación de las \(\gamma\), obtenemos:

\[ \gamma^0 \, (I + \eta \, \alpha \gamma^0\gamma^3)^2 = \gamma^0 + \gamma^3 \eta \]

Multiplicando por \(\gamma^0\) por la izquierda, desarrollando el cuadrado, y despreciando términos en \(\eta^2\) al tratarse de un boost infinitesimal:

\[ (I + \eta \, 2 \alpha \gamma^0\gamma^3) = I + \eta \gamma^0 \gamma^3 \]

De donde concluimos que:

\[ K^S_3 = \frac{1}{2} i \gamma^0 \gamma^3 \]

Consideremos ahora una rotación infinitesimal \(\theta\) a lo largo del eje \(z\).

La transformación infinitesimal en el espacio espacio-temporal viene dada por:

\[ \Lambda(\theta) = I -i \theta \, J_3 \]

Mientras que en el espacio de espinores:

\[ S(\theta) = I -i \theta \, J^S_3 \]

Las condiciones que deben cumplir son:

\[\begin{split} S^{-1} \gamma^0 S = \gamma^0 \\ S^{-1}\gamma^1 S = \gamma^1 - \theta \, \gamma^2 \\ S^{-1}\gamma^2 S = \theta \, \gamma^1 + \gamma^2 \\ S^{-1 }\gamma^3 S = \gamma^3 \\ \end{split}\]

Vemos que \(S\) , y por lo tanto \(J^S_3\) deben conmutar con \(\gamma^0, \, \gamma^3\), luego podemos suponer que:

\[ J^S_3 = \alpha i \gamma^1\gamma^2 \]

donde \(\alpha\) es de nuevo una constante.

De la segunda condición, obtenemos:

\[ (I - \theta \, \alpha \gamma^1 \gamma^2) \gamma^1 (I + \theta \, \alpha \gamma^1 \gamma^2) = \gamma^1 - \theta \, \gamma^2 \]

Transladando \(\gamma^1\) en la parte de la izquierda de la igualdad a la izquierda, y usando las reglas de conmutación de las matrices \(\gamma\):

\[ \gamma^1 \, (I + \theta \, \alpha \gamma^1 \gamma^2)^2 = \gamma^1 - \theta \, \gamma^2 \]

Multiplicando ambos lados por \(\gamma^1\) y recordando que \((\gamma^1)^2 = -I\)

\[ (I + 2 \theta \, \alpha \gamma^1 \gamma^2) = I + \theta \gamma^1\gamma^2 \]

Obtenemos que:

\[ J^S_3 = \frac{1}{2} i \gamma^1\gamma^2 \]

Los generadores, \(J_s, K_3\) en la representación de Pauli-Dirac.

\[\begin{split} K^S_3 = \frac{1}{2} i \gamma^0 \gamma^3 = \frac{1}{2} i \begin{pmatrix} I & 0 \\ 0 & - I \end{pmatrix} \begin{pmatrix} 0 & \sigma_3 \\ -\sigma_3 & 0 \end{pmatrix} = \frac{1}{2} i \begin{pmatrix} 0 & \sigma_3 \\ \sigma_3 & 0 \end{pmatrix} \end{split}\]
\[\begin{split} J^S_3 = \frac{1}{2} i \gamma^1\gamma^2 = \frac{1}{2} i \begin{pmatrix} 0 & \sigma_1 \\ -\sigma_1 & 0 \end{pmatrix} \begin{pmatrix} 0 & \sigma_2 \\ -\sigma_2 & 0 \end{pmatrix} = \frac{1}{2} \begin{pmatrix} \sigma_3 & 0 \\ 0 & \sigma_3 \end{pmatrix} = \frac{1}{2}\Sigma_3 \end{split}\]

De forma similar daríamos el resto de rotaciones y boost, obtenemos

\[ K^S_i = \frac{1}{2}i \gamma^0\gamma^i, \;\; J^S_k = \epsilon_{ijk} \, \frac{1}{2} i \gamma^i\gamma^k \]

donde \(i \lt j, \, i, j = 1, 2, 3\).

De tal forma que recuperamos los generadores en \(z\) y podemos dar además los de \(x, y\).

Vemos que el generador de las rotaciones en el espacio de los espinores es el espín

\[ {\bf S} = \frac{1}{2} {\bf \Sigma} \]

Representaciones espinoriales de boosts y rotaciones.#

Calculemos ahora la representación espinorial, \(S(\eta)\), de un boost \(\eta\) en \(z\)

Que obtendríamos de la sucesión de transformación infinitesimales, esto es:

\[\begin{split} S(\eta) = e^{-i \eta K^S_3} = e^{\frac{\eta}{2} \gamma^0\gamma^3} \equiv \sum_{k= 0}^\infty \frac{1}{k!} \left(\frac{\eta}{2} \right)^k \begin{pmatrix} 0 & \sigma_3 \\ \sigma_3 & 0 \end{pmatrix}^k \end{split}\]

Dado que

\[\begin{split} \begin{pmatrix} 0 & \sigma_3 \\ \sigma_3 & 0 \end{pmatrix}^2 = \begin{pmatrix} I & 0 \\ 0 & I \end{pmatrix} \end{split}\]

podemos separar los términos pares e impares de la sucesión:

\[\begin{split} S(\eta) = \sum_{k= 0}^\infty \left(\frac{\eta}{2}\right)^{2k} \frac{1}{2k!} \begin{pmatrix} I & 0 \\ 0 & I \end{pmatrix} + \sum_{k= 0}^\infty \left(\frac{\eta}{2}\right)^{2k+1} \frac{1}{(2k+1)!} \begin{pmatrix} 0 & \sigma_3 \\ \sigma_3 & 0 \end{pmatrix} \end{split}\]

Y podemos expresar \(S(\eta)\) como:

\[\begin{split} S(\eta) = \cosh \frac{\eta}{2} \begin{pmatrix} I & 0 \\ 0 & I \end{pmatrix} + \sinh \frac{\eta}{2} \begin{pmatrix} 0 & \sigma_3 \\ \sigma_3 & 0 \end{pmatrix} = \\ \cosh \frac{\eta}{2} \, I + \gamma^0\gamma^3 \, \sinh \frac{\eta}{2} \end{split}\]

O simplemente:

\[\begin{split} S(\eta) = \begin{pmatrix} \cosh \frac{\eta}{2} I & \sinh \frac{\eta}{2} \sigma_3 \\ \sinh \frac{\eta}{2} \sigma_3 & \cosh \frac{\eta}{2} I \end{pmatrix} \end{split}\]

Que podemos reescribir en una expresión más conocida, si usamos las relaciones trigonométricas hyperbólicas:

\[ \cosh \frac{\eta}{2} = \sqrt{\frac{\cosh \eta + 1}{2}} = \sqrt{\frac{\gamma+1}{2}}, \;\; \sinh \frac{\eta}{2} = \text{sign}(\eta) \, \sqrt{\frac{\cosh \eta-1}{2}} = \text{sign}(\eta) \, \sqrt{\frac{\gamma-1}{2}} \]

Si introducimos que \(E = \gamma m\), obtenemos las siguientes relaciones:

\[ \sqrt{\frac{\gamma+1}{2}} = \sqrt{\frac{E+m}{2m}}, \;\; \sqrt{\frac{\gamma-1}{\gamma+1}} = \sqrt{\frac{E-m}{E+m}} = \frac{\sqrt{E^2-m^2}}{E+m} = \frac{p}{E+m} = \kappa \]

Asi pues, la matriz \(S\), al hacer un boost en la dirección \(z\), queda:

\[\begin{split} S(\beta) = \sqrt{\frac{E+m}{2m}} \begin{pmatrix} I & \kappa \, \sigma_3 \\ \kappa \, \sigma_3 & I \end{pmatrix} \end{split}\]

Si aplicamos un boost sobre un espinor en reposo, \(u_s(m)\), el espinor que obtendríamos sería, \(u_s(p)\):

\[ u_s(p) = S(\beta) \, u_s(m), \]

Esto es:

\[\begin{split} u_s(p) = \sqrt{\frac{E+m}{2m}} \begin{pmatrix} I & \kappa \, \sigma_3 \\ \kappa \, \sigma_3 & I \end{pmatrix} \, \sqrt{2m} \begin{pmatrix} \chi_s \\ 0 \end{pmatrix} = \sqrt{E+m} \begin{pmatrix} \chi_s \\ \kappa \sigma_3 \chi_s \end{pmatrix} \end{split}\]

que es el espinor \(u_s(p)\) para un fermión en movimiento en la dirección \(z\), que hemos obtenido al resolver en la sección anterior la ecuación de Dirac.

Ejercicio: Comprobar que \(S(\eta)\) cumple las condiciones de las matrices \(S\)

Por similitud, las matrices \(S(\eta_i)\) que representan a los boosts en las tres posibles direcciones, \(\eta_i, \, i = 1, 2, 3\), son:

\[\begin{split} S(\eta_i) = e^{-i \eta_i K^S_i } = e^{\frac{\eta_i}{2} \gamma^0\gamma^i } = \begin{pmatrix} \cosh \frac{\eta_i}{2} I & \sinh \frac{\eta_i}{2} \sigma_i \\ \sinh \frac{\eta_i}{2} \sigma_i & \cosh \frac{\eta_i}{2} I \end{pmatrix} \end{split}\]

Y si hacemos un boost con rapidez \(\eta\) en la dirección \(\hat{{\bf v}}\):

\[\begin{split} S(\eta \, \hat{{\bf v}}) = \begin{pmatrix} \cosh \frac{\eta}{2} I & \sinh \frac{\eta}{2} \, (\vec{\sigma} \cdot \hat{{\bf v}}) \\ \sinh \frac{\eta}{2} \, ({\vec \sigma} \cdot \hat{{\bf v}}) & \cosh \frac{\eta}{2} I \end{pmatrix} = \\ \end{split}\]

Esto es:

\[\begin{split} S(\beta \hat{\bf v}) = \sqrt{\frac{E+m}{2m}} \begin{pmatrix} I & \kappa \, (\vec{\sigma} \cdot \hat{{\bf v}}) \\ \kappa \, (\vec{\sigma} \cdot \hat{\bf v}) & I \end{pmatrix} \end{split}\]

Determinemos ahora las matrices \(S(\theta)\) asociadas a una rotación \(\theta\) alrededor de \(z\):

\[ S(\theta) = e^{-i \theta S_3} = e^{-i \frac{\theta}{2} \Sigma_3} \]

En la representación Pauli-Dirac:

\[\begin{split} \begin{pmatrix} \sigma_3 & 0 \\ 0 & \sigma_3 \end{pmatrix} \end{split}\]

A partir de:

\[ S(\theta) = e^{-i \frac{\theta}{2} \Sigma_3} = \sum_{k=0} \frac{1}{k!} \left(-i \frac{\theta}{2} \right)^k (\Sigma_3)^k \]

separando en términos pares e impares

\[ \sum_{k=0} (-1)^k \frac{1}{2k!}\left(\frac{\theta}{2}\right)^{2k} I - i \sum_{k=0} (-1)^{k+1} \frac{1}{(2k+1)!} \left(\frac{\theta}{2}\right)^{2k+1} \Sigma_3 \]

usando:

\[ (\Sigma_k)^{2k} = I, \;\; (\Sigma_3)^{2k+1} = \Sigma_3 \]

obtenemos:

\[ \cos \frac{\theta}{2} \, I - i \sin \frac{\theta}{2} \, \Sigma_3 \]

Dado que también:

\[ e^{-i \frac{\theta}{2} \sigma_k} = \cos \frac{\theta}{2} I - i \sin \frac{\theta}{2} \sigma_k \]

Obtenemos:

\[\begin{split} S(\theta) = \begin{pmatrix} \cos \frac{\theta}{2} I - i \sin \frac{\theta}{2} \sigma_3 \\ 0 & \cos \frac{\theta}{2} I - i \sin \frac{\theta}{2} \sigma_3 \end{pmatrix} = \begin{pmatrix} e^{-i\frac{\theta}{2} \sigma_3} & 0 \\ 0 & e^{-i\frac{\theta}{2} \sigma_3} \end{pmatrix} \end{split}\]

Para el caso de las rotaciones de un ángulo \(\theta\) alrededor de un eje coordenado \(k\), las matrices son, con \(i <j, \, i,j = 1, 2, 3\):

\[\begin{split} S(\theta) = e^{-i \theta S_k} = e^{-i \frac{\theta}{2} \Sigma_k} = \\ \cos \frac{\theta}{2} \, I -i \sin \frac{\theta}{2} \, \Sigma_k \\ \end{split}\]

O también:

\[\begin{split} \begin{pmatrix} e^{-i\frac{\theta}{2} \sigma_k} & 0 \\ 0 & e^{-i\frac{\theta}{2} \sigma_k} \end{pmatrix} \end{split}\]

Para una rotación de un ángulo \(\theta\) alrededor de un eje dado por \(\hat{{\bf n}}\) en sentido anti-horario, la expresión de \(S\) es:

\[ S(\theta \, \hat{\bf n}) = e^{-i\frac{\theta}{2} \hat{\bf n} \, {\bf \Sigma}} = \cos \frac{\theta}{2} I - i \sin \frac{\theta}{2} (\hat{\bf n} \cdot {\bf \Sigma}) \]

O simplemente:

\[\begin{split} S(\theta \, \hat{\bf n}) = \begin{pmatrix} e^{-i\frac{\theta}{2} \, (\hat{{\bf n}} \cdot {\vec \sigma})} & 0 \\ 0 & e^{-i\frac{\theta}{2} \, (\hat{{\bf n}} \cdot {\vec \sigma})} \end{pmatrix} \end{split}\]

Vemos que para \(\theta = 2 \pi\) tenemos \(S(2\pi ) = -I\), y que hacen falta dos vueltas completas, \(\theta = 4 \pi\), para regresar a la identidad \(S(4\pi) = I\).

¡La rotación de un espinor es diferente a la de un vector!

También observamos que los dos bi-espinores del espinor de Dirac se transforman igual pero independientemente, sin afectar uno a otro.

La siguiente figura muestra un dibujo de Escher en el que una hormiga (el espín) tiene que realizar dos vueltas (\(4\pi\) para el espín) en la cinta de Moebius para regresar a su estado inicial. Si solo d una vuelta, queda invertida, igual que el espín bajo una rotación de \(2\pi\).

../_images/dirac_Escher_Moebius.jpg

Hormiga en una cita de Moebius por Escher

Recopilemos: de forma genérica podemos dar ahora la representación \(S\) de una rotación \(\theta\) alrededor de un eje \(\hat{{\bf n}}\) en sentido anti-horario y un boost de rapidez \(\eta\) en dirección \(\hat{{\bf v}}\) como:

\[ S(\theta \, \hat{{\bf n}}, \, \eta \hat{{\bf v}}) = e^{-i \theta \, \hat{{\bf n}} \cdot {\bf S} + \eta \, \hat{{\bf v}} \cdot {\bf K^S} } \]

Ejercicio: A partir de las expresiones de los generadores en la representación Pauli-Dirac comprueba las reglas de conmutación:

\[ [S_i, S_j] = i\epsilon_{ijk} S_k, \; [K^S_i, K^S_j] = -i\epsilon_{ijk} S_k, \; [S_i, K^S_j] = i\epsilon_{ijk} K^S_k \]

Ejercicio: Rota el espinor en reposo \(u_s(m)\) respecto al eje \(y\) por un ángulo \(\theta\), y verfica que se trata del espinor cuyo espín entá alineado en la dirección donde queda el vector \({\hat k}\) tras la rotación.

solución:

Sea el espinor en reposo \(u_1(m)\), que corresponde al espín en dirección hacia arriba en \(z\).

La matriz de rotación que lo rote un ángulo \(\theta\) alrededor del eje \(y\) es:

\[\begin{split} S(\theta) = \begin{pmatrix} \cos \frac{\theta}{2} - i \sigma_2 \sin \frac{\theta}{2} & 0 \\ 0 & \cos \frac{\theta}{2} -i \sigma_2 \sin \frac{\theta}{2} \end{pmatrix} \end{split}\]

Donde:

\[\begin{split} \cos \frac{\theta}{2} -i \sigma_2 \sin \frac{\theta}{2} = \begin{pmatrix} \cos \frac{\theta}{2} & -\sin \frac{\theta}{2} \\ \sin \frac{\theta}{2} & \cos \frac{\theta}{2} \end{pmatrix} \end{split}\]

La rotación de \(\chi_1\) es:

\[\begin{split} \begin{pmatrix} \cos \frac{\theta}{2} & -\sin \frac{\theta}{2} \\ \sin \frac{\theta}{2} & \cos \frac{\theta}{2} \end{pmatrix} \begin{pmatrix} 1 \\ 0 \end{pmatrix} = \begin{pmatrix} \cos \frac{\theta}{2} \\ \sin \frac{\theta}{2} \end{pmatrix} \end{split}\]

No unitariedad de los boosts#

Una último apunte importante: Las transformaciones por boost no son unitarias, pero sí las rotaciones.

Para que la transformación, \(S\), sea unitaria debe cumplir

\[ S^{-1} = S^\dagger, \;\; S^\dagger \, S = I \]

Nota: recordar que la unitariedad es una propiedad fundamental en mecánica cuántica, que nos asegura que un estado transformado mantiene la norma. Si una transformación \(U\) es unitaria cumple \(U^\dagger U = I\).

Véamoslo con la expresión infinitesimal, (aunque puede verse igualmente con la expresión explícita \(S(\eta)\)).

La transformación inversa es \(S^{-1}(\eta) = S(-\eta)\), que viene de exigir que al hacer la transformación inversa obtenemos la identidad, lo que para la representación se traduce

\[ S(\Lambda^{-1}) \, S(\Lambda) = I, \;\; S(\Lambda^{-1}) = S^{-1}(\Lambda) \]

Si hacemos el traspuesto conjungado de \(S(\eta)\) para un boost, \(\eta\), infinitesimal en \(z\). Notar que el factor \(-i\) que acompaña al ángulo infinitesimal y el factor \(i\) que aparece en el generador se cancelan.

\[\begin{split} S^\dagger(\eta) = I + \frac{\eta}{2} (\gamma^0 \gamma^1)^\dagger = I + \frac{\eta}{2} (\gamma^1)^\dagger (\gamma^0)^\dagger = \\ I + \frac{\eta}{2} (-\gamma^1)(\gamma^0) = I + \frac{1}{2} (\gamma^0\gamma^i) = S(\eta) \end{split}\]

Luego:

\[ S^{-1}(\eta) \neq S^\dagger(\eta) \]

Esto tendrá consecuencias relevantes cuando más tarde, cuando veamos que el término \(\Psi^\dagger(x) \Psi(x)\), no es un invariante Lorentz.

Sin embargo, para rotaciones:

\[ S^{-1}(\theta) = S(-\theta) = S^\dagger(\theta) \]

Veámoslo con una rotación \(\theta\) infinitesimal alrededor de \(z\),

\[\begin{split} S^\dagger(\theta) = I + \frac{\theta}{2} (\gamma^1\gamma^2)^\dagger = I + \frac{\theta}{2} (\gamma^2)^\dagger(\gamma^1)^\dagger = \\ I + \frac{\theta}{2} (-\gamma^2)(-\gamma^1) = I + \frac{\theta}{2} \gamma^2\gamma^1 \\ I - \frac{\theta}{2} \gamma^1 \gamma^2 = S(-\theta) = S^{-1}(\theta) \end{split}\]

Luego las rotaciones si son transformaciones unitarias en el espacio de los espinores.

Inversión por paridad#

La matriz que representa la inversión por paridad, \(S(P)\), debe cumplir (por las condiciones de las matrices \(S\), ver arriba):

\[\begin{split} S^{-1}\gamma^0 S = \gamma^0, \\ S^{-1}\gamma^1 S = -\gamma^1, \\ S^{-1}\gamma^2 S = -\gamma^2, \\ S^{-1}\gamma^3 S = -\gamma^3. \\ \end{split}\]

Esto es, si multiplicamos por \(S\) a ambos lados de la igualdad por la izquierda:

\[ \gamma^0 S = S \gamma^0, \;\; \gamma^i S = - S \gamma^{i} \]

La matriz que cumple esta condición es:

\[ S(P) = \gamma^{0} \]

La matriz \(S\) podría incluir una pase compleja, pero por convención se tomó como 1.

Si aplicamos paridad sobre los espinores nos encontramos:

\[\begin{split} u_s(E, {\bf p}) \to S(P) \, u_s(E, -{\bf p}) = + \, u_s(E, {\bf p}), \\ v_s(E, {\bf p}) \to S(P) \, v_s(E, -{\bf p}) = - \, v_s(E, {\bf p}), \;\; \end{split}\]

Los espinores son autoestados de paridad, los de los fermiones, \(u_s(p)\), tienen paridad positiva, mientras que los de los antifermiones \(v_s(p)\), negativa.

Ejercio Comprobar que la operación de paridad transforma los espinores \(u_+(p) \to u_-(p)\).

Inversión bajo Carga#

La operación de inversión de carga debe cambiar las soluciones de Dirac de fermiones a anti-fermiones, \(\Psi(x) \to \Phi(x)\).

Para cambiar la parte espacio-temporal, la operación debe incluir el complejo conjugado.

La operación de carga debe tener la expresión:

\[ \Psi(x) \to S(C) \, \Psi^*(x) \]

Donde \(S(C)\) es la matriz que representa la inversión de carga en el espacio espinorial.

Si exigimos que la ecuación de Dirac sea válida para \(S \, \Psi^*(x)\):

\[ (i \gamma^{\mu} S \partial_\mu - m) \,S \, \Psi^*(x) = 0 \]

Si multiplicamos por la izquierda por \(S^{-1}\) obtenemos:

\[ (i S^{-1} \gamma^{\mu} S \partial_\mu - m)\, \Psi^*(x) = 0 \]

Por otro lado, si tomamos el complejo conjugado de la ecuación de Dirac inicial:

\[ (-i (\gamma^\mu)^* \partial_\mu - m) \, \Psi^*(x) = 0 \]

Para que ambas sean iguales debe cumplirse que:

\[ S^{-1} \gamma^\mu S = - (\gamma^\mu)^* \]

En la representación de Pauli-Dirac, la única matriz \(\gamma^\mu\) que cambia al aplicar el complejo conjugado es \((\gamma^2)^* = - \gamma^2\), asi pues, las condiciones anteriores se traducen en:

\[\begin{split} S^{-1}\gamma^0 S = - \gamma^0, \\ S^{-1}\gamma^1 S = - \gamma^1, \\ S^{-1}\gamma^2 S = \gamma^2, \\ S^{-1}\gamma^3 S = - \gamma^3. \end{split}\]

Y la matriz que las cumple es:

\[ S(C) = i \gamma^2 \]

Donde el factor \(i\) es una convención, que permite que la matriz \(S\) sea real.

\[\begin{split} i \gamma^2 = i \begin{pmatrix} 0 & 0 & 0 & -i \\ 0 & 0 & i & 0 \\ 0 & i & 0 & 0 \\ -i & 0 & 0 & 0 \end{pmatrix} = \begin{pmatrix} 0 & 0 & 0 & 1 \\ 0 & 0 & -1 & 0 \\ 0 & -1 & 0 & 0 \\ 1 & 0 & 0 & 0 \end{pmatrix} \end{split}\]

Ejercicio: Verifica que la conjungación de carga cambia \(\Psi_i(x) \to \Phi_i(x)\). Usa los espinores autoestados de helicidad que se deplazan en la dirección \(z\)

Relación con la inversión de las cargas#

Para incluir la interacción del fermión con carga \(q\) con un campo electromagnético \(A_\mu\) modificamos de forma mínima la ecuación de Dirac:

\[ \left[\gamma^\mu (i\partial_\mu - q A_\mu) - m \right] \, \Psi(x) = 0 \]

Vamos a transformar las soluciones de fermiones en las de antifermiones y ver cómo queda la interacción con el campo \(A_\mu\).

Si tomamos el complejo conjugado y multiplicamos por \(i\gamma^2\) por la izquierda:

\[ i\gamma^2 \left[-i (\gamma^\mu)^* \partial_\mu - q (\gamma^\mu)^* A_\mu - m \right] \, \Psi^*(x) = 0 \]

Aplicando las reglas de conmutación de las matrices \(\gamma^2 \gamma^\mu\) y el hecho de que bajo el conjugado solo cambia \((\gamma^2)^* = - \gamma^2\), obtenemos:

\[\begin{split} \left[i \gamma^\mu \partial_\mu + q \gamma^\mu A_\mu -m \right] \, i \gamma^2 \Psi^*(x) = 0 \\ \left[\gamma^\mu (i\partial_\mu + q A_\mu) - m \right] \, i \gamma^2 \Psi^*(x) = 0 \end{split}\]

Luego al intercambiar las gammas en \(\gamma^2(\gamma^\mu)^*\), el factor que se acopla con \(A_\mu\), se produce un cambio de signo.

Esto es la solución \(\Phi(x) = i \gamma^2 \Psi^*(x)\) tiene carga opuesta: en la ecuación de Dirac ha cambiado \(-q \to q\).

\[ \left[i\gamma^\mu(i\partial_\mu + q A_\mu) -m \right] \Phi(x) = 0 \]

Espinor adjunto y formas bilineales#

En cuántica la densidad de probabilidad estaba asociada a \(\psi^*(x) \psi(x)\), sin embargo la expresión equivalente construida con los espinores de Dirac, \(\Psi^\dagger(x) \Psi(x)\), no es un escalar bajo transformaciones de Lorentz.

La ecuación de Dirac nos provee no obstante de una corriente de probabilidad conservada, válida en todos los sistemas inerciales. Esa corriente se transforma como un vector. Y para construirla necesitamos introducir el espinor adjunto:

\[ \bar{\Psi}(x) = \Psi^\dagger(x) \, \gamma^0 \]

Veremos que la presencia de \(\gamma^0\) hace que la forma \(\bar{\Psi}(x)\Psi(x)\) sea un escalar Lorentz, y \(\bar{\Psi}(x) \gamma^\mu \Psi(x)\) la corriente de probabilidad.

También estudiaremos otras formas bilineales (donde aparecen contraidos \(\bar{\Psi}(x)\) y \(\Psi(x)\), y cómo se comportan con respecto a las transformaciones de Lorentz, en especial con la inversión por paridad.

El espinor de Dirac adjunto#

El término

\[ \Psi^\dagger \Psi = |\psi_1|^2 + |\psi_2|^2 + |\psi_2|^2 + |\psi_4|^2 \]

está asociado a la densidad de probabilidad, es siempre una cantidad positiva.

Sin embargo no es un invariante Lorentz, debido a que las matrices que representan el boost en el espacio de los espinores no son unitarias.

Sabemos que:

\[ S^{-1}(\eta) = S(-\eta) \neq S(\eta)^\dagger \]

Por lo tanto la transformación por boost del término \(\Psi^\dagger(x) \Psi(x)\),

\[\begin{split} \Psi^\dagger(x) \Psi(x) \to \Psi'^\dagger(x) \Psi'(x) = \\ \Psi^\dagger(y) S^{\dagger}(\eta) S(\eta) \Psi(y) \neq \Psi^\dagger(y) \Psi(y) \end{split}\]

con \(y = \Lambda^{-1} x\), no es invariante Lorentz.

El término \(\Psi^\dagger(x)\Psi(x)\) será no obstante la densidad de probabilidad de la corriente (el elemento 0 de un cuadri-vector) de probabilidad.

Para definir la corriente de probabilidad introducimos el espinor adjunto:

\[ \bar{\Psi}(x) = \Psi^\dagger(x) \gamma^0 \]

En la representación de Pauli-Dirac:

\[ \bar{\Psi}(x) = (\psi^*_1(x), \psi^*_2(x), -\psi^*_3(x), -\psi^*_4(x)), \]

que tiene forma de vector fila.

La ecuación de Dirac para el espinor adjunto#

Vamos a determinar la ecuación de Dirac para el espinor adjunto.

para ello, aplicamos primero el transpuesto conjugado a la ec. de Dirac:

\[\begin{split} - i \partial_\mu \Psi^\dagger \, (\gamma^\mu)^\dagger - m \Psi^\dagger = 0 \\ \end{split}\]

si primero usamos \((\gamma^0)^\dagger = \gamma^0, \, (\gamma^k)^\dagger = - \gamma^k\), luego multiplicamos por \(\gamma^0\) por la derecha, y aplicando \(\gamma^k\gamma^0 = - \gamma^0\gamma^k\), obtenemos:

\[\begin{split} -i\partial_0 \Psi^\dagger \gamma^0 + i \partial_k \Psi^\dagger \gamma^k - m \Psi^\dagger = 0 \\ -i\partial_0 \Psi^\dagger \gamma^0 \gamma^0 + i \partial_k \Psi^\dagger \gamma^k \gamma^0 - m \Psi^\dagger \gamma^0 = 0 \\ -i\partial_0 \Psi^\dagger \gamma^0 \gamma^0 - i \partial_k \Psi^\dagger \gamma^0 \gamma^k - m \Psi^\dagger \gamma^0 = 0 \\ -i\partial_\mu \bar{\Psi} \gamma^\mu - m \bar{\Psi}= 0 \\ \end{split}\]

Finalmente:

\[ i\partial_\mu \bar{\Psi} \, \gamma^\mu + m \bar{\Psi}= 0 \]

que es la ecuación de Dirac para el espinor adjunto.

Norma#

El término \(\bar{\Psi}(x)\Psi(x)\) es un invariante Lorentz y está asociado a la masa de la partícula.

Hemos visto que para boosts, \(S(\eta)\) no es unitaria, pero que \(S(\theta)\), asociada a las rotaciones, sí lo es.

Pero podemos construir fácilmente \(S^{-1}(\eta)\):

\[\begin{split} S^{-1}(\eta) = \gamma^0 S^\dagger(\eta) \gamma^0 \neq S^{\dagger}(\eta) \\ S^{-1}(\theta) = \gamma^0 S^\dagger(\theta) \gamma^0 = S^\dagger(\theta) \end{split}\]

Podemos ahora comprobar que para cualquier transformación Lorentz, \(\bar{\Psi}(x) \Psi(x)\) es un escalar:

\[\begin{split} \bar{\Psi}(x) \Psi(x) \to \bar{\Psi}'(x) \Psi'(x) = \\ (S \, \Psi(y))^\dagger \gamma^0 (S \, \Psi(y)) = \Psi^\dagger(y) \, S^{\dagger} \gamma^ 0 S \, \Psi(y) = \Psi^\dagger(y) \gamma^0 (\gamma^0 S^{\dagger} \gamma^ 0) S \, \Psi(y) = \\ \Psi^\dagger(y) \gamma^0 (S^{-1} S) \Psi(y)) = \Psi^\dagger(y) \gamma^0 \Psi(y) = \bar{\Psi}(y) \Psi(y) \end{split}\]

donde \(y = \Lambda^{-1} x\).

Vamos a explicitar su valor, usando las soluciones de la ecuación de Dirac para los fermiones en la representación Pauli-Dirac.

\[\begin{split}\Psi_s(x) \Psi_s(x) = (E+m) \, \begin{pmatrix} \chi^\dagger_s, & \kappa \, \chi^\dagger _s(\hat{\bf v} \cdot \vec{\sigma})^\dagger \end{pmatrix} \, e^{+i \, px} \, \begin{pmatrix} I & 0 \\ 0 & - I \end{pmatrix} \, \begin{pmatrix} \chi_s \\ \kappa \, (\hat{\bf v} \cdot \vec{\sigma}) \chi_s \end{pmatrix} \, e^{-i \, px} = \\ (E+m) \, \begin{pmatrix} \chi^\dagger_s, & \kappa \, \chi^\dagger_s (\hat{\bf v} \cdot \vec{\sigma})^\dagger \end{pmatrix} \begin{pmatrix} \chi_s \\ - \kappa \, (\hat{\bf v} \cdot \vec{\sigma}) \chi_s \end{pmatrix} \end{split}\]

Como:

\[ (\hat{\bf v} \cdot \vec{\sigma})^\dagger \, (\hat{\bf v} \cdot \vec{\sigma}) = (\hat{\bf v} \cdot \vec{\sigma}) ^2 = |{\hat{\bf v}}|^2 I= I \]

Obtenemos

\[\begin{split} \bar{\Psi}(x) \, \Psi(x) = (E+m) \chi^\dagger_s \, \chi_s - \kappa^2 \chi^\dagger_s \, (\hat{\bf v} \cdot \vec{\sigma})^\dagger \, (\hat{\bf v} \cdot \vec{\sigma}) \, \chi_s = \\(E+m) \, (1 - \kappa^2) \end{split}\]

Si operamos

\[\begin{split} 1-\kappa^2 = 1 - \frac{\text{p}^2}{(E+m)^2} = 1 - \frac{(E^2-m^2)}{(E+m)^2} = \\ 1 - \frac{(E-m)(E+m)}{(E+m)^2} = 1 - \frac{E-m}{E+m} = \frac{2m}{E+m} \end{split}\]

Concluimos por lo tanto que:

\[ \bar{\Psi}(x) \, \Psi(x) = 2m \]

El factor \(2\) es una convención.

Densidad y corriente de probabilidad#

La corriente de probabilidad fermiónica es un cuadrivector dado por:

\[ \bar{\Psi} \gamma^\mu \Psi = (\rho, {\bf j}) \]

donde \(\rho\), es la densidad, y \({\bf j}\) será el corriente de probabilidad del spinor de Dirac.

Notar que los cuatro elementos de la corriente corresponden al valor de los índices de \(\mu\)

La densidad, nos ha aparecido antes:

\[ \rho = \bar{\Psi} \gamma^0 \Psi = \Psi^\dagger \Psi = \sum_{\mu = 0}^3 |\psi_i|^2 \]

Podemos ver primero que la corriente se conserva, esto es que cumple la ecuación de conservación:

\[ \frac{\partial \rho}{\partial t} + \nabla \cdot {\bf j} = 0. \]

O en forma covariante:

\[ \partial_\mu j^\mu = 0 \]

Podemos comprobar que es cierto:

\[ \partial_\mu \left(\bar{\Psi} \gamma^\mu \Psi\right) = (\partial_\mu \bar{\Psi}) \gamma^\mu \Psi + \bar{\Psi} \gamma^\mu \partial_\mu\Psi \]

De las ecuaciones de Dirac del espinor y el espinor adjunto, tenemos que:

\[ \partial_\mu \bar{\Psi} \gamma^\mu = -i m \bar{\Psi}, \;\;\; \gamma^\mu \partial_\mu \Psi = +i m \Psi \]

Si sustituimos:

\[ (\partial_\mu \bar{\Psi} \gamma^\mu) \Psi + \bar{\Psi} (\gamma^\mu \partial_\mu\Psi) = (-i m \bar{\Psi}) \Psi + \bar{\Psi} (i m \Psi) = 0. \]

Luego:

\[ \partial_\mu \left(\bar{\Psi} \gamma^\mu \Psi\right) = 0, \;\; \partial_\mu j^\mu = 0. \]

\(j^\mu\) es una corriente conservada.

Vamos a comprobar ahora que \(\bar{\psi}(x) \gamma^\mu \Psi(x)\) es un cuadri-vector y que se transforma como tal bajo transformaciones Lorentz.

Si aplicamos una transformación de Lorentz, con representación espinorial \(S\), la corriente transforma como:

\[ \bar{\Psi} \gamma^\mu \Psi \to \bar{\Psi}'(x) \gamma^\mu \Psi'(x) = \Psi(y)^\dagger S^\dagger \, \gamma^0 \gamma^\mu \, S \Psi(y) \]

con \(y = \Lambda^{-1} x\).

Que la corriente se transforme como un vector implica que:

\[ \bar{\Psi}'(x) \gamma^\mu \Psi'(x) = \Lambda^{\mu}_{\;\;\nu} \, \bar{\Psi}(y) \gamma^\nu \Psi(y) \]

Esto es:

\[\begin{split} \Psi^\dagger(y) \, S^\dagger \gamma^0 \gamma^\mu S \, \Psi(y) = \Lambda^{\mu}_{\;\;\nu} \, \Psi^\dagger(y) \gamma^0 \gamma^\nu \Psi(y) \\ \end{split}\]

O que se cumple:

\[ S^\dagger \gamma^0 \gamma^\mu \, S = \Lambda^{\mu}_{\;\;\nu} \gamma^0 \gamma^\nu \]

En la parte derecha de la ecuación, haciendo uso \(S^\dagger \gamma^0 = \gamma^0 S^{-1}\),

\[ \gamma^0 S^{-1} \gamma^\mu S \]

Y aplicando las condiciones de las matrices \(S\), esto es, \(S^{-1} \gamma^\mu S = \Lambda^\mu_{\;\;\nu}\gamma^\nu \)

nos queda:

\[ \Lambda^{\mu}_{\;\;\nu} \gamma^0 \gamma^\nu \]

Luego, efecticamente, \(\bar{\Psi}(x) \gamma^\mu \Psi(x)\) se comporta como vector con respecto a las transformaciones Lorentz.

Comportamiento bajo paridad#

Además de las formas anteriores vamos a introducir dos más que resultaran fundamentales al tratar las interacciones débiles:

Una cantidad que veremos es pseudo-escalar:

\[ \bar{\Psi}(x) \gamma^5 \Psi(x) \]

Y otra cantidad que es un vector axial:

\[ \bar{\Psi}(x) \gamma^\mu \gamma^5 \Psi(x) \]

A partir del hecho que:

\[ S^{-1} \gamma^5 S = \gamma^5, \;\; \gamma^5 S = S \gamma^5 \]

es sencillo comprobar que \(\bar{\Psi}(x) \gamma^5 \Psi(x)\) y \(\bar{\Psi}(x) \gamma^\mu \gamma^5 \Psi(x)\) se transforman frente a boosts y rotaciones como un escalar y un vector respectivamente.

Vamos a ver como se comportan con respecto a la inversión por paridad.

Recordemos que la representación espinorial de la inversión de paridad es simplemente, \(S(P) = \gamma^0\).

Apliquemos inversión de paridad a \(\bar{\Psi}(x) \Psi(x)\):

\[\begin{split} \bar{\Psi}(x) \Psi(x) \to (S \Psi(y))^\dagger \gamma^0 (S \Psi(x)) = \\ \Psi^\dagger(y) (\gamma^0)^\dagger \gamma^0 \gamma^0 \Psi(y) = \Psi^\dagger(y) \gamma^0 \Psi(y) = \bar{\Psi}(y) \Psi(y) \end{split}\]

donde \(y = \Lambda^{-1}x\).

Por lo tanto \(\bar{\Psi}(x) \Psi(x)\) es un escalar bajo paridad.

Apliquemos inversión de paridad ahora a \(\Psi(x) \gamma^5 \Psi(x)\):

\[\begin{split} \bar{\Psi}(x) \gamma^5 \Psi(x) \to (S \Psi(y))^\dagger \gamma^0 \gamma^5 (S \Psi(y)) = \\ \Psi^\dagger(y) (\gamma^0)^\dagger \gamma^0 \gamma^5 \gamma^0 \Psi(y) = \Psi^\dagger(y) \gamma^5 \gamma^0 \Psi(y) = \\ - \Psi^\dagger(y) \gamma^0 \gamma^5 \Psi(y) = - \bar{\Psi}(y) \gamma^5 \Psi(y) \end{split}\]

donde \(y = \Lambda^{-1}x\).

Por lo tanto \(\Psi(x) \gamma^5 \Psi(x)\) es un pseudo-escalar bajo paridad.

Aplicamos inversión de paridad a la corriente \(\bar{\Psi}(x) \gamma^\mu \Psi(x)\):

\[\begin{split} \bar{\Psi}(x) \gamma^\mu \Psi(x) \to (S \Psi(y))^\dagger \gamma^0 \gamma^\mu (S \Psi(y)) = \\ \Psi^\dagger(y) (\gamma^0)^\dagger \gamma^0 \gamma^\mu \gamma^0 \Psi(y) = \Psi^\dagger(y) \gamma^\mu \gamma^0 \Psi(y) \end{split}\]

donde \(y= \Lambda^{-1}x\).

para \(\mu = 0\)

\[ (\Psi^\dagger(y) \gamma^0) \gamma^0 \Psi(y) = \bar{\Psi}(y) \gamma^0 \Psi(y) \]

para los índices espaciales, \(k = 1, 2, 3\).

\[ \Psi^\dagger(y) \gamma^k \gamma^0 \Psi(y) = - (\Psi^\dagger(y) \gamma^0) \gamma^k \Psi(y) = - \bar{\Psi}(y) \gamma^k \Psi(y) \]

Luego bajo paridad:

\[\begin{split} \bar{\Psi}(x) \gamma^\mu \Psi(x) = (\bar{\Psi}(x) \gamma^0 \Psi(x), \bar{\Psi}(x) \gamma^k \Psi(x)) \to \\ \bar{\Psi}'(x) \gamma^\mu \Psi'(x) = (\bar{\Psi}(y) \gamma^0 \Psi(y), -\bar{\Psi}(y) \gamma^k \Psi(y)) \end{split}\]

La componente temporal no cambia de signo, pero si las espaciales, que es justamente la operación de paridad sobre un cuadri-vector.

Luego \(\Psi(x) \gamma^\mu\Psi(x)\) es un vector bajo paridad.

Aplicamos ahora inversión de paridad a \(\bar{\Psi}(x) \gamma^\mu \gamma^5 \Psi(x)\):

\[\begin{split} \bar{\Psi}(x) \gamma^\mu \gamma^5 \Psi(x) \to (S \Psi(y))^\dagger \gamma^0 \gamma^\mu \gamma^5 (S \Psi(y)) = \\ \Psi^\dagger(y) (\gamma^0)^\dagger \gamma^0 \gamma^\mu \gamma^5 \gamma^0 \Psi(y) = \Psi^\dagger(y) \gamma^\mu \gamma^5 \gamma^0 \Psi(y) = - \Psi^\dagger(y) \gamma^\mu \gamma^0 \gamma^5 \Psi(y) \end{split}\]

Reencontramos la misma situación que antes, al intercambair \(\gamma^\mu\gamma^0 \to \gamma^0 \gamma^\mu\), la parte temporal no introduce cambio de signo \(\mu = 0\), pero si la espacial, \(k = 1, 2, 3\).

Así pues:

\[\begin{split} \bar{\Psi}(x) \gamma^\mu \gamma^5 \Psi(x) = (\bar{\Psi}(x) \gamma^0 \gamma^5 \Psi(x), \bar{\Psi}(x) \gamma^k \gamma^5 \Psi(x)) \to \\ \bar{\Psi}'(x) \gamma^\mu \gamma^5 \Psi'(x) = (-\bar{\Psi}(y) \gamma^0 \gamma^5\Psi(y), \bar{\Psi}(y) \gamma^k \gamma^5 \Psi(y)) \\ \end{split}\]

Cambia de signo la parte temporal pero no la espcial.

Luego \(\Psi(x) \gamma^\mu \gamma^5 \Psi(x)\) se comporta como un vector axial bajo paridad.

En resumen tenemos la siguientes formas que transforman bajo Lorentz como:

\(\bar{\Psi} \Psi\)

escalar

\(\bar{\Psi} \gamma^5 \Psi\)

pseudo-escalar

\(\bar{\Psi} \gamma^\mu \Psi\)

vectorial

\(\bar{\Psi} \gamma^\mu \gamma^5 \Psi\)

vector axial

Quiralidad#

La violación de paridad de las interacciones débiles está relacionada con una propiedad del espinor de Dirac, llamada quiralidad.

Veremos que un espinor de Dirac puede descomponerse en dos espinores, que se llaman de quiralidad a izquierdas y derechas, tales que la inversión de paridad intercambia la quiralidad, la derecha por la izquierda y viceversa.

Esto hace que una interacción que sea invariante por paridad, no hará distinción entre los dos quiralidades, pero una que sí lo haga, favorecerá o incluso suprimirá una quiralidad.

La quiralidad está ligada con la matriz \(\gamma^5\) que nos divide el espacio de espinores en dos, mediante los proyectores de quiralidad:

\[ P_L = \frac{1}{2} (1-\gamma^5), \;\;\; P_R = \frac{1}{2} (1+\gamma^5) \]

De tal forma que \(\Psi(x)\) se descompone en dos partes, a izquierdas y derechas.

\[ \Psi_L(x) = P_L \, \Psi(x), \;\;\, \Psi_R(x) = P_R \, \Psi(x) \]

Los proyectores son en realidad dos matrices que están actuado sobre la parte espinorial de \(\Psi(x)\).

Esto es para los espinores de los fermiones, actuan sobre \(u(p)\):

\[ u_L(p) = P_L \, u(p), \;\;\, u_R(p) = P_L \, u(p) \]

donde hemos eliminado el subíndice \(s\) de los espinores \(u_s(p)\) por simplicidad.

Vamos a comprobar que se trata de proyectores.

Estos deben cumplir:

\[ P_R + P_L = I, \;\; P^2_R = P_R, \;\;, P^2_L = P_L, \;\; P_L P_R = P_R P_L = 0 \]

La primera es inmediata.

Comprobemos que \(P^2_R = P_R\)

\[ \left[\frac{1}{2} (1+\gamma^5) \right]^2 = \frac{1}{4}(I + 2\gamma^5 + (\gamma^5)^2) = \frac{1}{4}(I + 2\gamma^5 + I) = \frac{1}{2}(1+\gamma^5) \]

dado que \((\gamma^5)^2 = I\).

De igual manera obraríamos con \(P^2_L = P_L\)

Y finalmente, \(P_L \, P_R = P_R \, P_L = 0\):

\[ \frac{1}{2}(1-\gamma^5) \frac{1}{2}(1+\gamma^5) = \frac{1}{4} (I-(\gamma^5)^2) = 0 \]

Vamos a aplicar paridad sobre \(u_L(p), \; u_R(p)\), recordemos que la representación espinorial de la inversión por paridad es \(S(P) = \gamma^0\)

\[\begin{split} \frac{1}{2}(1\pm\gamma^5) \, u(p) \to S(P) \, \frac{1}{2}(1 \pm \gamma^5) \, u(E, -{\bf p}) = \\ \gamma^0 \, \frac{1}{2}(1 \pm \gamma^5) \, u(E, -{\bf p}) = \\ \frac{1}{2} (1 \mp \gamma^5) (\gamma^0 \, u(E, -{\bf p})) = \frac{1}{2}(1 \mp \gamma^5) u(p) \end{split}\]

Luego la inversión por paridad nos intercambia los espinores de quiralidad a derechas por izquierdas y viceversa:

\[ u_L(p) \leftrightarrow u_R(p) \]

Para los espinores de los antifermiones definimos la quiralidad de forma complementaria a la de los fermiones, esto es:

\[ v_R(p) = P_L\, v(p), \;\;\; v_L(p) = P_R \, v(p), \;\;\; \]

Igualmente la inversión por paridad intercambia sus quiralidades

\[ v_R(p) \leftrightarrow v_L(p) \]

Las espinores en su expresión quiral#

Si los aplicamos sobre los espinores de Dirac que son autoestados de helicidad. Recordémos que son:

\[\begin{split} u_r(p) = N \begin{pmatrix} \chi_r(\hat{\bf v}) \\ \lambda_s \kappa \, \chi_r(\hat{\bf v}) \end{pmatrix}, \;\;\; v_r(p) = N \begin{pmatrix} -\lambda_s \kappa \, \xi_r(\hat{\bf v}) \\ \xi_r(\hat{\bf v}) \end{pmatrix}, \;\;\; \end{split}\]

donde \(r = \pm, \, \lambda_\pm = \pm 1\).

Obtenemos:

\[\begin{split} P_R u_\pm(p) = \frac{1}{2} (1 \pm \kappa) N \begin{pmatrix} \chi_\pm(\hat{\bf v}) \\ \chi_\pm(\hat{\bf v}) \end{pmatrix}, \;\;\; P_L u_\pm(p) = \frac{1}{2} (1 \mp \kappa) N \begin{pmatrix} \chi_\pm(\hat{\bf v}) \\ -\chi_\pm(\hat{\bf v}) \end{pmatrix}, \;\;\; \end{split}\]

Que podemos explicitar en la siguiente tabla:

helicidad \(\downarrow\) \ quiralidad \(\rightarrow\)

— R —

— L —

+

\(\frac{1}{2}(1+\kappa)\)

\(\frac{1}{2}(1-\kappa)\)

-

\(\frac{1}{2}(1-\kappa)\)

\(\frac{1}{2}(1+\kappa)\)

En el caso en el que la partícula es ultra-relativista \(E \gg m\) o sin masa, \(m=0\), esto es, cuando \(\kappa = 1\)

En ese caso el espinor de helicidad negativa solo tiene componene de quiralidad a izquierdas. Y el espinor de helicidad positiva solo quiralidad a derechas.

\[\begin{split} u_R(p) = u_+(p) = N \begin{pmatrix} \chi_+(\hat{\bf v}) \\ \chi_+(\hat{\bf v}) \end{pmatrix}, \;\;\; u_L(p) = u_-(p) = N \begin{pmatrix} \chi_-(\hat{\bf v}) \\ -\chi_-(\hat{\bf v}) \end{pmatrix}, \;\;\; \end{split}\]

solo cuando \(\kappa = 1\).

Que si explicitamos para el caso \(\hat{\bf v} = \hat{k}\), esto es, elegimos el eje \(z\) como la dirección de movimiento de la partícula.

y en el caso ultra-relativista,

\[\begin{split} u_R(p) = u_+(p) = \sqrt{E} \begin{pmatrix} 1 \\ 0 \\ 1 \\ 0 \end{pmatrix}, \;\;\; u_L(p) = u_-(p) = \sqrt{E} \begin{pmatrix} 0 \\ 1 \\ 0 \\ -1 \end{pmatrix}, \;\;\; \end{split}\]

Donde, recordemos \(N = \sqrt{E + m } = \sqrt{E}\)

Para los espinores de los antifermiones:

\[\begin{split} v_R(p) = P_L v_\pm(p) = \frac{1}{2} (1 \pm \kappa) N \begin{pmatrix} - \xi_\pm(\hat{\bf v}) \\ \xi_\pm(\hat{\bf v}) \end{pmatrix}, \;\;\; v_L(p) = P_R v_\pm(p) = \frac{1}{2} (1 \mp \kappa) N \begin{pmatrix} \xi_\pm(\hat{\bf v}) \\ \xi_\pm(\hat{\bf v}) \end{pmatrix}, \;\;\; \end{split}\]

que si explicitamos para el caso \(\hat{\bf v} = \hat{k}\) y en el caso ultra-relativista,

\[\begin{split} v_R(p) = P_L v_+(p) = \sqrt{E} \begin{pmatrix} 0 \\ -1 \\ 0 \\ 1 \end{pmatrix}, \;\;\; v_L(p) = P_R v_-(p) = \sqrt{E} \begin{pmatrix} 1 \\ 0 \\ 1 \\ 0 \end{pmatrix}, \;\;\; \end{split}\]

Podemos especificar los proyectores de quiralidad en la representación Pauli-Dirac:

\[\begin{split} P_R = \frac{1}{2}\begin{pmatrix} I & I \\ I & I \end{pmatrix}, \;\;\; P_L = \frac{1}{2}\begin{pmatrix} I & -I \\ -I & I \end{pmatrix}, \end{split}\]

las formas escalar y vectorial según quiralidad#

Como \((\gamma^5)^\dagger = \gamma^5\), los projectores no se ven afectados por la operación \(\dagger\):

\[ \frac{1}{2}(1\pm \gamma^5)^\dagger = \frac{1}{2}(1\pm \gamma^5), \;\; P^\dagger_{L/R} = P_{L/R} \]

Mientras que el intercambio con \(\gamma^0\) intercambia los proyectores:

\[ \gamma^0 \, P_{L/R} = P_{R/L} \, \gamma^0 \]

Esto separa en dos las formas invariantes Lorentz

Para la escalar \(\bar{\Psi}(x) \Psi(x)\), si la escribimos solo en función de sus espinores \(\bar{u}(p) u(p)\):

\[\begin{split} \bar{u}(p) \, u_L(p) = \bar{u}(p) \, P_L u_L(p) = (u^\dagger(p) \gamma^0) P_L \, u_L(p) = \\ (u^\dagger(p) P_R \gamma^0) \, u_L(p) = (P_R u(p))^\dagger \gamma^0 u_L(p) = u^\dagger_R(p) \gamma^0 u_L(p) = \bar{u}_R(p) u_L(p) \end{split}\]

Y de forma recíproca:

\[ \bar{u}(p) \, u_R(p) = \bar{u}_L \, u_R(p) \]

Luego la forma escalar:

\[ \bar{u}(p) \, u(p) = \bar{u}_R \, u_L(p) + \bar{u}_L \, u_R(p) \]

Se compone de dos partes donde las dos quiralidades se acoplan una a la otra.

Esto implica que un término escalar en el Lagrangiano (el que estará asociado a la masa) exige la existencia de las dos quiralidades.

Recordando que \(\gamma^5\gamma^\mu = - \gamma^\mu\gamma^5\), vemos que:

\[ \gamma^\mu \, P_{L/R} = P_{R/L} \gamma^\mu \]

el intercambio de lado de \(\gamma^\mu\), intercambia los proyectores.

Veamos ahora cómo queda la forma vectorial, \(\bar{\Psi}(x)\gamma^\mu\Psi(x)\) escrita en sus componentes de quiralidad. Desarrollamos nuevamente la expresión con os espinores, \(\bar{u}(p) \gamma^\mu u(p)\).

\[\begin{split} \bar{u}(p) \gamma^\mu u_L(p) = \bar{u}(p) \gamma^\mu P_L u_L(p) = (u^\dagger(p) \gamma^0) \gamma^\mu P_L \, u_L(p) = \\ u^\dagger(p) \gamma^0 P_R \, \gamma^\mu \, u_L(p) = (u^\dagger(p) P_L) \gamma^0 \gamma^\mu \, u_L(p) = \\ (P_L u(p))^\dagger \gamma^0 \gamma^\mu u_L(p) = (u^\dagger_L(p) \gamma^0) \gamma^\mu u_L(p) = \bar{u}_L(p) \gamma^\mu u_L(p) \end{split}\]

De forma similar:

\[ \bar{u}(p) \gamma^\mu u_R(p) = \bar{u}_R(p) \gamma^\mu u_R(p) \]

Así la forma vectorial queda:

\[ \bar{u}(p) \gamma^\mu u(p) = \bar{u}_R(p) \gamma^\mu u_R(p) + \bar{u}_L(p) \gamma^\mu u_L(p) \]

Esto es la corriente se divide en dos, una corriente de quiralidad a izquierdas y otra a derechas.

En resumen:

\[\begin{split} \bar{\Psi}\Psi = \bar{\Psi}_R \Psi_L + \bar{\Psi}_L \Psi_R, \\ \bar{\Psi} \gamma^\mu \Psi = \bar{\Psi}_R \gamma^\mu \Psi_R + \bar{\Psi}_L \gamma^\mu \Psi_L \end{split}\]