Ir al contenido

Operador de proyección

De Wikipedia, la enciclopedia libre
La transformación P es la proyección ortogonal sobre una recta m

En matemáticas, un operador de proyección P en un espacio vectorial es una transformación lineal idempotente, es decir, que satisface la igualdad P2 = P.[1]

Introducción

[editar]

Dichas transformaciones proyectan cualquier punto x del espacio vectorial a un punto del subespacio imagen de la transformación. En caso de que x pertenezca al subespacio imagen, la proyección no tiene efecto, dejando el punto x fijo.[2]

Por ejemplo, el operador P definido en R3 de la forma siguiente

es un operador que "proyecta" el espacio R3 sobre el espacio de dimensión 2 que consiste de los vectores cuya coordenada y es cero.

Esta definición abstracta, de "proyector" o "proyección" generaliza la idea gráfica intuitiva de proyección extendiéndola a cualquier tipo de espacio vectorial, incluyendo el caso de dimensión infinita donde no resulta posible una aproximación gráfica.

Descomposición de un vector mediante una proyección

[editar]

Sea V un espacio vectorial, una proyección e la aplicación identidad. Se verifica que Q=I-P es una proyección. Además, dado que P+Q=I todo vector puede ser descompuesto de la siguiente forma: .[3]

Proyectores ortogonales o autoadjuntos

[editar]

Para pasar del concepto de «proyección» al de «proyección ortogonal» es preciso que exista un instrumento que nos diga si dos vectores son ortogonales, es decir, perpendiculares. Este instrumento es un producto interior definido en el espacio vectorial. Todo producto interior define una norma. El espacio vectorial puede ser o no completo respecto a ella. Si lo es, pasamos a hablar de un espacio de Hilbert. En este espacio, los conceptos «ortogonal» y «proyección ortogonal» están dotados plenamente de sentido.

En general, dado un subespacio vectorial W de un espacio V, existen muchas proyecciones sobre V. Si el espacio es un espacio de Hilbert y se exige además que el operador P sea un autoadjunto, es decir

entonces la proyección sobre V es única. El término «operador de proyección ortogonal» significa «operador de proyección autoadjunto».

En física, el término «operador de proyección» es sinónimo con proyección ortogonal.

En álgebra lineal y análisis funcional, una proyección es un aplicación lineal de un espacio vectorial sobre sí mismo (un endomorfismo) tal que . Es decir, siempre que se aplica dos veces a cualquier vector, se obtiene el mismo resultado que si se aplicara una vez (es decir, es idempotente). Expresado de otra manera, la imagen resultante queda sin cambios tras sucesivas aplicaciones.[2]​ Esta definición de proyección formaliza y generaliza la idea de proyección tridimensional. También se puede considerar el efecto de una proyección sobre un objeto geométrico examinando el efecto de la proyección sobre sus puntos.

Definiciones

[editar]

Una proyección sobre un espacio vectorial es un operador lineal tal que .

Cuando posee un producto interior y es completo, es decir, cuando es un espacio de Hilbert, se puede utilizar el concepto de ortogonalidad. Una proyección en un espacio de Hilbert se denomina proyección ortogonal si satisface para todo . Una proyección sobre un espacio de Hilbert que no es ortogonal se denomina proyección oblicua.

Matriz de proyección

[editar]
  • Una matriz cuadrada se llama matriz de proyección si es igual a su cuadrado,[4]: p. 38  es decir, si .
  • Una matriz cuadrada se denomina matriz de proyección ortogonal si para una matriz real y, respectivamente, para una matriz compleja, donde denota la matriz transpuesta de y denota la matriz adjunta o traspuesta hermítica[4]: p. 223  de .
  • Una matriz de proyección que no es una matriz de proyección ortogonal se denomina matriz de proyección oblicua.

Los autovalores de una matriz de proyección deben ser 0 o 1.

Ejemplos

[editar]

Proyección ortogonal

[editar]

Por ejemplo, la función que asigna el punto en el espacio tridimensional al punto es una proyección ortogonal sobre el plano xy. Esta función está representada por la matriz.

La acción de esta matriz sobre un vector arbitrario es

Para ver que es de hecho una proyección, es decir, , se calcula

Debe observarse que muestra que la proyección es una proyección ortogonal.

Proyección oblicua

[editar]

Un ejemplo simple de una proyección no ortogonal (oblicua) es

A través de multiplicación de matrices, se ve que

mostrando que es de hecho una proyección.

La proyección es ortogonal si y solo si porque solo entonces

Propiedades y clasificación

[editar]
La transformación T es la proyección a lo largo de k sobre m. El rango de T es m y el núcleo es k

Idempotencia

[editar]

Por definición, una proyección es idempotente (es decir, ).

Aplicación abierta

[editar]

Cada proyección es una aplicación abierta, lo que significa que asigna cada conjunto abierto de su dominio a un conjunto abierto en el subespacio topológico de la imagen. Es decir, para cualquier vector y cualquier bola (con radio positivo) centrada en , existe una bola (con radio positivo) centrada en que está totalmente contenida en la imagen .

Complementariedad de imagen y kernel

[editar]

Sea un espacio vectorial de dimensión finita y sea una proyección sobre . Supóngase que los subespacios y son imagen y núcleo de respectivamente. Entonces, tiene las siguientes propiedades:

  1. es la función identidad en :
  1. Existe la suma directa . Cada vector puede descomponerse únicamente como con y , y donde

La imagen y el núcleo de una proyección son complementarios, al igual que y . El operador también es una proyección, ya que la imagen y el núcleo de se convierten en el núcleo y la imagen de y viceversa. Se dice que es una proyección en sobre (núcleo/imagen) y es una proyección en sobre .

Espectro

[editar]

En espacios vectoriales de dimensión infinita, el espectro de una proyección está contenido en como

Sólo 0 o 1 puede ser los valores propios de una proyección. Esto implica que una proyección ortogonal es siempre una matriz semidefinida positiva. En general, los espacios propios correspondientes son (respectivamente) el núcleo y el rango de la proyección. La descomposición de un espacio vectorial en sumas directas no es única. Por lo tanto, dado un subespacio , puede haber muchas proyecciones cuyo rango (o núcleo) sea .

Si una proyección no es trivial, tiene como polinomio mínimo , que se descompone en distintos factores lineales y, por lo tanto, es diagonalizable.

Producto de proyecciones

[editar]

El producto de proyecciones no es en general una proyección, aunque sean ortogonales. Si dos proyecciones conmutan entonces su producto es una proyección, pero el enunciado inverso es falso: el producto de dos proyecciones que no conmutan puede ser una proyección.

Si dos proyecciones ortogonales conmutan, entonces su producto es una proyección ortogonal. Si el producto de dos proyecciones ortogonales es una proyección ortogonal, entonces las dos proyecciones ortogonales conmutan (de manera más general: dos endomorfismo autoadjuntos conmutan si y solo si su producto es autoadjunto).

Proyecciones ortogonales

[editar]

Cuando el espacio vectorial tiene un espacio prehilbertiano y está completo (es decir, es un espacio de Hilbert) se puede utilizar el concepto de ortogonalidad. Una proyección ortogonal se caracteriza porque el rango y el núcleo son subespacios ortogonales. Así, por cada y en , .

Equivalentemente:

Una proyección es ortogonal si y solo si es autoadjunta. Usando las propiedades de ser autoadjunta e idempotente de , para cualquier y en se tiene que , y

donde es el producto interno asociado con . Por tanto, y son proyecciones ortogonales.[5]​ La relación en sentido contrario, es decir, que si es ortogonal, entonces es autoadjunta; se sigue de la implicación de a

para cada y en ; y por lo tanto .

La existencia de una proyección ortogonal sobre un subespacio cerrado se desprende del teorema de proyección de Hilbert.

Propiedades y casos especiales

[editar]

Una proyección ortogonal es un operador lineal acotado. Esto se debe a que para cada en el espacio vectorial se tiene que, por la desigualdad de Cauchy-Bunyakovsky-Schwarz:

Así, .

Para espacios vectoriales reales o complejos de dimensión finita, el producto escalar se puede sustituir por .

Fórmulas
[editar]

Un caso simple ocurre cuando la proyección ortogonal es sobre una recta. Si es un vector unitario en la recta, entonces la proyección viene dada por el producto exterior

(si tiene un valor complejo, la traspuesta en la ecuación anterior se reemplaza por una transpuesta hermítica). Este operador deja invariante u y anula todos los vectores ortogonales a , lo que demuestra que de hecho es la proyección ortogonal sobre la línea recta que contiene a u.[6]​ Una forma sencilla de ver esto es considerar un vector arbitrario como la suma de una componente de la recta (es decir, el vector proyectado que buscamos) y otra perpendicular a ella, . Aplicando la proyección se obtiene

por las propiedades del producto escalar de vectores paralelos y perpendiculares.

Esta fórmula se puede generalizar a proyecciones ortogonales en un subespacio de dimensión arbitraria. Sea una base ortonormal del subespacio , asumiendo que el número entero , y sea la matriz cuyas columnas son , es decir, . Entonces, la proyección viene dada por:[7]

que se puede reescribir como

La matriz es la isometria parcial que desaparece en el complemento ortogonal de , y es la isometría que embebe a en el espacio vectorial subyacente. Por tanto, el rango de es el espacio final de . También está claro que es el operador de identidad en .

También se puede eliminar la condición de ortonormalidad. Si es una base (no necesariamente ortonormal) con , y es la matriz con estos vectores como columnas, entonces la proyección es:[8][9]

La matriz todavía incorpora en el espacio vectorial subyacente pero ya no es una isometría en general. La matriz es un factor normalizador que recupera la norma. Por ejemplo, el operador de rango-1 no es una proyección si . Después de dividir por se obtiene la proyección sobre el subespacio abarcado por .

En el caso general, se puede tener una matriz positiva definida arbitraria que define un producto interno , y la proyección viene dada por . Entonces

Cuando el espacio de rango de la proyección es generado por un marco (es decir, el número de generadores es mayor que su dimensión), la fórmula para la proyección toma la forma: . Aquí represnta la matriz pseudoinversa de Moore-Penrose. Esta es solo una de las muchas formas de construir el operador de proyección.

Si es una matriz no singular y (es decir, es la matriz núcleo de ),[10]​ se cumple lo siguiente:

Si la condición ortogonal se mejora a con no singular, se cumple lo siguiente:

Todas estas fórmulas también son válidas para espacios con productos internos complejos, siempre que se utilice la matriz traspuesta conjugada en lugar de la traspuesta. Se pueden encontrar más detalles sobre las sumas de las proyecciones en Banerjee y Roy (2014).[8]​ Véase también Banerjee (2004)[11]​ para la aplicación de sumas de proyecciones en trigonometría esférica básica.

Proyecciones oblicuas

[editar]

El término proyecciones oblicuas se utiliza a veces para referirse a proyecciones no ortogonales. Estas proyecciones también se utilizan para representar figuras espaciales en dibujos bidimensionales (véase proyección oblicua), aunque no con tanta frecuencia como las proyecciones ortogonales. Mientras que calcular el valor ajustado de una regresión mínimos cuadrados ordinarios requiere una proyección ortogonal, calcular el valor ajustado de una regresión variable instrumental requiere una proyección oblicua.

Una proyección se define por su núcleo y los vectores base utilizados para caracterizar su rango (que es un complemento del núcleo). Cuando estos vectores base son ortogonales al núcleo, entonces la proyección es ortogonal. Cuando estos vectores base no son ortogonales al núcleo, la proyección es una proyección oblicua, o simplemente una proyección.

Fórmula de representación matricial para un operador de proyección distinto de cero

[editar]

Sea un operador lineal, tal que y supóngase que no es el operador cero. Ahora, se considera que los vectores forman una base para el rango de , que se representan en la matriz de orden . Por lo tanto, el número entero ; de lo contrario, y es el operador cero. El rango y el núcleo son espacios complementarios, por lo que el núcleo tiene dimensión . De ello se deduce que el complemento ortogonal del núcleo tiene la dimensión . Sea una base para el complemento ortogonal del núcleo de la proyección, represéntesen estos vectores en la matriz . Entonces, la proyección (con la condición ) viene dada por

Esta expresión generaliza la fórmula para proyecciones ortogonales dada anteriormente.[8][12]​ Una prueba estándar de esta expresión es la siguiente. Para cualquier vector en el espacio vectorial , se puede descomponer , donde el vector está en la imagen de y el vector Entonces , y entonces está en el núcleo de , que es el espacio nulo de En otras palabras, el vector está en el espacio de columnas de , por lo que para algún vector de dimensión y el vector satisface mediante la construcción de . Uniendo estas condiciones se encuentra un vector tal que . Dado que las matrices y tienen el rango completo por su construcción, la matriz es invertible. Entonces la ecuación da el vector . De esta manera, para cualquier vector y por lo tanto .

En el caso de que sea una proyección ortogonal, se puede tomar , y se deduce que . Al utilizar esta fórmula, se puede comprobar fácilmente que . En general, si el espacio vectorial está definido sobre el cuerpo de los números complejos, se usa la matriz traspuesta conjugada , y se obtiene la fórmula . Recuérdese que se puede definir la matriz pseudoinversa de Moore-Penrose de la matriz por , ya que tiene rango de columna completo, y por lo tanto .

Valores singulares

[editar]

Téngase en cuenta que también es una proyección oblicua. Los valores singulares de e se pueden calcular mediante una base ortonormal de .

Sea una base ortonormal de y sea el complemento ortogonal de . Ahora, se denotan los valores singulares de la matriz mediante los valores positivos . Con esto, los valores singulares para son:[13]

y los valores singulares para son

Esto implica que los valores singulares más grandes de e son iguales y, por lo tanto, que la norma matricial de las proyecciones oblicuas es la misma. Sin embargo, su número de condición satisface la relación y, por lo tanto, no es necesariamente igual.

Determinar una proyección con un producto interno

[editar]

Sea un espacio vectorial (en este caso un plano) abarcado por vectores ortogonales . Sea un vector. Se puede definir una proyección de sobre como

donde los índices repetidos se suman (de acuerdo con el convenio de suma de Einstein). El vector se puede escribir como una suma ortogonal tal que . a veces se denomina . Hay un teorema en álgebra lineal que establece que este es la distancia más pequeña (la distancia ortogonal) de a y se usa comúnmente en áreas como el aprendizaje automático.

y proyectado en el espacio vectorial V

Formas canónicas

[editar]

Cualquier proyección sobre un espacio vectorial de dimensión sobre un cuerpo es una matriz diagonalizable, ya que su polinomio mínimo divide a , que se divide en distintos factores lineales. Por lo tanto, existe una base en la que tiene la forma

donde es el rango de . Aquí, es la matriz identidad de tamaño , es la matriz cero de tamaño y es el operador suma directa. Si el espacio vectorial es complejo y está equipado con un espacio prehilbertiano, entonces existe una base ortonormal en la que la matriz de P es[14]

donde . Los números enteros y los números reales están determinados de forma única. Téngase en cuenta que . El factor corresponde al subespacio invariante máximo en el que actúa como una proyección ortogonal (de modo que P es ortogonal si y solo si ) y los bloques corresponden a las componentes oblicuas.

Proyecciones sobre espacios vectoriales normados

[editar]

Cuando el espacio vectorial subyacente es un espacio vectorial normado (no necesariamente de dimensión finita), es necesario considerar cuestiones analíticas, irrelevantes en el caso de dimensión finita. Supóngase ahora que es un espacio de Banach.

Muchos de los resultados algebraicos discutidos anteriormente se conservan en este nuevo contexto. Una descomposición de suma directa dada de en subespacios complementarios todavía especifica una proyección, y viceversa. Si es la suma directa , entonces el operador definido por sigue siendo una proyección con rango y núcleo . También está claro que . Por el contrario, si es una proyección sobre , es decir, , entonces se verifica fácilmente que . En otras palabras, también es una proyección. La relación implica que y es la suma directa .

Sin embargo, a diferencia del caso de dimensión finita, las proyecciones no necesitan ser continuas en general. Si un subespacio de no está cerrado en la topología normal, entonces la proyección sobre no es continua. En otras palabras, el rango de una proyección continua debe ser un subespacio cerrado. Además, el núcleo de una proyección continua (de hecho, un operador lineal continuo en general) es cerrado. Así, una proyección continua da una descomposición de en dos subespacios cerrados complementarios: .

Lo contrario también es válido, con un supuesto adicional. Supóngase que es un subespacio cerrado de . Si existe un subespacio cerrado tal que X= UV, entonces la proyección con rango y núcleo es continua. Esto se desprende del teorema de la gráfica cerrada. Supóngase también que xnx y Pxny. Es necesario demostrar que . Dado que es cerrado y {Pxn} ⊂ U, y se encuentra en , es decir, Py= y. Además, xnPxn= (IP)xnxy. Debido a que está cerrado y {(IP)xn} ⊂ V, se tiene que , es decir, , lo que prueba la afirmación.

El argumento anterior hace uso del supuesto de que tanto como están cerrados. En general, dado un subespacio cerrado , no es necesario que exista un subespacio cerrado complementario , aunque para un espacio de Hilbert esto siempre se puede hacer tomando el complemento ortogonal. Para los espacios de Banach, un subespacio unidimensional siempre tiene un subespacio complementario cerrado. Esta es una consecuencia inmediata del teorema de Hahn–Banach. Sea el tramo lineal de . Por el mencionado teorema de Hahn-Banach, existe una funcional lineal acotada tal que φ(u)= 1. El operador satisface que , es decir, es una proyección. La acotación de implica continuidad de y, por lo tanto, es un subespacio complementario cerrado de .

Aplicaciones y consideraciones adicionales

[editar]

Las proyecciones (ortogonales y de otro tipo) juegan un papel importante en la algoritmia para ciertos problemas de álgebra lineal:

Como se indicó anteriormente, las proyecciones son un caso especial de idempotencia. Analíticamente, las proyecciones ortogonales son generalizaciones no conmutativas de funciones características. La idempotencia se utiliza para clasificar, por ejemplo, álgebras semisimples, mientras que la teoría de medida comienza considerando las funciones características de los conjuntos mdibles. Por lo tanto, como se puede imaginar, las proyecciones se encuentran muy a menudo en el contexto del álgebra de operadores. En particular, un álgebra de von Neumann se genera por su retículo completo de proyecciones.

Generalizaciones

[editar]

De manera más general, dada una aplicación entre espacios vectoriales normados , se puede pedir de manera análoga que esta aplicación sea una isometría en el complemento ortogonal del núcleo: que sea una isometría (compárese con una isometría parcial); y en particular debe ser sobreyectiva. El caso de una proyección ortogonal es cuando W es un subespacio de V. En la geometría de Riemann, esto se utiliza en la definición de submersión riemanniana.

Véase también

[editar]

Referencias

[editar]
  1. "Basic methods of linear Functional Analysis" J.D. Pryce. Hutchinson University Library. Página 150
  2. a b Meyer, pp 386+387
  3. "Basic methods of linear functional analysis" J.D. Pryce. Hutchinson University Library. Página 150.
  4. a b Horn, Roger A.; Johnson, Charles R. (2013). Matrix Analysis, second edition. Cambridge University Press. ISBN 9780521839402. 
  5. Meyer, p. 433
  6. Meyer, p. 431
  7. Meyer, equation (5.13.4)
  8. a b c Banerjee, Sudipto; Roy, Anindya (2014), Linear Algebra and Matrix Analysis for Statistics, Texts in Statistical Science (1st edición), Chapman and Hall/CRC, ISBN 978-1420095388 .
  9. Meyer, equation (5.13.3)
  10. Véase también Mínimos cuadrados lineales (matemáticas) § Propiedades de los estimadores de mínimos cuadrados.
  11. Banerjee, Sudipto (2004), «Revisiting Spherical Trigonometry with Orthogonal Projectors», The College Mathematics Journal 35 (5): 375-381, S2CID 122277398, doi:10.1080/07468342.2004.11922099 .
  12. Meyer, equation (7.10.39)
  13. Brust, J. J.; Marcia, R. F.; Petra, C. G. (2020), «Computationally Efficient Decompositions of Oblique Projection Matrices», SIAM Journal on Matrix Analysis and Applications 41 (2): 852-870, OSTI 1680061, S2CID 219921214, doi:10.1137/19M1288115 .
  14. Doković, D. Ž. (August 1991). «Unitary similarity of projectors». Aequationes Mathematicae 42 (1): 220-224. S2CID 122704926. doi:10.1007/BF01818492. 

Bibliografía

[editar]
  • Banerjee, Sudipto; Roy, Anindya (2014), Linear Algebra and Matrix Analysis for Statistics, Texts in Statistical Science (1st edición), Chapman and Hall/CRC, ISBN 978-1420095388 .
  • Dunford, N.; Schwartz, J. T. (1958). Linear Operators, Part I: General Theory. Interscience. 
  • Meyer, Carl D. (2000). Matrix Analysis and Applied Linear Algebra. Society for Industrial and Applied Mathematics. ISBN 978-0-89871-454-8. 

Enlaces externos

[editar]