Forma kwadratowa

Forma kwadratowa (funkcjonał kwadratowy) – wielomian jednorodny II stopnia n {\displaystyle n} zmiennych określony na przestrzeni liniowej V {\displaystyle V} – zmienne występują tu najwyżej w drugiej potędze; ogólna postać[1]:

Q ( x ) Q ( x 1 , , x n ) = i = 1 n j = 1 n a i j x i x j , {\displaystyle Q(\mathbf {x} )\equiv Q(x_{1},\dots ,x_{n})=\sum _{i=1}^{n}\sum _{j=1}^{n}a_{ij}{x_{i}}{x_{j}},}

gdzie:

  • a i j {\displaystyle a_{ij}} – stałe współczynniki liczbowe – całkowite, wymierne, rzeczywiste lub zespolone,
  • x i , x j , i , j = 1 , , n {\displaystyle x_{i},x_{j},i,j=1,\dots ,n} – zmienne, współrzędne dowolnego wektora x {\displaystyle \mathbf {x} } danej przestrzeni liniowej V , {\displaystyle V,} x = [ x 1 , , x n ] , {\displaystyle \mathbf {x} =[x_{1},\dots ,x_{n}],}
  • jednorodność II stopnia oznacza, że dla dowolnej liczby c K {\displaystyle c\in K} zachodzi równość,
    Q ( c x ) = c 2 Q ( x ) . {\displaystyle Q(c\,\mathbf {x} )=c^{2}\,Q(\mathbf {x} ).}

W przypadku jednej zmiennej, dwóch zmiennych oraz trzech zmiennych formy nazywa się odpowiednio unarną, binarną i ternarną. Mają one postacie:

Q ( x ) = a x 2 (unarna) , {\displaystyle Q(x)=a\,x^{2}\quad {\textrm {(unarna)}},}
Q ( x , y ) = a x 2 + b x y + c y 2 (binarna) , {\displaystyle Q(x,y)=a\,x^{2}+b\,xy+c\,y^{2}\quad {\textrm {(binarna)}},}
Q ( x , y , z ) = a x 2 + b y 2 + c z 2 + d x y + e x z + f y z (ternarna) , {\displaystyle Q(x,y,z)=a\,x^{2}+b\,y^{2}+c\,z^{2}+d\,xy+e\,xz+f\,yz\quad {\textrm {(ternarna)}},}

gdzie a , , f {\displaystyle a,\dots ,f} są stałymi współczynnikami[a].

Np.

Q ( x , y , z ) = 4 x 2 + 2 x y 3 y 2 + z 2 {\displaystyle Q(x,y,z)=4x^{2}+2xy-3y^{2}+z^{2}}

jest formą kwadratową trzech zmiennych x , y , z . {\displaystyle x,y,z.}

Funkcje kwadratowe, jak np. f ( x ) = a x 2 + b x + c {\displaystyle f(x)=ax^{2}+bx+c} w przypadku jednej zmiennej, nie są na ogół formami kwadratowymi, gdyż nie są jednorodne (chyba że b {\displaystyle b} oraz c {\displaystyle c} są równe 0).

Pojęcie formy kwadratowej zajmuje fundamentalne miejsce w różnych działach matematyki, takich jak np. teoria liczb, algebra liniowa, teoria grup (w tym teoria grup ortogonalnych), geometria różniczkowa (metryka Riemanna, druga forma fundamentalna), topologia różniczkowa.

Uwaga: O ile nie zaznaczono inaczej, w artykule rozpatruje się przestrzenie liniowe nad ustalonym ciałem K {\displaystyle K} charakterystyki różnej od 2.

Historia

Pytania, czy jakaś liczba całkowita spełnia zadaną formę kwadratową, zadawano wiele stuleci temu. Przykładem jest teoria Fermata o sumie dwóch kwadratów, która określa, kiedy istnieje liczba całkowita spełniająca formę x 2 + y 2 , {\displaystyle x^{2}+y^{2},} gdzie x , {\displaystyle x,} y {\displaystyle y} – liczby całkowite. Problem ten jest analogiczny do znajdowania trójek pitagorejskich, który pojawił się w drugim tysiącleciu p.n. Chr.[b]

W 628, Hinduski matematyk Brahmagupta napisał dzieło Brāhmasphuṭasiddhānta zawierające m.in. wyniki badań równań typu 1 = x 2 n y 2 = c . {\displaystyle 1=x^{2}-ny^{2}=c.} W szczególności znalazł rozwiązanie równania (zwanego dziś równaniem Pella) 1 = x 2 n y 2 = 1 {\displaystyle 1=x^{2}-ny^{2}=1} [c]. W Europie problem ten badali Brouncker, Euler i Lagrange.

W 1801 Gauss opublikował dzieło Disquisitiones Arithmeticae, w którym główną część poświęcił teorii binarnych form kwadratowych o współczynnikach całkowitych. Jego idee zostały uogólnione i z czasem odkryto związki z liczbowymi ciałami kwadratowymi, z grupami modularnymi i innymi działami matematyki.

Forma kwadratowa a forma dwuliniowa

Tw. 1 Każdej formie kwadratowej[d][e] Q ( x ) {\displaystyle Q(\mathbf {x} )} odpowiada wzajemnie jednoznacznie symetryczna forma dwuliniowa B ( x , x ) {\displaystyle B(\mathbf {x} ,\mathbf {x} )} określona na tej samej przestrzeni, tak że zachodzą związki

Q ( x ) = B ( x , x ) , {\displaystyle Q(\mathbf {x} )=B(\mathbf {x} ,\mathbf {x} ),}
B ( x , y ) = B ( y , x ) = 1 2 ( Q ( x + y ) Q ( x ) Q ( y ) ) . {\displaystyle B(\mathbf {x} ,\mathbf {y} )=B(\mathbf {y} ,\mathbf {x} )={\tfrac {1}{2}}(Q(\mathbf {x+y} )-Q(\mathbf {x} )-Q(\mathbf {y} )).}

Np.

(a) formą dwuliniową dodatnio określoną i symetryczną jest iloczyn skalarny wektorów x , y {\displaystyle \langle \mathbf {x,y} \rangle }

B ( x , y ) x | y 0 , {\displaystyle B(\mathbf {x,y} )\equiv \langle \mathbf {x} |\mathbf {y} \rangle \geqslant 0,}

(b) formą kwadratową odpowiadająca jednoznacznie iloczynowi skalarnemu jest iloczyn skalarny wektora przez samego siebie – definiuje on kwadrat normy, która określa długości wektorów przestrzeni liniowej:

x | x = | | x | | 2 . {\displaystyle \langle \mathbf {x} |\mathbf {x} \rangle =||\mathbf {x} ||^{2}.}

Df. Funkcję B {\displaystyle B} nazywa się formą dwuliniową odpowiadającą formie Q {\displaystyle Q} (stowarzyszoną z formą Q {\displaystyle Q} ).

Czynnik 1 2 {\displaystyle {\frac {1}{2}}} jest powodem, dla którego wyklucza się ciała, w których 2 = 0 ; {\displaystyle 2=0;} formy kwadratowe w ciałach charakterystyki 2 opisano w oddzielnej sekcji.

Wybór bazy a przedstawienie formy

Jeżeli V {\displaystyle V} jest przestrzenią liniową skończonego wymiaru n , {\displaystyle n,} to wybór bazy przestrzeni prowadzi do przedstawienia Q {\displaystyle Q} w postaci jednorodnego wielomianu kwadratowego[f]. Z drugiej strony dowolny jednorodny wielomian II stopnia V K {\displaystyle V\to K} zadaje we współrzędnych pewnej bazy formę kwadratową na V {\displaystyle V} [g].

Własności

Tw. Forma dwuliniowa jest symetryczna.

Df. Formy kwadratowe nazywa się równoważnymi, jeśli równoważne są odpowiadające im formy dwuliniowe[h].

Df. Przestrzeń ( V , Q ) {\displaystyle (V,Q)} nazywa się przestrzenią kwadratową.

Df. Przestrzenie ( V 1 , Q 1 ) {\displaystyle (V_{1},Q_{1})} i ( V 2 , Q 2 ) {\displaystyle (V_{2},Q_{2})} nazywa się izomorficznymi, jeżeli istnieje taki izomorfizm liniowy A : V 1 V 2 , {\displaystyle \mathrm {A} \colon V_{1}\to V_{2},} że

Q 2 ( A ( x ) ) = Q 1 ( x ) , {\displaystyle Q_{2}(\mathrm {A} (\mathbf {x} ))=Q_{1}(\mathbf {x} ),}
dla wszystkich x V 1 . {\displaystyle \mathbf {x} \in V_{1}.}

Df. Ortogonalną sumą prostą V 1 V 2 {\displaystyle V_{1}\perp V_{2}} przestrzeni ( V 1 , Q 1 ) {\displaystyle (V_{1},Q_{1})} i ( V 2 , Q 2 ) {\displaystyle (V_{2},Q_{2})} nazywa się sumę prostą przestrzeni V 1 V 2 , {\displaystyle V_{1}\oplus V_{2},} w której zdefiniowano formą kwadratową

Q ( x 1 , x 2 ) = Q 1 ( x 1 ) + Q 2 ( x 2 ) . {\displaystyle Q(\mathbf {x} _{1},\mathbf {x} _{2})=Q_{1}(\mathbf {x} _{1})+Q_{2}(\mathbf {x} _{2}).}

Oznaczenie: V n {\displaystyle V^{\perp n}} oznacza n {\displaystyle n} -krotną ortogonalną sumę prostą przestrzeni kwadratowej V {\displaystyle V} ze sobą.

Df. Wektorem izotropowym względem Q {\displaystyle Q} (bądź V {\displaystyle V} ) nazywa się niezerowy wektor x V , {\displaystyle \mathbf {x} \in V,} dla którego

Q ( x ) = 0. {\displaystyle Q(\mathbf {x} )=0.}

Innymi słowy: wektor izotropowy to wektor niezerowy, będący rozwiązaniem równania

B ( x , x ) = 0 , {\displaystyle B(\mathbf {x} ,\mathbf {x} )=0,}
czyli wektor niezerowy, który jest ortogonalny sam do siebie.

Macierze odpowiadające formom

(1) Wybierając bazę w V {\displaystyle V} formie kwadratowej Q {\displaystyle Q} zdefiniowanej na przestrzeni n {\displaystyle n} -wymiarowej, można przypisać macierz A {\displaystyle A} symetryczną n × n {\displaystyle n\times n} w następujący sposób:

Q ( x ) Q ( x 1 , , x n ) = i = 1 n j = 1 n a i j x i x j = x T A x , {\displaystyle Q(\mathbf {x} )\equiv Q(x_{1},\dots ,x_{n})=\sum _{i=1}^{n}\sum _{j=1}^{n}a_{ij}{x_{i}}{x_{j}}=\mathbf {x} ^{\text{T}}A\,\mathbf {x} ,}

gdzie x = [ x 1 , , x n ] {\displaystyle \mathbf {x} =[x_{1},\dots ,x_{n}]} jest dowolnym wektorem o n {\displaystyle n} współrzędnych x 1 , , x n , {\displaystyle x_{1},\dots ,x_{n},} takich że nie wszystkie współrzędne są równe zeru; indeks górny T {\displaystyle ^{\mathrm {T} }} oznacza transpozycję.

Macierz A {\displaystyle A} nazywaną macierzą formy kwadratowej względem ustalonej bazy[i].

(2) Symetrycznej formie dwuliniowej B {\displaystyle B} stowarzyszonej z formą Q {\displaystyle Q} odpowiada identyczna macierz A , {\displaystyle A,} taka że

B ( x , y ) = x T A y . {\displaystyle B(\mathbf {x} ,\mathbf {y} )=\mathbf {x} ^{T}A\,\mathbf {y} .}

(3) Zmiana bazy w V {\displaystyle V} powoduje, że formie Q {\displaystyle Q} przyporządkowana zostaje inna macierz A , {\displaystyle A',} przy czym zachodzi związek

A = C T A C . {\displaystyle A'=C^{T}A\,C.}

gdzie C {\displaystyle C} jest macierzą zamiany bazy.

Df. Macierze danej formy kwadratowej, wyrażone w różnych bazach, nazywa się macierzami przystającymi.

Df. Wyróżnikiem formy kwadratowej Q {\displaystyle Q} reprezentowanej przez macierz A {\displaystyle A} nazywa się liczbę

Δ Q = det A {\displaystyle \Delta _{Q}=\det A} modulo niezerowe kwadraty,

gdzie det A {\displaystyle \det A} wyznacznik macierzy A . {\displaystyle A.}

Df. Formę kwadratową nazywa się niezdegenerowaną (nieosobliwą), gdy jej macierz jest odwracalna, tzn. ma niezerowy wyznacznik.

Diagonalizacja

 Zobacz też: diagonalizacja.

Df. Forma kwadratowa Q ( x ) {\displaystyle Q(\mathbf {x} )} jest w postaci diagonalnej, jeśli zadana jest jako suma kwadratów współrzędnych wektora x , {\displaystyle \mathbf {x} ,} tj.

Q ( x ) Q ( x 1 , , x n ) = a 1 x 1 2 + + a n x n 2 . {\displaystyle Q(\mathbf {x} )\equiv Q(x_{1},\dots ,x_{n})=a_{1}\,x_{1}^{2}+\ldots +a_{n}\,x_{n}^{2}.}

Tw. Forma kwadratowa Q {\displaystyle Q} jest w postaci diagonalnej, jeżeli jej reprezentacja macierzowa jest diagonalna, tzn. wszystkie wyrazy macierzy poza główną przekątną są równe zeru.

Twierdzenie Lagrange’a
Dla każdej formy kwadratowej istnieje baza, w której forma ma postać diagonalną

Tw. Wyznacznik formy kwadratowej w postaci diagonalnej wynosi

a 1 a n mod ( K ) 2 {\displaystyle a_{1}\dots a_{n}{\bmod {(}}K^{*})^{2}} [j]

Konstrukcja bazy ortogonalnej

Konstrukcję bazy ortogonalnej można przeprowadzić w oparciu o własności odpowiadającej jej formy dwuliniowej:

  1. należy rozpocząć od wyboru dowolnego wektora e 1 , {\displaystyle \mathbf {e} _{1},} dla którego Q ( e 1 ) 0 , {\displaystyle Q(\mathbf {e} _{1})\neq 0,}
  2. trzeba wybrać z podprzestrzeni e 1 {\displaystyle \mathbf {e} _{1}^{\perp }} wektor e 2 , {\displaystyle \mathbf {e} _{2},} taki że Q ( e 2 ) 0 ; {\displaystyle Q(\mathbf {e} _{2})\neq 0;} wektory e 1 {\displaystyle \mathbf {e} _{1}} i e 2 {\displaystyle \mathbf {e} _{2}} są ortogonalne i liniowo niezależne,
  3. należy przejść do e 1 e 2 {\displaystyle \mathbf {e} _{1}^{\perp }\cap \mathbf {e} _{2}^{\perp }} i wskazać w niej wektor e 3 , {\displaystyle \mathbf {e} _{3},} taki że Q ( e 3 ) 0 {\displaystyle Q(\mathbf {e} _{3})\neq 0} itd.,
  4. proces kończy się na podprzestrzeni, na której Q {\displaystyle Q} zeruje się tożsamościowo:
    1. jeśli jest to podprzestrzeń zerowa, to wybrane wektory tworzą bazę, w której Q {\displaystyle Q} ma postać diagonalną,
    2. w przeciwnym wypadku bazę diagonalizującą Q {\displaystyle Q} na całej przestrzeni tworzą wybrane wektory oraz dowolna baza otrzymanej podprzestrzeni.

Twierdzenia

Następujące stwierdzenie charakteryzuje formy kwadratowe wprowadzające liczby podwójne. Dla formy kwadratowej Q {\displaystyle Q} określonej na przestrzeni dwuwymiarowej następujące warunki są równoważne:

(a) ma ona postać x 2 y 2 {\displaystyle x^{2}-y^{2}} w pewnej bazie,

(b) jej wyróżnik jest równy 1 , {\displaystyle -1,}

(c) jest ona niezdegenerowana i daje wektory izotropowe.

Klasyfikacja

W tej sekcji Q {\displaystyle Q} będzie niezdegenerowana, zaś K {\displaystyle K} oznaczać będzie liczby rzeczywiste R , {\displaystyle \mathbb {R} ,} liczby zespolone C {\displaystyle \mathbb {C} } lub dowolne ciało skończone F {\displaystyle \mathbb {F} } nieparzystej charakterystyki.

Sygnatura

Twierdzenie[k]
Każda forma kwadratowa na C n {\displaystyle \mathbb {C} ^{n}} jest równoważna z formą diagonalną x 1 2 + + x n 2 . {\displaystyle \mathbf {x} _{1}^{2}+\ldots +\mathbf {x} _{n}^{2}.}

Twierdzenie

Dowolna forma kwadratowa na R n {\displaystyle \mathbb {R} ^{n}} jest równoważna z formą diagonalną postaci
x 1 2 + + x p 2 x p + 1 2 x n 2 , {\displaystyle \mathbf {x} _{1}^{2}+\ldots +\mathbf {x} _{p}^{2}-\mathbf {x} _{p+1}^{2}-\ldots -\mathbf {x} _{n}^{2},}

gdzie: p [ 0 , n ] . {\displaystyle p\in [0,n].}

Jeśli p + q = p + q , {\displaystyle p+q=p'+q',} to formy

, p , q {\displaystyle \langle \cdot ,\cdot \rangle _{p,q}} oraz , p , q {\displaystyle \langle \cdot ,\cdot \rangle _{p',q'}}

są równoważne wtedy i tylko wtedy, gdy

p = p {\displaystyle p=p'} i q = q . {\displaystyle q=q'.}

Wniosek:

Dana forma kwadratowa na R n {\displaystyle \mathbb {R} ^{n}} jest wyznaczona z dokładnością do równoważności przez parę liczb ( p , q ) , {\displaystyle (p,q),} którą można uzyskać z diagonalizacji formy:

p {\displaystyle p} jest liczbą znaków dodatnich,
q = n p {\displaystyle q=n-p} to liczba znaków ujemnych.

Df. Parę liczb ( p , q ) {\displaystyle (p,q)} nazywa się sygnaturą formy kwadratowej.

(czasem sygnaturą nazywa się tylko liczbę p , {\displaystyle p,} gdyż q {\displaystyle q} jest jednoznacznie wyznaczone przy danym n {\displaystyle n} ).

Formy kwadratowe a geometria

Formy kwadratowe wprowadzają na zbiorze R n {\displaystyle \mathbb {R} ^{n}}

– mówimy, że formy kwadratowe generują geometrie pseudoriemannowskie (w szczególnym przypadku formy – geometrię euklidesową). Z tego względu formy kwadratowe mają fundamentalne znaczenie dla geometrii różniczkowej.

Określoność formy

 Zobacz też: określoność formy.

Df. Formę kwadratową Q {\displaystyle Q} na przestrzeni liniowej nad R {\displaystyle \mathbb {R} } nazywa się dodatnio określoną (lub dodatnią), jeżeli Q ( x ) > 0 {\displaystyle Q(\mathbf {x} )>0} i ujemnie określoną (lub ujemną), gdy Q ( x ) < 0 {\displaystyle Q(\mathbf {x} )<0} dla wszystkich x 0 {\displaystyle \mathbf {x} \neq \mathbf {0} } [l]

Tw. Każda dodatnio określona forma na przestrzeni wymiaru n {\displaystyle n} jest równoważna sumie n {\displaystyle n} kwadratów. Podobnie ma się rzecz z formami określonymi ujemnie.

Własności te nie zależą od wyboru współrzędnych w przestrzeni.

Uniwersalność

Jeśli Q {\displaystyle Q} jest określona na przestrzeni V {\displaystyle V} co najmniej trójwymiarowej nad ciałem skończonym K , {\displaystyle K,} to daje ona wektory izotropowe. W ciele dowolnej charakterystyki pociąga to uniwersalność formy Q , {\displaystyle Q,} tzn. Q ( V ) = K {\displaystyle Q(V)=K} [m][n]. Choć stwierdzenie o istnieniu wektorów izotropowych w dowolnych przestrzeniach wymiaru 2 nie jest prawdziwe, to prawdą jest, iż dowolna forma na przestrzeni dwuwymiarowej nad ciałem skończonym jest uniwersalna[o].

Twierdzenie
Niech c K {\displaystyle c\in K^{*}} będzie niekwadratem. Dowolna forma kwadratowa na przestrzeni liniowej wymiaru n 1 {\displaystyle n\geqslant 1} nad ciałem skończonym K {\displaystyle K} jest równoważna z dokładnie jedną formą na K n , {\displaystyle K^{n},} mianowicie: x 1 2 + + x n 2 {\displaystyle x_{1}^{2}+\ldots +x_{n}^{2}} lub
x 1 2 + + x n 1 2 + c x n 2 . {\displaystyle x_{1}^{2}+\ldots +x_{n-1}^{2}+cx_{n}^{2}.}

W szczególności wymiar i wyróżnik wyznaczają formę nad ciałem skończonym w sposób jednoznaczny z dokładnością do równoważności.

Reguła równoległoboku i polaryzacja

Tw. 1 Dla dowolnej formy kwadratowej Q {\displaystyle Q} zachodzi wzór nazywany regułą równoległoboku[p]

Q ( x + y ) + Q ( x y ) = 2 ( Q ( x ) + Q ( y ) ) . {\displaystyle Q(\mathbf {x} +\mathbf {y} )+Q(\mathbf {x} -\mathbf {y} )=2{\big (}Q(\mathbf {x} )+Q(\mathbf {y} ){\big )}.}

Tw. 2 Podobny wzór

Q ( x + y ) Q ( x y ) = 4 B ( x , y ) {\displaystyle Q(\mathbf {x} +\mathbf {y} )-Q(\mathbf {x} -\mathbf {y} )=4B(\mathbf {x} ,\mathbf {y} )}

znany również jako tożsamość polaryzacyjna, wyraża formę dwuliniową B {\displaystyle B} za pomocą formy kwadratowej Q , {\displaystyle Q,} jednak w inny sposób niż podany w definicji.

Być może oba powyższe wzory mogą posłużyć do zdefiniowania formy kwadratowej? Zagadnieniem tym zajęli się John von Neumann i Pascual Jordan, którzy dowiedli

Tw. 3 (Jordana-von Neumanna)

Założenia:

(1) Q : V K {\displaystyle Q\colon V\to K} spełnia tożsamość

Q ( x + y ) + Q ( x y ) = 2 Q ( x ) + 2 Q ( y ) . {\displaystyle Q(\mathbf {x} +\mathbf {y} )+Q(\mathbf {x} -\mathbf {y} )=2Q(\mathbf {x} )+2Q(\mathbf {y} ).}

(2) B : V × V K {\displaystyle B\colon V\times V\to K} jest określona wzorem

4 B ( x , y ) = Q ( x + y ) Q ( x y ) . {\displaystyle 4B(\mathbf {x} ,\mathbf {y} )=Q(\mathbf {x} +\mathbf {y} )-Q(\mathbf {x} -\mathbf {y} ).}

Teza:

B {\displaystyle B} jest symetryczna, dwuaddytywna oraz
B ( x , x ) = Q ( x ) . {\displaystyle B(\mathbf {x} ,\mathbf {x} )=Q(\mathbf {x} ).}

Dwuaddytywność pociąga Z {\displaystyle \mathbb {Z} } -dwuliniowość. Stąd B {\displaystyle B} z powyższego twierdzenia jest Q {\displaystyle \mathbb {Q} } -dwuliniowa, jeśli K {\displaystyle K} jest charakterystyki zero lub F {\displaystyle \mathbb {F} } -dwuliniowa, jeśli K {\displaystyle K} jest charakterystyki p . {\displaystyle p.} Oznacza to, że jeśli K = Q {\displaystyle K=\mathbb {Q} } lub F , {\displaystyle \mathbb {F} ,} to forma Q {\displaystyle Q} jest kwadratowa. Jeżeli K = R , {\displaystyle K=\mathbb {R} ,} to forma Q {\displaystyle Q} jest kwadratowa, o ile V {\displaystyle V} jest skończonego wymiaru (bądź ogólniej: zupełna), przy dodatkowym założeniu, że Q {\displaystyle Q} jest ciągła (co pociąga ciągłość B , {\displaystyle B,} a stąd jej R {\displaystyle \mathbb {R} } -dwuliniowość).

Przy oznaczeniach = Q ( ) {\displaystyle \|\cdot \|=Q(\cdot )} oraz , = B ( , ) {\displaystyle \langle \cdot ,\cdot \rangle =B(\cdot ,\cdot )} i przyjęciu K = R , C {\displaystyle K=\mathbb {R} ,\mathbb {C} } powyższe twierdzenie mówi, że:

Ciała charakterystyki 2

O ile nie zaznaczono inaczej, niżej przestrzenie liniowe określone są nad ustalonym ciałem K {\displaystyle K} charakterystyki 2.

Niech V {\displaystyle V} będzie przestrzenią liniową. Przekształcenie Q : V K {\displaystyle Q\colon V\to K} nazywa się formą kwadratową albo funkcjonałem kwadratowym na V , {\displaystyle V,} jeżeli:

  • jest jednorodne II stopnia,
    Q ( c x ) = c 2 Q ( x ) , {\displaystyle Q(c\mathbf {x} )=c^{2}Q(\mathbf {x} ),}
  • następująca funkcja jest dwuliniowa:
    B ( x , y ) = Q ( x + y ) Q ( x ) Q ( y ) . {\displaystyle B(\mathbf {x} ,\mathbf {y} )=Q(\mathbf {x} +\mathbf {y} )-Q(\mathbf {x} )-Q(\mathbf {y} ).}

Definicja we współrzędnych nie ulega zmianie: forma kwadratowa to jednorodna, kwadratowa funkcja wielomianowa. Podobnie definiuje się pozostałe pojęcia i dowodzi równoważności definicji abstrakcyjnej i z ustaloną bazą. Zasadniczą różnicą jest postać macierzowa: macierz N {\displaystyle \mathbf {N} } formy kwadratowej Q {\displaystyle Q} jest górnotrójkątna, nie zaś symetryczna; macierz B = N + N T {\displaystyle \mathbf {B} =\mathbf {N} +\mathbf {N} ^{\mathrm {T} }} odpowiadającej jej formy dwuliniowej B {\displaystyle B} jest z kolei symetryczna z zerami na przekątnej głównej[q]. Niekiedy powyższą definicję stosuje się dla ciał dowolnej charakterystyki[r], jednak przyjęcie jej sprawia, iż forma dwuliniowa stowarzyszona z formą kwadratową wyrażającą się sumą kwadratów nie daje standardowego iloczynu skalarnego, lecz jego dwukrotność.

Jest B = 0 {\displaystyle B=0} wtedy i tylko wtedy, gdy wszystkie elementy macierzy B {\displaystyle \mathbf {B} } spoza przekątnej głównej znikają (równoważnie: B = 0 {\displaystyle B=0} wtedy i tylko wtedy, gdy Q {\displaystyle Q} jest diagonalizowalna w pewnej bazie). Gdy charakterystyka nie jest równa 2, wyrazy spoza przekątnej dowolnej formy kwadratowej zerują się w odpowiedniej bazie, jednakże wyrazy spoza przekątnej głównej w Q {\displaystyle Q} potrzebne w ciele charakterystyki 2, gdy stowarzyszona z nią symetryczna forma dwuliniowa nie jest zerowa. Z definicji dowolna forma kwadratowa (w ciele charakterystyki 2) ma powiązaną symetryczną formę dwuliniową, choć odpowiedniość między formami kwadratowymi a symetrycznymi formami dwuliniowymi nie jest iniektywna, ani surjektywna: różne formy kwadratowe (np. ( x , y ) x 1 2 + x 1 x 2 {\displaystyle (\mathbf {x} ,\mathbf {y} )\mapsto x_{1}^{2}+x_{1}x_{2}} oraz ( x , y ) x 1 x 2 {\displaystyle (\mathbf {x} ,\mathbf {y} )\mapsto x_{1}x_{2}} ) mogą mieć tę samą symetryczną formę dwuliniową, a pewne symetryczne formy dwuliniowe (np. ( x , y ) x 1 y 1 + x 2 y 2 {\displaystyle (\mathbf {x} ,\mathbf {y} )\mapsto x_{1}y_{1}+x_{2}y_{2}} ) nie są formami dwuliniowymi jakichkolwiek form kwadratowych. W języku macierzy każda forma kwadratowa w ciele charakterystyki różnej od 2 może być zapisana jako X M X , {\displaystyle \mathbf {X} \cdot \mathbf {MX} ,} gdzie M {\displaystyle \mathbf {M} } jest pewną macierzą symetryczną, nie jest to jednak prawda w ciele charakterystyki 2. Forma kwadratowa przedstawiona w baie z wyrazami poza przekątną nie jest reprezentowana przez macierz symetryczną w jakiekolwiek bazie. Jednakże odpowiadająca jej forma dwuliniowa jest zawsze reprezentowana za pomocą macierzy symetrycznej (zob. wyżej). Dlatego nie wolno mylić macierzy N {\displaystyle \mathbf {N} } formy kwadratowej w ciele charakterystyki 2 z macierzą postaci B {\displaystyle \mathbf {B} } jej formy dwuliniowej.

Kluczową obserwacją jest to, że symetryczna forma dwuliniowa stowarzyszona z formą kwadratową w ciele charakterystyki 2 jest alternująca:

B ( x , x ) = Q ( 2 x ) 2 Q ( x ) = Q ( 0 ) 0 = 0. {\displaystyle B(\mathbf {x} ,\mathbf {x} )=Q(2\mathbf {x} )-2Q(\mathbf {x} )=Q(\mathbf {0} )-0=0.}

W ciele charakterystyki innej niż 2 można odzyskać Q {\displaystyle Q} z B , {\displaystyle B,} gdyż B ( x , x ) = Q ( x ) , {\displaystyle B(\mathbf {x} ,\mathbf {x} )=Q(\mathbf {x} ),} ale dla charakterystyki 2 jest B ( x , x ) = 0. {\displaystyle B(\mathbf {x} ,\mathbf {x} )=0.} Ponieważ dowolna alternująca forma dwuliniowa jest symetryczna w ciele charakterystyki 2, to o odpowiedniości z Q {\displaystyle Q} do B {\displaystyle B} w ciele charakterystyki 2 należy myśleć jako o przekształceniu form kwadratowych w alternujące (a nie tylko symetryczna) formy dwuliniowe. Wówczas jest ono surjektywne, ale nadal nigdy nie jest iniektywne, tzn. nie istnieje żaden odpowiednik polaryzacji dla charakterystyki 2, a więc sama wiedza o B {\displaystyle B} nie wystarcza do odzyskania informacji o Q . {\displaystyle Q.} Zatem choć w ciele charakterystyki różnej od 2 pewne pojęcia można wyrazić równie dobrze w języku form kwadratowych bądź symetrycznych form kwadratowych, to w ciele charakterystyki 2 ich wyrażenie w obu tych językach może być niemożliwe.

Zobacz też

Typy form

Własności

Przykłady form w geometrii

Uwagi

  1. Tradycja zapoczątkowana przez Gaussa każe używać parzystych współczynników przy iloczynach różnych zmiennych, tj. w postaci 2 b {\displaystyle 2b} zamiast b {\displaystyle b} w formach binarnych oraz 2 d ,   2 e ,   2 f {\displaystyle 2d,\ 2e,\ 2f} zamiast d ,   e ,   f {\displaystyle d,\ e,\ f} w formach ternarnych. Obie konwencje są stosowane w literaturze.
  2. Babylonian Pythagoras.
  3. Brahmagupta biography.
  4. Niektórzy autorzy terminy „forma” i „funkcjonał” bądź traktują synonimicznie, bądź stosują tylko jeden z nich, np. Komorowski (s. 104) i Więsław (s. 217) używają jedynie określenia „forma kwadratowa”, podając definicję odwzorowania przestrzeni liniowej w ciało skalarów. Inni, np. Gleichgewicht (s. 179–180) czy Newelski (rozdz. 14), odróżniają „funkcjonał” (przekształcenie, funkcja wielomianowa, przedstawienie niezależne od współrzędnych) od „formy” (wyrażenie formalne, wielomian, przedstawienie w bazie). W tym podejściu „forma kwadratowa” jest przedstawieniem „funkcjonału kwadratowego” w ustalonej bazie, co wyjaśniono w definicji; w tym artykule nie stosuje się tej konwencji.
  5. Poniższy warunek można przedstawić w dogodniejszej postaci Q ( x + y ) = Q ( x ) + Q ( y ) + 2 B ( x , y ) ; {\displaystyle Q(\mathbf {x} +\mathbf {y} )=Q(\mathbf {x} )+Q(\mathbf {y} )+2B(\mathbf {x} ,\mathbf {y} );} w szczególności B ( x , y ) = 0 {\displaystyle B(\mathbf {x} ,\mathbf {y} )=0} jest równoważne Q ( x + y ) = Q ( x ) + Q ( y ) , {\displaystyle Q(\mathbf {x} +\mathbf {y} )=Q(\mathbf {x} )+Q(\mathbf {y} ),} co czyni z Q {\displaystyle Q} funkcję addytywną tej przestrzeni liniowej.
  6. Indukcja po liczbie wyrazów daje Q ( x 1 + + x k ) = i = 1 k Q ( x i ) + 2 i < j B ( x i , x j ) {\displaystyle Q(\mathbf {x} _{1}+\ldots +\mathbf {x} _{k})=\sum _{i=1}^{k}Q(\mathbf {x} _{i})+2\sum _{i<j}B(\mathbf {x} _{i},\mathbf {x} _{j})} dla dowolnego k 2 {\displaystyle k\geqslant 2} i wektorów x i V . {\displaystyle x_{i}\in V.} Stąd jeżeli { e 1 , , e n } {\displaystyle \{\mathbf {e} _{1},\dots ,\mathbf {e} _{n}\}} jest bazą tej przestrzeni, to Q ( x 1 e 1 + + x n e n ) = i = 1 n q i x i 2 + i < j q i j x i x j , {\displaystyle Q(x_{1}\mathbf {e} _{1}+\ldots +x_{n}\mathbf {e} _{n})=\sum _{i=1}^{n}q_{i}x_{i}^{2}+\sum _{i<j}q_{ij}x_{i}x_{j},} gdzie q i = Q ( e i ) {\displaystyle q_{i}=Q(\mathbf {e} _{i})} oraz q i j = 2 B ( e i , e j ) . {\displaystyle q_{ij}=2B(\mathbf {e} _{i},\mathbf {e} _{j}).}
  7. Jeśli Q ( x 1 e 1 + + x n e n ) {\displaystyle Q(x_{1}\mathbf {e} _{1}+\ldots +x_{n}\mathbf {e} _{n})} jest postaci wielomianowej jak wyżej, to natychmiast otrzymuje się pierwszą część definicji, Q ( c x ) = c 2 Q ( x ) {\displaystyle Q(c\mathbf {x} )=c^{2}Q(\mathbf {x} )} dla dowolnego c K , {\displaystyle c\in K,} z kolei dla x = x 1 e 1 + + x n e n {\displaystyle \mathbf {x} =x_{1}\mathbf {e} _{1}+\ldots +x_{n}\mathbf {e} _{n}} oraz y = y 1 e 1 + + y n e n {\displaystyle \mathbf {y} =y_{1}\mathbf {e} _{1}+\ldots +y_{n}\mathbf {e} _{n}} uzyskuje się drugą, B ( x , y ) = 1 2 ( Q ( x + y ) Q ( x ) Q ( y ) ) = i = 1 n q i x i y i + 1 2 1 i < j n q i j ( x i y j + y i x j ) , {\displaystyle B(\mathbf {x} ,\mathbf {y} )={\frac {1}{2}}(Q(\mathbf {x} +\mathbf {y} )-Q(\mathbf {x} )-Q(\mathbf {y} ))=\sum _{i=1}^{n}q_{i}x_{i}y_{i}+{\frac {1}{2}}\sum _{1\leqslant i<j\leqslant n}q_{ij}(x_{i}y_{j}+y_{i}x_{j}),} przy oznaczeniach q i = Q ( e i ) {\displaystyle q_{i}=Q(\mathbf {e} _{i})} oraz q i j = 2 B ( e i , e j ) . {\displaystyle q_{ij}=2B(\mathbf {e} _{i},\mathbf {e} _{j}).} W notacji macierzowej wzór ten można wyrazić jako x A y , {\displaystyle \mathbf {x} \,A\,\mathbf {y} ,} gdzie kropka oznacza standardowy iloczyn skalarny przestrzeni współrzędnych K n , {\displaystyle K^{n},} zaś x = [ x 1     x n ] , {\displaystyle \mathbf {x} =[x_{1}\ \dots \ x_{n}],} y = [ y 1     y n ] T {\displaystyle \mathbf {y} =[y_{1}\ \dots \ y_{n}]^{\mathrm {T} }} oraz
    A = [ q 1 1 2 q 12 1 2 q 1 n 1 2 q 12 q 2 1 2 q 2 n 1 2 q 1 n 1 2 q 2 n q n ] {\displaystyle A=\left[{\begin{smallmatrix}q_{1}&{\frac {1}{2}}q_{12}&\dots &{\frac {1}{2}}q_{1n}\\{\frac {1}{2}}q_{12}&q_{2}&\dots &{\frac {1}{2}}q_{2n}\\\vdots &\vdots &\ddots &\vdots \\{\frac {1}{2}}q_{1n}&{\frac {1}{2}}q_{2n}&\dots &q_{n}\end{smallmatrix}}\right]}
    jest macierzą formy dwuliniowej na V , {\displaystyle V,} co czyni zadość definicji formy kwadratowej.
  8. Na mocy tożsamości polaryzacyjnej.
  9. Wynika to wprost z zapisania Q {\displaystyle Q} w postaci wielomianowej z macierzą M {\displaystyle \mathbf {M} } o postaci jak w przypisie wyżej.
  10. Niech { e 1 , , e n } {\displaystyle \{\mathbf {e} _{1},\dots ,\mathbf {e} _{n}\}} będzie bazą ortogonalną stowarzyszonej z Q {\displaystyle Q} symetrycznej formy dwuliniowej B {\displaystyle B} (istnieje zawsze dla ciał charakterystyki różnej od 2); w bazie tej wyrazy mieszane znikają, a więc Q {\displaystyle Q} jest w postaci diagonalnej; macierz A {\displaystyle A} jest wówczas diagonalna, a więc jej wyróżnik jest wymaganej postaci.
  11. Twierdzenie to można uogólnić na zdegenerowane formy kwadratowe – nazywa się je wtedy twierdzeniem Sylvestera-Jacobiego o bezwładności form kwadratowych.
  12. Niezdegenerowane formy kwadratowe, które nie są ani dodatnio, ani ujemnie określone, nazywa się nieokreślonymi. Rozpatruje się także nierówności nieostre: mówi się wtedy o formach określonych niedodatnio i nieujemnie (bądź półokreślonych dodatnio i ujemnie).
  13. Niech x 0 {\displaystyle \mathbf {x} \neq \mathbf {0} } będzie wektorem, dla którego Q ( x ) = 0 ; {\displaystyle Q(\mathbf {x} )=0;} ponieważ Q ( c x ) = c 2 Q ( x ) = 0 , {\displaystyle Q(c\mathbf {x} )=c^{2}Q(\mathbf {x} )=0,} a Q 0 {\displaystyle Q\not \equiv 0} (z niezdegenerowania), to dim V 2 ; {\displaystyle \dim V\geqslant 2;} z niezdegenerowania formy istnieje y V , {\displaystyle \mathbf {y} \in V,} dla którego stowarzyszona forma dwuliniowa B ( x , y ) 0. {\displaystyle B(\mathbf {x} ,\mathbf {y} )\neq 0.} Wówczas dla dowolnego c K {\displaystyle c\in K} zachodzi Q ( c x + y ) = Q ( c x ) + Q ( y ) + 2 B ( c x , y ) = Q ( y ) + 2 B ( x , y ) c , {\displaystyle Q(c\mathbf {x} +\mathbf {y} )=Q(c\mathbf {x} )+Q(\mathbf {y} )+2B(c\mathbf {x} ,\mathbf {y} )=Q(\mathbf {y} )+2B(\mathbf {x} ,\mathbf {y} )c,} czyli jest to funkcja liniowa zmiennej c , {\displaystyle c,} która przyjmuje wszystkie wartości z K . {\displaystyle K.}
  14. Twierdzenie jest fałszywe, gdy Q {\displaystyle Q} jest zdegenerowana, np. Q ( x , y ) = x 2 {\displaystyle Q(x,y)=x^{2}} na R 2 , {\displaystyle \mathbb {R} ^{2},} gdzie Q ( 0 , 1 ) = 0. {\displaystyle Q(0,1)=0.}
  15. Po przedstawieniu formy w postaci diagonalnej wystarczy dowieść, iż wielomian postaci a x 2 + b y 2 {\displaystyle ax^{2}+by^{2}} przyjmuje wszystkie wartości z K {\displaystyle K} dla a , b K ; {\displaystyle a,b\in K^{*};} otóż forma x 2 c y 2 , {\displaystyle x^{2}-cy^{2},} gdzie c K {\displaystyle c\in K^{*}} jest niekwadratem, przyjmuje zero wyłącznie dla x = y = 0 , {\displaystyle x=y=0,} co dowodzi różnowartościowości tej funkcji liniowej zmiennej c . {\displaystyle c.} Wynik ten tłumaczy też dlaczego ograniczenie dim V 3 {\displaystyle \dim V\geqslant 3} w pierwszym twierdzeniu jest ostre.
  16. Wzór ten łatwo wyprowadzić z alternatywnej postaci drugiego wzoru definiującego: wystarczy dodać go do siebie, przy czym jeden z nich z podstawieniem y = y . {\displaystyle \mathbf {y} =-\mathbf {y} .} Odjęcie ze wspomnianym podstawieniem daje kolejny.
  17. Formalnie jest to macierz M {\displaystyle \mathbf {M} } pomnożona przez 2.
  18. Wówczas związek między formą kwadratową Q {\displaystyle Q} a odpowiadającą jej symetryczną formą dwuliniową wyraża się wzorem B ( x , x ) = 2 Q ( x ) . {\displaystyle B(\mathbf {x} ,\mathbf {x} )=2Q(\mathbf {x} ).}

Przypisy

  1. Forma kwadratowa, [w:] Encyklopedia PWN [dostęp 2021-07-24] .

Bibliografia

  • H. Guściora, M. Sadowski, Repetytorium z algebry liniowej, Państwowe Wydawnictwo Naukowe, Warszawa 1979, s. 123–138.
  • T. Trajdos, Matematyka dla inżynierów, PWN, Warszawa 1974, s. 73–77.
  • Więsław, Witold: Algebra geometryczna. Skrypt dla studentów matematyki. Wydawnictwa Uniwersytetu Wrocławskiego, Wrocław 1974.
  • Komorowski, Jacek: Od liczb zespolonych do tensorów, spinorów, algebr Liego i kwadryk, Państwowe Wydawnictwo Naukowe, Warszawa 1978.
  • Gleichgewicht, Bolesław: Algebra. Podręcznik dla kierunków nauczycielskich studiów matematycznych, Państwowe Wydawnictwo Naukowe, Warszawa 1983. Wydanie III. ISBN 83-01-03903-5.
  • Newelski, Ludomir: Algebra liniowa II, Rozdział 14. W przygotowaniu.

Linki zewnętrzne

  • Eric W.E.W. Weisstein Eric W.E.W., Quadratic Form, [w:] MathWorld, Wolfram Research  (ang.). [dostęp 2024-03-07].
  • Encyklopedia Mathematica (j. ang.)
  • p
  • d
  • e
typy
pojęcia podstawowe
opis algebraiczny
wszystkich stożkowych
okręgów i elips
hiperbol
opis parametryczny
okręgów i elips
hiperbol
występowanie
powiązane powierzchnie
nawiązujące pojęcia
uogólnienia
badacze
Kontrola autorytatywna (homogeneous polynomial):
  • LCCN: sh85050828
  • GND: 4128297-8
  • NDL: 00568586
  • BnF: 11935832h
  • BNCF: 67334
  • NKC: ph520062
  • J9U: 987007545854605171
  • LNB: 000140089
  • PWN: 3929539
  • Universalis: formes-quadratiques