Faltung (Mathematik)

Dieser Artikel behandelt die Faltung in der allgemeinen Analysis. Zur Faltung zahlentheoretischer Funktionen siehe Zahlentheoretische Funktion #Faltung, zur Faltung von Wahrscheinlichkeitsmaßen Faltung (Stochastik).

In der Analysis, einem Teilbereich der Mathematik, beschreibt die Faltung, auch Konvolution (von lateinisch convolvere „zusammenrollen“), einen mathematischen Operator, der für zwei Funktionen f {\displaystyle f} und g {\displaystyle g} eine dritte Funktion f g {\displaystyle f\ast g} liefert.

Anschaulich bedeutet die Faltung f g {\displaystyle f\ast g} , dass jeder Wert von f {\displaystyle f} durch das mit g {\displaystyle g} gewichtete Mittel der ihn umgebenden Werte ersetzt wird. Genauer wird für den Mittelwert ( f g ) ( x ) {\displaystyle (f\ast g)(x)} der Funktionswert f ( τ ) {\displaystyle f(\tau )} mit g ( x τ ) {\displaystyle g(x-\tau )} gewichtet. Die resultierende „Überlagerung“ zwischen f {\displaystyle f} und gespiegelten und verschobenen Versionen von g {\displaystyle g} (man spricht auch von einer „Verschmierung“ von f {\displaystyle f} ) kann z. B. verwendet werden, um einen gleitenden Durchschnitt zu bilden.

Die Kreuzkorrelationsfunktion ist identisch mit der komplex konjugierten Faltung f ( τ ) ¯ {\displaystyle {\overline {f(-\tau )}}} . Insbesondere im Fachgebiet Maschinelles Lernen, wo man mit Convolutional Neural Networks arbeitet, wird aufgrund dieser Identität meistens die Kreuzkorrelation verwendet, diese aber als Faltung bezeichnet, weil sie leichter zu implementieren ist.[1]

Definition

Faltung für Funktionen auf Rn

Die Faltung f g {\displaystyle f\ast g} zweier Funktionen f , g : R n C {\displaystyle f,g\colon \mathbb {R} ^{n}\to \mathbb {C} } ist definiert durch

( f g ) ( x ) := R n f ( τ ) g ( x τ ) d τ . {\displaystyle (f*g)(x):=\int \limits _{\mathbb {R} ^{n}}f(\tau )g(x-\tau )\mathrm {d} \tau .}

Um die Definition möglichst allgemein zu halten, schränkt man den Raum der zulässigen Funktionen zunächst nicht ein und fordert stattdessen, dass das Integral für fast alle Werte von x {\displaystyle x} wohldefiniert ist. Eine äquivalente Definition ergibt sich durch die Kommutativität der Faltung.

Im Fall f , g L 1 ( R n ) {\displaystyle f,g\in {\mathcal {L}}^{1}(\mathbb {R} ^{n})} , also für zwei integrierbare Funktionen (insbesondere bedeutet das, dass das uneigentliche Betragsintegral endlich ist), kann man zeigen, dass diese Voraussetzung immer erfüllt ist, siehe Satz von Fubini.[2]

Faltung periodischer Funktionen

Für periodische Funktionen f {\displaystyle f} und g {\displaystyle g} einer reellen Variablen mit Periode T > 0 {\displaystyle T>0} definiert man die Faltung als

( f g ) ( t ) = 1 T a a + T f ( τ ) g ( t τ ) d τ {\displaystyle (f\ast g)(t)={\frac {1}{T}}\int \limits _{a}^{a+T}f(\tau )g(t-\tau )\mathrm {d} \tau } ,

wobei sich die Integration über ein beliebiges Intervall mit Periodenlänge T {\displaystyle T} erstreckt. Es ist f g {\displaystyle f\ast g} wiederum eine periodische Funktion mit Periode T {\displaystyle T} .

Faltung für Funktionen auf Intervallen

Im Fall eines beschränkten Definitionsbereichs D {\displaystyle \mathbb {D} } setzt man f {\displaystyle f} und g {\displaystyle g} auf den gesamten Raum fort, um die Faltung ausführen zu können. Hierzu gibt es je nach Anwendung mehrere Ansätze.

Fortsetzung durch Null
Man setzt die Funktionen per Definition außerhalb des Definitionsbereiches durch die Nullfunktion fort: f | R n D 0 {\displaystyle f{\Big |}_{\mathbb {R} ^{n}\setminus \mathbb {D} }\equiv 0} .
Periodische Fortsetzung
Man setzt die Funktionen außerhalb des Definitionsbereiches periodisch fort und verwendet die für periodische Funktionen definierte Faltung.

Im Allgemeinen ist die Faltung für derart fortgesetzte Funktionen nicht mehr wohldefiniert. Eine oft auftretende Ausnahme bilden stetige Funktionen mit kompaktem Träger f C c ( D ) L 1 ( D ) {\displaystyle f\in C_{c}(\mathbb {D} )\cap {\mathcal {L}}^{1}(\mathbb {D} )} , die durch Null zu einer integrierbaren Funktion in L 1 ( R n ) {\displaystyle {\mathcal {L}}^{1}(\mathbb {R} ^{n})} fortsetzbar sind.

Bedeutung

Faltung der Rechteckfunktion mit sich selbst ergibt die Dreiecksfunktion.

Eine anschauliche Deutung der eindimensionalen Faltung ist die Gewichtung einer von der Zeit abhängigen Funktion mit einer anderen. Der Funktionswert der Gewichtsfunktion f {\displaystyle f} an einer Stelle τ {\displaystyle \tau } gibt an, wie stark der um τ {\displaystyle \tau } zurückliegende Wert der gewichteten Funktion, also g ( t τ ) {\displaystyle g(t-\tau )} , in den Wert der Ergebnisfunktion zum Zeitpunkt t {\displaystyle t} eingeht.

Die Faltung ist ein geeignetes Modell zur Beschreibung zahlreicher physikalischer Vorgänge.

Glättungskern

Faltung mit der Gauß-Funktion.

Eine Methode, eine Funktion f {\displaystyle f} zu „glätten“, besteht darin, sie mit einem so genannten Glättungskern j {\displaystyle j} zu falten. Die entstehende Funktion F = j f {\displaystyle F=j*f} ist glatt (unendlich oft stetig differenzierbar), ihr Träger ist nur etwas größer als der von f {\displaystyle f} , und die Abweichung in der L1-Norm lässt sich durch eine vorgegebene positive Konstante beschränken.

Ein d {\displaystyle d} -dimensionaler Glättungskern oder Mollifier ist eine unendlich oft stetig differenzierbare Funktion j : R d R 0 {\displaystyle j\colon \mathbb {R} ^{d}\to \mathbb {R} _{\geq 0}} , die nichtnegativ ist, ihren Träger in der abgeschlossenen Einheitskugel B ( 0 , 1 ) {\displaystyle B(0,1)} hat und das Integral 1, durch entsprechende Wahl einer Konstanten c {\displaystyle c} , besitzt.

Ein Beispiel ist der Glättungskern

j ( x ) = { c exp ( 1 1 | x | 2 ) , | x | < 1 0 , sonst. {\displaystyle j(x)={\begin{cases}c\cdot \exp \!\left(-{\frac {1}{1-|x|^{2}}}\right),&|x|<1\\0,&{\text{sonst.}}\end{cases}}}

wobei c = [ B ( 0 , 1 ) exp ( 1 1 | x | 2 ) d x ] 1 < {\displaystyle c=\left[\int \limits _{B(0,1)}\exp \!\left(-{\frac {1}{1-|x|^{2}}}\right)dx\right]^{-1}<\infty } eine Normierungskonstante ist.

Aus dieser Funktion kann man weitere Glättungskerne bilden, indem man für e ( 0 , 1 ] {\displaystyle e\in (0,1]} setzt:

j e ( x ) = 1 e d j ( x e ) , {\displaystyle j_{e}(x)={\frac {1}{e^{d}}}\cdot j\left({\frac {x}{e}}\right),} wobei j e ( x ) = 0 {\displaystyle j_{e}(x)=0} für | x | > e {\displaystyle |x|>e} .

Die sich ergebenden Glättungskerne für e = 1 {\displaystyle e=1} und e = 1 2 {\displaystyle e={\tfrac {1}{2}}} sind im Folgenden dargestellt:

Glättungskerne j und j½
Glättungskerne j und j½

Beispiele

Rechteckfunktion

Sei

f : R R , x { 1 1 x 2 0 s o n s t {\displaystyle f\colon \mathbb {R} \to \mathbb {R} ,\;x\mapsto {\begin{cases}1&-1\leq x\leq 2\\0&\mathrm {sonst} \end{cases}}} .

Durch Faltung von f {\displaystyle f} (rot dargestellt) mit dem Glättungskern j 1 / 2 {\displaystyle j_{1/2}} entsteht eine glatte Funktion F = f j 1 / 2 {\displaystyle F=f*j_{1/2}} (blau dargestellt) mit kompaktem Träger, die von f in der L1-Norm um etwa 0,4 abweicht, d. h.

R | F ( t ) f ( t ) | d t < 0 , 4 {\displaystyle \int \limits _{\mathbb {R} }|F(t)-f(t)|\mathrm {d} t<0{,}4} .

Glaettung durch Faltung

Bei der Faltung mit j e {\displaystyle j_{e}} für e kleiner 1/2 erhält man glatte Funktionen, die in der Integralnorm noch dichter bei f liegen.

Normalverteilung

Wird eine Normalverteilung mit dem Mittelwert μ 1 {\displaystyle \mu _{1}} und der Standardabweichung σ 1 {\displaystyle \sigma _{1}} gefaltet mit einer zweiten Normalverteilung mit den Parametern μ 2 {\displaystyle \mu _{2}} und σ 2 {\displaystyle \sigma _{2}} , so ergibt sich wieder eine Normalverteilung mit dem Mittelwert μ = μ 1 + μ 2 {\displaystyle \mu =\mu _{1}+\mu _{2}} und der Standardabweichung σ = σ 1 2 + σ 2 2 {\displaystyle \sigma ={\sqrt {\sigma _{1}^{2}+\sigma _{2}^{2}}}} .

Beweis
1 2 π σ 1 e ( ξ μ 1 ) 2 2 σ 1 2 1 2 π σ 2 e ( x ξ μ 2 ) 2 2 σ 2 2 d ξ {\displaystyle \int \limits _{-\infty }^{\infty }{\frac {1}{{\sqrt {2\pi }}\sigma _{1}}}e^{-{\frac {(\mathbf {\xi } -\mu _{1})^{2}}{2\sigma _{1}^{2}}}}\cdot {\frac {1}{{\sqrt {2\pi }}\sigma _{2}}}e^{-{\frac {(x-\mathbf {\xi } -\mu _{2})^{2}}{2\sigma _{2}^{2}}}}\mathbf {\mathrm {d} \xi } } = 1 2 π σ 1 σ 2 e ξ 2 + μ 1 2 2 ξ μ 1 2 σ 1 2 ξ 2 + ( x μ 2 ) 2 2 ξ ( x μ 2 ) 2 σ 2 2 d ξ {\displaystyle ={\frac {1}{2\pi \sigma _{1}\sigma _{2}}}\int \limits _{-\infty }^{\infty }e^{-{\frac {\mathbf {\xi } ^{2}+\mu _{1}^{2}-2\mathbf {\xi } \mu _{1}}{2\sigma _{1}^{2}}}-{\frac {\mathbf {\xi } ^{2}+(x-\mu _{2})^{2}-2\mathbf {\xi } (x-\mu _{2})}{2\sigma _{2}^{2}}}}\mathbf {\mathrm {d} \xi } }

= 1 2 π σ 1 σ 2 e μ 1 2 2 σ 1 2 ( x μ 2 ) 2 2 σ 2 2 e ξ 2 σ 2 2 2 ξ μ 1 σ 2 2 + ξ 2 σ 1 2 2 ξ ( x μ 2 ) σ 1 2 2 σ 1 2 σ 2 2 d ξ {\displaystyle ={\frac {1}{2\pi \sigma _{1}\sigma _{2}}}e^{-{\frac {\mu _{1}^{2}}{2\sigma _{1}^{2}}}-{\frac {(x-\mu _{2})^{2}}{2\sigma _{2}^{2}}}}\int \limits _{-\infty }^{\infty }e^{-{\frac {\mathbf {\xi } ^{2}\sigma _{2}^{2}-2\mathbf {\xi } \mu _{1}\sigma _{2}^{2}+\mathbf {\xi } ^{2}\sigma _{1}^{2}-2\mathbf {\xi } (x-\mu _{2})\sigma _{1}^{2}}{2\sigma _{1}^{2}\sigma _{2}^{2}}}}\mathbf {\mathrm {d} \xi } } = 1 2 π σ 1 σ 2 e μ 1 2 σ 2 2 + ( x μ 2 ) 2 σ 1 2 2 σ 1 2 σ 2 2 e σ 1 2 + σ 2 2 2 σ 1 2 σ 2 2 [ ( ξ μ 1 σ 2 2 + ( x μ 2 ) σ 1 2 σ 1 2 + σ 2 2 ) 2 ( μ 1 σ 2 2 + ( x μ 2 ) σ 1 2 σ 1 2 + σ 2 2 ) 2 ] d ξ {\displaystyle ={\frac {1}{2\pi \sigma _{1}\sigma _{2}}}e^{-{\frac {\mu _{1}^{2}\sigma _{2}^{2}+(x-\mu _{2})^{2}\sigma _{1}^{2}}{2\sigma _{1}^{2}\sigma _{2}^{2}}}}\int \limits _{-\infty }^{\infty }e^{-{\frac {\sigma _{1}^{2}+\sigma _{2}^{2}}{2\sigma _{1}^{2}\sigma _{2}^{2}}}\left[\left(\mathbf {\xi } -{\frac {\mu _{1}\sigma _{2}^{2}+(x-\mu _{2})\sigma _{1}^{2}}{\sigma _{1}^{2}+\sigma _{2}^{2}}}\right)^{2}-\left({\frac {\mu _{1}\sigma _{2}^{2}+(x-\mu _{2})\sigma _{1}^{2}}{\sigma _{1}^{2}+\sigma _{2}^{2}}}\right)^{2}\right]}\mathbf {\mathrm {d} \xi } } = 1 2 π σ 1 σ 2 e μ 1 2 σ 2 2 + ( x μ 2 ) 2 σ 1 2 ( μ 1 σ 2 2 + ( x μ 2 ) σ 1 2 ) 2 σ 1 2 + σ 2 2 2 σ 1 2 σ 2 2 e ( ξ μ 1 σ 2 2 + ( x μ 2 ) σ 1 2 σ 1 2 + σ 2 2 ) 2 2 σ 1 2 σ 2 2 σ 1 2 + σ 2 2 d ξ {\displaystyle ={\frac {1}{2\pi \sigma _{1}\sigma _{2}}}e^{-{\frac {\mu _{1}^{2}\sigma _{2}^{2}+(x-\mu _{2})^{2}\sigma _{1}^{2}-{\frac {\left(\mu _{1}\sigma _{2}^{2}+(x-\mu _{2})\sigma _{1}^{2}\right)^{2}}{\sigma _{1}^{2}+\sigma _{2}^{2}}}}{2\sigma _{1}^{2}\sigma _{2}^{2}}}}\int \limits _{-\infty }^{\infty }e^{-{\frac {\left(\mathbf {\xi } -{\frac {\mu _{1}\sigma _{2}^{2}+(x-\mu _{2})\sigma _{1}^{2}}{\sigma _{1}^{2}+\sigma _{2}^{2}}}\right)^{2}}{2{\frac {\sigma _{1}^{2}\sigma _{2}^{2}}{\sigma _{1}^{2}+\sigma _{2}^{2}}}}}}\mathbf {\mathrm {d} \xi } } = 1 2 π σ 1 σ 2 e μ 1 2 σ 2 4 + μ 1 2 σ 1 2 σ 2 2 + ( x μ 2 ) 2 σ 1 4 + ( x μ 2 ) 2 σ 1 2 σ 2 2 ( μ 1 2 σ 2 4 + ( x μ 2 ) 2 σ 1 4 + 2 μ 1 σ 2 2 ( x μ 2 ) σ 1 2 ) 2 σ 1 2 σ 2 2 ( σ 1 2 + σ 2 2 ) 2 π σ 1 σ 2 σ 1 2 + σ 2 2 {\displaystyle ={\frac {1}{2\pi \sigma _{1}\sigma _{2}}}e^{-{\frac {{\cancel {\mu _{1}^{2}\sigma _{2}^{4}}}+\mu _{1}^{2}\sigma _{1}^{2}\sigma _{2}^{2}+{{\cancel {(x-\mu _{2})^{2}\sigma _{1}^{4}}}+(x-\mu _{2})^{2}\sigma _{1}^{2}\sigma _{2}^{2}-\left({\cancel {\mu _{1}^{2}\sigma _{2}^{4}}}+{\cancel {(x-\mu _{2})^{2}\sigma _{1}^{4}}}+2\mu _{1}\sigma _{2}^{2}(x-\mu _{2})\sigma _{1}^{2}\right)}}{2\sigma _{1}^{2}\sigma _{2}^{2}(\sigma _{1}^{2}+\sigma _{2}^{2})}}}{\sqrt {2\pi }}{\frac {\sigma _{1}\sigma _{2}}{\sqrt {\sigma _{1}^{2}+\sigma _{2}^{2}}}}} = 1 2 π σ 1 2 + σ 2 2 e μ 1 2 + ( x μ 2 ) 2 2 μ 1 ( x μ 2 ) 2 ( σ 1 2 + σ 2 2 ) {\displaystyle ={\frac {1}{{\sqrt {2\pi }}{\sqrt {\sigma _{1}^{2}+\sigma _{2}^{2}}}}}e^{-{\frac {\mu _{1}^{2}+(x-\mu _{2})^{2}-2\mu _{1}(x-\mu _{2})}{2(\sigma _{1}^{2}+\sigma _{2}^{2})}}}}

= 1 2 π σ 1 2 + σ 2 2 e [ x ( μ 1 + μ 2 ) ] 2 2 σ 1 2 + σ 2 2 2 _ _ {\displaystyle ={\underline {\underline {{\frac {1}{{\sqrt {2\pi }}{\sqrt {\sigma _{1}^{2}+\sigma _{2}^{2}}}}}e^{-{\frac {\left[x-(\mu _{1}+\mu _{2})\right]^{2}}{2{\sqrt {\sigma _{1}^{2}+\sigma _{2}^{2}}}^{2}}}}}}}}

Damit lässt sich die Gaußsche Fehleraddition (Fehlerfortplanzungsgesetz) begründen: Gegeben seien zwei Stäbe mit fehlerbehafteten Längen L 1 = ( 1 ± 0 , 03 ) m {\displaystyle L_{1}=\left(1\pm 0{,}03\right)\,\mathrm {m} } und L 2 = ( 2 ± 0 , 04 ) m {\displaystyle L_{2}=\left(2\pm 0{,}04\right)\,\mathrm {m} } . Will man nun wissen, wie lang der zusammengesetzte Stab ist, dann kann man die beiden Stäbe als zufallsverteiltes Ensemble betrachten. Das heißt, die Messungen von Stab 1 und Stab 2 unterliegen jeweils einer Streuung, welche der Normalverteilung folgt. Es kann z. B. sein, dass Stab 1 in Wirklichkeit 1 , 01 m {\displaystyle 1{,}01\,\mathrm {m} } lang ist. Dieses Ereignis tritt mit einer bestimmten Wahrscheinlichkeit auf, die man aus dem Streumaß der Normalverteilung σ 1 = 0 , 03 m {\displaystyle \sigma _{1}=0{,}03\,\mathrm {m} } um den Mittelwert μ 1 = 1 m {\displaystyle \mu _{1}=1\,\mathrm {m} } ablesen kann. Für dieses Ereignis ist dann die Gesamtlänge der beiden Stäbe normalverteilt, und zwar mit der Normalverteilung des 2. Stabes multipliziert mit der Wahrscheinlichkeit, dass der 1. Stab 1 , 01 m {\displaystyle 1{,}01\,\mathrm {m} } lang ist. Geht man dies für alle Stablängen für Stab 1 durch und addiert die Verteilungen des zusammengesetzten Stabes, dann entspricht dies der im Beweis angegebenen Integration, welche äquivalent zu einer Faltung ist. Der zusammengesetzte Stab ist also auch normalverteilt und L 3 = μ 1 + μ 2 ± σ 1 2 + σ 2 2 = 1 + 2 ± 0 , 03 2 + 0 , 04 2 = ( 3 ± 0 , 05 ) m {\displaystyle L_{3}=\mu _{1}+\mu _{2}\pm {\sqrt {\sigma _{1}^{2}+\sigma _{2}^{2}}}=1+2\pm {\sqrt {0{,}03^{2}+0{,}04^{2}}}=\left(3\pm 0{,}05\right)\,\mathrm {m} } lang.

Eigenschaften der Faltung

Algebraische Eigenschaften

Die Faltung von L 1 ( R n ) {\displaystyle L^{1}(\mathbb {R} ^{n})} -Funktionen erfüllt zusammen mit der Addition fast alle Axiome eines kommutativen Rings mit Ausnahme dessen, dass diese Struktur kein neutrales Element besitzt. Man spricht scherzhaft auch von einem „Rng“, weil das i für "Identität" fehlt. Im Detail gelten also die folgenden Eigenschaften:

f g = g f {\displaystyle f\ast g=g\ast f}
f ( g h ) = ( f g ) h {\displaystyle f\ast (g\ast h)=(f\ast g)\ast h}
f ( g + h ) = ( f g ) + ( f h ) {\displaystyle f\ast (g+h)=(f\ast g)+(f\ast h)}
  • Assoziativität mit der skalaren Multiplikation
a ( f g ) = ( a f ) g = f ( a g ) {\displaystyle a(f\ast g)=(af)\ast g=f\ast (ag)}
Wobei a {\displaystyle a} eine beliebige komplexe Zahl ist.

Ableitungsregel

D ( f g ) = ( D f ) g = f D g {\displaystyle \mathrm {D} (f\ast g)=(\mathrm {D} f)\ast g=f\ast \mathrm {D} g}

Dabei ist D f {\displaystyle \mathrm {D} f} die distributionelle Ableitung von f {\displaystyle f} . Falls f {\displaystyle f} (total) differenzierbar ist, so stimmen distributionelle Ableitung und (totale) Ableitung überein. Zwei interessante Beispiele dazu sind:

  • D ( f δ ) ( x ) = ( f D δ ) ( x ) = D f ( x ) {\displaystyle \mathrm {D} (f\ast \delta )(x)=(f\ast D\delta )(x)=Df(x)} , wobei D δ {\displaystyle D\delta } die Ableitung der Delta-Distribution ist. Die Ableitung lässt sich also als Faltungsoperator auffassen.
  • ( f Θ ) ( x ) = x f ( t ) d t {\displaystyle \textstyle (f*\Theta )(x)=\int _{-\infty }^{x}f(t)\mathrm {d} t} , wobei Θ {\displaystyle \Theta } die Sprungfunktion ist, ergibt eine Stammfunktion für f {\displaystyle f} .

Integration

Sind f {\displaystyle f} und g {\displaystyle g} integrierbare Funktionen, so gilt

R n ( f g ) ( x ) d x = ( R n f ( x ) d x ) ( R n g ( x ) d x ) . {\displaystyle \int \limits _{\mathbb {R} ^{n}}(f*g)(x)dx=\left(\int \limits _{\mathbb {R} ^{n}}f(x)dx\right)\left(\int \limits _{\mathbb {R} ^{n}}g(x)dx\right).}

Dies ist eine einfache Folgerung aus dem Satz von Fubini.

Faltungstheorem

Nach Fourier-Transformation

F ( f ) ( t ) = 1 ( 2 π ) n 2 R n f ( x ) e i t x d x , f L 1 ( R n ) {\displaystyle {\mathcal {F}}(f)(t)={\frac {1}{\left(2\pi \right)^{\frac {n}{2}}}}\int \limits _{\mathbb {R} ^{n}}f(x)\,e^{-\mathrm {i} t\cdot x}\,\mathrm {d} x,\quad f\in L^{1}(\mathbb {R} ^{n})}

stellt sich die Faltung zweier Funktionen als Produkt der einzelnen Fouriertransformierten dar:

F ( f g ) = ( 2 π ) n 2 F ( f ) F ( g ) , f , g L 1 ( R n ) {\displaystyle {\mathcal {F}}(f*g)=(2\pi )^{\tfrac {n}{2}}\,{\mathcal {F}}(f)\cdot {\mathcal {F}}(g),\quad f,g\in L^{1}(\mathbb {R} ^{n})}

Ein ähnliches Theorem gilt auch für die Laplacetransformation. Die Umkehrung des Faltungssatzes besagt[3]:

F ( f ) F ( g ) = ( 2 π ) n 2 F ( f g ) {\displaystyle {\mathcal {F}}(f)*{\mathcal {F}}(g)=(2\pi )^{\tfrac {n}{2}}{\mathcal {F}}(f\cdot g)}

Dabei ist {\displaystyle \cdot } das punktweise Produkt der beiden Funktionen, f = g h {\displaystyle f=g\cdot h} ist also gleichbedeutend mit f ( x ) = g ( x ) h ( x ) {\displaystyle f(x)=g(x)\cdot h(x)} an jeder Stelle x {\displaystyle x} .

Spiegelungsoperator

Es sei S {\displaystyle S} der Spiegelungsoperator mit S f ( t ) = f ( t ) {\displaystyle Sf(t)=f(-t)} für alle t {\displaystyle t} , dann gilt

  • ( S f g ) ( t ) = R n f ( τ ) g ( t τ ) d τ = R n f ( τ ) g ( τ + t ) d τ = S ( f S g ) ( t ) {\displaystyle (Sf*g)(t)=\int \limits _{\mathbb {R} ^{n}}f(-\tau )g(t-\tau )\mathrm {d} \tau =\int \limits _{\mathbb {R} ^{n}}f(\tau )g(\tau +t)\mathrm {d} \tau =S(f*Sg)(t)} und
  • ( S f S g ) ( t ) = R n f ( τ ) g ( t + τ ) d τ = S ( f g ) ( t ) . {\displaystyle (Sf*Sg)(t)=\int \limits _{\mathbb {R} ^{n}}f(-\tau )g(-t+\tau )\mathrm {d} \tau =S(f*g)(t).}

Faltung dualer Lp-Funktionen ist stetig

Sei f L p ( R n ) {\displaystyle f\in L^{p}(\mathbb {R} ^{n})} und g L q ( R n ) {\displaystyle g\in L^{q}(\mathbb {R} ^{n})} mit 1 p , q {\displaystyle 1\leq p,q\leq \infty } und 1 p + 1 q = 1 {\displaystyle {\tfrac {1}{p}}+{\tfrac {1}{q}}=1} . Dann ist die Faltung f g {\displaystyle f*g} eine beschränkte stetige Funktion auf R n {\displaystyle \mathbb {R} ^{n}} . Ist p q {\displaystyle p\neq \infty \neq q} , so verschwindet die Faltung im Unendlichen, ist also eine C 0 {\displaystyle C_{0}} -Funktion. Diese Aussage ist ebenfalls richtig, wenn f {\displaystyle f} eine reelle Hardy-Funktion ist und g {\displaystyle g} in BMO liegt.

Verallgemeinerte Young’sche Ungleichung

Aus der Hölder’schen Ungleichung folgt die verallgemeinerte Young’sche Ungleichung

f g L r f L p g L q {\displaystyle \|f*g\|_{L^{r}}\leq \|f\|_{L^{p}}\|g\|_{L^{q}}}

für 1 p + 1 q = 1 + 1 r {\displaystyle {\tfrac {1}{p}}+{\tfrac {1}{q}}=1+{\tfrac {1}{r}}} und p , q , r 1 {\displaystyle p,q,r\geq 1} .

Faltung als Integraloperator

Sei h L 2 ( [ 0 , 2 π ] ) {\displaystyle h\in L^{2}([0,2\pi ])} , dann kann man die Faltung auch als Integraloperator mit dem Integralkern h {\displaystyle h} auffassen. Das heißt, man kann die Faltung als Operator T h : L 2 ( [ 0 , 2 π ] ) L 2 ( [ 0 , 2 π ] ) {\displaystyle T_{h}\colon L^{2}([0,2\pi ])\to L^{2}([0,2\pi ])} definiert durch

T h f ( s ) := 1 2 π [ 0 , 2 π ] f ( t ) h ( s t ) d t {\displaystyle T_{h}f(s):={\frac {1}{2\pi }}\int \limits _{[0,2\pi ]}f(t)h(s-t)\mathrm {d} t}

auffassen. Dies ist ein linearer und kompakter Operator, der außerdem normal ist. Sein adjungierter Operator ist gegeben durch

T h f ( s ) = 1 2 π [ 0 , 2 π ] f ( t ) h ( t s ) ¯ d t . {\displaystyle T_{h}^{*}f(s)={\frac {1}{2\pi }}\int \limits _{[0,2\pi ]}f(t){\overline {h(t-s)}}\mathrm {d} t\,.}

Außerdem ist T h {\displaystyle T_{h}} ein Hilbert-Schmidt-Operator.

Diskrete Faltung

Hauptartikel: Faltungsmatrix

In der digitalen Signalverarbeitung und der digitalen Bildverarbeitung hat man es meist mit diskreten Funktionen zu tun, die miteinander gefaltet werden sollen. In diesem Fall tritt an die Stelle des Integrals eine Summe und man spricht von der zeitdiskreten Faltung.

Definition

Seien f , g : D C {\displaystyle f,g\colon D\to \mathbb {C} } Funktionen mit dem diskreten Definitionsbereich D Z {\displaystyle D\subseteq \mathbb {Z} } . Dann ist die diskrete Faltung definiert durch

( f g ) ( n ) = k D f ( k ) g ( n k ) {\displaystyle (f*g)(n)=\sum _{k\in D}f(k)g(n-k)} .

Der Summationsbereich ist der gesamte Definitionsbereich D {\displaystyle D} beider Funktionen. Im Fall eines beschränkten Definitionsbereichs werden f {\displaystyle f} und g {\displaystyle g} meist durch Nullen fortgesetzt.

Ist der Definitionsbereich endlich, so können die beiden Funktionen auch als Vektoren f C n f {\displaystyle {\vec {f}}\in \mathbb {C} ^{n_{f}}} , respektive g C n g {\displaystyle {\vec {g}}\in \mathbb {C} ^{n_{g}}} verstanden werden. Die Faltung ist dann gegeben als Matrix-Vektor-Produkt:

( f g ) ( n ) = G f {\displaystyle (f*g)(n)=\mathbf {G} {\vec {f}}}

mit der Matrix

G = [ g 0 0 0 0 g 0 0 0 g 0 0 0 0 g ] {\displaystyle \mathbf {G} ={\begin{bmatrix}{\vec {g}}&0&0&\cdots &0\\0&{\vec {g}}&0&\cdots &0\\\vdots &0&{\vec {g}}&\cdots &0\\\vdots &\vdots &\vdots &\ddots &\vdots \\0&0&0&\cdots &{\vec {g}}\end{bmatrix}}}

mit G m × n f {\displaystyle \mathbf {G} \in m\times n_{f}} und m = n f + n g 1. {\displaystyle m=n_{f}+n_{g}-1.} [4]

Wenn man die Spalten von G {\displaystyle \mathbf {G} } unter und über den g {\displaystyle {\vec {g}}} periodisch fortsetzt, statt mit Nullen zu ergänzen, wird G {\displaystyle \mathbf {G} } zu einer zyklischen Matrix, und man erhält die zyklische Faltung.

Anwendungen

Das Produkt zweier Polynome f {\displaystyle f} und g {\displaystyle g} ist zum Beispiel die diskrete Faltung ihrer mit Nullen fortgesetzten Koeffizientenfolgen. Die dabei auftretenden unendlichen Reihen haben stets nur endlich viele Summanden, die ungleich Null sind. Analog definiert man das Produkt zweier formaler Laurentreihen mit endlichem Hauptteil.

Ein in Bezug auf die Rechenleistung effizienter Algorithmus für die Berechnung der diskreten Faltung ist die Schnelle Faltung, die sich ihrerseits auf die Schnelle Fourier-Transformation (FFT) zur effizienten Berechnung der diskreten Fourier-Transformation stützt.

Distributionen

Die Faltung wurde von Laurent Schwartz, der als Begründer der Distributionentheorie gilt, auf Distributionen erweitert.[5]

Faltung mit einer Funktion

Eine andere Verallgemeinerung ist die Faltung einer Distribution T {\displaystyle T} mit einer Funktion φ C c ( R n ) {\displaystyle \varphi \in C_{c}^{\infty }(\mathbb {R} ^{n})} . Diese ist definiert durch

( T φ ) ( x ) := T ( τ x φ ) = T ( φ ( x ) ) , {\displaystyle (T*\varphi )(x):=T(\tau _{x}\varphi )=T(\varphi (x-\cdot )),}

wobei τ x {\displaystyle \tau _{x}} ein Translations- und Spiegelungsoperator ist, welcher durch τ x ϕ ( y ) = ϕ ( x y ) {\displaystyle \tau _{x}\phi (y)=\phi (x-y)} definiert ist.

Faltung zweier Distributionen

Seien u 1 {\displaystyle u_{1}} und u 2 {\displaystyle u_{2}} zwei Distributionen, wobei eine einen kompakten Träger hat. Dann ist für alle φ C c ( R n ) {\displaystyle \varphi \in C_{c}^{\infty }(\mathbb {R} ^{n})} die Faltung zwischen diesen Distributionen definiert durch

( u 1 u 2 ) φ = u 1 ( u 2 φ ) {\displaystyle (u_{1}*u_{2})*\varphi =u_{1}*(u_{2}*\varphi )} .

Eine weitergehende Aussage stellt sicher, dass es eine eindeutige Distribution u D {\displaystyle u\in {\mathcal {D}}'} gibt mit

u 1 ( u 2 φ ) = u φ {\displaystyle u_{1}*(u_{2}*\varphi )=u*\varphi }

für alle φ C c ( R n ) {\displaystyle \varphi \in C_{c}^{\infty }(\mathbb {R} ^{n})} .

Algebraische Eigenschaften

Seien u 1 {\displaystyle u_{1}} , u 2 {\displaystyle u_{2}} und u 3 {\displaystyle u_{3}} Distributionen, dann gilt

u 1 u 2 = u 2 u 1 {\displaystyle u_{1}*u_{2}=u_{2}*u_{1}\,}
u 1 ( u 2 + u 3 ) = ( u 1 u 2 ) + ( u 1 u 3 ) {\displaystyle u_{1}*(u_{2}+u_{3})=(u_{1}*u_{2})+(u_{1}*u_{3})\,}
  • Assoziativität mit der skalaren Multiplikation
a ( u 1 u 2 ) = ( a u 1 ) u 2 = u 1 ( a u 2 ) {\displaystyle a(u_{1}*u_{2})=(au_{1})*u_{2}=u_{1}*(au_{2})\,}
Wobei a {\displaystyle a} eine beliebige komplexe Zahl ist.

Faltungstheorem

Mit F {\displaystyle {\mathcal {F}}} wird die (unitäre) Fourier-Transformation von Distributionen bezeichnet. Sei nun u 1 S ( R n ) {\displaystyle u_{1}\in S'(\mathbb {R} ^{n})} eine temperierte Distribution und u 2 E ( R n ) {\displaystyle u_{2}\in {\mathcal {E'}}(\mathbb {R} ^{n})} eine Distribution mit kompaktem Träger. Dann ist u 1 u 2 S ( R n ) {\displaystyle u_{1}*u_{2}\in S'(\mathbb {R} ^{n})} und es gilt

F ( u 1 u 2 ) = ( 2 π ) n 2 F ( u 1 ) F ( u 2 ) {\displaystyle {\mathcal {F}}(u_{1}*u_{2})=(2\pi )^{\tfrac {n}{2}}{\mathcal {F}}(u_{1})\cdot {\mathcal {F}}(u_{2})} .

Topologische Gruppen

Faltung auf topologischen Gruppen

Die beiden Faltungsbegriffe können gemeinsam beschrieben und verallgemeinert werden durch einen allgemeinen Faltungsbegriff für komplexwertige m-integrierbare Funktionen auf einer geeigneten topologischen Gruppe G mit einem Maß m (z. B. einer lokalkompakten hausdorffschen topologischen Gruppe mit einem Haar-Maß):

( f g ) ( x ) = G f ( t ) g ( x t 1 ) d m ( t ) {\displaystyle (f*g)(x)=\int \limits _{G}f(t)g(xt^{-1})\mathrm {d} m(t)\,}

Dieser Faltungsbegriff spielt eine zentrale Rolle in der Darstellungstheorie dieser Gruppen, deren wichtigste Vertreter die Lie-Gruppen bilden. Die Algebra der integrierbaren Funktionen mit dem Faltungsprodukt ist für kompakte Gruppen das Analogon zum Gruppenring einer endlichen Gruppe. Weiterführende Themen sind:

Die Faltungsalgebra endlicher Gruppen

Für eine endliche Gruppe G {\displaystyle G} mit g := ord ( G ) , {\displaystyle g:=\operatorname {ord} (G),} wird die Menge L 1 ( G ) := { f : G C } {\displaystyle L^{1}(G):=\{f\colon G\to \mathbb {C} \}} mit der Addition und der skalaren Multiplikation ein C {\displaystyle \mathbb {C} } -Vektorraum, isomorph zu C g . {\displaystyle \textstyle \mathbb {C} ^{g}.} Mit der Faltung f h ( s ) = t G f ( t ) h ( t 1 s ) {\displaystyle \textstyle f*h(s)=\sum _{t\in G}f(t)h(t^{-1}s)} wird L 1 ( G ) {\displaystyle \textstyle L^{1}(G)} dann zu einer Algebra, genannt die Faltungsalgebra.
Die Faltungsalgebra besitzt eine Basis indiziert mit den Gruppenelementen ( δ s ) s G , {\displaystyle (\delta _{s})_{s\in G},} wobei

δ s ( t ) = { 1 falls  t = s 0 sonst . {\displaystyle \delta _{s}(t)={\begin{cases}1&{\text{falls }}\,\,\,t=s\\0&{\text{sonst}}\end{cases}}.}

Mit der Faltung gilt: δ s δ t = δ s t . {\displaystyle \delta _{s}*\delta _{t}=\delta _{st}.}
Wir definieren eine Abbildung zwischen L 1 ( G ) {\displaystyle L^{1}(G)} und C [ G ] , {\displaystyle \mathbb {C} [G],} indem wir für Basiselemente definieren: δ s e s {\displaystyle \delta _{s}\mapsto e_{s}} und linear fortsetzen. Diese Abbildung ist offensichtlich bijektiv. Man erkennt an obiger Gleichung für die Faltung zweier Basiselemente aus L 1 ( G ) , {\displaystyle L^{1}(G),} dass die Multiplikation in L 1 ( G ) {\displaystyle L^{1}(G)} der in C [ G ] {\displaystyle \mathbb {C} [G]} entspricht. Damit sind die Faltungsalgebra und die Gruppenalgebra als Algebren isomorph.

Mit der Involution f ( s ) = f ( s 1 ) ¯ {\displaystyle \textstyle f^{*}(s)={\overline {f(s^{-1})}}} wird L 1 ( G ) {\displaystyle \textstyle L^{1}(G)} zu einer {\displaystyle ^{*}} -Algebra. Es gilt δ s = δ s 1 . {\displaystyle \delta _{s}^{*}=\delta _{s^{-1}}.}
Eine Darstellung ( π , V π ) {\displaystyle (\pi ,V_{\pi })} einer Gruppe G {\displaystyle G} setzt fort zu einem {\displaystyle ^{*}} -Algebrenhomomorphismus π : L 1 ( G ) End ( V π ) {\displaystyle \pi \colon L^{1}(G)\to {\text{End}}(V_{\pi })} durch π ( δ s ) = π ( s ) . {\displaystyle \pi (\delta _{s})=\pi (s).}
Da π {\displaystyle \pi } als {\displaystyle ^{*}} -Algebrenhomomorphismus insbesondere multiplikativ ist, erhalten wir π ( f h ) = π ( f ) π ( h ) . {\displaystyle \pi (f*h)=\pi (f)\pi (h).} Falls π {\displaystyle \pi } unitär ist, gilt außerdem π ( f ) = π ( f ) . {\displaystyle \pi (f)^{*}=\pi (f^{*}).} Die Definition einer unitären Darstellung findet sich im Kapitel Eigenschaften der Faltung. Dort wird auch gezeigt, dass wir eine lineare Darstellung ohne Einschränkung als unitär annehmen können.

Im Rahmen der Faltungsalgebra kann man auf Gruppen eine Fouriertransformation durchführen. In der Harmonischen Analyse wird gezeigt, dass diese Definition mit der Definition der Fouriertransformation auf R {\displaystyle \mathbb {R} } konsistent ist.
Sei ρ : G GL ( V ρ ) {\displaystyle \rho \colon G\to {\text{GL}}(V_{\rho })} eine Darstellung, f L 1 ( G ) , {\displaystyle f\in L^{1}(G),} dann definiert man die Fouriertransformierte f ^ ( ρ ) End ( V ρ ) {\displaystyle {\hat {f}}(\rho )\in {\text{End}}(V_{\rho })} durch die Formel

f ^ ( ρ ) = s G f ( s ) ρ ( s ) . {\displaystyle {\hat {f}}(\rho )=\sum _{s\in G}f(s)\rho (s).}

Es gilt dann f g ^ ( ρ ) = f ^ ( ρ ) g ^ ( ρ ) . {\displaystyle {\widehat {f*g}}(\rho )={\hat {f}}(\rho )\cdot {\hat {g}}(\rho ).}

Anwendung

  • In der Bildbearbeitung und in der Bildverarbeitung wird die diskrete Faltung eingesetzt, um entweder störende Einflüsse wie Rauschen zu beheben oder Bildinformationen wie z. B. Kanten zu extrahieren (Kantendetektion). Dabei kommen der Aufgabenstellung angepasste Faltungsmatrizen zum Einsatz, die als Operatorvorschrift für den Glättungskern zu verstehen sind.
  • Bei einem linearen, zeitinvarianten Übertragungsglied ergibt sich die Antwort auf eine Anregung durch Faltung der Anregungsfunktion mit der Impulsantwort des Übertragungsglieds. Beispielsweise stellt die lineare Filterung eines elektronischen Signals die Faltung der Original-Funktion mit der Impulsantwort dar.
  • Faltungen werden genutzt, um spezielle Lösungen bestimmter partieller Differentialgleichungen zu konstruieren. Ist G {\displaystyle G} die Fundamentallösung des partiellen Differentialoperators L {\displaystyle L} , so ist G f {\displaystyle G*f} eine Lösung der partiellen Differentialgleichung L u = f {\displaystyle Lu=f} .
  • Diffusions-Prozesse lassen sich durch die Faltung beschreiben.
  • Wenn X {\displaystyle X} und Y {\displaystyle Y} zwei stochastisch unabhängige Zufallsvariablen mit den Wahrscheinlichkeitsdichten f {\displaystyle f} und g {\displaystyle g} sind, dann ist die Dichte der Summe X + Y {\displaystyle X+Y} gleich der Faltung f g {\displaystyle f*g} . Siehe auch Faltung (Stochastik).
  • In der Akustik (Musik) wird die Faltung (unter Zuhilfenahme der FFT = schnelle Fouriertransformation) auch zur digitalen Erzeugung von Hall und Echos und zur Anpassung von Klangeigenschaften verwendet. Dazu wird die Impulsantwort des Raumes, dessen Klangcharakteristik man übernehmen möchte, mit dem Signal, das man beeinflussen möchte, gefaltet.
  • In der Ingenieurmathematik und der Signalverarbeitung werden Eingangssignale (äußere Einflüsse) mit der Impulsantwort (Reaktion des betrachteten Systems auf einen Diracimpuls als Signaleingang, auch Gewichtsfunktion) gefaltet, um die Antwort eines LTI-Systems auf beliebige Eingangssignale zu berechnen. Die Impulsantwort ist nicht zu verwechseln mit der Sprungantwort. Erstere beschreibt die Gesamtheit aus System und einem Dirac-Impuls als Eingangs-Testfunktion, letztere die Gesamtheit aus System und einer Sprungfunktion als Eingangs-Testfunktion. Die Berechnungen finden meist nicht im Zeitbereich, sondern im Frequenzbereich statt. Dazu müssen sowohl vom Signal als auch von der das Systemverhalten beschreibenden Impulsantwort Spektralfunktionen im Frequenzbereich vorliegen, oder ggf. aus dem Zeitbereich per Fouriertransformation oder einseitiger Laplacetransformation dorthin transformiert werden. Die entsprechende Spektralfunktion der Impulsantwort wird Frequenzgang oder Übertragungsfunktion genannt.
  • In der numerischen Mathematik erhält man durch Faltung der Boxfunktion N 0 ( t ) {\displaystyle N^{0}(t)} mit N k 1 ( t ) {\displaystyle N^{k-1}(t)} die B-Spline-Basisfunktion N k ( t ) {\displaystyle N^{k}(t)} für den Vektorraum der stückweisen Polynome vom Grad k.
  • In der Computeralgebra kann die Faltung für eine effiziente Berechnung der Multiplikation vielstelliger Zahlen eingesetzt werden, da die Multiplikation im Wesentlichen eine Faltung mit nachfolgendem Übertrag darstellt. Die Komplexität dieses Vorgehens ist mit O ( n log ( n ) ) {\displaystyle {\mathcal {O}}(n\cdot \log {(n)})} nahe linear, während das „Schulverfahren“ quadratischen Aufwand O ( n 2 ) {\displaystyle {\mathcal {O}}(n^{2})} hat, wobei n {\displaystyle n} die Zahl der Stellen ist. Dies lohnt sich trotz des zusätzlichen Aufwands, der hierbei für die Fouriertransformation (und deren Umkehrung) erforderlich ist.
  • In der Hydrologie verwendet man die Faltung, um den durch ein Niederschlags-Abfluss-Ereignis produzierten Abfluss in einem Einzugsgebiet bei vorgegebener Menge und Dauer des Niederschlages zu berechnen. Dazu wird der sogenannte „Unit-Hydrograph“ (Einheits-Abflussganglinie) – die Abflussganglinie auf einen Einheitsniederschlag von vorgegebener Dauer – mit der zeitlichen Funktion des Niederschlages gefaltet.
  • In der Reflexionsseismik wird eine seismische Spur als Faltung von Impedanzkontrasten der geologischen Schichtgrenzen und dem Ausgangssignal (Wavelet) betrachtet. Der Vorgang zur Wiederherstellung der unverzerrten Schichtgrenzen im Seismogramm ist die Dekonvolution.

Literatur

  • N. Bourbaki: Integration. Springer, Berlin u. a. 2004, ISBN 3-540-41129-1.
  • Kôsaku Yosida: Functional Analysis. Springer-Verlag, Berlin u. a. 1995, ISBN 3-540-58654-7.

Einzelnachweise und Fußnoten

  1. Ian Goodfellow, Yoshua Bengio und Aaron Courville: Deep Learning. Hrsg.: MIT Press. S. 329 (deeplearningbook.org). 
  2. Allgemeiner kann auch f L p ( R n ) {\displaystyle f\in {\mathcal {L}}^{p}(\mathbb {R} ^{n})} für ein p [ 1 ; ] {\displaystyle p\in [1;\infty ]} und g L 1 ( R n ) {\displaystyle g\in {\mathcal {L}}^{1}(\mathbb {R} ^{n})} vorausgesetzt werden. Vgl. Herbert Amann, Joachim Escher: Analysis III. 1. Auflage. Birkhäuser-Verlag, Basel/Boston/Berlin 2001, ISBN 3-7643-6613-3, Abschnitt 7.1.
  3. Beweis mittels Einsetzen der inversen Fouriertransformierten. Z. B. wie in Fouriertransformation für Fußgänger, Tilman Butz, Ausgabe 7, Springer DE, 2011, ISBN 978-3-8348-8295-0, S. 53, Google Books
  4. @1@2Vorlage:Toter Link/www.dt.e-technik.uni-dortmund.dedt.e-technik.uni-dortmund.de (Seite nicht mehr abrufbar. Suche in Webarchiven) (PDF).
  5. Dirk Werner: Funktionalanalysis. 6., korrigierte Auflage, Springer-Verlag, Berlin 2007, ISBN 978-3-540-72533-6, S. 447.

Weblinks

Commons: Convolution – Sammlung von Bildern, Videos und Audiodateien
  • Interaktive Visualisierung der Faltung als Java-Applet
  • Interaktive Visualisierung der Faltung als Java-Applet für Diskrete Funktionen
  • Onlinerechner für Diskrete-Konvolution
  • Java-Applet zur Visualisierung der Faltung