Wallace-Tree-Multiplizierer

Ein Wallace-Tree-Multiplizierer ist ein Multiplizierer, der in der Digitaltechnik eingesetzt wird. Das Verfahren ist benannt nach Christopher Stewart Wallace, welcher diesen Multiplizierer 1964 vorstellte.[1]

Funktionsweise

Ein n {\displaystyle n} -Bit Wallace-Tree-Multiplizierer basiert wie der Dadda-Tree-Multiplizierer auf der Formel

( k = 0 n a k 2 k ) ( k = 0 n b k 2 k ) = k = 0 2 n i + j = k a i b j 2 k {\displaystyle \left(\sum _{k=0}^{n}a_{k}2^{k}\right)\cdot \left(\sum _{k=0}^{n}b_{k}2^{k}\right)=\sum _{k=0}^{2n}\sum _{i+j=k}a_{i}b_{j}2^{k}} .

Hierbei sind k = 0 n a k 2 k {\displaystyle \sum _{k=0}^{n}a_{k}2^{k}} und k = 0 n b k 2 k {\displaystyle \sum _{k=0}^{n}b_{k}2^{k}} , a k , b k { 0 , 1 } {\displaystyle a_{k},b_{k}\in \{0,1\}} die Binärdarstellungen der zwei zu multiplizierenden Zahlen.

Der Wallace-Tree-Multiplizierer geht in drei Schritten vor:

  1. Berechne für jedes Paar ( i , j ) {\displaystyle (i,j)} mit 1 i n {\displaystyle 1\leq i\leq n} und 1 j n {\displaystyle 1\leq j\leq n} das Partialprodukt a i b j 2 i + j {\displaystyle a_{i}\cdot b_{j}\cdot 2^{i+j}} .
  2. Addiere die Resultate dieser Berechnung innerhalb der für den Wallace-Tree-Multiplizierer spezifischen Baumstruktur stufenweise mithilfe von Voll- und Halbaddierern, bis nur noch zwei Zahlen übrig sind, die addiert werden müssen.
  3. Addiere diese beiden Zahlen mit einem normalen Addierwerk.

Baumstruktur des Wallace-Tree-Multiplizierers

In Schritt 2 der obigen Schritte werden die Partialprodukte in einer Baumstruktur addiert. Dabei werden zunächst die Partialprodukte in Spalten angeordnet, sodass in einer Spalte jeweils alle Partialprodukte a i b j {\displaystyle a_{i}\cdot b_{j}} mit i + j = k {\displaystyle i+j=k} stehen. Dann fasst man die Spalten der so entstandenen Tabelle in Dreiergruppen zusammen. Jede Spalte dieser Dreiergruppen wird als Eingang für einen Volladdierer verwendet, sofern in der Spalte drei Eingänge sind, für einen Halbaddierer, sofern zwei Einträge vorhanden sind, und gar nicht modifiziert, sofern nur ein Eintrag vorhanden ist. Der höher gewichtete Ausgang der Addierer wird dann jeweils der nächsten Spalte zugeordnet. Dieser Vorgang wird solange wiederholt, bis nur noch eine Dreiergruppe vorhanden ist, bei der in jeder Spalte nur zwei Einträge stehen. Diese beiden letzten Zeilen werden dann mittels eines normalen Addierwerks addiert.

Beispiel 8-Bit

Hier sieht man die obige Vorgehensweise für einen 8-Bit-Wallace-Tree-Multiplizierer. Die Punkte stehen dabei für die Partialprodukte bzw. für die Ausgänge der vormalig verwendeten Voll- und Halbaddierer, welche durch die dünnen Linien gekennzeichnet sind.

4-Schicht-Wallace-Reduktion einer 8x8-Partialproduktmatrix mit 14 Halbaddierern (zwei Punkte) und 38 Volladdierern (drei Punkte). Die Punkte in jeder Spalte sind Bits mit gleichem Gewicht.

Laufzeit

Oben wurde die Funktionsweise des Wallace-Tree-Multiplizierers unter Rückgriff auf Tabellen beschrieben. Jede dieser Tabellen steht dabei für einen Schritt, den ein elektronisches Signal durchlaufen muss. Um die Laufzeit des Wallace-Tree-Multiplizierers zu ermitteln, finden wir daher heraus, wie viele Tabellen es gibt.

Da ein Volladdierer drei Signale in zwei verwandelt, und ggf. in einer Dreiergruppe (siehe oben) weniger Elemente als für einen Volladdierer benötigt werden vorhanden sind, gilt, wenn wir mit w j {\displaystyle w_{j}} die Höhe der j-ten Tabelle und mit n {\displaystyle n} die Anzahl der Eingangsbits bezeichnen:

w 0 = n  ,  w j + 1 2 w j 3 + ( w j mod 3 ) {\displaystyle w_{0}=n{\text{ , }}w_{j+1}\leq 2\cdot \left\lfloor {\frac {w_{j}}{3}}\right\rfloor +(w_{j}\mod 3)}

Hieraus kann man folgende Abschätzung herleiten:

w j 2 w j 3 + ( w j mod 3 ) 2 w j 3 + 1 {\displaystyle w_{j}\leq 2\cdot \left\lfloor {\frac {w_{j}}{3}}\right\rfloor +(w_{j}\mod 3)\leq 2\cdot \left\lfloor {\frac {w_{j}}{3}}+1\right\rfloor } 2 2 w j 1 3 + 1 3 + 1 ( 2 3 ) j + 1 w 0 + 2 k = 0 j 2 k 3 k {\displaystyle \leq 2\cdot \left\lfloor {\frac {2\cdot \left\lfloor {\frac {w_{j-1}}{3}}+1\right\rfloor }{3}}+1\right\rfloor \leq \ldots \leq \left({\frac {2}{3}}\right)^{j+1}w_{0}+2\sum _{k=0}^{j}{\frac {2^{k}}{3^{k}}}} < ( 2 3 ) j + 1 w 0 + 2 k = 0 2 k 3 k = ( 2 3 ) j + 1 w 0 + 6 {\displaystyle <\left({\frac {2}{3}}\right)^{j+1}w_{0}+2\sum _{k=0}^{\infty }{\frac {2^{k}}{3^{k}}}=\left({\frac {2}{3}}\right)^{j+1}w_{0}+6}

Somit folgt

w j ( 2 3 ) j + 1 w 0 + 6 {\displaystyle w_{j}\leq \left({\frac {2}{3}}\right)^{j+1}w_{0}+6} .

Wählt man nun j + 1 = log 3 / 2 ( n ) ( 3 2 ) j + 1 = n = w 0 {\displaystyle j+1=\lceil \log _{3/2}(n)\rceil \Leftrightarrow \left({\frac {3}{2}}\right)^{j+1}=n=w_{0}} , so gilt

w j ( 2 3 ) j + 1 ( 3 2 ) j + 1 + 6 = 7 {\displaystyle w_{j}\leq \left({\frac {2}{3}}\right)^{j+1}\cdot \left({\frac {3}{2}}\right)^{j+1}+6=7}

Eine Tabelle mit sieben Zeilen kann man jedoch nach obiger Vorgehensweise in konstant vielen Schritten reduzieren. Somit gilt für die Laufzeit L = j + k {\displaystyle L=j+k} für eine konstante Schrittanzahl k N {\displaystyle k\in \mathbb {N} } :

L log 3 / 2 ( n ) + k O ( log ( n ) ) {\displaystyle L\leq \lceil \log _{3/2}(n)\rceil +k\in {\mathcal {O}}(\log(n))}

Da die Laufzeit eines Addierwerks (der letzte Schritt beim Wallace-Tree-Multiplizierer) auch in O ( log ( n ) ) {\displaystyle {\mathcal {O}}(\log(n))} liegt, hat der Wallace-Tree-Multiplizierer dieselbe asymptotische Laufzeit wie ein Addierwerk und ist damit schneller als ein vorzeichenloser paralleler Multiplizierer, der eine asymptotische Laufzeit von O ( log 2 ( n ) ) {\displaystyle {\mathcal {O}}(\log ^{2}(n))} aufweist.

Der Wallace-Tree-Multiplizierer ist ferner absolut gesehen langsamer als der Dadda-Tree-Multiplizierer, obwohl beide Multiplizierer dieselbe asymptotische Laufzeit von O ( log ( n ) ) {\displaystyle {\mathcal {O}}(\log(n))} besitzen.

Literatur

  • Peter Pirsch: Architekturen der digitalen Signalverarbeitung. Teubner, 1996, ISBN 3-519-06157-0. 
  • Multiplication in FPGAs (Memento vom 23. Dezember 2014 im Internet Archive)

Einzelnachweise

  1. C. S. Wallace: A suggestion for a fast multiplier. In: IEEE Transactions on Electronic Computers. EC-13, Nr. 1, Februar 1964, S. 14–17, doi:10.1109/PGEC.1964.263830.