Danke für deine Antwort. Die Performance Frage ist mir hier völlig klar, für einen normalen Gauss Blur benutze ich auch die separierte 2N anstatt der Rechenaufwendigen N² Variante.
Es geht mir hier in erster Linie darum, einen Testshader zu bauen, in dem ich unterschiedliche Algorithmen zur Erstellung der Gewichtungsmaps für die einzelnen Bilder der Belichtungsreihe, sehr effektiv ausprobieren kann.
Die Optimierung und Zerlegung in verschiedene aufeinanderfolgende Shader/Passes erfolgt dann sobald ein HDR Operator als "ok" eingestuft wird.
Zur Zeit habe ich einen Varianzoperator implementiert, der die Varianz der Helligkeit um einen Pixel mit einem Radius von "kernelSize" berechnet. Genau diese Ausdehnung des lokalen Operators würde ich nun gerne steuern, um die Auswirkung bei größerem Einzugsbereich untersuchen zu können.
Zum Thema Gewichte, die berechne ich zur Zeit auch innerhalb des Shaders mit weight= 1 / (Pi*kernelSize²) + exp (- (deltax²+deltay²) / kernelSize²)
Performance ist also erstmal nicht das vordringliche Problem (die landen Später dann natürlich in Lookup tables