Du bist nicht angemeldet.

Stilllegung des Forums
Das Forum wurde am 05.06.2023 nach über 20 Jahren stillgelegt (weitere Informationen und ein kleiner Rückblick).
Registrierungen, Anmeldungen und Postings sind nicht mehr möglich. Öffentliche Inhalte sind weiterhin zugänglich.
Das Team von spieleprogrammierer.de bedankt sich bei der Community für die vielen schönen Jahre.
Wenn du eine deutschsprachige Spieleentwickler-Community suchst, schau doch mal im Discord und auf ZFX vorbei!

Werbeanzeige

LukasBanana

Alter Hase

  • »LukasBanana« ist der Autor dieses Themas

Beiträge: 1 097

Beruf: Shader Tools Programmer

  • Private Nachricht senden

1

25.08.2013, 19:02

Brauche Hilfe bei HLSL Compilation Error

Hi,
ich baue mir gerade einen eigenen 'Stack' in HLSL und nutze den "GPU ShaderAnalyzer" von AMD um Fehler zu finden.
Folgender Code macht mir gerade Schwierigkeiten:

C-/C++-Quelltext

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
#define MAX_STACK_SIZE 64

struct SIdStack
{
    uint Data[MAX_STACK_SIZE];
    uint StackPointer;
};

/* ... */

void StackPop(SIdStack Stack, inout uint StackPointer, out uint Id)
{
    --StackPointer;
    Id = Stack.Data[StackPointer];
}

/* ... */

StackPop(MyStack, MyStack.StackPointer, MyId);

Ursprünglich hatte die Funktion nur folgende Argumentenliste: (inout SIdStack Stack, uint Id). Ging aber nicht, weil der Parameter "Stack" nicht vollständig geschrieben wurde.
Klar, ich wollte ja nur den Stack-Pointer verändern.
Aber es klappt immer noch nicht. Der Shader Analyzer spuckt folgende Fehlermeldung aus:

C-/C++-Quelltext

1
"ERROR 0:220: error X3508: 'StackPop': output parameter 'Id' not completely initialized"

Aber "Id" wird doch vollständig geschrieben. Das verstehe ich leider gar nicht :-(
Hat jemand ne Idee?

Dieser Beitrag wurde bereits 2 mal editiert, zuletzt von »LukasBanana« (01.09.2013, 21:32)


LukasBanana

Alter Hase

  • »LukasBanana« ist der Autor dieses Themas

Beiträge: 1 097

Beruf: Shader Tools Programmer

  • Private Nachricht senden

2

26.08.2013, 10:14

Ich habe das Problem jetzt erst mal umgangen, indem ich den Rückgabewert aus der Argumentenliste genommen habe, also so:

C-/C++-Quelltext

1
uint StackPop(SIdStack Stack, inout uint StackPointer)

Das geht jetzt. Aber dafür habe ich jetzt leider ein noch viel schwer wiegenderes Problem :-(
Der Shader Compiler will alle Loops 'unrollen'. Aber es sind alles dynamische Loops:

C-/C++-Quelltext

1
2
3
4
5
6
7
8
9
10
11
while (!StackEmpty(MyStack))
{
    /* ... */
}

/* ... */

for (uint i = 0; i < NumLights; ++i)
{
    /* ... */
}

Meine einzige Vermutung ist im Moment, dass mein Shader Program zu groß ist. Aber seit Shader Model 4.0 gibt's doch mindestens 65536 Instruction Slots.
Afaik ist in HLSL jede Funktion automatisch inline, auch wenn man das nicht angiebt. Daher kann es schon sein, dass der Shader am Ende mit den ganzen Schleifen und Funktionsaufrufen sehr groß wird.
Aber genau deswegen verstehe ich nicht, warum der Compiler die Schleifen unrollen muss ?(
Hat jemand Erfahrung mit sowas?

EDIT:
Mir ist gerade wieder eingefallen, dass es bei Schleifen in HLSL und GLSL ein paar Limitierungen gibt. Zum einen kann man nicht dynamisch auf ein Array von Texture-
bzw. Sampler Objekten zu greifen (für dieses Problem gibt's "sampler2DArray") und zum anderen kann die Abbruchbedingung einer Schleifen nicht von den Daten einer Texture abhängen.
Allerdings gibt's für die Compute Shader das Attribute [allow_uav_condition] was genau das erlaubt (zumindest für UAVs).
Hilft mir bei meinem Problem aber leider auch nicht weiter :-(
Er will immer noch die Schleife unrollen.

Ich poste hier einfach mal den kompletten Code, vielleicht kann ja irgend jemand was damit anfangen:

C-/C++-Quelltext

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
/*
 * Lightmap generation D3D11 shader file
 * 
 * This file is part of the "SoftPixel Engine" (Copyright (c) 2008 by Lukas Hermanns)
 * See "SoftPixelEngine.hpp" for license information.
 */

//****INFO****: Diese Macros dienen nur dazu, um Teile des Codes mit GLSL kompativel zu halten.
#define MUL(m, v)               mul(m, v)
#define CAST(t, v)              ((t)(v))


/* === Macros === */

#define ID_NONE                 0xFFFFFFFF
#define EPSILON                 0.0001

#define PLANE_NORMAL(Plane)     ((Plane).xyz)
#define PLANE_DISTANCE(Plane)   ((Plane).w)

#define SPHERE_POINT(Sphere)    ((Sphere).xyz)
#define SPHERE_RADIUS(Sphere)   ((Sphere).w)

#define SPlane                  float4

#define MAX_STACK_SIZE          64

#define LIGHT_DIRECTIONAL       0
#define LIGHT_POINT             1
#define LIGHT_SPOT              2

#define KDTREE_XAXIS            0
#define KDTREE_YAXIS            1
#define KDTREE_ZAXIS            2


/* === Structures === */

struct STriangle
{
    float3 A, B, C;
};

struct SRay
{
    float3 Origin, Direction;
};

struct SLine
{
    float3 Start, End;
};

struct SKDTreeNode
{
    /* Node construction */
    int Axis;
    float Distance;
    
    /* Content */
    uint TriangleStart; //!< Index to 'TriangleIdList' or ID_NONE
    uint NumTriangles;  //!< Length in 'TriangleIdList' or 0
    
    /* Children pointers */
    uint ChildIds[2];   //!< Index to 'NodeList' or ID_NONE
};

struct SLightSource
{
    int Type;
    float4 Sphere;
    float3 Color;
    float3 Direction;
    float SpotTheta;
    float SpotPhiMinusTheta;
};

struct SLightmapTexel
{
    float3 WorldPos;
    float3 Normal;
    float3 Tangent;
};

struct SIdStack
{
    uint Data[MAX_STACK_SIZE];
    uint StackPointer;
};


/* === Uniforms === */

cbuffer BufferMain : register(b0)
{
    float4x4 WVPMatrix          : packoffset(c0);
    float4 AmbientColor         : packoffset(c4);
    uint NumLights              : packoffset(c5);
    uint2 LightmapSize          : packoffset(c5.y);
};

cbuffer BufferRadiositySetup : register(b1)
{
    uint NumRadiosityRays : packoffset(c0);
    float RadiosityFactor : packoffset(c0.y);   // (1.0 / NumRadiosityRays) * Factor
}

cbuffer BufferRadiosityRays : register(b2)
{
    float4 RadiosityDirections[4096];
};


/*
 * ======= Compute shader: =======
 */

/* === Uniforms === */

StructuredBuffer<SLightSource> LightList : register(t0);
StructuredBuffer<SLightmapTexel> Lightmap : register(t1);   // Active lightmap texels (one draw-call for every lightmap texture)

//****INFO****: Hatte ich zuvor ohne das "RW" aber dann könnte ich das "allow_uav_condition" Attribut nicht verwenden.
// cbuffer nutzen mir hier leider auch nichts.
RWStructuredBuffer<STriangle> TriangleList : register(u2);
RWStructuredBuffer<SKDTreeNode> NodeList : register(u3);
RWBuffer<uint> TriangleIdList : register(u4);

RWTexture2D<float4> OutputLightmap : register(u0);


/* === Functions === */

bool StackEmpty(SIdStack Stack)
{
    return Stack.StackPointer == 0;
}

void StackPush(SIdStack Stack, inout uint StackPointer, uint Id)
{
    Stack.Data[StackPointer] = Id;
    ++StackPointer;
}

uint StackPop(SIdStack Stack, inout uint StackPointer)
{
    --StackPointer;
    return Stack.Data[StackPointer];
}

SPlane BuildPlane(STriangle Tri)
{
    SPlane Plane;
    
    float3 U = Tri.B - Tri.A;
    float3 V = Tri.C - Tri.A;
    
    PLANE_NORMAL(Plane) = normalize(cross(U, V));
    PLANE_DISTANCE(Plane) = dot(PLANE_NORMAL(Plane), Tri.A);
    
    return Plane;
}

bool IntersectionLinePlane(SPlane Plane, SLine Line, out float3 Intersection)
{
    float3 Dir = Line.End - Line.Start;
    float t = (PLANE_DISTANCE(Plane) - dot(PLANE_NORMAL(Plane), Line.Start)) / dot(PLANE_NORMAL(Plane), Dir);
    
    if (t >= 0.0 && t <= 1.0)
    {
        Intersection = Line.Start + Dir * CAST(float3, t);
        return true;
    }
    
    return false;
}

bool IntersectionLineTriangle(STriangle Tri, SLine Line, out float3 Intersection)
{
    float3 pq = Line.End - Line.Start;
    float3 pa = Tri.A - Line.Start;
    float3 pb = Tri.B - Line.Start;
    float3 pc = Tri.C - Line.Start;
    
    /* Check if pq is inside the edges bc, ca and ab */
    Intersection.x = dot(pb, cross(pq, pc));
    if (Intersection.x < 0.0)
        return false;
    
    Intersection.y = dot(pc, cross(pq, pa));
    if (Intersection.y < 0.0)
        return false;
    
    Intersection.z = dot(pa, cross(pq, pb));
    if (Intersection.z < 0.0)
        return false;
    
    return IntersectionLinePlane(BuildPlane(Tri), Line, Intersection);
}

bool OverlapLineTriangle(STriangle Tri, SLine Line)
{
    float3 Intersection = CAST(float3, 0.0);
    
    if (IntersectionLineTriangle(Tri, Line, Intersection))
    {
        return
            distance(Intersection, Line.Start) < EPSILON && 
            distance(Intersection, Line.End) < EPSILON;
    }
    
    return false;
}

void StackPushNodeChildren(SIdStack Stack, inout uint StackPointer, SKDTreeNode Node, SLine Line)
{
    /* Get line segment in other representation */
    float3 Vec = Line.End - Line.Start;
    float tmax = length(Vec);
    Vec = normalize(Vec);
    
    int Axis = Node.Axis;
    int First = (Line.Start[Axis] > Node.Distance);
    
    if (Vec[Axis] == 0.0)
    {
        /* Line segment parallel to splitting plane, visit near side only */
        StackPush(Stack, StackPointer, Node.ChildIds[First]);
    }
    else
    {
        float t = (Node.Distance - Line.Start[Axis]) / Vec[Axis];
        
        /* Check if line segment straddles splitting plane */
        if (t >= 0.0 && t <= tmax)
        {
            /* Traverse near side first, then far side */
            StackPush(Stack, StackPointer, Node.ChildIds[First]);
            StackPush(Stack, StackPointer, Node.ChildIds[First ^ 1]);
        }
        else
        {
            /* Just traverse near side */
            StackPush(Stack, StackPointer, Node.ChildIds[First]);
        }
    }
}

float GetAngle(float3 a, float3 b)
{
    return acos(dot(a, b));
}

float GetSpotLightIntensity(float3 LightDir, SLightSource Light)
{
    /* Compute spot light cone */
    float Angle = GetAngle(LightDir, Light.Direction);
    float ConeAngleLerp = (Angle - Light.SpotTheta) / Light.SpotPhiMinusTheta;
    
    return saturate(1.0 - ConeAngleLerp);
}

void ComputeLightShading(inout float3 Color, SLightSource Light, SLightmapTexel Texel)
{
    /* Compute light direction vector */
    float3 LightDir = CAST(float3, 0.0);
    
    if (Light.Type != LIGHT_DIRECTIONAL)
        LightDir = normalize(Texel.WorldPos - SPHERE_POINT(Light.Sphere));
    else
        LightDir = Light.Direction;
    
    /* Compute phong shading */
    float NdotL = max(0.0, -dot(Texel.Normal, LightDir));
    
    /* Compute light attenuation */
    float Distance = distance(Texel.WorldPos, SPHERE_POINT(Light.Sphere));
    
    float AttnLinear    = Distance * SPHERE_RADIUS(Light.Sphere);
    float AttnQuadratic = AttnLinear * Distance;
    
    float Intensity = 1.0 / (1.0 + AttnLinear + AttnQuadratic);
    
    if (Light.Type == LIGHT_SPOT)
        Intensity *= GetSpotLightIntensity(LightDir, Light);
    
    /* Compute diffuse color */
    Color += Light.Color * CAST(float3, Intensity * NdotL);
}

bool TexelVisibleFromLight(SLightSource Light, SLightmapTexel Texel)
{
    /* Setup line segment */
    SLine Line;
    Line.Start = SPHERE_POINT(Light.Sphere);
    Line.End = Texel.WorldPos;
    
    /* Initialize node ID stack */
    SIdStack Stack;
    for (uint i = 0; i < MAX_STACK_SIZE; ++i)
        Stack.Data[i] = 0;
    Stack.StackPointer = 0;
    
    uint Id = 0;
    StackPush(Stack, Stack.StackPointer, Id);
    
    /* Iterate over all affected tree nodes */
    [allow_uav_condition]
    while (!StackEmpty(Stack))
    {
        /* Get next tree node */
        Id = StackPop(Stack, Stack.StackPointer);
        SKDTreeNode Node = NodeList[Id];
        
        /* Check if this is a node leaf */
        if (Node.TriangleStart != ID_NONE)
        {
            /* Iterate over all triangles inside the tree node */
            [allow_uav_condition]
            //****INFO****: Wenn ich hier nicht "[allow_uav_condition]" davor schreibe,
            //beschwert sich der Compiler, dass die Abbruchbedingung nicht von einem UAV
            //abhängen darf. Mit diesem Attribut kommt aber wieder der Fehler "cannot unroll loop".
            for (uint i = Node.TriangleStart, n = i + Node.NumTriangles; i < n; ++i)
            {
                /* Get current triangle */
                uint TriIndex = TriangleIdList[i];
                STriangle Tri = TriangleList[TriIndex];
                
                /* Make intersection tests */
                if (OverlapLineTriangle(Tri, Line))
                    return false;
            }
        }
        else
        {
            /* Push child nodes which are affected by the line segment */
            //****INFO****: Wenn ich diese Zeile entferne läuft alles, allerdings wird dann halt auch fast alles weg-optimiert.
            StackPushNodeChildren(Stack, Stack.StackPointer, Node, Line);
        }
    }
    
    return true;
}

float3 GetRandomRayDirection(float3x3 NormalMatrix, uint Index)
{
    return MUL(NormalMatrix, RadiosityDirections[Index].xyz);
}

bool SampleLightEnergy(SRay Ray, out float3 Color, out float Distance)
{
    Color = CAST(float3, 0.0);
    Distance = 0.0;
    //todo...
    return false;
}

void ComputeRadiosityShading(inout float3 Color, SRay Ray, float3 TexelNormal)
{
    /* Sampel light energy along specified ray */
    float3 SampleColor = CAST(float3, 0.0);
    float SampleDistance = 0.0;
    
    if (SampleLightEnergy(Ray, SampleColor, SampleDistance))
    {
        /* Add light energy to final texel color */
        float NdotL = max(0.0, dot(TexelNormal, Ray.Direction));
        
        Color += SampleColor * CAST(float3, NdotL * RadiosityFactor);
    }
}

void GenerateLightmapTexel(inout float3 Color, SLightSource Light, SLightmapTexel Texel)
{
    /* Compute direct illumination */
    if (TexelVisibleFromLight(Light, Texel))
        ComputeLightShading(Color, Light, Texel);
    
    /* Compute radiosity */
    if (NumRadiosityRays > 0)
    {
        /* Generate normal matrix (tangent space) */
        float3x3 NormalMatrix = float3x3(
            Texel.Tangent,
            cross(Texel.Normal, Texel.Tangent),
            Texel.Normal
        );
        
        /* Sample radiosity rays */
        SRay Ray;
        Ray.Origin = Texel.WorldPos;
        
        for (uint i = 0; i < NumRadiosityRays; ++i)
        {
            Ray.Direction = GetRandomRayDirection(NormalMatrix, i);
            ComputeRadiosityShading(Color, Ray, Texel.Normal);
        }
    }
}

[numthreads(8, 8, 1)]
void ComputeMain(
    uint3 GroupId : SV_GroupID,
    uint3 LocalId : SV_GroupThreadID,
    uint3 GlobalId : SV_DispatchThreadID)
{
    float4 Color = AmbientColor;
    
    /* Get current lightmap texel */
    uint2 TexelPos = GlobalId.xy;
    SLightmapTexel Texel = Lightmap[TexelPos.y * LightmapSize.x + TexelPos.x];
    
    /* Generate lightmap texel for each light source */
    [allow_uav_condition]
    //****INFO****: Hier kommt der Fehler "forced to unroll loop, but unrolling failed.".
    //Diese Schleife muss aber Dynamisch bleiben.
    for (uint i = 0; i < NumLights; ++i)
        GenerateLightmapTexel(Color.rgb, LightList[i], Texel);
    
    OutputLightmap[TexelPos] = Color;
}

Dieser Beitrag wurde bereits 5 mal editiert, zuletzt von »LukasBanana« (26.08.2013, 11:52)


dot

Supermoderator

Beiträge: 9 757

Wohnort: Graz

  • Private Nachricht senden

3

26.08.2013, 11:51

Sicher, dass es am Unrollen liegt? Was genau passiert denn?

LukasBanana

Alter Hase

  • »LukasBanana« ist der Autor dieses Themas

Beiträge: 1 097

Beruf: Shader Tools Programmer

  • Private Nachricht senden

4

26.08.2013, 11:54

Was meinst du mit "Was passiert denn"? Ich kann halt den Shader nicht kompilieren, weil der Shader Compiler genau diese Fehlermeldung ausspuckt:

C-/C++-Quelltext

1
ERROR 0:518: error X3511: forced to unroll loop, but unrolling failed.


Ihr könnt den Code so wie er ist in den AMD ShaderAnalyzer reinhauen mit folgenden Einstellungen:

C-/C++-Quelltext

1
2
Source Type: HLSL
HLSL Compiler: cs_5_0


Zum Debuggen von Shadern sehr hilfreich. Nur bei mir im Moment halt nicht so richtig ^^

Schrompf

Alter Hase

Beiträge: 1 470

Wohnort: Dresden

Beruf: Softwareentwickler

  • Private Nachricht senden

5

26.08.2013, 12:25

Probiere mal, vor der Schleife dem Compiler mittels [loop] das Unrollen zu verbieten. Wobei "verbieten" das falsche Wort ist, es ist nach meinem Wissen nur eine Empfehlung. Diese Seite besagt, dass bei [allow_uav_condition] keine Synchronisations-Befehle benutzt werden dürfen. Evtl. hast Du eins davon in Deiner Funktion und zwingst deswegen den Compiler zum Ausrollen?
Häuptling von Dreamworlds. Baut aktuell an nichts konkretem, weil das Vollzeitangestelltenverhältnis ihn fest im Griff hat. Baut daneben nur noch sehr selten an der Open Asset Import Library mit.

LukasBanana

Alter Hase

  • »LukasBanana« ist der Autor dieses Themas

Beiträge: 1 097

Beruf: Shader Tools Programmer

  • Private Nachricht senden

6

26.08.2013, 12:30

Das Attribut "[loop]" habe ich auch schon ausprobiert - noch vor dem [allow_uav_condition]. Aber da er unbedingt unrollen will, kommt dann statt dessen die Fehler meldung:
"[loop] kann nicht zusammen mit 'unrolling' verwendet werden".

In diesem Shader brauche ich auch keine Synchronisation. Daher wäre mir diese Limitierung mit [allow_uav_condition] egal.

LukasBanana

Alter Hase

  • »LukasBanana« ist der Autor dieses Themas

Beiträge: 1 097

Beruf: Shader Tools Programmer

  • Private Nachricht senden

7

29.08.2013, 13:02

Hab den Fehler gefunden.

Das "allow_uav_condition" kann ich wegalssen. Ich nehme auch wieder "StructuredBuffer" und nicht die RW variante.
Das Problem war mein Stack. Ich hatte eine temporäre variable als Stack:

C-/C++-Quelltext

1
2
3
4
5
6
7
struct SIdStack
{
    uint Data[MAX_STACK_SIZE];
    uint Pointer;
};
/* ... */
SIdStack Stack;

Den habe ich dann als Parameter an Funktionen übergeben:

C-/C++-Quelltext

1
2
3
4
5
void StackPush(inout SIdStack Stack, uint Id)
{
    Stack.Data[Stack.Pointer] = Id;
    ++Stack.Pointer;
}

Das ging nicht, weil der "Stack" Parameter nicht vollständig geschrieben wurde. Also war das "inout" oder auch ein "out" ungültig.
Dann hatte ich das umgeschrieben:

C-/C++-Quelltext

1
2
3
4
5
void StackPush(SIdStack Stack, inout uint StackPointer, uint Id)
{
    Stack.Data[StackPointer] = Id;
    ++StackPointer;
}

Nur jetzt wurde leider nicht die Id in meinem eigentlichen Stack gespeichert. Dabei hat mir der AMD ShaderAnalyzer wirklich sehr geholfen :-)

Jetzt habe ich erst mal einen (innerhalb einer Thread-Group) globalen Stack mit "groupshared".
Besser wäre allerdings weiterhin einen temporären Speicher zu verwenden. Der groupshared kommt sich allerdings nicht mit anderen Threads in die Quere,
da ich pro Thread-Group nur einen Thread verwende.

Bei RayTracing hat man so viel dynamic-branching, dass sich mehr threads pro Thread-Group eher weniger lohnen.

LukasBanana

Alter Hase

  • »LukasBanana« ist der Autor dieses Themas

Beiträge: 1 097

Beruf: Shader Tools Programmer

  • Private Nachricht senden

8

01.09.2013, 22:12

Ich habe leider immer noch Probleme mit meinem Shader.

Und zwar kann ich den Shader mit dem GPU ShaderAnalyzer von AMD kompilieren, egal ob mit oder ohne Optimierung, aber in C++ mit der DXGI Funktion D3DCompile kann ich den Shader
nur ohne Optimierung kompilieren.
Ansonsten erhalte ich wieder den Fehler: "Race condition while writing to shared memory detected". Dabei habe besteht zur Zeit jede Thread-Group aus gerade mal einen Thread.
Es kann somit beim 'groupshared' Memory niemals zu einer Racecondition kommen.

Danach habe ich den Stack in einen globalen Buffer umgebaut (RWBuffer<uint>), sodass jeder Thread seinen eigenen Stack hat.
Dadurch wird der Buffer leider sehr groß, und eigentlich sollte jede Thread-Group genug Register haben, um einen kleinen Stack von 64 Einträgen temporär speichern zu können.
Geht aber jetzt anscheinend nicht andern, denn meinen Shader ohne Optimierung zu verwenden, ist keine tolle Lösung.

Nun habe ich den Teil umgeschrieben, dann ging schon wieder das Problem mit den UAV Conditions los. Also habe ich wieder "[allow_uav_condition]" vor die Schleifen gesetzt.
Und jetzt kommt nur noch der Fehler "error: compilation aborted unexpectedly" :-(
Aber auch wieder nur mit Optimierung. Es kann doch nicht die einzige Lösung sein, keine Optimierung zu verwenden, oder?!

Hat jemand ne Idee, wie man den Stack sonst aufbauen könnte?
Ich will auf dem Stack nur eine ID (als 'uint') pro Eintrag speichern.

EDIT:
Den Compiler-Flag "D3DCOMPILE_SKIP_VALIDATION" habe ich auch schon ausprobiert, aber das hat auch nicht geholfen.
Es würde mich auch brennend interessieren, warum ich den Shader mit dem Analyzer problemlos kompiliert bekomme - auch mit Optimierung.

Dieser Beitrag wurde bereits 1 mal editiert, zuletzt von »LukasBanana« (01.09.2013, 22:20)


Werbeanzeige