Bei mir wären es wohl 20xfloat. Also 5xfloat4. Ist das annehmbar? Ein Beispiel: Ich habe zwei mal einen Quader aus 36 Vertices. Lohnt sich der höhere Speicheraufwand bzw. die höhere Rechenleistung in Relation zur Renderzeit?
Ich bin übrigens auf DirectX9 unterwegs.
Du scheinst immernoch davon auszugehen, dass es eine konkrete Antwort auf diese Frage gibt. Gibt es aber nicht. Es hängt viel davon ab, wie Deine Renderpipeline aussieht, ob Du für das Instancing irgendwelche Kompromisse eingehen musst oder ob Du für das Instancing teure State Changes machen musst, wie z.B. die Input Declaration wechseln. Wenn Du fünf Modelle zu je 10k Vertizes hast und durch Instancing alle fünf zeichnen müsstest, obwohl nur drei im Blick sind, dann ist es Verschwendung. Wenn Du zehn Würfel zu je 24 Vertices hast, wirst Du den Unterschied zwischen Instancing und Nicht-Instancing nicht mal messen können. Wenn Du 200 Würfel hast, die alle gleichartig sind, könnte es sich lohnen.
Probier es doch einfach aus.