Die Kamera würde im View Space immer noch die Position (0, 0, 0) haben, weil so der View Space definiert ist (d.h. der Raum, den die Kamera aufspannt). Im World Space läge die Kamera bei den Koordinaten (1, 1, 1). Da du auf deinem Bildschirm aber alles aus dem Auge/der Position der Kamera siehst, müssen ja alle Objekte so transformiert/projiziert werden, dass sie in korrekter Größe und Position auf dem Bildschirm erscheinen.
Kurzes Beispiel: Haus befindet sich im World Space auf Position (0, 0, 2) (also "weit hinten"). Die Kamera befindet sich im World Space auf Position (0, 0, 1), was in der View Matrix beschrieben ist. Wenn Du das jetzt auf dem Bildschirm darstellen willst, muss das Haus ja größer erscheinen, weil die Kamera näher am Objekt ist als wenn du den World Space darstellen würdest. Daher wendest Du die View Matrix auf das Haus an. Das Haus wird damit quasi um (0, 0, 1) nach vorne geschoben, befindet sich näher an der Kamera und wird größer gerendert. Wenn Du die Kamera nach vorne bewegst, würdest Du damit das Haus näher ziehen.
Deswegen sagt man oft auch, dass man eigentlich nicht die Kamera bewegt, sondern die Objekte sich bewegen und es dann so wirkt, als würde man sich in der Welt bewegen. Das ist hier ganz gut dargestellt (unten bei "Model Space, World Space, View Space"):
http://www.codinglabs.net/article_world_…ion_matrix.aspx
Der View Space ist damit ein Zwischenschritt um die Szene später möglichst einfach auf den Bildschirm zu bringen (d.h. erst in den Projection Space und dann Screen Space).