Was du suchst ist die allgemeine Funktionsweise von 3D-Visualisierungen. Stichworte dazu wären Modelspace, Worldspace, Viewspace, Projectionspace, Transformationsmatrix, homogene Koordinaten.
Ich versuch es mal ganz kurz zusammen zu fassen:
Am Anfang hast du ein 3D-Objekt, das im eigenen Koordinatensystem erstellt wurde (Modelspace). Damit du es in deiner Szene (Worldspace) platzieren kannst, benötigst du eine Transformationsmatrix (Modelmatrix genannt). Jeder Punkt deines Objektes wird mit dieser Matrix multipliziert und so an eine Position in deiner Szene transformiert. Inbegriffen sind Translation, Rotation und Skalierung.
Der nächste Schritt ist, die Kamera. Du möchtest ja am Ende einen Ausschnitt aus deiner Szene auf dem Bildschirm darstellen. Die Kamera ist definiert durch Position, Ausrichtung und Öffnungswinkel (und noch ein paar andere Dinge wie Near- und Farplane). Um nun deine Szene aus der Kameraperspektive zu zeigen musst du wieder alle Punkte transformieren. Das machst du mit der Viewmatrix. Hast du alle Punkt deiner Szene damit multipliziert, hast du alle Punkte im Viewspace.
Am Ende kommt die Projektion vom 3D-Raum auf dein 2D-Bildschirm. Dafür brauchst du die Projectionmatrix. Wieder mit allen Punkten multipliziert, hast du alle Punkte im Projectionspace. In diesem Projectionspace sind (nach der Normalisierung...ein Detail, was du in anderen Quellen findest) alle Punkte innerhalb eines Einheitswürfels von -1 bis 1 in alle 3 Achsen. Diese Punkte können dann anhand der x- und y-Achse in Pixelkoordinaten transformiert werden. -1 entspricht dann 0 und 1 deiner maximalen Auflösung.
Das war wirklich nur sehr grob erklärt, wie es abläuft. Details musst du mit Hilfe der Stichworte finden. Das ist ein sehr wichtiges, aber auch sehr weitreichendes Thema. Man sollte es auf jeden Fall verstanden haben, wenn man in 3D arbeiten möchte.
Abgeleitet davon beantworten sich auch die meisten deiner Fragen. Für Animationen transformierst du deine Objektpunkte eben jeden Frame mit einer anderen Matrix.
Hinsichtlich der Genauigkeit hast du recht, dass es da Grenzen gibt. Sehr sehr große Zahlen sind genauso schlecht wie sehr sehr kleine Zahlen. Dabei kommt es dann zu verschiedensten Problemen.
Allerdings ist auch zu sagen, dass eine 64-bit Float im Normalfall Zahlen von −10^308 bis +10^308 (laut Wiki) darstellen kann (die Präzision mal außer acht gelassen). Das sollte für alle Spiele ausreichen. Du würdest auch kein Universum in einer Szene erstellen. Das wäre nämlich an den meisten Stellen leer und für den Spieler extremst langweilig
Edit: Vielleicht hast du das auch nicht gesucht
Aber es erklärt trotzdem, dass die gesamte 3D-Darstellung absolut nichts mit menschlichen Einheitensystemen zu tun hat. Ob jetzt eine Koordinatenverschiebung um 1 bedeutet, dass das Objekt 1mm, 1m, 1km oder 1 Lichtjahr weit verschoben wurde, ist ganz dem Entwickler überlassen.