std::wistream holt nur einen char

Werbeanzeige

Roflo

Alter Hase

Beiträge: 955

08.07.2015, 20:39

std::wistream holt nur einen char

Ich hab VS2010 am werkeln und hab festgestellt, dass std::wistream/std::wfstream, wenn ich deren get methode aufrufe, der dateizeiger nur um 1 weiterrückt, aber nicht wie erwartet um 2, da es sich ja um einen wchar_t handelt, welcher nunmal 2 bytes/chars groß ist. Ist da was was ich nicht weiß? :hmm:

Zum Seitenanfang

dot

Supermoderator

Beiträge: 9 757

Wohnort: Graz

08.07.2015, 22:23

Was genau ist für dich der "Datenzeiger"?

m4studios

Zum Seitenanfang

Roflo

Alter Hase

Beiträge: 955

09.07.2015, 06:39

Ich meinte Dateizeiger. Also den welchen man sich mit tellg besorgen kann. Und der rutscht nur um eine Position weiter, anstatt zwei. Und nun frag ich warum

Zum Seitenanfang

Tobiking

1x Rätselkönig

Beiträge: 1 231

09.07.2015, 08:45

Mit tellg bekommst du keinen Zeiger, sondern eine Position. Und die Position ist unabhängig davon wie groß dein Zeichen ist.

Zum Seitenanfang

Roflo

Alter Hase

Beiträge: 955

09.07.2015, 09:33

Neineinein

wenn ich von einem wistream mit get einen wchar_t hole, rückt der dateizeiger nur um eine position weiter. Somit holt das nächste get nicht den wchar_t danach sondern irgendeinen schnulli.

Zum Seitenanfang

dot

Supermoderator

Beiträge: 9 757

Wohnort: Graz

09.07.2015, 10:51

Was heißt "das Nächste geht nicht"? Was genau kommt zurück? Vermutlich pos_type(-1)!? Ich nehme an, du hast den Stream im Textmodus geöffnet?

m4studios

Zum Seitenanfang

Roflo

Alter Hase

Beiträge: 955

09.07.2015, 13:21

Also, noch mal von ganz vorne

Ich öffne mit einem wfstream eine Unicode-Datei und lese die BOM aus. Funktioniert alles. Im Hexeditor sehe ich zuerst 2 bytes für die BOM und dannjeweils zwei bytes für die zeichen, welche also schön in ein wchar_t passen würden. Sagen wir mal es steht der text 'Baum' drin, dann würde es byteweise so aussehen:

	Quellcode
1	'B', '\0', 'a', '\0', 'u, '\0', 'm', '\0',

So nun lese ich mit wfstream::get zeichen für zeichen ein:
(geöffnet im textmodus)

	C-/C++-Quelltext
1 2 3 4 5 6	wchar_t c1 = file.get(); wchar_t c2 = file.get(); wchar_t c3 = file.get(); wchar_t c4 = file.get(); wchar_t c5 = file.get(); ...

c1 enthält danach 'B', c2 '\0', c3 'a', c4 '\0', c5 'u', usw.
Also holt sich get nur jeweils ein byte/char anstatt, wie man es sich denken könnte, einen wchar_t. Dementsprechend wird auch der Dateizeiger nur um ein byte weitergerückt.
Ich kann da natürlich ein Workaround basteln, aber warum macht get das bloß? :hmm: