[devel] codecvt + UTF-8 - не работает преобразование.

Anriy Stepanov =?iso-8859-1?q?stanv_=CE=C1_altlinux=2Eru?=
Ср Июн 14 18:35:39 MSD 2006


Написал програмку для тестирования:

#include <iostream>
#include <locale>
#include <clocale>
#include <string>
#include <limits>
#include <climits>

using namespace std;

int main()
{
         setlocale(LC_ALL, "");
locale const loc = locale(""); // System locale (ru_RU.UTF-8)

typedef codecvt_base::result res;
typedef codecvt<wchar_t, char, mbstate_t> my_codecvt; // internal,
external, state
locale const new_locale(loc, new my_codecvt); // locale with codecvt facet
const my_codecvt& cdcvt = use_facet<my_codecvt>(new_locale);
mbstate_t state;
res r;

const char *in_next = 0;
wchar_t *out_next = 0;

string s("Строка!");
// string s("String!");
const int bytes = s.length();
const int symbols = 7;

wstring ws(L'.', symbols);
cout << "Bytes: " << bytes << endl;
cout << "Symbols: " << symbols << endl;

r = cdcvt.in(state, s.c_str(), s.c_str()+s.size(), in_next,
&ws[0], &ws[0] + ws.size(), out_next);

cout << "Encoding result: ";
cout << (r == codecvt_base::ok ? "Succes!" : "Fail!") << endl;
 
cout << "Was: " << s << endl;  
wcout << "Is: " << ws << endl;

return 0;
}

Если роскоментировать string s("String!"); то все работает как надо.
Создаестся строка с wide char.
И результат:
Bytes: 7
Symbols: 7
Encoding result: Succes!
Was: String!
Is: String!
Т.е. преобразование работает.

Но если раскоментировать string s("Строка!"); то оно не может
преобразовать multi byte symbols в wide chars....

Результат выполнения:
Bytes: 13
Symbols: 7
Encoding result: Fail!
Was: Строка!
Is:

Вот.

локаль UTF-8

Почему оно не может string c multi bytes characters (где один символ
занимает несколько байт, но не каждый) UTF-8 перенести в whar_t ?



Подробная информация о списке рассылки Devel