Strona 1 z 1

Problemik z edytorkiem Unicode

PostNapisane: 1 lutego 2005, o 15:14
przez jacost
Witam,

Zastrzegam, że być może nie potrafię posłużyć się pomocą do programu i to narzędzie mnie przerasta -- nie potrafię zmusić edytorka Unicode do wpisania encji Unicode dla polskich liter do dokumentu. Robię tak:

1. tworzę dokument HTML z kodowaniem np. ISO 8859-1;
2. otwieram edytorek Unicode;
3. wpisuję jakiś tekst z pliterkami do edytorka, np. ąćęłńóśźż;
4. klikam drugi guzik z lewej (hint: "Wstawienie tekstu z edytorka do edytora z zamianą na encje");
5. w edytorze dostaję tekst z pliterkami ("ąćęłńóśźż") zamiast spodziewanych encji.

Czy ja nie rozumiem czegoś, co powinienem rozumieć, czy to narzędzie nie robi tego, co powinno? A może istnieje jakaś opcja, którą należy włączyć, żeby uzyskać encje?

Pozdrawiam

Problemik z edytorkiem Unicode

PostNapisane: 1 lutego 2005, o 15:21
przez platekr
W sekcji META powinno być zadeklarowane kodowanie Unicode (UTF16 lub UTF8), a nie ISO.

Problemik z edytorkiem Unicode

PostNapisane: 1 lutego 2005, o 15:39
przez jacost
Hmm... nie widzę różnicy w działaniu. Zresztą nie bardzo rozumiem, dlaczego miałoby to działać tylko w dokumentach Unicode. Wyobrażam sobie, że zastosowanie encji jest głównie takie, żeby reprezentować znaki, które nie dadzą się zaprezentować w danym kodowaniu, czyli np. do pokazania pliterek w dokumencie kodowanym ISO Latin 1.

PostNapisane: 1 lutego 2005, o 20:26
przez platekr
Edytorek Unicode działa w ten sposób, że w postaci Entities wklejane są te znaki, które nie posiadają reprezentacji w bieżącym zestawie znaków. Dlatego dla ciągu składającego się z polskich znaków encje nie zostaną wklejone, gdyż znaki te są poprawnie wyświetlane w edytorze głównym Pajączka i po prostu nie ma takiej potrzeby. Gdy jednak do edytorka Unicode wkleimy tekst, który nie posiada reprezentacji w bieżącym zestawie znaków, to wstawienie tekstu z edytorka do edytora spowoduje wstawienie encji. Przykład to:

napis po grecku: Τί εἶναι τὸ
napis po persku: يونی‌کُد چيست؟

Po wklejeniu tego napisu do edytorka Unicode (bez zamiany na encje!) i wstawieniu następnie do edytora głównego, otrzymamy entities, które przy kodowaniu w META ustawionym na UTF-8 będą poprawnie wyświetlane w przeglądarce.

PostNapisane: 2 lutego 2005, o 10:44
przez jacost
Dziękuję za odpowiedź. Tak sobie właśnie to wyobrażałem (że znaki nie mające reprezentacji w bieżącym zestawie znaków zostaną zastąpione encjami), więc dlatego ustawiłem kodowanie ISO 8859-1. W tym kodowaniu polskie literki nie mają reprezentacji.

PostNapisane: 2 lutego 2005, o 16:23
przez platekr