Kodowanie znaków narodowych

Pliki w komputerze tak naprawdę nie składają się z liczb i liter, lecz z pojedynczych liczb. Strona kodowa wskazuje, jaka liczba odpowiada jakiemu znakowi. Dla przykładu, dziesiętna liczba 65 oznacza wielką literę A, 66 oznacza B itd. Jednak w starszych stronach kodowych jest miejsce do określenia jedynie 255 znaków, co jest niewystarczające do oznaczenia wszystkich znaków narodowych. Dlatego każdy język (bądź grupa języków) posiada własną stronę kodową. To, co w jednej stronie kodowej wyświetli literę Ľ (ISO-8859-2), w innej wyświetli znak Ľ (w tym wypadku w ISO-8859-1)

Aby poprawnie wyświetlać znaki narodowe, program musi wiedzieć, w jakiej stronie kodowej zostały one zapisane w dokumencie. Gdyby istniała tylko jedna strona kodowa dla jednego języka, nie byłoby problemu, jednak dla samego języka polskiego istnieje kilkanaście sposobów kodowania znaków, z czego najczęściej w Internecie używane są dwa:

  • ISO-8859-2 - strona zgodna z normą ISO, używana w większości systemów,
  • WIN-CP-1250 - strona używana przez MS Windows.

Bardzo zalecaną stroną kodową jest strona zgodna z Polską Normą ISO-8859-2. Jest to domyślny sposób kodowania polskich znaków w Pająku.

Korzystanie z różnych stron kodowych podczas pracy

Pająk pozwala na tworzenie dokumentów w praktycznie dowolnym języku. Program potrafi również automatycznie rozpoznać stronę kodową, stosowaną w danym dokumencie, na podstawie wpisów w sekcji META. Odpowiednie opcje znajdują się w oknie Ustawienia programu - Dokumenty, a także w Menu pisownia.

Podczas pracy z serwisem, w oknie Właściwości serwisu możesz wskazać kodowanie, jakie ma być domyślnie stosowane dla wszystkich dokumentów tego serwisu. Pozwala to uniezależnić dany serwis od globalnych ustawień programu.

Możesz też szybko otworzyć i zapisać dokument, korzystając z wybranego kodowania za pomocą poleceń w Menu pisownia -> Odczytaj w kodowaniu... i Zapisuj w kodowaniu..., co pozwala dodatkowo korzystać z kodowania niezależnego od ustawień programu i serwisu.

Najczęściej używaną konwersją jest zmiana kodowania znaków z WIN-CP-1250 (strona kodowa używana w MS Windows) na ISO-8859-2 (zgodna z normą ISO strona kodowa używana w większości systemów).

Priorytet najwyższy ma kodowanie dla dokumentu. Następnie kodowanie dla serwisu i na końcu kodowanie ogólne. W przypadku zmiany kodowania do odczytu dla dokumentu następuje ponowne odczytanie dokumentu z konwersją wg wybranego kodowania. W przypadku zmiany kodowania przy zapisie dla dokumentu następuje zapisanie dokumentu w wybranym kodowaniu.

Wspomaganie dla Unicode

W celu poprawienia komfortu pracy podczas korzystania z kodowania za pomocą Unicode stworzony został mini edytorek unicode. Narzędzie to pozwala kopiować i wklejać do dokumentu teksty zawierające encje Unicode, które automatycznie zamieniane będą na znaki UTF.

Konwersja znaków narodowych

Pająk umożliwia konwersję kodowania znaków na wiele różnych stron kodowych. Możesz ją przeprowadzić na kilka sposobów:

  • za pomocą narzędzia Rozszerzone wyszukiwanie i zamiana, które umożliwia konwersję kodowania w aktualnym dokumencie, wszystkich otwartych, a także w wybranych lub wszystkich dokumentach określonego folderu lub Serwisu. Okno możesz otworzyć za pomocą polecenia Konwerter kodowania znaków w menu Pisownia. Ikona polecenia została pokazana obok.
  • szybką konwersję znaków w bieżącym dokumencie możesz przeprowadzić za pomocą polecenia Znaki narodowe w bieżącym w menu Pisownia. Ikona polecenia została pokazana obok.

Możesz też szybko usunąć wszystkie polskie znaki w bieżącym dokumencie lub we wszystkich otwartych dokumentach, używając poleceń Usuń polskie znaki w bieżącym i Usuń polskie znaki w otwartych w menu Pisownia.

Podczas tworzenia nowego dokumentu możesz wybrać stronę kodową w Edytorze sekcji META. Domyślnie jest ustawiona strona ISO-8859-2.

Pokrewne tematy

Do góry