Kodowanie znaków narodowych w dokumentach w Pajączku

header bg2 Kodowanie znaków narodowych w dokumentach w Pajączku
4.7/5 - (3 votes)

Kodowanie znaków narodowych do czasu premiery Pajączka było prawdziwą udręką. Pliki źródłowe tworzyło się w jednym programie, konwertowało następnie do porządanego formatu (najczęściej ISO-8859-2) za pomocą osobnego narzędzia. Pajączek natomiast pozwala na w pełni automatyczne kodowanie znaków w dowolnym standardzie.

Pliki w komputerze tak naprawdę nie składają się z liczb i liter, lecz z pojedynczych liczb. Strona kodowa wskazuje, jaka liczba odpowiada jakiemu znakowi. Dla przykładu, dziesiętna liczba 65 oznacza wielką literę A, 66 oznacza B itd. Jednak w starszych stronach kodowych jest miejsce do określenia jedynie 255 znaków, co jest niewystarczające do oznaczenia wszystkich znaków narodowych. Dlatego każdy język (bądź grupa języków) posiada własną stronę kodową. To, co w jednej stronie kodowej wyświetli literę Ľ (ISO-8859-2), w innej wyświetli znak £ (w tym wypadku w ISO-8859-1)

Aby poprawnie wyświetlać znaki narodowe, program musi wiedzieć, w jakiej stronie kodowej zostały one zapisane w dokumencie. Gdyby istniała tylko jedna strona kodowa dla jednego języka, nie byłoby problemu, jednak dla samego języka polskiego istnieje kilkanaście sposobów kodowania znaków, z czego najczęściej w Internecie używane są trzy:

  • ISO-8859-2 – strona zgodna z normą ISO, używana w większości systemów,
  • Unicode – wielonarodowy alfabet znaków coraz częściej używany do kodowania stron
  • WIN-CP-1250 – strona używana przez MS Windows.

Zalecaną stroną kodową jest strona zgodna z Polską Normą ISO-8859-2. Jest to domyślny sposób kodowania polskich znaków w Pajączku.

Korzystanie z różnych stron kodowych podczas pracy

Pajączek 5 NxG pozwala na tworzenie dokumentów w praktycznie dowolnym języku. Program potrafi również automatycznie rozpoznać stronę kodową, stosowaną w danym dokumencie, na podstawie wpisów w sekcji META. Odpowiednie opcje znajdują się w oknie Ustawienia programu – Dokumenty, a także w Menu pisownia.

Podczas pracy z serwisem, w oknie Właściwości serwisu możesz wskazać kodowanie, jakie ma być domyślnie stosowane dla wszystkich dokumentów tego serwisu. Pozwala to uniezależnić dany serwis od globalnych ustawień programu.

Możesz też szybko otworzyć i zapisać dokument, korzystając z wybranego kodowania za pomocą poleceń w Menu pisownia -> Odczytaj w kodowaniu… i Zapisuj w kodowaniu…, co pozwala dodatkowo korzystać z kodowania niezależnego od ustawień programu i serwisu.

Najczęściej używaną konwersją jest zamiana kodowania znaków z WIN-CP-1250 (strona kodowa używana w MS Windows) na ISO-8859-2 (zgodna z normą ISO strona kodowa używana w większości systemów).

Priorytet najwyższy ma kodowanie dla dokumentu. Następnie kodowanie dla serwisu i na końcu kodowanie ogólne. W przypadku zmiany kodowania do odczytu dla dokumentu następuje ponowne odczytanie dokumentu z konwersją wg wybranego kodowania. W przypadku zmiany kodowania przy zapisie dla dokumentu następuje zapisanie dokumentu w wybranym kodowaniu.

Wspomaganie dla Unicode

W celu poprawienia komfortu pracy podczas korzystania z kodowania za pomocą Unicode stworzony został mini edytorek unicode. Narzędzie to pozwala kopiować i wklejać do dokumentu teksty zawierające encje Unicode, które automatycznie zamieniane będą na znaki UTF.

Konwersja znaków narodowych

Pajączek umożliwia konwersję kodowania znaków na wiele różnych stron kodowych. Możesz ją przeprowadzić na kilka sposobów:

  • Za pomocą narzędzia Rozszerzone wyszukiwanie i zamiana, które umożliwia konwersję kodowania w aktualnym dokumencie, wszystkich otwartych, a także w wybranych lub wszystkich dokumentach określonego folderu lub Serwisu. Okno możesz otworzyć za pomocą polecenia Konwerter kodowania znaków w menu Pisownia.
  • Szybką konwersję znaków w bieżącym dokumencie możesz przeprowadzić za pomocą polecenia Znaki narodowe w bieżącym w menu Pisownia.
  • Możesz też szybko usunąć wszystkie polskie znaki w bieżącym dokumencie lub we wszystkich otwartych dokumentach, używając poleceń Usuń polskie znaki w bieżącym i Usuń polskie znaki w otwartych w menu Pisownia.

Podczas tworzenia nowego dokumentu możesz wybrać stronę kodową w Edytorze sekcji META. Domyślnie jest ustawiona strona ISO-8859-2.

2 komentarze

  1. sadul

    Ile najwięcej zestawów narodowych może być kodowane jednocześnie? Myślałem np., by ważniejsze słowa kluczowe dać w prawie wszystkich istniejących językach/czcionkach/grafikach. No ale żadne kodowanie nie pozwala na poprawne wyświetlenie wszystkiego, co bym chciał. Z drugiej strony, czy na komputerze kogoś, do kogo te słowa kluczowe są kierowane, one również będą wyświetlane niepoprawnie?

  2. Rafał Płatek

    Przy zastosowaniu UTF-8 można kodować wszystkie zestawy w jednym dokumencie. Natomiast wg ostatnich informacji z branży SEO, słowa kluczowe (w meta keywords) nie mają zbytnio wpływu na pozycję w wyszukiwarkach. W treści, owszem.
    Na komputerze gdzie przeglądarka obsługuje kodowanie Unicode (UTF-8) wszystkie słowa będą poprawnie wyświetlane.

Napisz parę słów o sadul Anuluj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *

Administratorem Twoich danych osobowych będzie Rafał Płatek, prowadzący działalność gospodarczą pod firmą CREAM.SOFTWARE RAFAŁ PŁATEK, wpisaną do rejestru ewidencji gospodarczej CEiDG pod numerem NIP 681-112-89-55. Szczegóły związane z przetwarzaniem danych osobowych znajdziesz w polityce prywatności.