.-----------.
| Kodowanie |
`--.--------'
  |
 .: Kodowanie transportowe - sposób zapisu wiadomości tak, by mogła zostać
  | przesłana i odebrana bez zniekształcenia również przez bardzo stare
  | programy.
  | Kodowanie transportowe jest używane do przesyłania załączników lub znaków,
  | których nie akceptuje program komunikacyjny jednej ze stron obsługujących
  | przesyłkę.
  | Znane kodowania transportowe to:
  | - Quoted Printable - zachowuje maksymalną czytelność zakodowanego tekstu;
  | - Base64 - daje mały przyrost objętości zakodowanej wiadomości (stąd
  |  używane do przesyłania binariów);
  | - uuencode - historyczny poprzednik Base64, używany np. do kodowania
  |  załączników w treści wiadomości (inline); nadmiernie uproszczony
  |  algorytm rozpoznawania takich załączników w OE pokazuje je nawet
  |  wtedy, kiedy ich faktycznie nie ma (błąd begin").
  | 
 .: Zestaw znaków - uporządkowany wykaz znaków używanych do zapisywania
  | wiadomości w danym języku (rodzinie języków). Stosowany najczęściej
  | we współczesnych komputerach sposób zapisu znaków (jeden znak - jeden bajt)
  | nie pozwala na zapisanie znaków ze wszystkich języków, stąd pomysł
  | wprowadzenia zestawów znaków. Cechą charakterystyczną jest to, że każdy
  | zestaw zawiera:
  | - Podstawowy zbiór znaków wspólnych (z przyczyn historycznych jest to
  |  zestaw us-ascii), które występują w każdym zestawie z tym samym numerem.
  |  Dzięki takiemu rozwiązaniu zestaw znaków us-ascii może być przesyłany
  |  bez używania kodowania transportowego czy deklarowania zestawu znaków,
  |  jest więc zestawem domyślnym.
  | - Zbiór znaków charakterystycznych dla danego języka (rodziny języków).
  |  Jednakowe numery w różnych zestawach mogą tu odpowiadać różnym znakom.
  |  Dla niektórych języków z przyczyn historycznych zostało zdefiniowanych
  |  kilka, a nawet kilkanaście różnych zestawów, jak to jest w przypadku
  |  języka polskiego. Nie wszystkie z nich zostały dopuszczone do używania
  |  w Internecie, i zazwyczaj tylko jeden z nich został przyjęty jako
  |  standard dla danego języka. W przypadku języka polskiego jest to
  |  zestaw znaków iso-8859-2 i tylko jego należy używać.
  |
  | Uwzględniając powyższe, oczywiste wydają się następujące rozwiązania:
  | - zestaw znaków MUSI być zadeklarowany w wiadomości, jeśli ma ona być
  |  czytelna dla innych bez odgadywania, co autor miał na myśli czy próby
  |  (najczęściej błędnej) automatycznego dopasowania zestawu.
  | - ponieważ deklaracja zestawu znaków następuje w jednym z nagłówków, więc
  |  znaki z innych zestawów niż domyślny MUSZĄ być w nagłówkach zapisane z
  |  użyciem kodowania transportowego.
  | Rozwiązania te będą sensowne również po zmianie domyślnego zestawu znaków,
  | jakim w niedalekiej przyszłości stanie się Unikod (patrz Unikod)
  | w kodowaniu (patrz kodowanie) utf-8.
  | 
 .: Unikod - Unicode, zestaw w założeniu obejmujący znaki wszystkich
  | ziemskich języków i wszystkie znaki typograficzne. Rozwiązanie, które
  | ma zastąpić stosowanie oddzielnych zestawów znaków (są one podzbiorami
  | Unikodu) i usunąć wiele niedogodności wynikających ze stosowania zestawów,
  | np. kłopoty z przytaczaniem w wiadomościach tekstowych cytatów w różnych
  | językach. Stosowanie Unikodu w istotny sposób może również ograniczyć
  | powszechne dziś występowanie wiadomości z błędną lub pominiętą deklaracją
  | zestawu znaków czy cytowaniu takich wiadomości.
  | Przyjęcie kodowania utf-8 pozwala na zachowanie wysokiej czytelności 
  | tekstu również w starych programach i równocześnie daje minimalny narzut 
  | na wielkość zakodowanego tekstu.
  |
  | dla potrzeb pl.internet.pomoc spisał Andrzej P. Woźniak
  |
.--^------------[ wróć na stronę główną ]------------------.
| Najnowsza wersja tego dokumentu znajduje się pod adresem |
| http://evil.pl/pip/                   |
`---------------[ wróć do słownika ]-----------------------'