Quote:
Nižšie uvádzam text svojho dnešného príspevku do emailovej diskusnej skupiny
Infoveku Údržba.
Dobrý večer,
urobil som práve ešte zopár pokusov s
UTF-8 v emailoch, aby som ešte viac podložil tvrdenie o zatiaľ ešte stále problematickom využívaní
UTF-8 v prostredí emailov, najmä webmailov, v roku 2007.
Na testy som použil
mainstreamové webmaily Horde a
Squirrelmail. To nie je žiadny „7-bitový telnet“, ako tu bolo naznačené, ale v dnešnej dobe dva zrejme najpoužívanejšie softvéry webmailu na svete.
Keď som v
Horde pri odosielaní explicitne zvolil
UTF-8, výsledkom po odoslaní správy aj po jej doručení adresátom boli hieroglyfy. V
Predmete správy aj v tele správy. Pri príjme v dvoch rôznych webmailoch aj v poštovom programe. Napriek deklarovanej podpore teda
Horde UTF-8 nezvláda.
Vo
Squirrelmaili to je ešte jednoduchšie: užívateľ vôbec nemá možnosť vybrať si pri odosielaní kódovanie. Toto stanovuje jednotne administrátor pre všetkých používateľov. Keďže na drvivej väčšine dnešných slovenských webmailov bude prednastavené
ISO-8859-2, nie
UTF-8, test s odosielaním
UTF-8 zo
Squirrelmail sa skončil ešte predtým, než sa začal.
Tak som aspoň skúsil vytvoriť správu v
UTF-8 v
The Bat a poslať ju na webmail. Zároveň som kópiu poslal do
The Bat, kam dorazila 100% v poriadku v
UTF-8 tak, ako bola odoslaná.
Ako sa tá istá správa zobrazila na webmaili? Takto vyzeral výsledok v
Horde (obrázok sa po kliknutí otvorí na plnú veľkosť):
Ako vidíte na troch riadkoch s hieroglyfmi, všetky 3 pokusy doručiť do
Horde email v
UTF-8 (troma rôznymi spôsobmi, z 2 rôznych webmailov a raz z poštového programu) zlyhali.
Predmety emailov sa nestanú čitateľné ani pri manuálnom prepínaní kódovania v prehliadači.
Po kliknutí na nečitateľný
Predmet emailu sa v
Horde objaví toto
(obrázok sa po kliknutí otvorí na plnú veľkosť):
Už samotné chybové hlásenie v tomto okne je chybné. Pred začiatkom testu som totiž v
Horde nastavil kódovanie
UTF-8 ako predvolené, čiže
je to „my own character set“. Toto chybové hlásenie sa zjaví aj vtedy, keď v prehliadači explicitne zvolíte kódovanie
UTF-8 a nespoľahnete sa na autodetekciu obsahu stránky. Či už explicitne zvolíte akékoľvek kódovanie alebo sa spoľahnete na autodetekciu, výsledkom sú žiaľ vždy hieroglyfy.
Ak uposlúchnete výzvu chybového hlásenia („click here“), objaví sa toto:
Čiže konečne sme sa prepracovali aspoň k čitateľnému
telu správy zaslanej v štandardnom
UTF-8. Žiaľ,
Predmet emailu si v
Horde neprečítame – prístupný je iba v hieroglyfoch.
Ešte horšie je, že na tento email v
Horde nemôžeme ani odpovedať. Napriek prednastavenému
UTF-8 pri pokuse odpovedať v
Horde na štandardný email doručený v
UTF-8 sa zjaví nový reťazec hieroglyfov:
Testy
UTF-8 v
Horde teda skončili (v máji 2007) fiaskom.
Pozrime sa teraz na
Squirrelmail. Odosielať
UTF-8 v štandardnej konfigurácii neumožňuje vôbec, pretože pre slovenčinu je prednastavené
ISO-8859-2. Ako to vyzerá aspoň s príjmom správ v
UTF-8? V priečinku s Doručenou poštou je všetko v poriadku
(obrázok sa po kliknutí otvorí na plnú veľkosť):
Po otvorení danej správy je takisto všetko v poriadku
(obrázok sa po kliknutí otvorí na plnú veľkosť):
Čo sa však stane, ak si želáte na danú správu odpovedať? Vraciame sa k hieroglyfom
(obrázok sa po kliknutí otvorí na plnú veľkosť):
Možnosť prepnúť do
UTF-8 neexistuje, odpovedať s citátom alebo so zachovaním čitateľného
Predmetu nie je možné. Komunikácia sa nekoná. Znova treba podotknúť, že pri použití kódovania
ISO-8859-2 všetko (príjem aj odosielanie) funguje bezchybne.
Toľko test z 29. mája 2007 dvoch dnešných masívne rozšírených webmailových systémov,
Horde a
Squirrelmail. Aj na slovenských školách sú často využívané na komunikáciu práve tieto webmaily. Práve tieto webmaily sú často ponúkané aj ako súčasť webhostingových služieb slovenskými i zahraničnými poskytovateľmi. Napríklad v
tomto cenníku sú na webmail k dispozícii práve
Squirrelmail a
Horde.
Squirrelmail a
Horde sú v dnešnej dobe súčasťou
štandardu. Ako testy dokázali, s ohľadom na
UTF-8 štandardu absolútne nepostačujúceho, ale žiaľ taká je momentálna realita.
Zhrnutie: vyššie uvedené testy sa zdajú byť presvedčivým dôkazom, že na celoplošné nasadenie
UTF-8 v dnešnej dobe ešte nedozrel čas. Bezpečnejšie a praktickejšie pre slovenčinu a češtinu je zatiaľ (rok 2007) odosielanie emailov v staršom štandarde
ISO-8859-2. Toto kódovanie by som odporúčal aj členom konferencií
Infoveku Údržba a
Garanti: korešpondovať v stredoeurópskom kódovaní
ISO-8859-2 a iba v odôvodnených prípadoch (napríklad ak v texte emailu treba zobraziť znak €) prepnúť na
UTF-8.
(Pozor: mnohí ľudia si v dnešnej dobe optimálne
stredoeurópske kódovanie
ISO-8859-2 mýlia so
západoeurópskym kódovaním
ISO-8859-1. Výsledkom v slovenských textoch sú pokazené mäkčene. Ďalšou bežnou príčinou, prečo sa mäkčene alebo dĺžne v emailoch nezobrazujú správne, je nepoužitie
žiadneho kódovania podporujúceho diakritiku – čiže použitie obyčajného
US-ASCII, ktoré však, ako v praveku internetu, nepodporuje žiadne mäkčene ani dĺžne. Napriek tomu sa ešte aj v roku 2007 pomerne často stáva, že menej skúsení pisatelia pošty sa v emailoch s
US-ASCII snažia používať mäkčene a dĺžne, čo sa nemôže skončiť úspechom...)
Keď raz príde deň, v ktorom
UTF-8 bude bezproblémové u svetových lídrov emailovej komunikácie, akými sú
Gmail,
Yahoogroups,
Squirrelmail a
Horde, potom budeme môcť dať zbohom kódovaniu
ISO-8859-2 a prejsť celoplošne výlučne na
UTF-8. Zdá sa však, že takýto krok by v dnešných podmienkach bol unáhlený.