It is currently Thu, 28 Oct 2021, 21:01




Post new topic Reply to topic  [ 4 posts ] 
 Je dnes (2007) pre emaily praktickejšie ISO-8859-2 než UTF? 
Author Message
site admin
User avatar

Joined: Sat, 7 Oct 2006, 18:46
Posts: 198
New post Je dnes (2007) pre emaily praktickejšie ISO-8859-2 než UTF?
Ak máte komentáre k tejto otázke, prosím pošlite svoju reakciu do tejto diskusnej témy:

Je dnes (2007) zatiaľ bezpečnejšie a praktickejšie používať pre slovenčinu alebo češtinu v emailoch kódovanie ISO-8859-2 radšej ako UTF-8 ?

(Ak dnes používate na webstránkach UTF-8, nespôsobuje to žiadne problémy. Avšak s odpovedaním na Vaše emaily zaslané v kódovaní UTF-8 môžu mať dnes ešte pisatelia problémy, najmä ak ide o počítačových laikov používajúcich rôzne, na plnú implementáciu UTF-8 zatiaľ ešte neprispôsobené webmaily.)


Last edited by Faterson on Fri, 1 Jun 2007, 12:54, edited 6 times in total.

Tue, 29 May 2007, 13:17
Profile E-mail WWW
site admin
User avatar

Joined: Sat, 7 Oct 2006, 18:46
Posts: 198
New post 
Quote:
Nižšie uvádzam text svojho dnešného príspevku do emailovej diskusnej skupiny Infoveku Údržba.

Dobrý večer,

urobil som práve ešte zopár pokusov s UTF-8 v emailoch, aby som ešte viac podložil tvrdenie o zatiaľ ešte stále problematickom využívaní UTF-8 v prostredí emailov, najmä webmailov, v roku 2007.

Na testy som použil mainstreamové webmaily Horde a Squirrelmail. To nie je žiadny „7-bitový telnet“, ako tu bolo naznačené, ale v dnešnej dobe dva zrejme najpoužívanejšie softvéry webmailu na svete.

Keď som v Horde pri odosielaní explicitne zvolil UTF-8, výsledkom po odoslaní správy aj po jej doručení adresátom boli hieroglyfy. V Predmete správy aj v tele správy. Pri príjme v dvoch rôznych webmailoch aj v poštovom programe. Napriek deklarovanej podpore teda Horde UTF-8 nezvláda.

Vo Squirrelmaili to je ešte jednoduchšie: užívateľ vôbec nemá možnosť vybrať si pri odosielaní kódovanie. Toto stanovuje jednotne administrátor pre všetkých používateľov. Keďže na drvivej väčšine dnešných slovenských webmailov bude prednastavené ISO-8859-2, nie UTF-8, test s odosielaním UTF-8 zo Squirrelmail sa skončil ešte predtým, než sa začal.

Tak som aspoň skúsil vytvoriť správu v UTF-8 v The Bat a poslať ju na webmail. Zároveň som kópiu poslal do The Bat, kam dorazila 100% v poriadku v UTF-8 tak, ako bola odoslaná.

Ako sa tá istá správa zobrazila na webmaili? Takto vyzeral výsledok v Horde (obrázok sa po kliknutí otvorí na plnú veľkosť):

Image

Ako vidíte na troch riadkoch s hieroglyfmi, všetky 3 pokusy doručiť do Horde email v UTF-8 (troma rôznymi spôsobmi, z 2 rôznych webmailov a raz z poštového programu) zlyhali. Predmety emailov sa nestanú čitateľné ani pri manuálnom prepínaní kódovania v prehliadači.

Po kliknutí na nečitateľný Predmet emailu sa v Horde objaví toto (obrázok sa po kliknutí otvorí na plnú veľkosť):

Image

Už samotné chybové hlásenie v tomto okne je chybné. Pred začiatkom testu som totiž v Horde nastavil kódovanie UTF-8 ako predvolené, čiže je to „my own character set“. Toto chybové hlásenie sa zjaví aj vtedy, keď v prehliadači explicitne zvolíte kódovanie UTF-8 a nespoľahnete sa na autodetekciu obsahu stránky. Či už explicitne zvolíte akékoľvek kódovanie alebo sa spoľahnete na autodetekciu, výsledkom sú žiaľ vždy hieroglyfy.

Ak uposlúchnete výzvu chybového hlásenia („click here“), objaví sa toto:

Image

Čiže konečne sme sa prepracovali aspoň k čitateľnému telu správy zaslanej v štandardnom UTF-8. Žiaľ, Predmet emailu si v Horde neprečítame – prístupný je iba v hieroglyfoch.

Ešte horšie je, že na tento email v Horde nemôžeme ani odpovedať. Napriek prednastavenému UTF-8 pri pokuse odpovedať v Horde na štandardný email doručený v UTF-8 sa zjaví nový reťazec hieroglyfov:

Image

Testy UTF-8 v Horde teda skončili (v máji 2007) fiaskom.

Pozrime sa teraz na Squirrelmail. Odosielať UTF-8 v štandardnej konfigurácii neumožňuje vôbec, pretože pre slovenčinu je prednastavené ISO-8859-2. Ako to vyzerá aspoň s príjmom správ v UTF-8? V priečinku s Doručenou poštou je všetko v poriadku (obrázok sa po kliknutí otvorí na plnú veľkosť):

Image

Po otvorení danej správy je takisto všetko v poriadku (obrázok sa po kliknutí otvorí na plnú veľkosť):

Image

Čo sa však stane, ak si želáte na danú správu odpovedať? Vraciame sa k hieroglyfom (obrázok sa po kliknutí otvorí na plnú veľkosť):

Image

Možnosť prepnúť do UTF-8 neexistuje, odpovedať s citátom alebo so zachovaním čitateľného Predmetu nie je možné. Komunikácia sa nekoná. Znova treba podotknúť, že pri použití kódovania ISO-8859-2 všetko (príjem aj odosielanie) funguje bezchybne.

Toľko test z 29. mája 2007 dvoch dnešných masívne rozšírených webmailových systémov, Horde a Squirrelmail. Aj na slovenských školách sú často využívané na komunikáciu práve tieto webmaily. Práve tieto webmaily sú často ponúkané aj ako súčasť webhostingových služieb slovenskými i zahraničnými poskytovateľmi. Napríklad v tomto cenníku sú na webmail k dispozícii práve Squirrelmail a Horde. Squirrelmail a Horde sú v dnešnej dobe súčasťou štandardu. Ako testy dokázali, s ohľadom na UTF-8 štandardu absolútne nepostačujúceho, ale žiaľ taká je momentálna realita.

Zhrnutie: vyššie uvedené testy sa zdajú byť presvedčivým dôkazom, že na celoplošné nasadenie UTF-8 v dnešnej dobe ešte nedozrel čas. Bezpečnejšie a praktickejšie pre slovenčinu a češtinu je zatiaľ (rok 2007) odosielanie emailov v staršom štandarde ISO-8859-2. Toto kódovanie by som odporúčal aj členom konferencií Infoveku Údržba a Garanti: korešpondovať v stredoeurópskom kódovaní ISO-8859-2 a iba v odôvodnených prípadoch (napríklad ak v texte emailu treba zobraziť znak €) prepnúť na UTF-8.

(Pozor: mnohí ľudia si v dnešnej dobe optimálne stredoeurópske kódovanie ISO-8859-2 mýlia so západoeurópskym kódovaním ISO-8859-1. Výsledkom v slovenských textoch sú pokazené mäkčene. Ďalšou bežnou príčinou, prečo sa mäkčene alebo dĺžne v emailoch nezobrazujú správne, je nepoužitie žiadneho kódovania podporujúceho diakritiku – čiže použitie obyčajného US-ASCII, ktoré však, ako v praveku internetu, nepodporuje žiadne mäkčene ani dĺžne. Napriek tomu sa ešte aj v roku 2007 pomerne často stáva, že menej skúsení pisatelia pošty sa v emailoch s US-ASCII snažia používať mäkčene a dĺžne, čo sa nemôže skončiť úspechom...)

Keď raz príde deň, v ktorom UTF-8 bude bezproblémové u svetových lídrov emailovej komunikácie, akými sú Gmail, Yahoogroups, Squirrelmail a Horde, potom budeme môcť dať zbohom kódovaniu ISO-8859-2 a prejsť celoplošne výlučne na UTF-8. Zdá sa však, že takýto krok by v dnešných podmienkach bol unáhlený.


Last edited by Faterson on Wed, 30 May 2007, 20:37, edited 2 times in total.

Tue, 29 May 2007, 21:46
Profile E-mail WWW
site admin
User avatar

Joined: Sat, 7 Oct 2006, 18:46
Posts: 198
New post 
Nižšie uvádzam text svojho dnešného príspevku do emailovej diskusnej skupiny Infoveku Údržba.

P.P. wrote:
Faterson wrote:
Tu by som odporučil voľbu 1. [...] Ako vidno, je to z blata do kaluže. Ideálne nie je ani č. 1, ani č. 2.

Spýtam sa: pán B[...] navrhol 2, Vy najprv 1, potom ani jednu voľbu, čo máme my „gmailisti“ teda nastaviť? Otestujeme, aké problémy v konferencii „vyrobí“ voľba 1 alebo sa neoplatí ďalej tým zaoberať? (pripomínam: mám zatiaľ nastavenú 2)

Ideálna nie je ani jedna voľba, ale osobne by som predsa len pre dnešok odporučil voľbu č. 1, to znamená nechať Gmail automaticky vybrať vhodné kódovanie odosielanej správy, podľa toho, aké písmená sa v odosielanej správe vyskytujú.

Ak si zvolíte voľbu č. 2, všetky odosielané správy budú mať nasilu UTF-8 a takéto forsírovanie napríklad nefunguje ani v Thunderbirdovi, ako sme videli v posledných dňoch.

Navyše aj samotný Gmail pre dnešok odporúča skôr voľbu 1, nie voľbu 2. (Asi aj číslovanie týchto volieb niečo napovedá... ;-)) Ak si kliknete na pomoc Viac informácií vedľa voľby kódovania, objaví sa toto:

Gmail wrote:
Each time you send a message, Gmail automatically selects an appropriate encoding for the language(s) in which you've composed your mail. It's possible, however, that the recipient may not be able to properly view the message you've sent.

If your contacts are having trouble viewing messages you've sent them, we recommend using 'UTF-8' (Unicode) for all outgoing mail. UTF-8 is a standard encoding that's accepted by many email clients.

V slovenskom preklade:

Gmail wrote:
Vždy, keď odosielate správu, Gmail automaticky vyberie vhodné kódovanie pre jazyk(y), v ktorých ste napísali svoj email. Je však možné, že prijímateľovi Vášho emailu sa nemusí správa zobraziť správne.

Ak zistíte, že osoby, s ktorými komunikujete, majú ťažkosti s čítaním Vašich správ, odporúčame Vám používať 'UTF-8' (Unicode) pre všetky odosielané správy. UTF-8 je štandardné kódovanie, ktoré je podporované mnohými poštovými programami.

Z vyjadrenia Gmailu vyplýva, že možnosť č. 2 (UTF-8) odporúčajú až ako alternatívu, ak by boli problémy s hlavnou možnosťou č. 1. Veľavravné je tiež mnou zvýraznené slovko many / mnohými. Keby UTF-8 bolo v emailoch v dnešnej dobe naozaj bezproblémové, namiesto many / mnohými by Gmail uviedol all / všetkými a takisto by zrejme UTF-8 bolo prednastavenou možnosťou č. 1 pre odosielanie správ, nie až záložnou možnosťou č. 2.

Dnes som urobil ešte zopár ďalších testov s ďalším webmailovým softvérom. Nutsmail, čo je modernizovaná verzia Squirrelmailu, v UTF-8 zlyhal tým istým spôsobom ako Squirrelmail, iba v krajšom dizajne. :lol: To znamená, že prijaté správy v UTF-8 sa zobrazujú v poriadku v priečinku s doručenou poštou aj po otvorení správy. V okamihu odpovede však dôjde k porušeniu diakritických písmen v Predmete aj v tele správy. Pisateľ nemá možnosť zmeniť kódovanie odosielanej správy na UTF-8, ale musí prijať to kódovanie, ktoré nastavil administrátor poštového systému pre všetkých užívateľov.

Otestoval som aj klasický Yahoo! Mail. V priečinku s doručenou poštou sa v Predmete správy v UTF-8 zobrazujú hieroglyfy. Treba manuálne v prehliadači prepnúť na UTF-8 a vtedy sa Predmet zobrazí korektne. Po otvorení emailu sa správa v UTF-8 (Predmet aj telo) zobrazuje korektne, dokonca aj bez manuálneho prepínania kódovania v prehliadači. Yahoo! Mail však zlyháva pri odoslaní správy: síce po stlačení tlačidla Odpovedať sa na rozdiel od Squirrelmailu a Horde citát pôvodného emailu zobrazuje v čitateľnej forme, no email je natvrdo odoslaný v prednastavenom západoeurópskom kódovaní ISO-8859-1. To znamená, že príjemca ho dostane v nečitateľnej forme. Nenašiel som na Yahoo! Mail žiadnu voľbu, ani tú elementárnu v štýle Gmailu, ktorá by pisateľovi umožnila pred odoslaním správy zvoliť jej kódovanie. Auto-detekcia kódovania na Yahoo! Mail evidentne neexistuje alebo nefunguje.

Gmail obstojí v priamej korešpondencii v UTF-8 bez chýb. Ak je však z niektorej z emailových konferencií (napríklad na Yahoogroups) doručená správa s telom emailu v UTF-8 a s neštandardne pripojenou pätičkou konferencie v (napríklad) ISO-8859-2, Gmail spôsobí namiesto nečitateľnosti neštandardne pripojenej pätičky nečitateľnosť celého tela správy. Problém sa nedá napraviť ani manuálnym prepínaním kódovania v prehliadači. Jediným riešením je požiadať správcu emailovej diskusie, aby z pätičky konferencie (len kvôli používateľom Gmailu) vyradil diakritické písmená.

Na záver som otestoval ďalší webmailový softvér, RoundCube. Je bezchybný pri prijímaní aj odosielaní správ v UTF-8. Zaujímavé je, že pre tento webmail podľa mojich informácií neexistuje slovenská lokalizácia a napriek tomu pracuje s UTF-8 bezchybne, čiže zo všetkých mnou doteraz testovaných webmailových softvérov by sa pre slovenských používateľov z perspektívy UTF-8 hodil najviac. Squirrelmail a Horde naproti tomu majú slovenskú lokalizáciu, no v testoch UTF-8 zlyhali. (Pričom pri Horde I[...] N[...] poukázal na to, že to môže závisieť od individuálnych nastavení konkrétnej inštalácie Horde.)


Wed, 30 May 2007, 14:20
Profile E-mail WWW
site admin
User avatar

Joined: Sat, 7 Oct 2006, 18:46
Posts: 198
New post 
I.N. wrote:
Nehovorme potom o tom, že Horde je zlý webmail, alebo že je nepoužiteľný.

Takže urobil som ďalšie testy a jediný prehliadač (aspoň u mňa), v ktorom je Horde v UTF-8 použiteľný, je Internet Explorer 7.0.5730.11. (Operačný systém Windows XP 5.1 Build 2600 Service Pack 2.)

A síce nezávisle od toho, aké kódovanie máte v IE nastavené: či je zapnuté alebo vypnuté automatické rozpoznávanie kódovania, alebo je explicitne vybrané kódovanie UTF-8 či ISO-8859-2... Všetko jedno, Horde v IE správne zobrazuje aj odosiela emaily v UTF-8.

Vo všetkých troch ostatných prehliadačoch, kde som to dnes testoval, Horde zlyháva včera opísaným spôsobom. Konkrétne v prehliadačoch:
Verím, že nikto nepovie, že chyba je v týchto 3 prehliadačoch a nie v Horde. ;-)

V Opere, Firefoxe a SeaMonkey môžete auto-rozpoznávanie vypínať alebo zapínať, explicitne nastavovať UTF-8 alebo ISO-8859-2 alebo ISO-8859-1... Výsledkom sú vždy hieroglyfy v zobrazovaných aj odosielaných emailoch v UTF-8.

V Opere, Firefoxe a SeaMonkey sa pri zobrazení tela správy v UTF-8 zjavuje už včera citované nezmyselné chybové hlásenie, že „toto kódovanie nie je your own“. Môžete si meniť kódovanie, ako chcete, vždy bude chybové hlásenie tvrdiť, že kódovanie emailu (čiže UTF-8) nie je „your own“. Aj pri explicitnom nastavení UTF-8 v menu prehliadača. Naproti tomu v Internet Exploreri si môžete kódovanie meniť, ako chcete, a to chybové hlásenie o nesprávnom kódovaní sa nezjaví nikdy.

Skúšal som meniť aj priamo v menu Horde preferované kódovanie, ale nič to nemení na fakte, že emaily v UTF-8 fungujú iba v Internet Exploreri.

I.N. wrote:
Bavíme sa o nastaveniach prostredia, čo je dosť podstatný rozdiel.

Zdá sa nakoniec, že s prostredím to nič nemá, ale Horde vyzerá byť pre používateľov Windows optimalizovaný iba pre Internet Explorer. Ak sa to potvrdí, je to veľký nedostatok.

J.B. wrote:
K tzv. leadrom – áno, Gmail je skutočne pozitívnym príkladom.

Nie celkom. Spomeňme si, že kvôli Gmailu bolo z pätičky emailovej konferencie potrebné vylúčiť diakritické písmená.

Skutočne pozitívnym príkladom pre UTF-8 vo svete webmailu je dnes testovaný RoundCube. Nielenže bezchybne funguje v každom prehliadači, ale aj pri každom odoslaní správy Vám dáva na výber, aké kódovanie chcete použiť. V Gmaili máte na výber iba 2 možnosti a ani jedna nie je ideálna, lebo pri 1. možnosti sa musíte slepo spoliehať na softvér, že „správne kódovanie vyberie za vás“ a o nespoľahlivosti 2. možnosti je celá táto diskusia.

J.B. wrote:
Ale Yahoo je jedna z najhorších implementácií [...] Kto nerešpektuje RFC2045-2049 [...], je skôr odstrašujúcim príkladom než leadrom.

Máte úplnú pravdu. Žiaľ lídri sa neurčujú podľa toho, do akej miery dodržiavajú štandardy. Inak by zrejme nebol celosvetovým softvérovým lídrom Microsoft. ;-) Či sa nám to páči alebo nie, Yahoo! Mail pri všetkej svojej nedokonalosti patrí medzi pravdepodobne 3 svetových lídrov v oblasti webmailu (spolu s Gmailom a Windows Live Hotmailom). Takže pokým UTF-8 v Yahoo Mail nebude fungovať absolútne bez problémov, ťažko možno celoplošne odporúčať UTF-8 ako preferované kódovanie pre emailovú komunikáciu.

Ak máte niekto z firemného prostredia poruke Outlook Remote Desktop, celkom by ma zaujímalo, či tam bude zobrazovanie aj odosielanie správ v UTF-8 fungovať bez problémov. (A nielen v Internet Exploreri. Keď som naposledy pred pár mesiacmi pracoval cez Outlook Remote Desktop, tá schránka mi v Opere ponúkala iba redukované možnosti práce v porovnaní s IE...) Možno by sa oplatilo otestovať aj Windows Live Hotmail, nech máme testy najvýznamnejších svetových poskytovateľov webmailu kompletné. Pokiaľ ide o slovenských poskytovateľov webmailu, viem, že u niektorých bol problém s UTF-8, žiaľ neviedol som si zatiaľ štatistiku, u ktorých poskytovateľov už UTF-8 funguje a u ktorých ešte nie.


Wed, 30 May 2007, 16:07
Profile E-mail WWW
Display posts from previous:  Sort by  
Post new topic Reply to topic  [ 4 posts ] 


Who is online

Users browsing this forum: No registered users and 1 guest


You cannot post new topics in this forum
You cannot reply to topics in this forum
You cannot edit your posts in this forum
You cannot delete your posts in this forum
You cannot post attachments in this forum

Search for:
Jump to:  
cron
Powered by phpBB © phpBB Group.
Designed by Vjacheslav Trushkin for Free Forums/DivisionCore.