Zbog čega slanje ćiriličke e-pošte ipak (ni)je toliko jednostavno

FacebookLinkedinEmail
04.07.2016.
@njnjnj.срб - IDN mejl
Izvor: pixabay.com

Recimo da koristite naziv domena koji nije na engleskoj latinici. Kako uz hostovanje domena (zbog veb sajta) najčešće idu i imejl adrese u paketu, logično je da imate i kompletnu adresu e-pošte na pismu koje nije latinica, a koje koristite u nazivu domena. Da li je tako?

Iako je kod veb adresa stvar poprilično jednostavna, kod imejl adrese situacija se komplikuje. Prilikom razmene elektronske pošte koristi se drugi set protokola, ali i drugi serveri (takozvani imejl serveri), pa je potrebno uneti promene koje će omogućiti da takozvani IDN imejl bude poslat.

Jedna adresa – dva standarda

Najčešće se kaže da adresa elektronske pošte ima dve strane: levu sa korisničkim imenom i desnu sa nazivom domena, ili dva dela: lokalni i domenski. Ta dva dela (ili dve strane) su odvojena znakom “@”.

Na primer, adresa „pera@rnids.rs“ identifikuje korisnika po imenu „pera“ na serveru „rnids.rs“. U ASCII obliku sve radi već duži niz godina bez problema, ali – da li je moguće da se koriste nelatinički karakteri u imejl adresi?

Pošto desna strana predstavlja zapravo naziv domena, logično je da ta strana može da bude napisana na nekom drugom pismu osim latiničkog. Punycode, kojim se predstavlja takav naziv domena, samo je ASCII prezentacija „nelatiničkih“ karaktera, tako da kroz internet mrežu desna strana u stvari ostaje u ASCII obliku i nema nikakvih problema.

Za levu stranu je oduvek važilo da može da se koristi samo ASCII. Da bi korisničko ime bilo na bilo kom drugom pismu osim latiničkog, bilo je neophodno da se promeni standard. Pored toga što mešanje pisama (levo ASCII latinica, a desno neko drugo pismo) nije baš po pravopisu, stvar je mnogo komplikovanija od samog pravopisa i nezgodnija za korisnika.

Zamislite arapsko pismo koje se piše s desna ulevo – kada biste ukucavali ovakvu imejl adresu, ASCII korisničko ime bi bilo pisano s leva udesno, dok biste naziv domena pisali s desna ulevo. Zgodno? Nije.

Zašto onda ne modifikovati malo standarde i omogućiti ljudima punu internacionalizovanu imejl adresu, sa istim, ne-ASCII pismom s obe strane znaka @?

Kada nelogično postane logično

Prateći celu ovu priču, lako se može (pogrešno) zaključiti da se za korisničko ime koristi punycode. Međutim, prilikom unosa i prikaza korisničkog imena koristi se UNICODE, a kroz mrežu se i korisničko ime prenosi u ASCII formatu, baš kao i naziv domena. Bilo je nekoliko pokušaja da se ovo izvede u praksi, najbliži ovome je bio THE BAT!, ali nije stvar doveo do kraja, jer nije postojao standard.

Institucija nadležna za standarde, IETF usvojila je sasvim drugo rešenje. Prema standardu koji je nazvan EAI (Email Address Internationalization) uveden je UNICODE za korisničko ime. Istovremeno, domenski deo ostaje u obliku koji regulišu standardi za internacionalizaciju naziva domena, to jest u punycode-u.

Prvo se postavlja pitanje – zašto tako?

Stepenik koji je bio predviđen za planirani prelazak sa ASCII-ja na UNICODE u budućnosti, bio je punycode. Lično nisam saglasan da se preskaču stepenici u razvoju interneta, ali očigledna želja autora ovih standarda (RFC 6530, RFC 6531, RFC 6532 i RFC 6533) bila je da se odmah prebacimo na UNICODE (UTF-8) i da se time približimo budućem internetu, koji umesto ASCII koda treba da koristi pun UTF-8.

Dakle, u sistemima koji rade sa EAI (poznat i pod drugim imenom IMA – Internationalized Mail Address) po prvi put celi imejlovi putuju u UNICODE formatu.

Majstorska radionica

Pošto je u pitanju standard koji je uveden tokom 2013. godine, a za njegovu punu implementaciju potrebne su opsežne prepravke na raznoraznim nivoima jer nije kompatibilan sa postojećim ASCII internetom, još uvek imamo ovakve adrese elektronske pošte samo u tragovima.

Naime, da bi se ovo koristilo, potrebno je da se ažuriraju svi imejl klijenti (Outlook, Thunderbird…), ali i softveri na imejl serverima. Sve ove promene idu veoma sporo, a mnogi razvojni timovi još uvek ni ne razmatraju ovaj standard. Najdalje se u njegovoj implementaciji stiglo u Kini, gde postoji oko milion korisnika koji koriste servise koji enkoduju UTF-8 u ASCII (rade slično što i punycode), čineći ove imejlove kompatibilnim sa ostatkom interneta.

Takođe, i bez EAI imejlova, sa običnim adresama elektronske pošte koji koriste nelatinične karaktere samo u desnom, domenskom delu, već postoje nagomilani problemi. Na primer, probajte da, koristeći takav imejl, rezervišete hotelsku sobu ili avio kartu, otvorite nalog na nekom servisu, ili izvršite onlajn kupovinu – u većini slučajeva nećete uspeti, iako razvojni timovi svakog dana unapređuju svoje servise i sređuju ove probleme. Naravno, internet već decenijama radi na engleskom alfabetu, potrebno je vreme da se i on navikne na UNICODE.

FacebookLinkedinEmail