Wednesday, December 24, 2008

ചില്ലറ പ്രശ്നം

മല്ലുവിന്റെ ചില്ലു പ്രശ്നം ഇവിടെയും തുടങ്ങുന്നു. യുനികോഡന്മാര്‍ 5.1-ല്‍ വരുത്തിയ മാറ്റങ്ങള്‍ പെട്ടെന്ന് മനസിലാവുന്ന വിധത്തില്‍ ഇവിടെ കാണാം. ഇതില്‍ ആറ് ചില്ലുകള്‍ ഉള്‍പ്പെടുത്തിയതാണ് കുറച്ചു നാളായി നടന്നുകൊണ്ടിരിക്കുന്ന കോലാഹലങ്ങളുടെ പ്രധാന കാരണം.

പ്രധാന പ്രശ്നമായി 5.1-നെ എതിര്‍ക്കുന്നവര്‍ ചൂണ്ടിക്കാണിക്കുന്നതില്‍ ഒന്ന് കാഴ്ചയില്‍ ഒരു പോലെയുള്ളതും എന്നാല്‍ വ്യത്യസ്ഥങ്ങളായ സൈറ്റുകളുടെ പിറവിയെ കുറിച്ചാണ്.
രണ്ടിടങ്ങളില്‍ (1, 2 ) ഉദാഹരണമായി കണ്ട കണ്ണികള്‍:

1. http://റാല്‍മിനോവ്.blogspot.com ആണവ ചില്ലു് കൂടാതെ 5.0 പ്രകാരം (http://xn--uwclier4cj1hof.blogspot.com/)

2. http://റാൽമിനോവ്.blogspot.com ആണവ ചില്ലു് ഉപയോഗിച്ച് 5.1 പ്രകാരം (http://xn--uwclis6bh9fra04b.blogspot.com/)


ഇത് രണ്ടും കാണാന്‍ ഒരു പോലെയിരിക്കുന്ന് എന്നാണ് പറഞ്ഞിട്ടുള്ളത്. എന്നാല്‍ അഡ്രസ്ബാറില്‍ നമുക്ക് കിട്ടുന്ന ലിങ്കുകളാണ് ബ്രാക്കറ്റില്‍ കൊടുത്തിരിക്കുന്നത്. രണ്ട് ചില്ലുകളും സപ്പോര്‍ട്ട് ചെയ്യുന്ന ഫോണ്ടുകള്‍ മാത്രമെ രണ്ടു ലിങ്കുകളും ഒരു പോലെ കാണിക്കുകയുള്ളൂ എന്നത് കൊണ്ട് വാദഗതിയോട് യോജിക്കാന്‍ പ്രയാസമുണ്ട്. http://xn--uwcli എന്നതിനു ശേഷം വരുന്ന മാറ്റങ്ങള്‍ ശ്രദ്ധിക്കുക. ഇനി അഥവാ ഇതു രണ്ടും ഒരു പോലെയാണെങ്കിലും യൂനികോഡോ .ഡി.ഏന്‍ കാരോ പഴയ 5.0-ല്‍ പറഞ്ഞ വിധത്തില്‍ പശവെച്ച് ഒട്ടിച്ച (ZWJ) ചില്ലുകള്‍ ഇനി പിന്താങ്ങുകയില്ല എന്ന് പറഞ്ഞാല്‍ തീരുന്ന പ്രശ്നമേയുള്ളൂ. 5.0 എന്ന പതിപ്പ് പൂര്‍ണ്ണമായും പിന്താങ്ങുകയില്ല എന്നല്ല ഉദ്ദേശിച്ചത്. യുനീകോഡിനെ മുന്നോട്ട് കൊണ്ട് പോകാന്‍ വേണ്ടിയായിരിക്കുമല്ലോ ബാക്ക്‌വേര്‍ഡ് കോമ്പാറ്റിബിലിറ്റി, സ്റ്റെബിലിറ്റി എന്നിവയെ പറ്റി അവരുടെ തന്നെ നിയമസംഹിതകളില്‍ പറയുന്നത്. എന്തായാലും പുതിയ പതിപ്പ് പിന്താങ്ങുകയില്ലെന്ന് പറയുമെന്ന് തോന്നുന്നില്ല. അതോടെ ചില്ല് വെച്ചുള്ള വ്യാജ്യന്മാരുടെ കളി തീരുമെന്ന് തോന്നുന്നു.

എന്നാല്‍ ചില്ലോ പശയോ (ZWJ) ഇല്ലാതെ തന്നെ കാഴ്ചയില്‍ ഒരു പോലെയുള്ള സൈറ്റുകള്‍ നിര്‍മ്മിക്കാന്‍ നിലവില്‍ സാധ്യമാണെന്ന് പറഞ്ഞാലോ? gഠഠgle.com എന്ന പേരില്‍ ഞാനൊരു സൈറ്റ് റെജിസ്റ്റര്‍ ചെയ്യാന്‍ നോക്കി അത് ലഭ്യമാണെന്നും വില്പനക്കാര്‍ പറയുന്നു. കണ്ടാല്‍ google പോലെയിരിക്കുമെങ്കിലും ഇടയിലുള്ള രണ്ട് -കള്‍ (“ഠഠ”) മലയാളത്തിലെ എന്ന അക്ഷരങ്ങളാണ്‍. ഇതിനു പരിഹാരമുണ്ടാക്കിയിട്ടല്ലേ ചില്ലിനേം പശയേം പറ്റി തലപുകയ്ക്കേണ്ടതുള്ളൂ. ഒറ്റ ഭാഷയില്‍ മാത്രമെ റെജിസ്റ്റര്‍ ചെയ്യാവൂ എന്നോക്കെ പരിഹാരമായി നിര്‍ദ്ദേശിക്കാമെങ്കിലും .com, .org തുടങ്ങിയ ടോപ്പ് ലെവല്‍ ഡൊമൈനിനുകളുടെ കാര്യത്തില്‍ വിട്ടുവീഴ്ച്ച ചെയ്യേണ്ടി വരും. കൂടാതെ “i” എന്നതിന്റെ വലിയ അക്ഷരമായ “I”; മിക്ക ഫോണ്ടുകളും “L” എന്ന അക്ഷരത്തിനു സമാനമായ രീതിയിലാണ് കാണിക്കുന്നത്. അതായത് “googIe.com” എന്നത് മിക്ക ഫോണ്ടുകളിലും “google.com” എന്ന് വായിക്കാവുന്ന വിധത്തിലാണ് കാണിക്കുന്നത്. ഇതൊക്കെ പരിഹരിക്കേണ്ടതില്ലെ? നിലവിലുള്ള കാര്യങ്ങളെ കാര്യമായി ബാധിക്കാത്ത രീതിയിലുള്ള മാറ്റങ്ങള്‍ യുനീകോഡ് ഇതിനു മുന്‍പും വരുത്തിയിട്ടില്ലേ?

ഇനി ബാക്ക്‌വേറ്ഡ് കോമ്പാറ്റിബിലിറ്റി കൂടിയേ തീരു എന്നാണെങ്കില്‍ മുന്‍പ് മലയാളത്തില്‍ 0 (പൂജ്യം) എന്നടിച്ചാല്‍ 1/4 (കാല്) എന്നതിന്റെ അടയാളമാണ് വന്നിരുന്ന്. അതേ പൊരുത്തം തന്നെ ഇപ്പോഴും വേണമെന്ന് കൂടി പറയേണ്ടി വരും.

പ്രശ്നങ്ങളുടെ അടിസ്ഥാന കാരണമായി ചൂണ്ടിക്കാണിക്കുന്ന കാര്യം "ചില്ലക്ഷരവും അതിന്റെ അടിസ്ഥാന അക്ഷരവും തമ്മിലുള്ള ബന്ധം നശിപ്പിയ്ക്കുന്നതു് കൊണ്ടാണു് ആണവ ചില്ലുകള്‍ സ്വീകാര്യമല്ലാത്തതു്.", “കൂട്ടക്ഷരം എന്നു് നമ്മള്‍ വിളിയ്ക്കുന്നവയോ? അവയും ഒറ്റ അക്ഷരമാണെന്നുണ്ടോ?” എന്നിവയാണ്.

ആദ്യമെ തന്നെ പറയട്ടേ ചില്ലക്ഷരം എന്നല്ല മറിച്ച് ചില്ല് (ബഹു: ചില്ലുകള്‍) എന്ന് പറയണം എന്നാണ് എന്റെ അറിവ് . സ്വരം, വ്യഞ്ജനം, ചില്ല് എന്നിങ്ങനെ.

സ്വരങ്ങള്‍: സ്വയം ഉച്ചരിക്കുവാന്‍ സാധിക്കുന്ന ശബ്ദങ്ങളാണ് സ്വരങ്ങള്‍.
വ്യഞ്ജനങ്ങള്‍: സ്വരങ്ങളുടെ സഹായത്തോടേ ഉച്ചരണക്ഷമമാവുന്ന ശബ്ദങ്ങളാണ് വ്യഞ്ജനങ്ങള്‍.
ചില്ലുകള്‍: സ്വരസഹായം കൂടാതെ ഉച്ചരിക്കാവുന്ന വ്യഞ്ജനങ്ങളാണ് ചില്ലുകള്‍.

ഇതു മൂന്നും ഭൂരിപഷം ആളുകളും അംഗീകരിച്ചതാണ്. ഇനി അടിസ്ഥാന അക്ഷരവുമായി ബന്ധമില്ലാത്ത അക്ഷരങ്ങളെ നീക്കം ചെയ്യുന്ന പരിപാടി തുടങ്ങാം. , , , . എന്നീ നാലക്ഷരം എടുത്താല്‍”, “തുടങ്ങിയ അക്ഷരങ്ങളെ നീക്കം ചെയ്യേണ്ടതുണ്ട്. കാരണം”, “എന്ന അടിസ്ഥാന അക്ഷരവുമായി അവബന്ധമില്ലാതെ കിടക്കുന്നു എന്നത് കൊണ്ട് തന്നെ. അപ്പോ”, “തുടങ്ങിയ അക്ഷരങ്ങള്‍ എങ്ങിനെ എഴുതും എന്ന ഒരു സ്വാഭാവികമായ ഒരു ചോദ്യം ഉന്നയിക്കാം. “+zwj+”, “+ zwj+”,... എന്നിങ്ങനെ ആയിക്കൂടേ? ടെക്നിക്കലാവുമ്പോ എല്ലാം അങ്ങിനെ വേണമല്ലോ; “എന്ന ഒറ്റ അക്ഷരത്തിന്”, “” “എന്നിങ്ങനെ മൂന്ന് അടയാളങ്ങള്‍ വേണമോ? ഒരെണ്ണമെങ്കിലും ഒഴിവാക്കാന്‍ പറ്റില്ലേ? ഇങ്ങനെ പരിശോധിച്ചാല്‍ ഇനിയും കുറെ അക്ഷരങ്ങള്‍ ഒഴിവാക്കേണ്ടിവരും. ഇവിടെയും ചില വിട്ടുവീഴ്ച്ചകള്‍ ചെയ്തതായി കാണുന്നു.

മറ്റൊരു പ്രശ്നം ഉപയോക്താവിനെ കൂടുതല്‍ ബാധിക്കുന്ന സോര്‍ട്ടിങ്ങ്, സേര്‍ചിങ്ങ് എന്നിങ്ങനെ വിളിക്കുന്ന അക്ഷരമാലക്രമത്തില്‍ വെക്കലും, തിരച്ചിലുമാണ്.

അക്ഷരമാലാക്രമത്തില്‍ ഇവയുടെ സ്ഥാനം നിര്‍ണ്ണയിക്കേണ്ടത് ആരാണ്? ചില്ലുകള്‍ ഏറ്റവും ആദ്യം വരണമോ സ്വരങ്ങള്‍ ശേഷം വരണോ വ്യഞ്ജനത്തിന്റെ ഇടയില്‍ തിരുകണോ എന്നോക്കെ തീരുമാനിക്കുന്നത് ആരാണ്? മലയാളികളാണൊ? ആണെങ്കില്‍ എങ്കില്‍ അതിനു നമ്മള്‍ തയ്യാറാണോ? അല്ലെങ്കില്‍ ഏതെങ്കിലും കണ്‍സോര്‍ഷ്യക്കാര്‍ വരുമെന്ന് കാത്തിരിക്കാം.

പുതിയ പതിപ്പ് (5.1) തിരിച്ചിലിനെ കാര്യമായി ബാധിക്കും എന്ന് തന്നെ പറയേണ്ടിവരും. എങ്കിലും പുതിയതിനോട് പുറംതിരിഞ്ഞിരിക്കേണ്ട കാര്യമില്ലെന്ന് തോന്നുന്നു. കാരണം ഇതിനു മുന്‍പ് കല്ലില്‍ കൊത്തിവെച്ച (നമ്മുടെ ആസ്കിയേ) വിലപ്പെട്ട രേഖകള്‍ പലതും കിട്ടാതെ പോകുന്നുണ്ട്. അതില്‍ പരാതി പറഞ്ഞിട്ട് കാര്യമുണ്ടോ? ഇപ്പോഴും മലയാളത്തിലെ നല്ലൊരു ശതമാനം രേഖകളും കല്ലില്‍ തന്നെയാണ് കൊത്തിവെക്കുന്നത്. അവരാരും യുനീകോഡിലേക്ക് വരികയോ പഴയ ചില്ലിലിട്ട് വെക്കുകയോ ചെയ്തതായി കാണുന്നില്ല. കൂടാതെ നിലവില്‍ യൂനികോഡില്‍ എഴുതിയ ചില്ലുകള്‍ പലയിടങ്ങളിലും പൊട്ടിയ രൂപത്തിലാണ് കണ്ടിട്ടുള്ളത് ല്, ള്, ണ്,... എന്നിങ്ങനെ. ഇതിനെക്കാള്‍ എന്തുകൊണ്ടും നല്ലതല്ലേ പൂര്‍ണ്ണ രൂപത്തില്‍ കിടക്കുന്നത്? പല അക്ഷരങ്ങളും ശരിയായി കാണിക്കാത്താത് യുനീകോഡിന്റെ ഒരു പോരായ്മ തന്നെയാണെന്ന് തോന്നുന്നു. അതില്‍ ചില്ലുകളാണ് പ്രധാന വില്ലന്‍. ന്റ പോലുള്ളവ ഒഴികെ ബാക്കി അക്ഷരങ്ങളൊക്കെ മിക്കസ്ഥലങ്ങളിലും ശരിയായി വരുന്നുണ്ടെന്നാണ് തോന്നുന്നത്.

5.1 വരിക വഴി ചില്ലിന്റെ പ്രശ്നമെങ്കിലും തീര്‍ന്നു കിട്ടിയാല്‍ അത്രയും നല്ലതല്ലേ? സാധാരണക്കാരനാണ് ഇതിന്റെ ഗുണം കൂടുതല്‍ കിട്ടുന്നത്. അവര്‍ക്ക് എത്രയും പെട്ടെന്ന് തപ്പിതടയാതെ കാര്യങ്ങള്‍ വായിച്ചെടുക്കാം, ടെപ്പ് ചെയ്യാം. അവരാരും ഇതെങ്ങിനെ വരുന്നു എന്നോന്നും ചിന്തിക്കുമെന്ന് തോന്നുന്നില്ല. ചില്ലടിച്ചിട്ട് ല്, ള് എന്നിങ്ങനെ കല്ലുകടിക്കുകയാണെങ്കില്‍ മിക്കവരും ഇട്ടിട്ട് പോകും. അതൊക്കെ ഒന്ന് തീര്‍ന്നു കിട്ടുമല്ലോ. യുനീകോഡ് മലയാളികള്‍ മാത്രമല്ല ഉപയോഗിക്കുത് എന്നിരിക്കേ, നാം 5.0 ഉറച്ചു നില്‍ക്കുകയും മറ്റുള്ളവര്‍ പുതിയ പതിപ്പുകള്‍ ഉപയോഗികയും ചെയ്താല്‍ പ്രശ്നം ഇനിയും സങ്കീര്‍ണ്ണമാവില്ലേ? സാധാരണക്കാരന് ഗുണം ചെയ്യുന്ന ടെക്നോളജിയല്ലേ മുന്നോട്ട് കുതിക്കുന്നത്?

സേര്‍ച്ചില്‍ പഴയ ചില്ലുകള്‍ കാണിക്കില്ല എന്ന ഒറ്റക്കാരണം കൊണ്ട് ഇനി വരുന്ന മാറ്റങ്ങളെ ഉള്‍കൊള്ളാതിരിക്കേണ്ടതുണ്ടോ? സേര്‍ച്ചില്‍ കാണിക്കില്ല എന്നു പറയപ്പെടുന്ന മിക്ക ചില്ലുകളും ഒന്ന് മനസുവെച്ചാല്‍ അപ്ഡേറ്റ് ചെയ്ത് പുതുക്കാവുന്നവയല്ലേ? എത്ര സേര്‍ച്ച് എന്‍‌ജിനുകള്‍ ഇപ്പോള്‍ മലയാളം കാണിക്കുന്നുണ്ട്? യൂണീക്കോഡ് തുടങ്ങിയപ്പോള്‍ ഇവയൊക്കെ മലയാളം കാണിച്ചിരുന്നോ? ചോദ്യങ്ങളൊക്കെ യുനീകോഡിനെ പിന്നോട്ട് നയിച്ചിരുന്നോ? ഇപ്പോള്‍ യുനീകോഡ് ഉപയോഗിക്കുന്ന മലയാളം സൈറ്റുകളും, ആസ്കിയിലുള്ള സൈറ്റുകളും ഏകദേശം എത്രയുണ്ടാകുമെന്ന് താരതമ്യം ചെയ്യുന്നത് നന്നായിരിക്കും. ഇതിലേറെ സൈറ്റുകള്‍ ഇനി മലയാളത്തില്‍ വരാനിരിക്കുന്നില്ലേ? പണ്ട് ആസ്കിക്കാര്‍ നിന്നപോലെ പാതിവഴിയില്‍ നില്‍ക്കണോ?

യുനികോഡ് ഇനിയും മാറ്റങ്ങള്‍ക്ക് വിധേയമായേക്കാം... യുനികോഡിനെക്കള്‍ നല്ല ടെക്നോളജി ഇനിയും വന്നേക്കാം... അപ്പോഴൊക്കെ അറച്ചു നില്‍ക്കുന്നത് നമ്മുടെ മലയാളത്തെ മുന്നോട്ട് നയിക്കുമോ?

5.1 ലേക്ക് മാറ്റാന്‍ പറ്റുന്ന ചില്ലുകളെ നമുക്ക് ബോട്ടോ, പാച്ചോ, എന്തെങ്കിലും വെച്ച് മാറ്റാന്‍ ശ്രമിക്കാം. ഇതു പോ‍ലെ പാച്ചി, പാച്ചിയല്ലേ അപാച്ചി ഉണ്ടായത്.

തിരഞ്ഞാല്‍ കിട്ടാത്ത ചില്ലുകളെ മറക്കേണ്ടി വരുത്തരുതേ എന്ന പ്രാര്‍ത്ഥനയോടൊപ്പം വിജ്ഞാനപ്രദമായ ചില്ലുടക്കല്‍ ആശംസകളോടെ....... :-)

2 comments:

ViswaPrabha വിശ്വപ്രഭ said...

for tracking

Ralminov റാല്‍മിനോവ് said...

IDN അതേപോലെ തന്നെ കാണിക്കുന്ന ബ്രൌസര്‍ സെറ്റിങുകളുണ്ടു്. അതില്‍ മലയാളത്തില്‍ തന്നെയാണു് റാല്‍മിനോവ് എന്നു് ബ്രൌസറിലെ അഡ്രസ് ബാറിലും കാണിക്കുന്നതു്.
പിന്നെ ഐഡീയെന്‍ ഒരു കാലത്തും പശയെ (സീറോ വിഡ്ത് ജോയ്നര്‍) അംഗീകരിച്ചിട്ടില്ല. എന്നാലും ഫ്രോഡുണ്ടാക്കാന്‍ ഇതുവരെ ഒരു പ്രശ്നവും ഉണ്ടായിട്ടില്ല.
IDNA പഴയ ചില്ലിനും പുതിയ ചില്ലിനും കാനോണിക്കല്‍ ഇക്വലന്‍സോ നോര്‍മലൈസേഷനോ എന്തെങ്കിലും കുന്തം ഉപയോഗിച്ചു് സമമായ മൂല്യം നല്‍കിയിട്ടില്ലെങ്കില്‍ ആ വഴിക്കുള്ള ഉപദ്രവം ഒരിക്കലും അടങ്ങുകയില്ല.
അറബിയിലൊക്കെയുള്ള പോലെ ഒരു പ്രസന്റേഷന്‍ ഫോമായോ മറ്റോ ചില്ലിനെ എന്‍കോഡ് ചെയ്താല്‍ മതിയായിരുന്നു.

പശയെ യുണിക്കോഡിനു് ഒഴിവാക്കാന്‍ പറ്റില്ല. ചെയ്യേണ്ടതു് വെണ്ടര്‍മാരാണു്. പശ തേച്ചാല്‍ ഒട്ടില്ല എന്നു് അവര്‍ തീരുമാനിച്ചാല്‍ മതി. അങ്ങനെ ചെയ്യുമോ മൈക്രോസോഫ്റ്റും മറ്റും. ചെയ്യില്ല (ചെയ്യാന്‍ പറ്റില്ല) എന്നാണു് മൈക്രോസോഫ്റ്റിന്റെ പ്രതിനിധി ഇന്റിക് ലിസ്റ്റില്‍ പറഞ്ഞതു്. ബാക് വാഡ് കംപാറ്റിബിലിറ്റി ചെറിയ കാര്യമല്ല. ആസ്കിയിലെഴുതിയ ഏതു് മലയാളവും ഇപ്പഴും യുണിക്കോഡിലേക്കു് മാറ്റാന്‍ കഴിയും , ഫോണ്ട് മാപ്പ് ലഭ്യമാണെങ്കില്‍ .

ഇനി, ഏതെങ്കിലും വേന്ദ്രന്‍ (വെണ്ടര്‍ ) മാറ്റുകയാണെങ്കില്‍ എന്റെ ഡാറ്റ നശിക്കാതിരിക്കാന്‍ ഞാന്‍ നന്ദിപൂര്‍വം ആ അപ്ഡേറ്റ് ഒഴിവാക്കും.

എന്തായാലും മലയാളത്തെ വീണ്ടും വേര്‍ഷനീകരിച്ച ചില്ലുസഖാക്കള്‍ക്കു് അഭിവാദ്യങ്ങള്‍ !a