മല്ലുവിന്റെ ചില്ലു പ്രശ്നം ഇവിടെയും തുടങ്ങുന്നു. യുനികോഡന്മാര് 5.1-ല് വരുത്തിയ മാറ്റങ്ങള് പെട്ടെന്ന് മനസിലാവുന്ന വിധത്തില് ഇവിടെ കാണാം. ഇതില് ആറ് ചില്ലുകള് ഉള്പ്പെടുത്തിയതാണ് കുറച്ചു നാളായി നടന്നുകൊണ്ടിരിക്കുന്ന കോലാഹലങ്ങളുടെ പ്രധാന കാരണം.
പ്രധാന പ്രശ്നമായി 5.1-നെ എതിര്ക്കുന്നവര് ചൂണ്ടിക്കാണിക്കുന്നതില് ഒന്ന് കാഴ്ചയില് ഒരു പോലെയുള്ളതും എന്നാല് വ്യത്യസ്ഥങ്ങളായ സൈറ്റുകളുടെ പിറവിയെ കുറിച്ചാണ്.
രണ്ടിടങ്ങളില് (1, 2 ) ഉദാഹരണമായി കണ്ട കണ്ണികള്:
1. http://റാല്മിനോവ്.blogspot.com ആണവ ചില്ലു് കൂടാതെ 5.0 പ്രകാരം (http://xn--uwclier4cj1hof.blogspot.com/)
2. http://റാൽമിനോവ്.blogspot.com ആണവ ചില്ലു് ഉപയോഗിച്ച് 5.1 പ്രകാരം (http://xn--uwclis6bh9fra04b.blogspot.com/)
ഇത് രണ്ടും കാണാന് ഒരു പോലെയിരിക്കുന്ന് എന്നാണ് പറഞ്ഞിട്ടുള്ളത്. എന്നാല് അഡ്രസ്ബാറില് നമുക്ക് കിട്ടുന്ന ലിങ്കുകളാണ് ബ്രാക്കറ്റില് കൊടുത്തിരിക്കുന്നത്. രണ്ട് ചില്ലുകളും സപ്പോര്ട്ട് ചെയ്യുന്ന ഫോണ്ടുകള് മാത്രമെ ഈ രണ്ടു ലിങ്കുകളും ഒരു പോലെ കാണിക്കുകയുള്ളൂ എന്നത് കൊണ്ട് ഈ വാദഗതിയോട് യോജിക്കാന് പ്രയാസമുണ്ട്. http://xn--uwcli എന്നതിനു ശേഷം വരുന്ന മാറ്റങ്ങള് ശ്രദ്ധിക്കുക. ഇനി അഥവാ ഇതു രണ്ടും ഒരു പോലെയാണെങ്കിലും യൂനികോഡോ ഐ.ഡി.ഏന് കാരോ പഴയ 5.0-ല് പറഞ്ഞ വിധത്തില് പശവെച്ച് ഒട്ടിച്ച (ZWJ) ചില്ലുകള് ഇനി പിന്താങ്ങുകയില്ല എന്ന് പറഞ്ഞാല് തീരുന്ന പ്രശ്നമേയുള്ളൂ. 5.0 എന്ന പതിപ്പ് പൂര്ണ്ണമായും പിന്താങ്ങുകയില്ല എന്നല്ല ഉദ്ദേശിച്ചത്. യുനീകോഡിനെ മുന്നോട്ട് കൊണ്ട് പോകാന് വേണ്ടിയായിരിക്കുമല്ലോ ബാക്ക്വേര്ഡ് കോമ്പാറ്റിബിലിറ്റി, സ്റ്റെബിലിറ്റി എന്നിവയെ പറ്റി അവരുടെ തന്നെ നിയമസംഹിതകളില് പറയുന്നത്. എന്തായാലും പുതിയ പതിപ്പ് പിന്താങ്ങുകയില്ലെന്ന് പറയുമെന്ന് തോന്നുന്നില്ല. അതോടെ ചില്ല് വെച്ചുള്ള വ്യാജ്യന്മാരുടെ കളി തീരുമെന്ന് തോന്നുന്നു.
എന്നാല് ചില്ലോ പശയോ (ZWJ) ഇല്ലാതെ തന്നെ കാഴ്ചയില് ഒരു പോലെയുള്ള സൈറ്റുകള് നിര്മ്മിക്കാന് നിലവില് സാധ്യമാണെന്ന് പറഞ്ഞാലോ? gഠഠgle.com എന്ന പേരില് ഞാനൊരു സൈറ്റ് റെജിസ്റ്റര് ചെയ്യാന് നോക്കി അത് ലഭ്യമാണെന്നും വില്പനക്കാര് പറയുന്നു. കണ്ടാല് google പോലെയിരിക്കുമെങ്കിലും ഇടയിലുള്ള രണ്ട് ഒ-കള് (“ഠഠ”) മലയാളത്തിലെ ഠ എന്ന അക്ഷരങ്ങളാണ്. ഇതിനു പരിഹാരമുണ്ടാക്കിയിട്ടല്ലേ ചില്ലിനേം പശയേം പറ്റി തലപുകയ്ക്കേണ്ടതുള്ളൂ. ഒറ്റ ഭാഷയില് മാത്രമെ റെജിസ്റ്റര് ചെയ്യാവൂ എന്നോക്കെ പരിഹാരമായി നിര്ദ്ദേശിക്കാമെങ്കിലും .com, .org തുടങ്ങിയ ടോപ്പ് ലെവല് ഡൊമൈനിനുകളുടെ കാര്യത്തില് വിട്ടുവീഴ്ച്ച ചെയ്യേണ്ടി വരും. കൂടാതെ “i” എന്നതിന്റെ വലിയ അക്ഷരമായ “I”; മിക്ക ഫോണ്ടുകളും “L” എന്ന അക്ഷരത്തിനു സമാനമായ രീതിയിലാണ് കാണിക്കുന്നത്. അതായത് “googIe.com” എന്നത് മിക്ക ഫോണ്ടുകളിലും “google.com” എന്ന് വായിക്കാവുന്ന വിധത്തിലാണ് കാണിക്കുന്നത്. ഇതൊക്കെ പരിഹരിക്കേണ്ടതില്ലെ? നിലവിലുള്ള കാര്യങ്ങളെ കാര്യമായി ബാധിക്കാത്ത രീതിയിലുള്ള മാറ്റങ്ങള് യുനീകോഡ് ഇതിനു മുന്പും വരുത്തിയിട്ടില്ലേ?
ഇനി ബാക്ക്വേറ്ഡ് കോമ്പാറ്റിബിലിറ്റി കൂടിയേ തീരു എന്നാണെങ്കില് മുന്പ് മലയാളത്തില് 0 (പൂജ്യം) എന്നടിച്ചാല് 1/4 (കാല്) എന്നതിന്റെ അടയാളമാണ് വന്നിരുന്ന്. അതേ പൊരുത്തം തന്നെ ഇപ്പോഴും വേണമെന്ന് കൂടി പറയേണ്ടി വരും.
പ്രശ്നങ്ങളുടെ അടിസ്ഥാന കാരണമായി ചൂണ്ടിക്കാണിക്കുന്ന കാര്യം "ചില്ലക്ഷരവും അതിന്റെ അടിസ്ഥാന അക്ഷരവും തമ്മിലുള്ള ബന്ധം നശിപ്പിയ്ക്കുന്നതു് കൊണ്ടാണു് ആണവ ചില്ലുകള് സ്വീകാര്യമല്ലാത്തതു്.", “കൂട്ടക്ഷരം എന്നു് നമ്മള് വിളിയ്ക്കുന്നവയോ? അവയും ഒറ്റ അക്ഷരമാണെന്നുണ്ടോ?” എന്നിവയാണ്.
ആദ്യമെ തന്നെ പറയട്ടേ ചില്ലക്ഷരം എന്നല്ല മറിച്ച് ചില്ല് (ബഹു: ചില്ലുകള്) എന്ന് പറയണം എന്നാണ് എന്റെ അറിവ് . സ്വരം, വ്യഞ്ജനം, ചില്ല് എന്നിങ്ങനെ.
സ്വരങ്ങള്: സ്വയം ഉച്ചരിക്കുവാന് സാധിക്കുന്ന ശബ്ദങ്ങളാണ് സ്വരങ്ങള്.
വ്യഞ്ജനങ്ങള്: സ്വരങ്ങളുടെ സഹായത്തോടേ ഉച്ചരണക്ഷമമാവുന്ന ശബ്ദങ്ങളാണ് വ്യഞ്ജനങ്ങള്.
ചില്ലുകള്: സ്വരസഹായം കൂടാതെ ഉച്ചരിക്കാവുന്ന വ്യഞ്ജനങ്ങളാണ് ചില്ലുകള്.
ഇതു മൂന്നും ഭൂരിപഷം ആളുകളും അംഗീകരിച്ചതാണ്. ഇനി അടിസ്ഥാന അക്ഷരവുമായി ബന്ധമില്ലാത്ത അക്ഷരങ്ങളെ നീക്കം ചെയ്യുന്ന പരിപാടി തുടങ്ങാം. അ, ആ, ഇ, ഈ. എന്നീ നാലക്ഷരം എടുത്താല് “ആ”, “ഈ” തുടങ്ങിയ അക്ഷരങ്ങളെ നീക്കം ചെയ്യേണ്ടതുണ്ട്. കാരണം “അ”, “ഇ” എന്ന അടിസ്ഥാന അക്ഷരവുമായി അവബന്ധമില്ലാതെ കിടക്കുന്നു എന്നത് കൊണ്ട് തന്നെ. അപ്പോ “ആ”, “ഈ” തുടങ്ങിയ അക്ഷരങ്ങള് എങ്ങിനെ എഴുതും എന്ന ഒരു സ്വാഭാവികമായ ഒരു ചോദ്യം ഉന്നയിക്കാം. “അ+zwj+ാ”, “ഇ+ zwj+ൗ”,... എന്നിങ്ങനെ ആയിക്കൂടേ? ടെക്നിക്കലാവുമ്പോ എല്ലാം അങ്ങിനെ വേണമല്ലോ; “അ” എന്ന ഒറ്റ അക്ഷരത്തിന് “അ”, “ആ” “ാ” എന്നിങ്ങനെ മൂന്ന് അടയാളങ്ങള് വേണമോ? ഒരെണ്ണമെങ്കിലും ഒഴിവാക്കാന് പറ്റില്ലേ? ഇങ്ങനെ പരിശോധിച്ചാല് ഇനിയും കുറെ അക്ഷരങ്ങള് ഒഴിവാക്കേണ്ടിവരും. ഇവിടെയും ചില വിട്ടുവീഴ്ച്ചകള് ചെയ്തതായി കാണുന്നു.
മറ്റൊരു പ്രശ്നം ഉപയോക്താവിനെ കൂടുതല് ബാധിക്കുന്ന സോര്ട്ടിങ്ങ്, സേര്ചിങ്ങ് എന്നിങ്ങനെ വിളിക്കുന്ന അക്ഷരമാലക്രമത്തില് വെക്കലും, തിരച്ചിലുമാണ്.
അക്ഷരമാലാക്രമത്തില് ഇവയുടെ സ്ഥാനം നിര്ണ്ണയിക്കേണ്ടത് ആരാണ്? ചില്ലുകള് ഏറ്റവും ആദ്യം വരണമോ സ്വരങ്ങള് ശേഷം വരണോ വ്യഞ്ജനത്തിന്റെ ഇടയില് തിരുകണോ എന്നോക്കെ തീരുമാനിക്കുന്നത് ആരാണ്? മലയാളികളാണൊ? ആണെങ്കില് എങ്കില് അതിനു നമ്മള് തയ്യാറാണോ? അല്ലെങ്കില് ഏതെങ്കിലും കണ്സോര്ഷ്യക്കാര് വരുമെന്ന് കാത്തിരിക്കാം.
പുതിയ പതിപ്പ് (5.1) തിരിച്ചിലിനെ കാര്യമായി ബാധിക്കും എന്ന് തന്നെ പറയേണ്ടിവരും. എങ്കിലും പുതിയതിനോട് പുറംതിരിഞ്ഞിരിക്കേണ്ട കാര്യമില്ലെന്ന് തോന്നുന്നു. കാരണം ഇതിനു മുന്പ് കല്ലില് കൊത്തിവെച്ച (നമ്മുടെ ആസ്കിയേ) വിലപ്പെട്ട രേഖകള് പലതും കിട്ടാതെ പോകുന്നുണ്ട്. അതില് പരാതി പറഞ്ഞിട്ട് കാര്യമുണ്ടോ? ഇപ്പോഴും മലയാളത്തിലെ നല്ലൊരു ശതമാനം രേഖകളും കല്ലില് തന്നെയാണ് കൊത്തിവെക്കുന്നത്. അവരാരും യുനീകോഡിലേക്ക് വരികയോ പഴയ ചില്ലിലിട്ട് വെക്കുകയോ ചെയ്തതായി കാണുന്നില്ല. കൂടാതെ നിലവില് യൂനികോഡില് എഴുതിയ ചില്ലുകള് പലയിടങ്ങളിലും പൊട്ടിയ രൂപത്തിലാണ് കണ്ടിട്ടുള്ളത് ല്, ള്, ണ്,... എന്നിങ്ങനെ. ഇതിനെക്കാള് എന്തുകൊണ്ടും നല്ലതല്ലേ പൂര്ണ്ണ രൂപത്തില് കിടക്കുന്നത്? പല അക്ഷരങ്ങളും ശരിയായി കാണിക്കാത്താത് യുനീകോഡിന്റെ ഒരു പോരായ്മ തന്നെയാണെന്ന് തോന്നുന്നു. അതില് ചില്ലുകളാണ് പ്രധാന വില്ലന്. ന്റ പോലുള്ളവ ഒഴികെ ബാക്കി അക്ഷരങ്ങളൊക്കെ മിക്കസ്ഥലങ്ങളിലും ശരിയായി വരുന്നുണ്ടെന്നാണ് തോന്നുന്നത്.
5.1 വരിക വഴി ചില്ലിന്റെ പ്രശ്നമെങ്കിലും തീര്ന്നു കിട്ടിയാല് അത്രയും നല്ലതല്ലേ? സാധാരണക്കാരനാണ് ഇതിന്റെ ഗുണം കൂടുതല് കിട്ടുന്നത്. അവര്ക്ക് എത്രയും പെട്ടെന്ന് തപ്പിതടയാതെ കാര്യങ്ങള് വായിച്ചെടുക്കാം, ടെപ്പ് ചെയ്യാം. അവരാരും ഇതെങ്ങിനെ വരുന്നു എന്നോന്നും ചിന്തിക്കുമെന്ന് തോന്നുന്നില്ല. ചില്ലടിച്ചിട്ട് ല്, ള് എന്നിങ്ങനെ കല്ലുകടിക്കുകയാണെങ്കില് മിക്കവരും ഇട്ടിട്ട് പോകും. അതൊക്കെ ഒന്ന് തീര്ന്നു കിട്ടുമല്ലോ. യുനീകോഡ് മലയാളികള് മാത്രമല്ല ഉപയോഗിക്കുത് എന്നിരിക്കേ, നാം 5.0 ഉറച്ചു നില്ക്കുകയും മറ്റുള്ളവര് പുതിയ പതിപ്പുകള് ഉപയോഗികയും ചെയ്താല് പ്രശ്നം ഇനിയും സങ്കീര്ണ്ണമാവില്ലേ? സാധാരണക്കാരന് ഗുണം ചെയ്യുന്ന ടെക്നോളജിയല്ലേ മുന്നോട്ട് കുതിക്കുന്നത്?
സേര്ച്ചില് പഴയ ചില്ലുകള് കാണിക്കില്ല എന്ന ഒറ്റക്കാരണം കൊണ്ട് ഇനി വരുന്ന മാറ്റങ്ങളെ ഉള്കൊള്ളാതിരിക്കേണ്ടതുണ്ടോ? സേര്ച്ചില് കാണിക്കില്ല എന്നു പറയപ്പെടുന്ന മിക്ക ചില്ലുകളും ഒന്ന് മനസുവെച്ചാല് അപ്ഡേറ്റ് ചെയ്ത് പുതുക്കാവുന്നവയല്ലേ? എത്ര സേര്ച്ച് എന്ജിനുകള് ഇപ്പോള് മലയാളം കാണിക്കുന്നുണ്ട്? യൂണീക്കോഡ് തുടങ്ങിയപ്പോള് ഇവയൊക്കെ മലയാളം കാണിച്ചിരുന്നോ? ഈ ചോദ്യങ്ങളൊക്കെ യുനീകോഡിനെ പിന്നോട്ട് നയിച്ചിരുന്നോ? ഇപ്പോള് യുനീകോഡ് ഉപയോഗിക്കുന്ന മലയാളം സൈറ്റുകളും, ആസ്കിയിലുള്ള സൈറ്റുകളും ഏകദേശം എത്രയുണ്ടാകുമെന്ന് താരതമ്യം ചെയ്യുന്നത് നന്നായിരിക്കും. ഇതിലേറെ സൈറ്റുകള് ഇനി മലയാളത്തില് വരാനിരിക്കുന്നില്ലേ? പണ്ട് ആസ്കിക്കാര് നിന്നപോലെ പാതിവഴിയില് നില്ക്കണോ?
യുനികോഡ് ഇനിയും മാറ്റങ്ങള്ക്ക് വിധേയമായേക്കാം... യുനികോഡിനെക്കള് നല്ല ടെക്നോളജി ഇനിയും വന്നേക്കാം... അപ്പോഴൊക്കെ അറച്ചു നില്ക്കുന്നത് നമ്മുടെ മലയാളത്തെ മുന്നോട്ട് നയിക്കുമോ?
5.1 ലേക്ക് മാറ്റാന് പറ്റുന്ന ചില്ലുകളെ നമുക്ക് ബോട്ടോ, പാച്ചോ, എന്തെങ്കിലും വെച്ച് മാറ്റാന് ശ്രമിക്കാം. ഇതു പോലെ പാച്ചി, പാച്ചിയല്ലേ അപാച്ചി ഉണ്ടായത്.
തിരഞ്ഞാല് കിട്ടാത്ത ചില്ലുകളെ മറക്കേണ്ടി വരുത്തരുതേ എന്ന പ്രാര്ത്ഥനയോടൊപ്പം വിജ്ഞാനപ്രദമായ ചില്ലുടക്കല് ആശംസകളോടെ....... :-)
Wednesday, December 24, 2008
Subscribe to:
Posts (Atom)