എന്താണു യൂണിക്കോഡ് ?

Posted on സെപ്റ്റംബര്‍ 1, 2007. Filed under: Bloggers Only |

അക്ഷരങ്ങളും അക്കങ്ങളും ചിഹ്നങ്ങളും പൂജ്യത്തിന്റേയും ഒന്നിന്റേയും കൂട്ടങ്ങളായി മാറ്റിയാണ്‍ കന്പ്യൂട്ടറില്‌ ശേഖരിച്ചു വയ്ക്കുന്നത്. ഇങ്ങനെ ശേഖരിക്കുന്നതിന് ഓരോന്നിനും അതി‍ന്റേതായ കോഡുകള്‌ ഉണ്ടായിരിക്കണം. ഇപ്പോള്‌ ഇത് കൂടുതലായും ASCII (അമേരിക്കന്‌ സ്റ്റാന്‌ഡാര്‌ഡ് കോഡ് ഫോര്‌ ഇന്‌ഫര്‌മേഷന്‌ ഇന്റര്‌ചേഞ്ച്) കോഡുപയോഗിച്ചാണ്‍ നിര്‌വ്വഹിച്ചു വരുന്നത്. ഇതുപയോഗിച്ചുണ്ടാക്കാവുന്ന അക്ഷരാദികളുടെ എണ്ണം (256) പരിമിതമായതുകൊണ്ട് രണ്ടു ഭാഷകളിലെ അക്ഷരങ്ങളേ ഒരേ സമയം ഉപയോഗിക്കാന്‌ സാധിക്കുകയുള്ളു. ഇതില്‌ ആദ്യത്തെ 128 എണ്ണം ഇംഗ്ളീഷിനും അടുത്ത 128 എണ്ണം വേറെ ഏതെങ്കിലും ഭാഷക്കും ഉപയോഗിക്കാം.ലോകമാസകലം കന്പ്യൂട്ടറുകള്‌ വരുകയും അവയെയെല്ലാം ബന്ധിപ്പിക്കുന്ന ഇന്റര്‌നെറ്റ് സംജാതമാകുകയും ചെയ്തതോടെ ലോകഭാഷകള്‌ എല്ലാം അടങ്ങുന്ന ഒരു കോഡിംഗ് സിസ്റ്റം ആവശ്യമായിവന്നു. ഇതിലേക്കായി ഇന്റര്‌നാഷണല്‌ സ്റ്റാന്‌ഡാര്‌ഡ് ISO/IEC 106461, ഒരു പദ്ധതി തയ്യാറാക്കി. ഈ പദ്ധതിയില്‌ ഉള്‌പ്പെടുത്തിയ എല്ലാ അക്ഷരാദികളേയും സ്വാംശീകരിച്ചുകൊണ്ട് കുറച്ചു കൂടി ബൃഹത്തായതും ലോകഭാഷകളാകമാനം ഉള്‌ക്കൊള്ളാനാവുന്നതും ഭാവി വികസനങ്ങള്‌ക്ക് പഴുതുള്ളതുമായ ഒരു കോഡിംഗ് സന്പ്രദായം വേണമെന്ന് കന്പ്യൂട്ടര്‌ ലോകത്തിനു തോന്നി. അങ്ങനെയാണ്‍ കംന്പ്യൂട്ടര്‌ കോര്‌പ്പറേഷനുകളും സോഫ്റ്റ്വെയര്‌ ഡാറ്റാബേസ് കച്ചവടക്കാരും, അന്താരാഷ്ട്ര ഏജന്‌സികളും ഉപയോകതാക്കളും ചേര്‌ന്ന് 1991-ല്‌ ദി യുണിക്കോഡ് കണ്‌സോര്‌ഷ്യം എന്ന ഒരു സംഘടന രൂപീകരിച്ചത്. ഇന്ത്യാ ഗവണ്‌മെന്റിന്റെ ഇന്‌ഫര്‌മേഷന്‌ ടെക്നോളജി ഡിപ്പാര്‌ട്ട്മെന്റ ഇതിലെ ഒരു മുഴുവന്‌ സമയ അംഗമാണ്‍ .
 

ഇന്റര്‌നാഷണല്‌ സ്റ്റാന്റേര്‌ഡ് ഓര്‌ഗനൈസേഷനും യുണിക്കോഡും ചേര്‌ന്ന് 1992ല്‌ യൂണിക്കോഡ് വേര്‌ഷന്‌ 1.0 പുറത്തിറക്കി. ഇതു പരിഷ്കരിച്ച് 2.0യും 2000 ഫെബ്രുവരിയില്‌ 3.0യും പുറത്തിറങ്ങി. ISO 10646 –ല്‌ 32 ബിറ്റുപയോഗിച്ചിരുന്നിടത്ത് 16 ബിറ്റു മാത്രമേ യൂണിക്കോഡ് ഉപയോഗിക്കുന്നുള്ളൂ. അതായത് 16 സ്ഥാനങ്ങളിലായി ഒന്നും പൂജ്യവും നിരത്തി 65000-ല്‌ പരം അക്ഷരാദികളുടെ കോഡുകള്‌ നിര്‌മ്മിക്കാം. ഇവ 500 ഓളം ഭാഷകള്‌ക്കു മതിയാകും. പുരാതന ലിപികളും ഭാവിയില്‌ ഉണ്ടാകുന്ന ലിപികളും ഇതില്‌ ഉള്‌ക്കൊള്ളിക്കാന്‌ തക്കവിധത്തില്‌ ഇതിനെ വിപുലപ്പെടുത്താനും സാധിക്കുന്നതാണ്‍ . പ്രധാനപ്പെട്ട ലോകഭാഷകള്‌ മിക്കവാറും എല്ലാം തന്നെ ഉള്‌പ്പെട്ടുത്തി 49194 അക്ഷരാദികള്‌ക്ക് ഇതിനകം കോഡുകള്‌ നല്കിക്കഴിഞ്ഞു. ഇതില്‌ ചൈനീസും ജാപ്പനീസും ഉള്‌പ്പെടും. അടുത്തുതന്നെ ബര്‌മീസ്, സിന്‌ഹാളീസ്, സിറിയക് മുതലായ ഭാഷകളും ഇതിന്റേ കീഴില്‌ കൊണ്ടു വരുന്നതാണ്‍


യൂണിക്കോഡ് ഭാഷയിലെ അക്ഷരങ്ങള്‌ക്ക് കോഡുകള്‌ നല്‌കിയെങ്കിലും അവ എങ്ങനെ സ്ക്രീനില്‌ കാണണമെന്ന് ഹാര്‌ഡ്‍വേറും സോഫ്‍റ്റ്വേറും ഇറക്കുന്നവരാണ്‍ തീരുമാനിക്കുന്നത്. ലോക ഭാഷകള്‌ ഒരേ സ്ക്രീനില്‌ പ്രത്യക്ഷപ്പെടേണ്ടി വരുന്പോള്‌ ലോക പ്രശസ്തരായ
IBM, മൈക്രോസോഫ്റ്റ്, ഒറാക്കിള്‌, ആപ്പിള്‌ എന്നിത്യാദി വന്പന്മാരെല്ലാം യൂണിക്കോഡിനെ വാരിപ്പുണരുന്നതില്‌ അത്ഭുതപ്പെടാനില്ല. ഇന്റര്‌നെറ്റിന്റേ ലോകവ്യാപകമായ പ്രചാരത്തോടുകൂടി യൂണിക്കോഡും ഒരു ആഗോളലിപികളുടെ കോഡായിമാറിക്കഴിഞ്ഞു
 

9 ഇന്ത്യന്‌ ഭാഷകള്‌ക്കായി 128 X 9 = 1152 കോഡുകള്‌ (2304 മുതല്‌ 3455 വരെ) അലോട്ടുചെയ്തിരിക്കുന്നതില്‌ 3328 മുതല്‌ 3455 വരെയുള്ള 128 എണ്ണം മലയാള ലിപികള്‌ക്കാണ്‍ തന്നിരിക്കുന്നത്.

 

കടപാട്: സൂപ്പര്‌സോഫ്‍റ്റ് , കന്പ്യൂട്ടര്‌ സോഫ്‍റ്റുവേര്‌ ഗവേഷണ വികസന കേന്ദ്രം, കേശവദാസപുരം, തിരുവനന്തപുരം, കേരളം – 695 004

Make a Comment

ഒരു മറുപടി കൊടുക്കുക

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / മാറ്റുക )

Twitter picture

You are commenting using your Twitter account. Log Out / മാറ്റുക )

Facebook photo

You are commenting using your Facebook account. Log Out / മാറ്റുക )

Google+ photo

You are commenting using your Google+ account. Log Out / മാറ്റുക )

Liked it here?
Why not try sites on the blogroll...

%d bloggers like this: