Pages

Saturday, January 08, 2011

யுனிக்கோடு: கிரந்தக் கலப்பின் பல்வேறு பக்கங்கள் - வினா-விடை - பகுதி 3

தொகுதி-2: ஒருங்குறியின் அமைப்பு

10) ஒருங்குறியின் அடிப்படை அடவு எப்படியானது?
விளக்கம் கிட்டுமா?

ஒருங்குறியின் அடிப்படை அடவு மிகவும் எளிது.
சற்று ஆழ்ந்து பார்த்தால், யாராலும் நன்றாகவே
விளங்கிக் கொள்ள இயலும். மொழி தொடர்பாக
நீண்ட எதிர்கால ஆளுமையைக் கொண்டிருக்கிற
ஒருங்குறியின் அமைப்பையும் அடிப்படைக்
கட்டமைப்பும் புரிந்து கொள்வது மிக அவசியமும் கூட.
கீழே படம் 2.1 ஐ நோக்குக.

செவ்வகக் கட்டகத்துக்குள் இருக்கும்
நீளச் சட்டங்களைக் காண்க. இந்த நீளச் சட்டங்கள்
ஒவ்வொன்றும் ஒரு தனித் தளத்தைக் குறிக்கின்றன.
ஒருங்குறித் தரப்பாடு, இப்படியாக 17 தளங்களைத்
தன் கட்டமைப்பில் கொண்டுள்ளது.

ஒவ்வொரு தளத்திலும் சிறியதும் பெரியதுமாகப்
பல்வேறு பாத்திகளைக் (Blocks) கொண்டுள்ளது.
இந்தப் பாத்திகள் ஒவ்வொன்றிலும் ஓர் எழுத்து
முறை வைக்கப் பட்டுள்ளது.

அது எழுத்து முறையாக இருக்கலாம்,
அன்றித் துணைக்குறிக் கூட்டமாகக் கூட இருக்கலாம்,
அல்லது சின்னங்களின் தொகுப்பாக இருக்கலாம்,
அல்லது அறிவியல், கணிதக் குறிகளாக இருக்கலாம்.

அந்தப் பாத்திகளின் அளவு அந்த எழுத்து முறை
அல்லது குறிகளின் கூட்டத்தில் உள்ள
குறிகளின் எண்ணிக்கையைப் பொறுத்து
சிறியதாகவோ, சற்று பெரியதாகவோ,
மிகப் பெரியதாகவோ அமையும்.


தளங்களில் வண்ணமிடாத வெள்ளைப்
பாத்திகள் இன்னும் எவ்வகைக் குறித்தொகுப்பாலும்
நிரப்பப் படாமல் இருக்கின்றது என்பதனைக் எடுத்துக்
காட்டுகிறது.

ஒவ்வொரு தளத்திலும் 65,536 குறிகளைக்
குடி வைக்கலாம். இதனை 64 கிலோ பைட்டுகள்
என்று ஆங்கிலத்தில் சொல்வார்கள். ஒருங்குறிக்
கட்டகம் 17 தளங்களைக் கொண்டுள்ளதால்
(இது எதிர்காலத்தில் 21 வரைக்குங் கூட உயர்ந்து
கொண்டு போகலாம்.) (17 X 65,536 = 11,14,112) மொத்தம்
பதினொரு இலக்கத்து பதினாலாயிரத்தி நூற்றிப்
பன்னிரண்டு குறிகளை வைக்கும்படியாக
கட்டமைக்கப் பட்டிருக்கிறது.

இந்த ஒவ்வொரு தளமும் உயரத்தில்
16 உள் அடுக்குகளையும் நீளத்தில்
4096 உள் பிரிப்புகளையும் கொண்டதாக
அமைக்கப் பட்டுள்ளது.

ஒவ்வொரு உள் அறைக்கும் ஒவ்வொரு
குறி எண் உண்டு. ஒவ்வொரு மொழித்
தொகுப்பு அல்லது எழுத்து முறைக்கும்
அதில் உள்ள குறிகளின் எண்ணிக்கையைப் பொறுத்து
பிரிப்புகளைக் கொடுப்பார்கள்.

எல்லாத் தொகுப்புக்கும் 16 உயர அடுக்குகள்
நிலையானது. நீளத்தை மட்டும் எண்ணிக்கைக்கு
ஏற்றவாறு கொடுப்பார்கள். காட்டாக, தமிழுக்கு
உயரத்தில்16 அடுக்குகளையும் நீளத்தில் 8 பிரிப்புகளையும் கொடுத்திருக்கிறார்கள்.

ஆக, தமிழிற்கு ஒதுக்கப் பட்டிருக்கும் பாத்தியில்
உள்ள இடங்கள் 16 X 8 = 128 ஆகும். இதே போல
அரபி எழுத்து முறைக்கு 16 X 16 = 256 இடங்கள்
கொண்ட பாத்தி கொடுக்கப் பட்டிருக்கின்றது.
தெலுங்குக்கு 128 இடப் பாத்தியும்,
தேவநாகரிக்கு 128 இடப் பாத்தியும்,
சீன-யப்பானிய-கொரிய எழுத்து முறைகளுக்குப்
பல நூறு இடங்கள் கொண்ட பல பாத்திகளும்
ஒதுக்கப் பட்டுள்ளன. ஒவ்வொரு எழுத்து
முறைக்கும் எவ்வளவு இடங்கள்
ஒதுக்கப்பட்டுள்ளன என்பதை மேலும்
அறிவதற்கு http://www.unicode.org/charts/
என்ற இந்த இணையவரியைச் சொடுக்குக.

படம் 2.2, ஒரு தளத்தின் உள்ளமைப்பு
விவரங்களைக் காட்டுகிறது.

இப்படித்தான் ஒருங்குறியின் கட்டகமும்
உள்ளமைப்பும் இருக்கின்றன. இப்படங்கள் கருத்தியல்
அடிப்படையை மட்டும் விளக்க வரையப்பட்டன ஆகும்.
இதே வரிசையில் எழுத்து முறைகள் இருக்காது.
அவை வேறுபடும் என்று அறிக.

குறிப்பு: படத்தைச் சொடுக்கினால் சற்று பெரிதாகக் காணலாம்.

(தொடரும்)

முந்தைய பகுதிகள்:
பகுதி 1: http://nayanam.blogspot.com/2011/01/1.html
பகுதி 2: http://nayanam.blogspot.com/2011/01/2.html

அன்புடன்
நாக.இளங்கோவன்





No comments: