7. ஆர்டிபிஎம்எஸ் என்னும் அதிரடி

எல்லா தகவல்களும் நமக்குத் தேவையில்லை. கிடைத்த தகவல்களை வைத்து, கூடுதல் தகவல்களை நாம் புரிந்துகொள்ள முடியும். இதனால் வேலை சுலபமாகிறது. சேமிக்க இடமும் மிச்சம்.
7. ஆர்டிபிஎம்எஸ் என்னும் அதிரடி

அறுபதுகளில் என்ன நடந்தது என்பதை பார்க்கலாம். அந்தக் காலத்து அரதப்பழசு டேட்டாபேஸை கையாளுவது என்பது கயிற்றைக் கட்டி பெட்ரூம் கட்டிலை இழுப்பது போன்றது. பத்துக்குப் பத்து உள்ள அறையில் கட்டிலை எங்கும் இழுத்துக்கொண்டு போகமுடியாது. அக்குவேறு ஆணிவேறாக பிரித்துதான் வெளியே எடுத்தாக வேண்டும். ஆதி காலத்து டேட்டாபேஸ்கூட அப்படித்தான் இருந்தது. ஒருமுறை சிஸ்டத்தை செட்டப் செய்துவிட்டால், புதிதாக மாற்றங்களெல்லாம் செய்துவிட முடியாது. அப்படி ஏதாவது செய்தால், ஏற்கெனவே உள்ளவையெல்லாம் மாயமாகிவிடும்.

அப்போதெல்லாம் டேட்டாபேஸை கையாள்வதற்கு தனியாக ஒரு குழு இருந்தது. ரயில்வே என்ஜின் போல், தனியறையில் யாராவது இரண்டு பேர் எந்நேரமும் உட்கார்ந்திருப்பார்கள். முழுநேரமும் கண்காணிக்க வேண்டியது அவசியமாக இருந்தது. டேட்டாபேஸ் சங்கதிகளை நிர்வகிக்க டிபிஏ என்னும் டேட்டாபேஸ் அட்மினிஸ்ட்ரர் தேவைப்பட்டார்கள். டேட்டாபேஸை உருவாக்குவது, அதில் தகவல்களை சேகரிப்பது, தேவைப்படும்போது டேட்டாவை வெளிக்கொண்டு வருவதுதான் அவர்களுடைய வேலை. டிபிஏ என்பது ஒரு காலத்தில் மிகப்பெரிய கௌரவமான பொறுப்பு. அதற்கென்று தனிப்பயிற்சியும், நிபுணத்துவமும் கொண்டிருக்க வேண்டும்.

ஆங்கிலத்தில் லாஜிக்கல் கன்சிஸ்டென்ஸி என்பார்கள். மாறா தர்க்கம் என்று தூய தமிழில் சொல்லலாம். எந்த மொழியாக இருந்தாலும், ஒற்றை வார்த்தையில் இப்படிச் சொல்லிவிட்டால் புரிந்துகொள்வது சிரமம்தான். ஆகவே, இந்த வார்த்தையின் மாயாஜாலத்தை சற்று விரிவாகவே பார்க்கலாம். ஏனென்றால், டேட்டாபேஸ்க்கு மட்டுமல்ல, இன்றைய தகவல் தொழில்நுட்பத்தின் அடுத்தகட்ட பாய்ச்சலான ஆர்ட்டிபிஷியல் இன்டலிஜென்ஸ் பற்றி புரிந்துகொள்வதற்கும் இதுவே அடிப்படையான விஷயம்.

லாஜிக்கல் கன்சிஸ்டென்ஸி என்பது தர்க்க நியாயங்களின் அடிப்படையில் ஒரு விஷயத்தை புரிந்துகொண்டு, அதுபற்றிய முடிவுக்கு நாம் வர வேண்டியது. ஒரு சில எடுத்துக்காட்டுகளை பார்ப்போம். குரைப்பது நாய்களின் குணம். அதுவே அதன் அடிப்படைக் குணம். இதில் யாருக்கும் சந்தேகம் இருக்க முடியாது. பொதுவாக, எல்லாம் நாய்களும் குரைக்கும் என்று தாராளமாகச் சொல்ல முடியும். அதாவது, நீங்கள் நாயாக இருந்தால் குரைத்துதான் ஆக வேண்டும் என்றும் சொல்லலாம். தப்பில்லை. ஆனால், ஒரு சில நாய்கள் குரைக்காமல் இருக்கக்கூடும். தெருவோரம் அசையாமல் படுத்துக்கிடக்கும். அவை குரைக்காமல் இருப்பதற்கு நிறைய காரணங்கள் இருக்கலாம். இவையெல்லாம் விதிவிலக்குகள். ஆனால், நாயாக பிறந்தால் குரைத்தாக வேண்டும்.

சரி, இப்போது பூனைக்கு வருவோம். பூனைகள் கருப்பாக இருக்கலாம். ஏன் வெள்ளையாகவும் இருக்கலாம். இரண்டும் கலந்துகூட இருக்கலாம். ஒரு சில பூனைகள் பழுப்பு நிறத்தில்கூட இருக்கலாம். ஆனால், பச்சை நிறத்தில் இருக்கவே முடியாது. நீலம், ரோஸ், மஞ்சள்… நோ சான்ஸ்! நாய் குரைத்தாலென்னா… பூனை, எந்த நிறத்தில் இருந்தால் எனக்கென்ன என்று நினைக்கத் தோன்றுகிறதா?

பூனைகளின் நிறம் பற்றி எழுதும்போது இத்தகைய தர்க்கங்களை நாம் கவனித்தாக வேண்டும் என்று கோட் நினைத்தார். குறிப்பாக, பூனை பற்றிய ப்ரொஃபைலை சேமித்துவைக்கும் டேட்டாபேஸ், இத்தகைய புரிதல்களை கொண்டிருக்க வேண்டும் என்பது அவரது எண்ணம். பூனையின் நிறம் கருப்பு, வெள்ளை, பழுப்பு அல்லது இவையெல்லாம் கலந்த ஒன்றாக இருந்தால் மட்டுமே டேட்டாபேஸ் உள்வாங்கிக்கொள்ள வேண்டும். பச்சை என்று யாராவது குறிப்பு எழுதியிருந்தால், தலையில் தட்டி, அது பூனையல்ல. ஒருவேளை கிளியாக இருக்கலாம் என்று சுட்டிக்காட்ட வேண்டும்.

கோட், எதிர்பார்த்த லாஜிக்கல் கன்சிஸ்டென்ஸி என்பது இதுதான். எல்லா தகவல்களும் நமக்குத் தேவையில்லை. கிடைத்த தகவல்களை வைத்து, கூடுதல் தகவல்களை நாம் புரிந்துகொள்ள முடியும். இதனால் வேலை சுலபமாகிறது. சேமிக்க இடமும் மிச்சம். ஏராளமான தகவல்களை ஏற்றுவதும் சரி, இறக்குவதும் சரி, சிரமமான காரியம். வேலைப்பளுவை குறைத்தாக வேண்டும். அதற்கு ஒரே வழி, தேவையான விஷயங்களை மட்டுமே டேட்டாபேஸில் பதிவு செய்துகொள்ள வேண்டும். பூனைக்கும் நிறத்துக்கும் உள்ள தொடர்பைப் புரிந்துகொள்ளுமளவுக்கு டேட்டாபேஸ் இருந்தாக வேண்டும். அறுபதுகளில் அதெல்லாம் சாத்தியப்படவில்லை. அதற்காகத்தான் கோட், களமிறங்கினார்.

எது தேவையோ அதை மட்டும் சேமிக்க வழி செய்தாக வேண்டும். காகிதத்தில் என்னவெல்லாம் எழுதுகிறோமோ, அவற்றையெல்லாம் டேட்டாபேஸில் எழுத வேண்டிய அவசியமில்லை. ஒரு சில விஷயங்களை தவிர்த்துவிடலாம். இப்போதும் சிலர் ஆர்வக்கோளாறில் தேவையில்லாத விஷயங்களை செய்வதுண்டு. எக்ஸெல் ஷீட் எப்போது உருவாக்கப்பட்டது என்பதை created on என்றொரு காலத்தில் எழுதுவார்கள். வருஷம், மாதம், நாள், நேரம் என்றெல்லாம் மெனக்கெட்டு அதில் தட்டச்சு செய்வார்கள்.

சரி, மீண்டும் கோட் காலத்துக்கே போய்விடுவோம். அறுபதுகளில் ஐபிஎம்மில் பணியாற்றிக்கொண்டிருந்த காலத்தில், கோட் மனதில் உதித்த கேள்விகள் இவை. ஏன் டேட்டாபேஸை இன்னும் முறையான மாடலாக ஆக்கக் கூடாது? ஒவ்வொரு டேட்டாவுக்கும் இடையேயான தொடர்புகளை, மற்றவற்றோடு கொண்டிருக்கும் பந்தங்களை கண்டறிந்து அதை ஆவணப்படுத்துமளவுக்கு டேட்டாபேஸை ஏன் தயார் செய்யக் கூடாது? செய்துதான் ஆக வேண்டும்.

பல்வேறு ஆராய்ச்சிகளுக்குப் பின்னர் எழுபதுகளின் ஆரம்பத்தில் பிரசித்தி பெற்ற அந்த ஆய்வுரையை சமர்ப்பித்தார், கோட். “A Relational Model of Data for Large Shared Data Banks” என்று அந்த ஆய்வுரை, நவீன டேட்டாபேஸ் சிஸ்டமான RDBMS என்னும் ரிலேஷனல் டேட்டாபேஸ் சிஸ்டத்துக்கு அடித்தளமாக அமைந்தது.

RDBMS பற்றி விரிவாகத் தெரிந்துகொள்வதற்கு முன்னர் ரிலேஷனல் தியரியை தெரிந்துகொள்வோம். அதற்கு டேட்டா பேஸ் அடிப்படைத் தரவுகளை முதலில் தெரிந்துகொள்வது நல்லது. ட்யுபில் தெரியுமா? ட்யுபில் (Tuple) என்பது ஒரு வரிசையில் வகைப்படுத்தப்பட்டுள்ள டேட்டா. குழப்பமாக இருக்கிறதா? சரி, எல்லோருக்கும் தெரிந்த எக்ஸெல் ஷீட்டை வைத்து சொல்லிவிடலாம். எக்ஸெல் ஷீட்டின் ஒரு வரிசையில் உள்ள டேட்டா. அவ்வளவுதான்.

ஒரு வகுப்பில் 40 மாணவர்கள் இருப்பதாக வைத்துக்கொள்வோம். அவர்களது பெயர், முகவரி, தொடர்பு எண், மெயில் ஐடி, வயது என்றெல்லாம் ஏராளமான விவரங்களை ஒரு டேபிளில் எழுதியிருப்போம். அதில் உள்ள ஒவ்வொரு மாணவரின் எண்ட்ரியும் ட்யுபில் என்று சொல்லலாம். ஒரு டேபிளில் எத்தனை வரிசை இருக்கிறதோ, அத்தனை ட்யுபில். இங்கே ஐந்து மாணவர்களின் விவரங்கள் கொடுக்கப்பட்டிருக்கின்றன. ஆகவே, ஐந்து ட்யுபில்!

அட்ரிபியூட் (attribute), அதாவது பண்புகள். மாணவர்களின் பெயர், வயது, முகவரி, இமெயில் முகவரி இவையெல்லாம்தான் அட்ரிபியூட். அதாவது, ஒரு டேபிளில் உள்ள தலைப்புகளையே அட்ரிபியூட் என்று சொல்லிவிடலாம். ஒரு வகுப்புறையில் உள்ள மாணவர்களின் விவரங்களை இந்த அட்ரிபியூட் அடிப்படையில் பகுத்து, தொகுத்துக் காட்டியிருக்கிறோம்.

ஒரு டேபிளில் தனித்துவம் கொண்ட ட்யுபில்ஸ் தொகுப்புகளை ரிலேஷன் (relation) என்று சொல்லலாம். ஒரே ட்யுபில் திரும்பத் திரும்ப வர சாத்தியமில்லை. வந்தால், அதை விலக்கிவிடலாம். இடமும் மிச்சம். அடுத்து கன்ஸ்ட்ரைண்ட்ஸ் (constraints) என்னும் தொடுப்பு விதிகள். அட்ரிபியூட் இடையே உள்ள சொந்த, பந்தங்களை அதாவது ரிலேஷனை வெளிக்கொண்டு வர உதவி செய்பவை. எத்தனை அட்ரிபியூட், அதில் எத்தனை ரிலேஷன் என்பதையெல்லாம் டிகிரி என்பார்கள். தொடர்ந்து விரிவாக பார்ப்போம்!

(தொடரும்)

தினமணி'யை வாட்ஸ்ஆப் சேனலில் பின்தொடர... WhatsApp

தினமணியைத் தொடர: Facebook, Twitter, Instagram, Youtube, Telegram, Threads, Koo

உடனுக்குடன் செய்திகளை தெரிந்து கொள்ள தினமணி செயலியை பதிவிறக்கம் செய்யவும் 

Related Stories

No stories found.
Dinamani
www.dinamani.com