Tuesday, August 15, 2006

Google Search- என்றொரு உளவாளி?


கடந்து இரண்டு வருடங்களாய், நான் அதிகமாய் சென்றுவந்து இணைய தளம் Google Search தான். ஒரு நாளைக்கு, குறைந்தது 20 சொற்கள் அல்லது வார்த்தைகளைத் தேடுவது எனக்கு வழக்கமாகும். இது பெரும்பாலும், நான் விரும்பிய புத்தகங்கள், படங்கள், இசைகள், தலைவர்கள் பற்றிய ஓசி விமர்சனங்களைப் படிப்பதற்காக இருக்கும். அபூர்வமாக, அது எனது தொழில் முன்னேற்ற விசயங்களைத் தெரிந்து கொள்வதற்காகவும் இருந்து விடுவதுண்டு! இதே மாதிரி, மனதுக்கு படுகிற விசயங்களையெல்லாம், Google Searchல் தேடுகிற நோய் சில வருடங்களாய் எல்லோருக்கும் தொற்றி வருகிறது. நீங்கள் அப்படிப்பட்ட நோயுள்ளவராயிருந்தால், உங்களுக்கும், எனக்கும் சேர்த்து, இப்பொழுது ஒரு திடுக்கிடும் செய்தி.

உங்களின் விருப்பங்களை, கனவுகளை, வினோதமான ஆசைகளைப் பற்றி அறிந்த, உங்கள் அந்தரங்க கட்டிடத்தின் மூலை-முடுக்குகளைப் பற்றி துல்லியமாய் அறிந்த இன்னொரு ஐந்து இருக்கின்றதென்றால் நீங்கள் நம்புவீர்களா? ஆனால், அது தான் உண்மை. அது வேறு யாருமில்லை- Google Search தான். இப்பொழுது எனது குற்றச்சாட்டுக்கு அடிப்படையான சில செய்திகளை சொல்லயிருக்கிறேன்.

சில வாரங்களுக்கு முன்பாக, AOL என்ற தேடும் இணையம் (search-engine என்பதற்கு எவ்வளவு மோசமான மொழிபெயர்ப்புடா சாமி! என்று நீங்கள் புலம்புவது எனக்குக் கேட்கிறது) , 658, 000 பேர்களின் Search Key-words (30 million சொற் தொடுப்புகள் (queries)) தொகுப்பை பொது ஆராய்ச்சிக்காக வெளியிட்டிருந்தது. இது இந்த இணையத்தைப் பயன்படுத்தியவர்களிடம் பெரும் அதிருப்தியை ஏற்படுத்தியது. உபயோகிப்பவர்களின் பலத்த எதிர்ப்புகளுக்குப் பிறகு, இதைத் திரும்பப்பெற்றுக்கொண்டதுடன், மன்னிப்பும் கேட்டுக்கொண்டது இந்த நிறுவனம். ஆனாலும், இந்த நிகழ்ச்சி search-keywords தொகுப்பின் முக்கியத்துவத்தை உணர உதவியாய் இருந்தது.

இந்த தேடுதல்கள் மூலம் ஒருவர் தன்னைப் பற்றிய எல்லா தகவல்களையும், வெளியிட்டு விடுகிறார். உதாரணமாக அவரது பெயர் (எல்லோரும் google searchல் அவரவர் பெயரை தேடிப்பார்ப்பது ஒரு இயல்பான விசயம்), இப்பொழுதைய தொழில் (எந்த மாதிரியான தொழில் சம்பந்தமான வார்த்தைகளைத் தேடுகிறார் என்பதை வைத்து சொல்ல முடியும்), அவரது விருப்பங்கள் (இசை, திரைப்படங்கள் , கவிதைகள், புத்தகங்கள்) போன்றவற்றை போதுமான search-keywords database கொண்டு சொல்லிவிடமுடியும். மற்றபடி, அவரின் இருப்பிடம் (geographical location) கண்டுபிடிப்பது மிகமிக சுலபம். உதாரணமாக, IP (internet protocol) எண்ணை வைத்துக்கொண்டு, நீங்கள் எந்த ஊரில் இருந்து, எந்த இடத்தில் இருந்து இதைப் படித்துக்கொண்டிருக்கிறீர்கள் என்று சொல்லிவிடமுடியும். அதற்கும் மேலாக, நீங்கள் இயலபான மன நிலையில் உள்ளவரா என்பதைக் கூட கண்டுபிடித்துவிட முடியும். உதாரணமாக, kill, murder, torture, child-porno, suicide, போன்ற வார்த்தைகளை இணையத்தில் ஒருவர் அடிக்கடி தேடுகிறார் என்றால், நிச்சயம் அவரது சில நட்டுகள் கழன்றுவிட்டன என்று சொல்லிவிடலாம்.

இப்பொழுது ஒத்துக்கொள்கிறீர்களா? Google-search உங்களைப் பற்றி எல்லாமும் அறிந்த ஒரு உளவாளி என்று.

கொசுறு தகவல்கள் :

US நீதித் துறை (US justice department), Search-engine பயன்படுத்துபவர்களின் சொற்தொடுப்புகளை இரண்டு வருடங்களாவது அந்தந்த நிறுவனங்கள் சேமித்துவைக்க வேண்டும் என்று கேட்டுக்கொண்டிருக்கிறது. அதோடு, US அரசு இந்த சொற்தொடுப்பு தகவல்களை, Google, Microsoft நிறுவனங்களிடமிருந்து கேட்டிருப்பதும் அதை இந்த நிறுவனங்கள் தர மறுத்திருப்பதும் முன்பு வெளியான செய்திகள்.

உங்களிடம் உள்ள ஒரே பாதுகாப்பு, நீங்கள் 65 பில்லியன் மனிதர்களில் ஒருவர் என்ற உண்மை தான். அதனால், இந்த தேடல் இணையங்கள் கையாளவேண்டிய தொகுப்பின் (database) அளவு அபரிமிதமானது. ஆனால், data-mining துறையில் நடக்கும் முன்னேற்றம் கூடிய விரைவில் இந்த database கையாளும் திறனை அதிகப்படுத்திவிடும்.


6 Comments:

Blogger சந்திப்பு said...

நல்ல தகவல்களுடன் கூடிய கட்டுரை. தேடுவதில் நானும் அடிக்ட்டுதான். வாழ்த்துக்கள்.

11:22 PM  
Blogger புதுமை விரும்பி said...

வருகைக்கு நன்றி சந்திப்பு அவர்களே. உங்கள் கருத்துக்களுக்கு நன்றிகள் பலப்பல.

3:21 AM  
Blogger Suresh said...

அருமையான தொகுப்பு..

மேலும் தொடருங்கள்...
பாராட்டுகள்..

2:48 AM  
Blogger திருவடியான் said...

அதிர்ச்சி ரகத்தைச் சேர்ந்த செய்தி. AOL Search சம்பந்தமான வலைச்சொடுக்கை தெரிவிக்கமுடியுமா? நன்றி.

3:17 AM  
Blogger புதுமை விரும்பி said...

வருகைக்கு நன்றி சுரேஷ்,

உங்கள் ஆதரவளிக்கும் வார்ததைகளுக்கு நன்றி.

அடுத்த பதிவில், hacking பற்றி எழுத இருக்கிறேன்.

பாகிஸ்தான் hackers எப்படி எங்கள் networkகுள் புகுந்தார்கள் என்று எனக்கு தெரிந்த வரை சொல்ல இருக்கிறேன்.

4:04 AM  
Blogger புதுமை விரும்பி said...

வருகைக்கு நன்றி திருவடியான்,

// அதிர்ச்சி ரகத்தைச் சேர்ந்த செய்தி. //

உண்மை தான். AOL வெளியிட்ட தொகுப்பை ஆய்வு செய்து, ஏகப்பட்ட செய்திகள் வர ஆரம்பித்துவிட்டன. AOL நிறுவனம், பொது ஆராய்ச்சிக்காக வெளியிட்டிருந்த இந்த தொகுப்பை தடை செய்துவிட்டாலும், இன்னும் வெறு இணையங்களில் தரவிரக்கம் செய்யக்கிடைக்கின்றது.

// AOL Search சம்பந்தமான வலைச்சொடுக்கை தெரிவிக்கமுடியுமா?//

http://thejordianapathist.infogami.com/aol-data

http://www.hojohnlee.com/weblog/archives/2006/08/06/aol-research-publishes-20-million-search-queries/

4:45 AM  

Post a Comment

<< Home

Free Hit Counter
Google PageRank

Your Ad Here