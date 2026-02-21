ৱিকিপিডিয়াৰ ভুল কেনেকৈ ধৰা পেলাব আৰু শুধৰণি কৰিব ? আই আই টি গুৱাহাটীৰ চমৎকাৰী উদ্ভাৱন
এ আই ইমপেক্ট সন্মিলনত আই আই টি গুৱাহাটীয়ে ৱিকিপিডিয়াৰ নামৰ ভুল ধৰা পেলোৱা আৰু শুধৰণি কৰাৰ পদ্ধতি প্ৰদৰ্শন কৰি সকলোকে আচৰিত কৰি দিলে ।
Published : February 21, 2026 at 1:10 PM IST
গুৱাহাটী : বৰ্তমান তথ্য-প্ৰযুক্তিৰ যুগত আমি কিবা নতুন বস্তু বা বিষয় জানিবলৈ সচৰাচৰ ৱিকিপিডিয়া বা অন্য মাধ্যমত চোৱাৰ প্ৰয়াস কৰোঁ । কিন্তু ৱিকিপিডিয়াত পোৱা সকলো তথ্য শুদ্ধ হয়নে ? বিভিন্ন অনুসন্ধানত পোহৰলৈ আহিছে যে ৱিকিপিডিয়াত উপলব্ধ তথ্যৰ প্ৰায় ৩-৬ শতাংশই ভুল থাকে । যাক লৈ আমি কেতিয়াবা বিভিন্ন সমস্যাত পৰো ।
কিন্তু ৱিকিপিডিয়াৰ 'ছাৰ্ফেচ নেম' (Surface Name) শুদ্ধ কৰাৰ ক্ষেত্ৰত আই আই টি গুৱাহাটীৰ গৱেষকৰ এটা দলে কাম কৰিছে । দলটোৱে বিশেষ পদ্ধতি উদ্ভাৱন কৰিছে । এই বহুভাষিক আৰু স্কেলেবল পদ্ধতিৰ দ্বাৰা ৱিকিপিডিয়াত ছাৰ্ফেচ নেম এৰ'ৰছ (SNE) চিনাক্ত আৰু সংশোধন কৰিব পৰা যায় । যিয়ে মানৱ ব্যৱহাৰকাৰী আৰু কৃত্ৰিম বুদ্ধিমত্তা ব্যৱস্থা (AI Systems) উভয়ৰে বাবে তথ্যৰ নিৰ্ভৰযোগ্যতা উন্নত কৰাত সহায় কৰিছে ।
ৱিকিপিডিয়া হৈছে মুক্ত, বহুভাষিক অনলাইন বিশ্বকোষ যাক সহযোগিতাৰ জৰিয়তে সৃষ্টি কৰাৰ লগতে বিশ্বব্যাপী স্বেচ্ছাসেৱকে বিনামূলীয়াকৈ চলায় । আই আই টি গুৱাহাটীয়ে এক প্ৰেছ বিবৃতিত উল্লেখ কৰিছে যে 'ছাৰ্ফেচ নেম' ৱিকিপিডিয়াৰ প্ৰবন্ধত আন এটা সত্তাৰ উল্লেখ বা লিংক কৰিবলৈ ব্যৱহাৰ কৰা লিখনিক বুজায় ।
বিবৃতিত কোৱা হৈছে, "এই লিখনি ভুল হ'লে ছাৰ্ফেচ নেম এৰ'ৰ (SNE) হয় । উদাহৰণস্বৰূপে পেৰিছৰ (Paris) বাবে পেজৰ সৈতে লিংক কৰিবলৈ 'Parise'ৰ দৰে ভুল শব্দ ব্যৱহাৰ কৰা আছে । আই আই টি গুৱাহাটীৰ গৱেষক দলে কৰা এক অধ্যয়নত দেখা গৈছে যে ৱিকিপিডিয়াত উল্লেখ কৰা সকলো তথ্য প্ৰায় ৩ শতাংশৰ পৰা ৬ শতাংশত ছাৰ্ফেচ নেম এৰ'ৰ থাকে । এই ভুলবোৰ সৰু যেন লাগিব পাৰে যদিও ইয়াৰ উল্লেখযোগ্য প্ৰভাৱ আছে ।"
মানৱ ব্যৱহাৰকাৰীৰ বাবে এটা ভুল 'ছাৰ্ফেছ নেম'এ প্ৰদান কৰা তথ্যৰ অনুভূত বিশ্বাসযোগ্যতা আৰু নিৰ্ভৰযোগ্যতা হ্ৰাস কৰিব পাৰে । একেদৰে বহুতো মেচিন লাৰ্ণিং আৰু ডিপ লাৰ্ণিং মডেলত ৱিকিপিডিয়াক মূল ডাটাছেট হিচাপে ব্যৱহাৰ কৰা হয় । 'ছাৰ্ফেচ নেম'ত এনে ভুলে AI কাৰ্য আৰু মডেলৰ পৰিৱেশনত নেতিবাচক প্ৰভাৱ পেলাব পাৰে ।
এই প্ৰত্যাহ্বানৰ সৈতে মোকাবিলা কৰিবলৈ কম্পিউটাৰ বিজ্ঞান আৰু অভিযান্ত্ৰিক বিভাগৰ সহযোগী অধ্যাপক অমিত আৱেকাৰে তেতিয়াৰ এম.টেকৰ ছাত্ৰ অনুজ খাৰেৰ (২০২২ চনৰ বেচ) সৈতে মিলি গাণিতিক কম্পাঙ্ক আৰ্হি ব্যৱহাৰ কৰা পদ্ধতি নিৰ্মাণ কৰিছিল, যাৰ ফলত ইয়াক বিভিন্ন ভাষাৰ মাজত খাপ খুৱাব পৰা যায় ।
প্ৰথম পদক্ষেপত ৱিকিপিডিয়া স্কেন কৰি প্ৰতিটো লিংকক চাৰিটা ভাগলৈ ৰূপান্তৰ কৰা আছিল য'ত এই তথ্য আছিল যে য'ত লিংকটো দেখা যায়, ই পইণ্টেড কৰা পেজ, লিংকত ব্যৱহৃত পেজৰ নাম আৰু চাৰিওফালৰ কনটেক্সতৰ(Context) প্ৰসংগ ।
পৰৱৰ্তী পদক্ষেপত বিকশিত পদ্ধতিয়ে 'ছাৰ্ফেচ নেম' পৰ্যালোচনা কৰে আৰু যদিহে ই কমেও ১০ বাৰ দেখা দিয়ে তেতিয়া ইয়াক শুদ্ধ বুলি বিবেচনা কৰে, যি এটা নিৰ্দিষ্ট পেজলৈ যোৱাৰ সকলো লিংকৰ অন্ততঃ ৫ শতাংশ ভাগ লয় ।
এই মাপকাঠীসমূহ পূৰণ নকৰা 'ছাৰ্ফেচ নেম'সমূহক সম্ভাৱ্য ভুল হিচাপে দেখুওৱা হয় । চূড়ান্ত পদক্ষেপত ই ধৰা পৰা ভুলবোৰক "টাইপিং ভুল" হিচাপে শ্ৰেণীভুক্ত কৰে, যেনে 'Guwahati'ৰ পৰিৱৰ্তে 'Gawahati', বা 'entity span errors' বুলি দেখাই য'ত অতিৰিক্ত বা ভুল শব্দ লিংকত ভুলকৈ অন্তৰ্ভুক্ত কৰা হৈছে ।
গৱেষকসকলে এই বিকশিত পদ্ধতিটো ইংৰাজী, সংস্কৃত, জাৰ্মান, ইটালিয়ান, উৰ্দু, হিন্দী, মাৰাঠী, গুজৰাটীকে ধৰি ৮ টা ভাষাত পৰীক্ষা কৰি সঠিক ফলাফল লাভ কৰিছে ।
বিকশিত পদ্ধতিটোৰ বাস্তৱ জগতৰ প্ৰয়োগৰ বিষয়ে আৱেকাৰে কয়, "এই কামে আমাক দেখুৱাইছে যে মানুহৰ ব্যৱহাৰ আৰু প্ৰশিক্ষণ এ আই মডেল দুয়োটাৰে বাবে আমি ৱেবৰ পৰা অহা তথ্যসমূহক চকু মুদি বিশ্বাস কৰা উচিত নহয় । শুদ্ধ তথ্য হৈছে যিকোনো ভাল এ আই মডেল আৰু ডাউনষ্ট্ৰিম প্ৰয়োগৰ আৰম্ভণি ।"
বিকশিত পদ্ধতিটোক বৈধতা প্ৰদান কৰিবলৈ গৱেষক দলটোৱে ২০১৮ আৰু ২০২২ চনৰ ইংৰাজী ৱিকিপিডিয়াৰ স্নেপশ্বট তুলনা কৰি দেখিলে যে এই পদ্ধতিৰ দ্বাৰা আঙুলিয়াই দিয়া প্ৰায় ৩০ শতাংশ ভুল তথ্য ৱিকিপিডিয়াত ৪ বছৰৰ ভিতৰত শুধৰণি কৰা হৈছে, যাৰ ফলত ইয়াৰ সঠিকতা নিশ্চিত কৰা হৈছে । ৱিকিপিডিয়া বিশ্বজুৰি স্বেচ্ছাসেৱকসকলে চলাই আছে আৰু বিকশিত পদ্ধতিয়ে সম্পাদকসকলক গম নোপোৱাকৈয়ে হোৱা টাইপিং ভুল আৰু সংযোগৰ ভুল চিনাক্ত কৰাত সহায় কৰিব পাৰে । যিবোৰ হয়তো বছৰ বছৰ ধৰি তেনেকৈয়ে থাকিব পাৰে ।
এই পদ্ধতিৰ সঠিকতাক আৰু অধিক বৈধ কৰিবলৈ লক্ষণীয় যে গৱেষকসকলে পৰামৰ্শ দিয়া সংশোধনৰ ৯৯ শতাংশতকৈ অধিক ৱিকিপিডিয়া সম্প্ৰদায়ে গ্ৰহণ কৰিছে । ৱিকিপিডিয়া সম্প্ৰদায়ৰ জৰিয়তে ব্যৱহাৰিক বৈধকৰণৰ সৈতে স্কেলেবল ডাটা প্ৰচেছিঙৰ সংমিশ্ৰণেৰে আই আই টি গুৱাহাটীৰ দলটোৱে ডিজিটেল জ্ঞান ব্যৱস্থা শক্তিশালী কৰাৰ ক্ষেত্ৰত এক ফলপ্ৰসূ পন্থা প্ৰদৰ্শন কৰিছে ।
