মানুষ এখন নিয়মিতভাবে কোড লেখা, বড় লেখা সংক্ষেপ করা বা কোনো বিষয়ের ওপর পরামর্শ নেওয়ার কাজে চ্যাটজিপিটি ব্যবহার করছেন। তবে অনেক মানুষ এই প্রযুক্তি ব্যবহার করে একদম নতুন লেখাও তৈরি করছেন এবং সেইসব লেখাকে নিজের লেখা বলে চালিয়েও দিচ্ছেন।
বিষয়টি স্বাভাবিকভাবেই সমস্যা তৈরি করেছে শিক্ষকদের জন্য। কারণ তাদের কাজ হচ্ছে শিক্ষার্থীদের লেখা মূল্যায়ন করা। একইসঙ্গে এটি তাদের বেলাতেও সমস্যা তৈরি করেছে যারা রেডিট-এর মতো ফোরামে পরামর্শ খোঁজেন বা কোনো কিছু কেনার আগে পণ্যের রিভিউ পড়ে সিদ্ধান্ত নিতে চান বলে প্রতিবেদনে লিখেছে ব্রিটিশ অনলাইন মিডিয়া প্ল্যাটফর্ম কনভারসেশন।
গত কয়েক বছর ধরে গবেষকেরা খুঁজে দেখছেন, আদৌ কি মানুষের লেখা আর এআইয়ের তৈরি লেখার মধ্যে পার্থক্য করা সম্ভব। তারা বলছেন, মানুষ ও এআইয়ের লেখার মধ্যে পার্থক্য ধরতে সাহায্য করতে পারে চ্যাটবট নিজেই।
চ্যাটবট দিয়ে লেখা ধরতে পারা মানুষের পক্ষে সম্ভব?
সাম্প্রতিক বেশ কিছু গবেষণায় উঠে এসেছে, কোনো লেখা মানুষ লিখেছে না কি এআই তৈরি করেছে সেটি বোঝা কঠিন। ২০২১ সালের এক অনলাইন গবেষণায় মানুষ ও চ্যাটজিপিটি’র লেখা গল্প, খবরের আর্টিকেল বা রেসিপির মধ্যে পার্থক্য করতে পারেননি অংশগ্রহণকারীরা, সব লেখাই তাদের কাছে একই রকম লেগেছে।
এ গবেষণায় ভাষাবিদরাও খুব একটা ভালো করতে পারেননি। ২০২৩ সালের এক গবেষণায় উঠে এসেছে, শীর্ষস্থানীয় ভাষাবিজ্ঞান জার্নালের সম্পাদকীয় বোর্ডের সদস্যরাও বুঝতে পারেননি কোন গবেষণাপত্রের সারসংক্ষেপ মানুষ লিখেছে আর কোনটি চ্যাটজিপিটি তৈরি করেছে।
২০২৪ সালের আরেকটি গবেষণায় দেখা গিয়েছে, ব্রিটেনের এক ইউনিভার্সিটিতে চ্যাটজিপিটি দিয়ে লেখা স্নাতক স্তরের পরীক্ষার ৯৪ শতাংশ উত্তর পরীক্ষকেরা ধরতেই পারেননি।
স্পষ্টভাবেই দেখা যাচ্ছে, মানুষ এ ব্যাপারে খুব একটা ভাল নন।
প্রচলিত ধারণা হচ্ছে, বিরল বা অস্বাভাবিক বিভিন্ন শব্দ লেখকের লেখকসত্বা সম্পর্কে ‘বলে’ দিতে পারে, ঠিক যেমন পোকার খেলোয়াড় যখন তার জয়ের হাত ধরানোর মতো কোনো ইঙ্গিত দেয় তখন বাকিরা বুঝতে পারেন, সে জিতবে।
গত কয়েক বছরে বিজ্ঞান সম্পর্কিত জার্নালে প্রকাশিত লেখায় অপেক্ষাকৃত কম ব্যবহৃত বিভিন্ন শব্দের সংখ্যা অনেক বেড়ে গিয়েছে বলে লক্ষ্য করেছেন গবেষকরা। যেমন ‘ডেলভস’ বা ‘ক্রিসিয়াল’-এর মতো শব্দ, যা হয়ত এআই ব্যবহারের লক্ষণ। এর থেকে ইঙ্গিত মেলে, গবেষণা পত্রের অংশ লেখার বা সম্পাদনার জন্য এআই ব্যবহার করছেন কিছু গবেষক। এ ধরনের কাজ ঠিক না ভুল তা নিয়ে এখনও বিতর্ক রয়েছে।
আরেকটি গবেষণায় অংশ নেওয়া ব্যক্তিদের গবেষকরা প্রশ্ন করেছিলেন, তারা কোন বৈশিষ্ট্য দেখে বুঝতে পারে কোনও লেখা চ্যাটবট তৈরি করেছে কি না। অনেকেই বেশি পরিমাণে ‘— বা দীর্ঘ ড্যাশ’ ব্যবহারের কথা উল্লেখ করেছেন, যা কম্পিউটার-তৈরি লেখার একটি লক্ষণ হতে পারে। তবে এ গবেষণায়ও এআই দিয়ে লেখা ভালভাবে ধরতে পারেননি অংশগ্রহণকারীরা।
মানুষ যদি এ পার্থক্য বুঝতে না পারেন তাহলে হয়ত মানুষের লেখা আর কৃত্রিম বুদ্ধিমত্তার লেখা আলাদা করতে অন্য কোনো উপায় থাকতে পারে।
‘স্টাইলোমেট্রি’ উদ্ধার করতে পারবে?
কিছু সমাধান পাওয়া যেতে পারে ‘স্টাইলোমেট্রি’র মাধ্যমে, যেখানে গবেষকরা পরিসংখ্যান পদ্ধতি ব্যবহার করে লেখকের লেখার ধরনে থাকা বিভিন্ন পার্থক্য খুঁজে বের করেন। ‘স্টাইলোমেট্রি’ এমন এক ক্ষেত্র, যেখানে লেখার ধরন বিশ্লেষণ করে বোঝার চেষ্টা করা হয় কে লেখক, কারণ প্রত্যেক লেখকের লেখার ধরনে কিছু ভিন্নতা থাকে।
‘ইউনিভার্সিটি অফ মেমফিস’-এর মনোবিজ্ঞান বিভাগের সহযোগী ডিন ও অধ্যাপক রজার জে. ক্রুজ বলেছেন, “আমি একজন কগনিটিভ সায়েন্টিস্ট ও স্টাইলোমেট্রিক প্রযুক্তির ইতিহাস নিয়ে একটি বই লিখেছি। সেখানে আমি তুলে ধরেছি, গবেষকরা কীভাবে এমন পদ্ধতি তৈরি করেছেন, যা ব্যবহার করে বিতর্কিত লেখার লেখক নির্ধারণ করা যায় বা যেসব লেখা বেনামে লেখা হয়েছে সেগুলোর সম্ভাব্য লেখক কে হতে পারেন তা বোঝা যায়।
লেখক শনাক্তের এক গুরুত্বপূর্ণ পদ্ধতি প্রস্তাব করেছিলেন অস্ট্রেলিয়ান গবেষক জন বারোজ। ‘বারোজ ডেল্টা’ নামের এক পদ্ধতি তৈরি করেছিলেন তিনি, যেটি এক ধরনের কম্পিউটারাইজড কৌশল। পদ্ধতিটি লেখায় ব্যবহৃত সাধারণ বা ঘনঘন ব্যবহৃত বিভিন্ন শব্দের ধরণ বিশ্লেষণ করে। সেই ধরণ বিশ্লেষণ করেই বোঝা যায়, কোনো লেখা কার লেখা হতে পারে।
শুনতে কিছুটা অস্বাভাবিক বা অবিশ্বাস্য মনে হলেও ‘দ্য’, ‘অ্যান্ড’ বা ‘টু’-এর মতো সাধারণ শব্দ ব্যবহার করে কারা কোনো লেখা লিখেছে সেটি নির্ধারণ করা যাবে। এ পদ্ধতিটি বিস্ময়করভাবে কার্যকর প্রমাণিত হয়েছে।
বারোজের ডেল্টা পদ্ধতি ব্যবহার গবেষকরা এমন লেখার পেছনে থাকা আসল লেখককে শনাক্ত করতে পেরেছেন, যেখানে লেখক পরিচয় নিয়ে সন্দেহ ছিল। যেমন– ‘উইজার্ড অফ ওজ’ সিরিজের বইটি আসলে এল. ফ্রাঙ্ক বাউমের লেখা ছিল না, তার উত্তরসূরি রুথ প্লামলি থম্পসনের লেখা ছিল। অন্যদিকে, ‘কনফেডারেট জেনারেল জর্জ পিকেট’-এর নামে প্রচলিত ভালোবাসার চিঠিগুলো আসলে তিনি লেখেননি, সেগুলো রচনা করেছিলেন তার স্ত্রী লা সাল করবেল পিকেট।
বারোজের ডেল্টা ও এর মতো অন্যান্য স্টাইলোমেট্রিক পদ্ধতির বড় সীমাবদ্ধতা হচ্ছে, এসব পদ্ধতি কাজ করতে হলে লেখকের কাছ থেকে প্রচুর পরিমাণে লেখা বা টেক্সট দরকার হয়, যাতে পরিসংখ্যানভিত্তিক বিশ্লেষণ নির্ভরযোগ্যভাবে করা যায়।
২০১৬ সালের এক গবেষণায় উঠে এসেছে, এজন্য প্রতিটি লেখকের অন্তত এক হাজার শব্দ লাগতে পারে, যাতে সঠিকভাবে লেখক শনাক্ত করা যায়। সেখানে একজন শিক্ষার্থীর রচনা কেবল দুইশো থেকে তিনশ শব্দের হয়। ফলে এর থেকে বেশি তথ্য মেলে না। এমন বিভিন্ন লেখার ক্ষেত্রে লেখকের পরিচয় শনাক্ত কেবল ‘গাণিতিক জাদুতে’ সম্ভব হয় না।
সাম্প্রতিক গবেষণাগুলোতে ব্যবহার করা হয়েছে ‘বিইআরটি’ বা বার্ট ল্যাঙ্গুয়েজ মডেল, যেগুলো বিশাল পরিমাণ মানুষের লেখা ও চ্যাটবটের তৈরি লেখা দিয়ে প্রশিক্ষিত। এসব মডেল প্রতিটি ধরনের লেখার মধ্যে থাকা নিয়মিত প্যাটার্ন বা ধরন শিখে ফেলে, অর্থাৎ, কোন ধরনের লেখা মানুষ লেখে আর কোনটা এআই লেখে, সেটার মধ্যে সূক্ষ্ম পার্থক্যও ধরতে পারে। এ পার্থক্য চেনার ক্ষেত্রে ৮০ শতাংশ থেকে ৯৮ শতাংশ পর্যন্ত সঠিক হতে পারে বার্ট।
তবে এসব মেশিন লার্নিং মডেলকে বলা হয় ‘ব্লাক বক্স’। কারণ, গবেষকরা জানেন না, এসব মডেল ঠিক কীভাবে বা লেখার কোন বৈশিষ্ট্য দেখে পার্থক্য করতে পারছে।
গবেষকরা এখনও চেষ্টা করছেন এসব মডেলের কাজের পেছনের যুক্তি বা কারণ বোঝার উপায় খুঁজে বের করতে। তবে, এখন পর্যন্ত স্পষ্ট নয় যে, এসব মডেল এমন নির্দিষ্ট কোনো বিশ্বাসযোগ্য সংকেত খুঁজে পাচ্ছে কি না, যা মানুষ নিজেই সহজে চিনতে পারে।
এআইয়ের লেখার ধরন প্রতিনিয়ত বদলাচ্ছে
এআইয়ের লেখা শনাক্তের আরেকটি চ্যালেঞ্জ হচ্ছে, এসব মডেল নিজেই সময়ের সঙ্গে ক্রমাগত পরিবর্তিত হয় এবং কখনও কখনও এ পরিবর্তন বড় মাত্রায়ও হয়। যেমন– আজকের চ্যাটজিপিটির লেখার ধরন কাল ভিন্ন হতে পারে। কারণ এসব মডেল নিয়মিত আপডেট ও উন্নত হয়। তাই কোন নির্দিষ্ট নিয়ম বা পদ্ধতি দিয়ে বটের লেখা চেনা অনেক কঠিন হয়ে যায়, কারণ লেখার ধরন বারবার বদলাচ্ছে।
২০২৫ সালের শুরুতে ব্যবহারকারীরা অভিযোগ করতে শুরু করেছিলেন যে, চ্যাটজিপিটি অনেক বেশি অতিথিপরায়ণ বা অতিরিক্ত প্রশংসার কথা বলছে, বিশেষ করে ছোটখাট সমস্যা বা সাধারণ বিভিন্ন প্রশ্নকেও ‘অসাধারণ’ বা ‘ফ্যানটাস্টিক’ বলে উল্লেখ করেছিল। ওই সময় এসব সমস্যার সমাধান করেছিল চ্যাটজিপিটির নির্মাতা ওপেনএআই।
মানুষের লেখার ধরনও সময়ের সঙ্গে সঙ্গে পরিবর্তিত হতে পারে। তবে সাধারণত তা হয় ধীরে ধীরে ও ধাপে ধাপে।
এক পর্যায়ে ক্রুজ বলেছেন, “একসময় আমি ভাবলাম এসব এআই বট নিজেই কী বলছে এই ব্যাপারে! তাই আমি চ্যাটজিপিটি-৪০-কে প্রশ্ন করলাম, কীভাবে বুঝব কোনো লেখা চ্যাটজিপিটির মাধ্যমে তৈরি? এর কোনো বিশেষ লক্ষণ আছে কি, যেমন শব্দ বাছাই বা বিরামচিহ্ন ব্যবহারের মতোই?
“চ্যাটজিপিটি স্বীকার করেছিল, মানুষের লেখা আর বটের লেখা আলাদা করা ‘কিছুটা জটিল’ হতে পারে। তবুও চ্যাটজিপিটি আমাকে এ নেয় ১০-পদক্ষেপের তালিকা দিয়েছিল এবং এর সঙ্গে উদাহরণও ছিল।
বিভিন্ন চ্যাটবট ‘হ্যালুসিনেট’ করতে পারে, অর্থাৎ মাঝেমধ্যে এরা এমন তথ্য দেয় বা এমন কিছু বলে, যা ভুল। তবে চ্যাটবটরা যখন নিজেরা নিজেদের নিয়ে কথা বলে তখন বিস্ময়করভাবে সচেতন মনে হয় এদেরকে।