এনক্রিপশন বা তথ্য সুরক্ষার স্তর ভেদ করে ব্যবহারকারী ও কৃত্রিম বুদ্ধিমত্তা (এআই) চ্যাটবটের কথোপকথনের বিষয় অনুমান করা সম্ভব। এমন এক নতুন সাইবার হুমকির তথ্য প্রকাশ করেছে মাইক্রোসফট। প্রতিষ্ঠানটি জানিয়েছে, এই নতুন সাইড চ্যানেল আক্রমণের নাম ‘হুইস্পার লিক’। এটি স্ট্রিমিংভিত্তিক ল্যাংগুয়েজ মডেলের এনক্রিপ্টেড ট্রাফিক বিশ্লেষণ করে কথোপকথনের বিষয় শনাক্ত করতে পারে।

মাইক্রোসফটের নিরাপত্তা গবেষকদের মতে, কোনো সাইবার হামলাকারী যদি ব্যবহারকারী ও ল্যাংগুয়েজ মডেলের মধ্যে এনক্রিপ্টেড যোগাযোগ পর্যবেক্ষণ করতে সক্ষম হয় তাহলে সে বুঝে ফেলতে পারে, ব্যবহারকারীর প্রশ্ন বা বার্তা কোনো নির্দিষ্ট সংবেদনশীল বিষয়ের সঙ্গে সম্পর্কিত কি না।

গবেষক জোনাথন বার ওর, জিওফ ম্যাকডোনাল্ড এবং মাইক্রোসফট ডিফেন্ডার নিরাপত্তা গবেষণা দল জানিয়েছে, এই আক্রমণে হামলাকারীরা এনক্রিপ্টেড টিএলএস ট্রাফিক থেকে ডেটা প্যাকেটের আকার ও প্রেরণ সময়ের ব্যবধান বিশ্লেষণ করে মেশিন লার্নিং ক্লাসিফায়ার ব্যবহার করে। এর মাধ্যমে কথোপকথনের বিষয়বস্তু সরাসরি না জেনেও অনুমান করা যায়, সেটি কোনো নির্দিষ্ট সংবেদনশীল বিষয়ের সঙ্গে সম্পর্কিত কি না। লার্জ ল্যাংগুয়েজ মডেলগুলো সাধারণত স্ট্রিমিং মোডে কাজ করে। অর্থাৎ পুরো উত্তর তৈরি না হওয়া পর্যন্ত অপেক্ষা না করে ধাপে ধাপে পাঠায়। এতে ব্যবহারকারীরা দ্রুত প্রতিক্রিয়া পান। তবে এ পদ্ধতিই এখন সাইড চ্যানেল আক্রমণের জন্য নতুন ঝুঁকির পথ তৈরি করছে।

মাইক্রোসফট জানায়, এইচটিটিপিএস এনক্রিপশন থাকা সত্ত্বেও এই আক্রমণ কার্যকর হতে পারে। সাধারণত এনক্রিপ্টেড কথোপকথনের তথ্য সুরক্ষিত রাখে এবং পরিবর্তন রোধ করে। কিন্তু হুইস্পার লিক আক্রমণে ট্রাফিকের আকার ও সময় বিশ্লেষণ করে কথোপকথনের বিষয় আন্দাজ করা যায়। যা ব্যবহারকারীর গোপনীয়তার জন্য বড় হুমকি। এর আগে গবেষকেরা ল্যাংগুয়েজ মডেলের ওপর আরও কয়েকটি সাইড-চ্যানেল আক্রমণ চালিয়েছিলেন। যেমন এনক্রিপ্টেড প্যাকেটের আকার দেখে টোকেনের দৈর্ঘ্য অনুমান করা বা ইনপুট চুরি করার চেষ্টা। হুইস্পার লিক সেই গবেষণারই সম্প্রসারিত রূপ। মাইক্রোসফটের প্রতিবেদনে বলা হয়েছে, স্ট্রিমিং মোডে মডেলের প্রতিক্রিয়া তৈরি হওয়ার সময় এনক্রিপ্টেড প্যাকেটের আকার ও আগমনের ব্যবধানের ক্রম বিশ্লেষণ করেই কথোপকথনের মূল বিষয় শনাক্ত করা সম্ভব।

এই ধারণা পরীক্ষা করতে মাইক্রোসফট একটি বাইনারি ক্লাসিফায়ার তৈরি করে। প্রম্পট কোনো নির্দিষ্ট বিষয়ের সঙ্গে সম্পর্কিত কি না, এই ক্লাসিফায়ার তা শনাক্ত করতে পারে। তারা তিনটি মেশিন লার্নিং মডেল লাইট জিবিএম, বাই-এলএটিএমও ব্যবহার করে পরীক্ষাটি চালায়।

ফলাফলে দেখা যায়, মিস্ট্রাল, ডিপসিক ও ওপেনএআইয়ের বেশ কয়েকটি মডেল ৯৮ শতাংশের বেশি নির্ভুলতা দেখিয়েছে। অর্থাৎ কোনো পর্যবেক্ষক যদি এলোমেলোভাবে চ্যাটবটের এনক্রিপ্টেড ট্রাফিক নজরদারি করে, তবু সে নির্দিষ্ট বিষয়ের কথোপকথন শনাক্ত করতে পারে। মাইক্রোসফট সতর্ক করে বলেছে, যদি কোনো সরকারি সংস্থা বা ইন্টারনেট সেবা প্রদানকারী জনপ্রিয় কোনো এআই চ্যাটবটের ট্রাফিক পর্যবেক্ষণ করে, তারা নির্ভরযোগ্যভাবে শনাক্ত করতে পারবে ব্যবহারকারী কোনো সংবেদনশীল বিষয়ে প্রশ্ন করছেন কি না। গবেষকেরা আরও জানান, সময়ের সঙ্গে আক্রমণকারীর হাতে যত বেশি প্রশিক্ষণ ডেটা জমবে, হুইস্পার লিক ততই কার্যকর হয়ে উঠবে।

বিষয়টি প্রকাশের পর ওপেনএআই, মিস্ট্রাল, মাইক্রোসফট ও এক্সএআই ইতিমধ্যে এই ঝুঁকি কমাতে প্রতিরোধমূলক ব্যবস্থা নিয়েছে। এর মধ্যে অন্যতম কার্যকর সমাধান হলো প্রতিটি উত্তরের সঙ্গে বিভিন্ন দৈর্ঘ্যের এলোমেলো টেক্সট যোগ করা, যাতে প্যাকেটের আকার বা টোকেনের দৈর্ঘ্য অনুমান করা না যায়। মাইক্রোসফট ব্যবহারকারীদের জন্যও কিছু পরামর্শ দিয়েছে। তাদের পরামর্শ, অনির্ভরযোগ্য নেটওয়ার্কে সংবেদনশীল বিষয় নিয়ে আলোচনা না করা, অতিরিক্ত সুরক্ষার জন্য ভিপিএন ব্যবহার করা, সম্ভব হলে নন-স্ট্রিমিং মডেল ব্যবহার করা এবং এমন এআই সেবা বেছে নেওয়া, যেখানে এসব সুরক্ষা ব্যবস্থা আগে থেকেই কার্যকর।

সূত্র: দ্য হ্যাকার নিউজ

.

উৎস: Prothomalo

কীওয়ার্ড: এনক র প ট ড ব যবহ র কর চ য টবট র ক র যকর র জন য স রক ষ

এছাড়াও পড়ুন:

এনক্রিপশন এড়িয়ে চ্যাটবটের সঙ্গে কথোপকথনের বিষয় শনাক্ত করতে পারে ‘হুইস্পার লিক’

এনক্রিপশন বা তথ্য সুরক্ষার স্তর ভেদ করে ব্যবহারকারী ও কৃত্রিম বুদ্ধিমত্তা (এআই) চ্যাটবটের কথোপকথনের বিষয় অনুমান করা সম্ভব। এমন এক নতুন সাইবার হুমকির তথ্য প্রকাশ করেছে মাইক্রোসফট। প্রতিষ্ঠানটি জানিয়েছে, এই নতুন সাইড চ্যানেল আক্রমণের নাম ‘হুইস্পার লিক’। এটি স্ট্রিমিংভিত্তিক ল্যাংগুয়েজ মডেলের এনক্রিপ্টেড ট্রাফিক বিশ্লেষণ করে কথোপকথনের বিষয় শনাক্ত করতে পারে।

মাইক্রোসফটের নিরাপত্তা গবেষকদের মতে, কোনো সাইবার হামলাকারী যদি ব্যবহারকারী ও ল্যাংগুয়েজ মডেলের মধ্যে এনক্রিপ্টেড যোগাযোগ পর্যবেক্ষণ করতে সক্ষম হয় তাহলে সে বুঝে ফেলতে পারে, ব্যবহারকারীর প্রশ্ন বা বার্তা কোনো নির্দিষ্ট সংবেদনশীল বিষয়ের সঙ্গে সম্পর্কিত কি না।

গবেষক জোনাথন বার ওর, জিওফ ম্যাকডোনাল্ড এবং মাইক্রোসফট ডিফেন্ডার নিরাপত্তা গবেষণা দল জানিয়েছে, এই আক্রমণে হামলাকারীরা এনক্রিপ্টেড টিএলএস ট্রাফিক থেকে ডেটা প্যাকেটের আকার ও প্রেরণ সময়ের ব্যবধান বিশ্লেষণ করে মেশিন লার্নিং ক্লাসিফায়ার ব্যবহার করে। এর মাধ্যমে কথোপকথনের বিষয়বস্তু সরাসরি না জেনেও অনুমান করা যায়, সেটি কোনো নির্দিষ্ট সংবেদনশীল বিষয়ের সঙ্গে সম্পর্কিত কি না। লার্জ ল্যাংগুয়েজ মডেলগুলো সাধারণত স্ট্রিমিং মোডে কাজ করে। অর্থাৎ পুরো উত্তর তৈরি না হওয়া পর্যন্ত অপেক্ষা না করে ধাপে ধাপে পাঠায়। এতে ব্যবহারকারীরা দ্রুত প্রতিক্রিয়া পান। তবে এ পদ্ধতিই এখন সাইড চ্যানেল আক্রমণের জন্য নতুন ঝুঁকির পথ তৈরি করছে।

মাইক্রোসফট জানায়, এইচটিটিপিএস এনক্রিপশন থাকা সত্ত্বেও এই আক্রমণ কার্যকর হতে পারে। সাধারণত এনক্রিপ্টেড কথোপকথনের তথ্য সুরক্ষিত রাখে এবং পরিবর্তন রোধ করে। কিন্তু হুইস্পার লিক আক্রমণে ট্রাফিকের আকার ও সময় বিশ্লেষণ করে কথোপকথনের বিষয় আন্দাজ করা যায়। যা ব্যবহারকারীর গোপনীয়তার জন্য বড় হুমকি। এর আগে গবেষকেরা ল্যাংগুয়েজ মডেলের ওপর আরও কয়েকটি সাইড-চ্যানেল আক্রমণ চালিয়েছিলেন। যেমন এনক্রিপ্টেড প্যাকেটের আকার দেখে টোকেনের দৈর্ঘ্য অনুমান করা বা ইনপুট চুরি করার চেষ্টা। হুইস্পার লিক সেই গবেষণারই সম্প্রসারিত রূপ। মাইক্রোসফটের প্রতিবেদনে বলা হয়েছে, স্ট্রিমিং মোডে মডেলের প্রতিক্রিয়া তৈরি হওয়ার সময় এনক্রিপ্টেড প্যাকেটের আকার ও আগমনের ব্যবধানের ক্রম বিশ্লেষণ করেই কথোপকথনের মূল বিষয় শনাক্ত করা সম্ভব।

এই ধারণা পরীক্ষা করতে মাইক্রোসফট একটি বাইনারি ক্লাসিফায়ার তৈরি করে। প্রম্পট কোনো নির্দিষ্ট বিষয়ের সঙ্গে সম্পর্কিত কি না, এই ক্লাসিফায়ার তা শনাক্ত করতে পারে। তারা তিনটি মেশিন লার্নিং মডেল লাইট জিবিএম, বাই-এলএটিএমও ব্যবহার করে পরীক্ষাটি চালায়।

ফলাফলে দেখা যায়, মিস্ট্রাল, ডিপসিক ও ওপেনএআইয়ের বেশ কয়েকটি মডেল ৯৮ শতাংশের বেশি নির্ভুলতা দেখিয়েছে। অর্থাৎ কোনো পর্যবেক্ষক যদি এলোমেলোভাবে চ্যাটবটের এনক্রিপ্টেড ট্রাফিক নজরদারি করে, তবু সে নির্দিষ্ট বিষয়ের কথোপকথন শনাক্ত করতে পারে। মাইক্রোসফট সতর্ক করে বলেছে, যদি কোনো সরকারি সংস্থা বা ইন্টারনেট সেবা প্রদানকারী জনপ্রিয় কোনো এআই চ্যাটবটের ট্রাফিক পর্যবেক্ষণ করে, তারা নির্ভরযোগ্যভাবে শনাক্ত করতে পারবে ব্যবহারকারী কোনো সংবেদনশীল বিষয়ে প্রশ্ন করছেন কি না। গবেষকেরা আরও জানান, সময়ের সঙ্গে আক্রমণকারীর হাতে যত বেশি প্রশিক্ষণ ডেটা জমবে, হুইস্পার লিক ততই কার্যকর হয়ে উঠবে।

বিষয়টি প্রকাশের পর ওপেনএআই, মিস্ট্রাল, মাইক্রোসফট ও এক্সএআই ইতিমধ্যে এই ঝুঁকি কমাতে প্রতিরোধমূলক ব্যবস্থা নিয়েছে। এর মধ্যে অন্যতম কার্যকর সমাধান হলো প্রতিটি উত্তরের সঙ্গে বিভিন্ন দৈর্ঘ্যের এলোমেলো টেক্সট যোগ করা, যাতে প্যাকেটের আকার বা টোকেনের দৈর্ঘ্য অনুমান করা না যায়। মাইক্রোসফট ব্যবহারকারীদের জন্যও কিছু পরামর্শ দিয়েছে। তাদের পরামর্শ, অনির্ভরযোগ্য নেটওয়ার্কে সংবেদনশীল বিষয় নিয়ে আলোচনা না করা, অতিরিক্ত সুরক্ষার জন্য ভিপিএন ব্যবহার করা, সম্ভব হলে নন-স্ট্রিমিং মডেল ব্যবহার করা এবং এমন এআই সেবা বেছে নেওয়া, যেখানে এসব সুরক্ষা ব্যবস্থা আগে থেকেই কার্যকর।

সূত্র: দ্য হ্যাকার নিউজ

সম্পর্কিত নিবন্ধ