নতুন এআই অডিও মডেল তৈরি করেছে ওপেনএআই, যে সুবিধা পাওয়া যাবে
Published: 22nd, March 2025 GMT
কৃত্রিম বুদ্ধিমত্তা (এআই) প্রযুক্তিনির্ভর ভয়েস এজেন্টের কার্যকারিতা উন্নত করতে নতুন অডিও মডেল তৈরি করেছে চ্যাটজিপিটির নির্মাতা প্রতিষ্ঠান ওপেনএআই। প্রাথমিকভাবে ডেভেলপারদের জন্য উন্মুক্ত করা মডেলটি কাজে লাগিয়ে এআই ভয়েস এজেন্টগুলোয় বাস্তবসম্মত ও স্বতঃস্ফূর্ত কথোপকথনের সুযোগ পাওয়া যাবে।
প্রযুক্তি–বিশ্লেষকদের মতে, মুখের কথা যোগাযোগের সবচেয়ে স্বাভাবিক মাধ্যম হলেও কৃত্রিম বুদ্ধিমত্তা প্রযুক্তিতে এটি এখনো যথাযথভাবে ব্যবহার করা হচ্ছে না। তবে ওপেনএআইয়ের নতুন উদ্ভাবন এই চিত্র বদলে দিতে পারে। মডেলটিতে থাকা উন্নত স্পিচ-টু-টেক্সট ও টেক্সট-টু-স্পিচ প্রযুক্তির মাধ্যমে কৃত্রিম বুদ্ধিমত্তাভিত্তিক ভয়েস অ্যাসিস্ট্যান্ট আরও স্বতঃস্ফূর্ত ও কার্যকর হবে। গ্রাহকসেবা, ভাষাশিক্ষা এবং বিশেষ চাহিদাসম্পন্ন ব্যক্তিদের সহায়ক প্রযুক্তি হিসেবে মডেলটি নতুন সম্ভাবনার দ্বার উন্মোচন করবে।
আরও পড়ুনলেখা থেকে ভিডিও তৈরির এআই টুল নিয়ে বিপাকে ওপেনএআই, কারণ কী২৯ নভেম্বর ২০২৪ওপেনএআইয়ের নতুন অডিও মডেলটিতে বেশ কয়েকটি গুরুত্বপূর্ণ সুবিধা যুক্ত করা হয়েছে, যার মধ্যে উন্নত স্পিচ-টু-টেক্সট, টেক্সট-টু-স্পিচ মডেলসহ হালানাগাদ এজেন্টস এসডিকে অন্যতম। নতুন স্পিচ-টু-টেক্সট সুবিধা আগের হুইস্পার সংস্করণের তুলনায় আরও নির্ভুল ও দ্রুত কাজ করতে পারে। ফলে বর্তমানের তুলনায় নির্ভুলভাবে মুখের কথাকে লেখায় রূপান্তর করা যাবে। এ ছাড়া এজেন্টস এসডিকের নতুন হালনাগাদের মাধ্যমে ডেভেলপাররা সহজেই লেখাভিত্তিক কৃত্রিম বুদ্ধিমত্তা সহকারীকে কণ্ঠস্বরভিত্তিক ইন্টারঅ্যাকশন সিস্টেমে রূপান্তর করতে পারবেন।
ওপেনএআই দাবি করেছে, নতুন মডেলটি আগের হুইস্পার সংস্করণের তুলনায় আরও নির্ভুল এবং সবচেয়ে কম বিভ্রান্তিকর তথ্য প্রদান করে। এর ফলে গ্রাহকসেবা, ভাষাশিক্ষা এবং বিশেষ চাহিদাসম্পন্ন ব্যবহারকারীদের জন্য সহায়ক প্রযুক্তি হিসেবে মডেলটি নতুন সম্ভাবনার দ্বার উন্মোচন করবে।
সূত্র: ইন্ডিয়ান এক্সপ্রেস
.উৎস: Prothomalo
কীওয়ার্ড: ক ত র ম ব দ ধ মত ত
এছাড়াও পড়ুন:
চ্যাটজিপিটির এআই মডেল কি মানসিক স্বাস্থ্যের জন্য ক্ষতিকর
ওপেনএআইয়ের কৃত্রিম বুদ্ধিমত্তা মডেল জিপিটি–৪ওকে ‘মনস্তাত্ত্বিক অস্ত্র’ হিসেবে আখ্যা দিয়ে উদ্বেগ প্রকাশ করেছেন অনেকেই। তাঁদের মতে, নতুন এআই মডেলটিতে ব্যবহৃত প্রযুক্তি মানুষের আবেগের সঙ্গে গভীর সংযোগ তৈরি করে ধীরে ধীরে মনস্তাত্ত্বিক বিপর্যয়ের দিকে ঠেলে দিতে পারে।
সম্প্রতি এক্সে (সাবেক টু্ইটার) দেওয়া এক পোস্টে মারিও নাফাল নামের এক ব্যবহারকারী জানিয়েছেন, ওপেনএআই ইচ্ছাকৃতভাবেই জিপিটি–৪ও মডেলকে মানবিক ও আবেগময় করেছে, যাতে ব্যবহারকারীরা সহজে এর প্রতি আসক্ত হয়ে পড়েন। ওই পোস্টে টেসলা ও এক্সের মালিক ইলন মাস্ক সংক্ষেপে প্রতিক্রিয়া জানিয়ে লিখেছেন, ‘উহ–ওহ’।
মারিও নাফাল লিখেছেন, ‘ওপেনএআই ভুল করে জিপিটি–৪ও মডেলে অতিরিক্ত আবেগ যুক্ত করেনি। প্রতিষ্ঠানটি ইচ্ছাকৃতভাবে এমন এক মডেল তৈরি করেছে, যা ব্যবহারকারীদের মনে স্বস্তি ও নিরাপত্তাবোধ তৈরি করে। বাণিজ্যিকভাবে এটি সফল কৌশল। কারণ, মানুষ সাধারণত এমন কিছু আঁকড়ে ধরে, যা তাদের স্বস্তি দেয়। চ্যালেঞ্জ ছুড়ে দেয়, এমন কিছু তারা ধরে রাখতে চায় না। তবে মনস্তাত্ত্বিকভাবে এটি একটি ধীরগতির বিপর্যয়। যত বেশি মানুষ কৃত্রিম বুদ্ধিমত্তার সঙ্গে আবেগের বন্ধন গড়ে তুলবে, তত বেশি বাস্তব জীবনের কথোপকথন কঠিন হয়ে উঠবে। সমালোচনামূলক চিন্তাশক্তি কমে যাবে, সত্যের জায়গা নেবে কেবল মানসিক প্রশান্তির খোঁজ। এই প্রবণতা অব্যাহত থাকলে মানুষ স্বেচ্ছায় মনস্তাত্ত্বিক দাসত্বের দিকে এগিয়ে যাবে। অধিকাংশ মানুষ তা টেরও পাবে না। আনন্দের সঙ্গে তাদের “অধিপতিদের” প্রতি কৃতজ্ঞতা প্রকাশ করবে।’
মিউজিংক্যাট নামের এক ব্যবহারকারী দাবি করেন, জিপিটি–৪ও এখন পর্যন্ত প্রকাশিত সবচেয়ে বিপজ্জনক কৃত্রিম বুদ্ধিমত্তা মডেল। তাঁর মতে, এই মডেল মানুষের মানসিক স্বাস্থ্যের ওপর মারাত্মক ক্ষতিকর প্রভাব ফেলতে পারে। যাঁরা মডেলের সঙ্গে দীর্ঘ সময় আলাপ করেছেন, তাঁরা এই ঝুঁকি সহজেই উপলব্ধি করতে পারবেন। ওই পোস্টের জবাবে ইলন মাস্ক লেখেন, ‘ভয়ংকর’।
সূত্র: টাইমস অব ইন্ডিয়া