নতুন এআই অডিও মডেল তৈরি করেছে ওপেনএআই, যে সুবিধা পাওয়া যাবে
Published: 22nd, March 2025 GMT
কৃত্রিম বুদ্ধিমত্তা (এআই) প্রযুক্তিনির্ভর ভয়েস এজেন্টের কার্যকারিতা উন্নত করতে নতুন অডিও মডেল তৈরি করেছে চ্যাটজিপিটির নির্মাতা প্রতিষ্ঠান ওপেনএআই। প্রাথমিকভাবে ডেভেলপারদের জন্য উন্মুক্ত করা মডেলটি কাজে লাগিয়ে এআই ভয়েস এজেন্টগুলোয় বাস্তবসম্মত ও স্বতঃস্ফূর্ত কথোপকথনের সুযোগ পাওয়া যাবে।
প্রযুক্তি–বিশ্লেষকদের মতে, মুখের কথা যোগাযোগের সবচেয়ে স্বাভাবিক মাধ্যম হলেও কৃত্রিম বুদ্ধিমত্তা প্রযুক্তিতে এটি এখনো যথাযথভাবে ব্যবহার করা হচ্ছে না। তবে ওপেনএআইয়ের নতুন উদ্ভাবন এই চিত্র বদলে দিতে পারে। মডেলটিতে থাকা উন্নত স্পিচ-টু-টেক্সট ও টেক্সট-টু-স্পিচ প্রযুক্তির মাধ্যমে কৃত্রিম বুদ্ধিমত্তাভিত্তিক ভয়েস অ্যাসিস্ট্যান্ট আরও স্বতঃস্ফূর্ত ও কার্যকর হবে। গ্রাহকসেবা, ভাষাশিক্ষা এবং বিশেষ চাহিদাসম্পন্ন ব্যক্তিদের সহায়ক প্রযুক্তি হিসেবে মডেলটি নতুন সম্ভাবনার দ্বার উন্মোচন করবে।
আরও পড়ুনলেখা থেকে ভিডিও তৈরির এআই টুল নিয়ে বিপাকে ওপেনএআই, কারণ কী২৯ নভেম্বর ২০২৪ওপেনএআইয়ের নতুন অডিও মডেলটিতে বেশ কয়েকটি গুরুত্বপূর্ণ সুবিধা যুক্ত করা হয়েছে, যার মধ্যে উন্নত স্পিচ-টু-টেক্সট, টেক্সট-টু-স্পিচ মডেলসহ হালানাগাদ এজেন্টস এসডিকে অন্যতম। নতুন স্পিচ-টু-টেক্সট সুবিধা আগের হুইস্পার সংস্করণের তুলনায় আরও নির্ভুল ও দ্রুত কাজ করতে পারে। ফলে বর্তমানের তুলনায় নির্ভুলভাবে মুখের কথাকে লেখায় রূপান্তর করা যাবে। এ ছাড়া এজেন্টস এসডিকের নতুন হালনাগাদের মাধ্যমে ডেভেলপাররা সহজেই লেখাভিত্তিক কৃত্রিম বুদ্ধিমত্তা সহকারীকে কণ্ঠস্বরভিত্তিক ইন্টারঅ্যাকশন সিস্টেমে রূপান্তর করতে পারবেন।
ওপেনএআই দাবি করেছে, নতুন মডেলটি আগের হুইস্পার সংস্করণের তুলনায় আরও নির্ভুল এবং সবচেয়ে কম বিভ্রান্তিকর তথ্য প্রদান করে। এর ফলে গ্রাহকসেবা, ভাষাশিক্ষা এবং বিশেষ চাহিদাসম্পন্ন ব্যবহারকারীদের জন্য সহায়ক প্রযুক্তি হিসেবে মডেলটি নতুন সম্ভাবনার দ্বার উন্মোচন করবে।
সূত্র: ইন্ডিয়ান এক্সপ্রেস
.উৎস: Prothomalo
কীওয়ার্ড: ক ত র ম ব দ ধ মত ত
এছাড়াও পড়ুন:
এআই দিয়ে তৈরি লেখা চিনবেন যেভাবে
কৃত্রিম বুদ্ধিমত্তা (এআই) প্রযুক্তির মাধ্যমে বার্তা পাঠানোর পাশাপাশি বিভিন্ন বিষয়ে বিস্তারিত লেখা যায়। আর তাই বিভিন্ন ব্লগ পোস্ট, প্রবন্ধ, ই–মেইল থেকে শুরু করে গবেষণাপত্র, পত্রিকার কলাম লেখায় এআইয়ের ব্যবহার বাড়ছে। বর্তমানে অনেক এআই মডেল মানুষের লেখার মতোই সাবলীলভাবে লিখতে পারায় সেগুলো মানুষ না এআই লিখেছে, তা সহজে বোঝা যায় না। তবে বেশ কিছু বিষয় পর্যালোচনা করে এআই দিয়ে লেখা বার্তা বা লেখা শনাক্ত করা সম্ভব। এআই দিয়ে তৈরি লেখা চেনার পদ্ধতিগুলো দেখে নেওয়া যাক।
এম ড্যাশ ব্যবহারবিভিন্ন এআই টুলে যে লার্জ ল্যাঙ্গুয়েজ মডেল ব্যবহার করা হয়, সেখানে প্রায়ই এম ড্যাশের অতিরিক্ত ব্যবহার দেখা যায়। সাধারণ লেখার ক্ষেত্রে আমরা এম ড্যাশ ব্যবহার করি না। সে ক্ষেত্রে কোনো লেখায় এম ড্যাশের উপস্থিতি থাকলে তা এআই দিয়ে তৈরি হতে পারে। এআই মডেলগুলো মূলত নিজস্ব তথ্যভান্ডারে থাকা তথ্য বিশ্লেষণ করে বিভিন্ন কাজ করে থাকে। এম ড্যাশ সাধারণত বই বা লেখা ছাপানোর সময় বিরতি বা অতিরিক্ত গুরুত্বপূর্ণ কোনো তথ্য প্রকাশে ব্যবহার করা হয়। এআই বিভিন্ন প্রকাশিত বইপত্রের লেখার শৈলী অনুকরণ করে বলে এম ড্যাশ বেশি ব্যবহার করে থাকে। আর তাই লেখায় অতিরিক্ত এম ড্যাশ ব্যবহার হলে তা এআই দিয়ে তৈরি বলে ধারণা করা যেতে পারে।
আরও পড়ুনএআই দিয়ে বানানো ছবি চিনবেন কীভাবে২২ আগস্ট ২০২৪যান্ত্রিক শব্দচয়নএআই মডেলগুলো প্রায়ই কিছু প্যাটার্ন ও শব্দকে পুনরাবৃত্ত করে, আর তাই এআই দিয়ে লেখায় পুনরাবৃত্তিমূলক বাক্য গঠন ও শব্দচয়ন বেশি দেখা যায়। শুধু তা–ই নয়, এআইয়ের মাধ্যমে লেখায় একই ধরনের বাক্য গঠন বেশি চোখে পড়ে। বিভিন্ন ধরনের সংযুক্তমূলক শব্দ যেমন এ ছাড়া, অতএব, ফলস্বরূপ বেশি ব্যবহার করে এআই মডেলে। আবার বিশেষ কিছু বিশেষণ বারবার ব্যবহৃত হতে দেখা যায়। আর তাই লেখায় যান্ত্রিক শব্দচয়ন বেশি থাকলে বুঝতে হবে সেটি এআই দিয়ে লেখা।
গভীরতার অভাবএআই তথ্য সংগ্রহে পারদর্শী হলেও মানুষের মতো জটিল বা মৌলিক বিশ্লেষণ করতে পারে না। আর তাই এআইয়ের তৈরি লেখায় গভীরতা ও বিশ্লেষণের অভাব দেখা যায়। এআইয়ের মাধ্যমে লেখায় তথ্য উপস্থাপন বেশি থাকলেও লেখকের ব্যক্তিগত মতামত বা মানবীয় ভাব অনুপস্থিত থাকে। এআই দিয়ে তৈরি লেখাতে সূক্ষ্ম বিশ্লেষণ, আবেগ বা গভীর চিন্তার অভাব থাকে। ফলে লেখাগুলোতে তথ্যের সারসংক্ষেপ বা অতিরঞ্জিত তথ্য দেখা যায়। এআই প্রায়ই এমন শব্দ বা শব্দগুচ্ছ ব্যবহার করে, যা ব্যাকরণগতভাবে সঠিক হলেও মানুষের স্বাভাবিক ও দৈনন্দিন আলাপে অনুপস্থিত থাকে।
আরও পড়ুনএআই দিয়ে কণ্ঠ নকল করে প্রতারণা শনাক্ত করবেন যেভাবে২৫ মে ২০২৫মানবিক দিক অনুপস্থিতখুব স্বাভাবিকভাবে এআই দিয়ে লেখায় ব্যক্তিগত অভিজ্ঞতা বা আবেগের অনুপস্থিতি থাকে। কিন্তু মানুষের লেখায় ব্যক্তিগত অভিজ্ঞতা, অনুভূতি, হাস্যরস বা নিজস্ব দৃষ্টিভঙ্গি জানা যায়। এআই মডেল গণিত অলিম্পিয়াডের প্রশ্ন সমাধান করতে পারলেও মানবিক স্পর্শ তৈরি করতে পারে না। যখন লেখা নিরপেক্ষ বা আবেগহীন মনে হয়, তখন তা এআই দিয়ে তৈরি হতে পারে। এআই দিয়ে তৈরি লেখায় বেশ অনাকাঙ্ক্ষিত অসংগতি বা তথ্যের ভুল দেখা যায়।
আরও পড়ুনএআই প্রযুক্তি দিয়ে প্রতারণা বাড়ছে জিমেইলে, নিরাপদ থাকবেন যেভাবে১৯ ফেব্রুয়ারি ২০২৫এআই দিয়ে লেখা চেনার একাধিক পদ্ধতি সম্পর্কে জানার পরও নিজের বিচার–বিশ্লেষণ ক্ষমতা বাড়াতে হবে। শুধু তা–ই নয়, বিষয়ে সঙ্গে লেখার প্রাসঙ্গিকতাও বিবেচনা করতে হবে। এ বিষয়ে ছোট একটি পরীক্ষা করা যাক। দুটি অনুচ্ছেদ পড়ে নিজেই সিদ্ধান্ত নিন কোন লেখাটি এআই দিয়ে লেখা হয়েছে।
ক. সুন্দরবনের শ্বাসমূল থেকে কক্সবাজারের বেলাভূমি—বাংলাদেশ এক বৈচিত্র্যময় দেশ। পদ্মা, মেঘনা, যমুনা বিধৌত এই ব-দ্বীপ সুজলা-সুফলা। ইতিহাস আর ঐতিহ্যের মিশেলে এটি যেন এক জীবন্ত জাদুঘর। প্রাকৃতিক সৌন্দর্যে ভরা এই ভূমি সত্যিই মন মুগ্ধ করে তোলে।
খ. প্রাকৃতিক সৌন্দর্যে ভরপুর বাংলাদেশ, যেখানে সবুজ গ্রাম আর নদীর ঢেউয়ে জীবন প্রবাহিত হয়। এখানকার মানুষের হৃদয়ে উষ্ণতা, আর সংস্কৃতিতে লুকিয়ে আছে হাজার বছরের ঐতিহ্য।
লেখাগুলো পড়ে অনেকেই বলবেন ‘ক’ অনুচ্ছেদের লেখাটি এআই দিয়ে তৈরি করা হয়েছে। কেউ বলবেন ‘খ’ অনুচ্ছেদের কথা। তবে মজার বিষয় হচ্ছে ‘ক’ ও ‘খ’ দুটি অনুচ্ছেদই গুগলের জেমিনি এআই দিয়ে লেখা হয়েছে। আর তাই এআই দিয়ে তৈরি লেখা চিনতে বেশ সতর্ক থাকতে হবে।
সূত্র: সেলজি ও ইস্ট সেন্ট্রাল কলেজ