চিত্র, শব্দ ও সংলাপ একসঙ্গে তৈরি করছে বাইদুর এআই মডেল মিউজস্টিমার
Published: 6th, July 2025 GMT
লিখিত প্রম্পট থেকে বাস্তবধর্মী ভিডিও তৈরিতে গুগল ও ওপেনএআইয়ের সঙ্গে দৌড়ে শামিল হয়েছে চীনের প্রযুক্তিপ্রতিষ্ঠানগুলোও। এরই মধ্যে চীনা সার্চ ইঞ্জিন বাইদু চালু করেছে তাদের প্রথম এআই ভিডিও তৈরির মডেল ‘মিউজস্টিমার’।
চিত্র, সাউন্ড ইফেক্ট ও চীনা ভাষায় সংলাপ তিনটি উপাদান একসঙ্গে তৈরি করার ক্ষমতা রয়েছে মিউজস্টিমার মডেলের। সব উপাদান একে অপরের সঙ্গে সিঙ্ক করে তৈরি হওয়ায় ভিডিওর গুণগত মান হয় উচ্চমাত্রার। বিশেষজ্ঞরা বলছেন, বিজ্ঞাপন, বিপণন বা কনটেন্ট নির্মাণের মতো খাতে এ প্রযুক্তি সময় ও খরচ বাঁচিয়ে দিতে পারে। মূলত ব্যবসায়িক ব্যবহারকারীদের লক্ষ্য করে তৈরি এই এআই মডেল স্থিরচিত্র থেকে স্বল্পদৈর্ঘ্য ভিডিও তৈরি করতে সক্ষম। এ ছাড়া বাইদু তাদের সার্চ প্রযুক্তিতেও এনেছে পরিবর্তন। নতুন সংস্করণে সার্চ হয়েছে আরও স্মার্ট, মাল্টিমোডাল ও ব্যবহারকারীভেদে পারসোনালাইজড।
মিউজস্টিমার একটি ‘ভিশন ল্যাঙ্গুয়েজ মডেল’ বা ভিএলএম। এ ধরনের মডেল কম্পিউটার ভিশন ও প্রাকৃতিক ভাষা প্রক্রিয়াকরণের সক্ষমতা একসঙ্গে কাজে লাগায়। ফলে ছবি ও লেখার সমন্বিত বিশ্লেষণ করে এমন কাজগুলোতে এই মডেল ব্যবহার করা যায়, যেগুলোতে মাল্টিমোডাল বোঝাপড়ার প্রয়োজন পড়ে। ১০ সেকেন্ড দৈর্ঘ্যের ফুল এইচডি (১০৮০পি) ভিডিও তৈরি করতে পারে মিউজস্টিমার, যেখানে দৃশ্য, সংলাপ ও শব্দ একসঙ্গে এবং সঠিকভাবে সমন্বিত থাকে। প্রাথমিকভাবে যাঁরা এই মডেল ব্যবহার করেছেন, তাঁরা বলছেন, আউটপুট দেখে বিস্মিত না হয়ে উপায় নেই।
সম্প্রতি সামাজিক যোগাযোগমাধ্যম এক্সে (সাবেক টুইটার) মিউজস্টিমার দিয়ে তৈরি কয়েকটি ভিডিও শেয়ার করা হয়েছে। সেখানে মডেলটির চিত্রনির্মাণ ও সাউন্ড ডিজাইনের সক্ষমতা স্পষ্ট হয়ে উঠেছে। বাইদু তিনটি স্তরে মিউজস্টিমার চালু করেছে। এগুলো হলো টার্বো, প্রো ও লাইট। প্রতিটি স্তরই মূলত এন্টারপ্রাইজ বা করপোরেট ব্যবহারকারীদের জন্য তৈরি। গুগলের ভিও থ্রি কিংবা ওপেনএআইয়ের সোরা সাধারণ ব্যবহারকারীদের জন্য তৈরি হলেও বাইদুর মিউজস্টিমার সেখানে পরিপূর্ণভাবে ব্যবসায়িক চাহিদা পূরণের কথা মাথায় রেখে ডিজাইন করা হয়েছে।
বিশ্লেষকেরা বলছেন, মিউজস্টিমারের মাধ্যমে চীনের জেনারেটিভ এআই খাতে প্রতিযোগিতা আরও জোরালো হলো। এরই মধ্যে বাইটড্যান্স, টেনসেন্ট ও আলিবাবার মতো প্রতিষ্ঠান এই খাতে সক্রিয়ভাবে কাজ করছে। এদিকে গত মে মাসে গুগলের বার্ষিক ডেভেলপার সম্মেলন ‘গুগল আই/ও’তে ‘ভিও থ্রি’ মডেল উন্মোচন করা হয়, যা এর হাইপাররিয়ালিস্টিক ভিডিও তৈরির দক্ষতার জন্য প্রশংসিত হয়।
সূত্র: ইন্ডিয়ান এক্সপ্রেস
.উৎস: Prothomalo
এছাড়াও পড়ুন:
একসঙ্গে জন্ম দেওয়া মোকসেদার ছয় সন্তানের পাঁচজনই মারা গেল
একসঙ্গে জন্ম দেওয়া মোকসেদা আক্তারের ছয় সন্তানের মধ্যে পাঁচজনই মারা গেল। গতকাল রোববার সকালে ঢাকা মেডিকেল কলেজ (ঢামেক) হাসপাতালে জন্ম নেওয়ার পরপরই একটি শিশু মারা যায়। আজ সোমবার দুপুর পর্যন্ত চিকিৎসাধীন অবস্থায় একে একে আরও চার নবজাতকের মৃত্যু হয়।
ঢাকা মেডিকেল কলেজ হাসপাতাল পুলিশ ফাঁড়ির ইনচার্জ কর্মকর্তা মো. ফারুক প্রথম আলোকে এ তথ্য নিশ্চিত করেছেন।
নোয়াখালীর সেনবাগ উপজেলার খাজুরিয়া গ্রামের মোকসেদা আক্তার রোববার সকালে একসঙ্গে এই ছয় সন্তানের জন্ম দেন। তাঁর স্বামী মো. হানিফ কাতারপ্রবাসী। মোকসেদা আক্তারের ননদ লিপি বেগম আজ প্রথম আলোকে বলেন, বেঁচে থাকা একমাত্র নবজাতকের অবস্থাও বেশি ভালো নয়।
ঢামেক হাসপাতালের গাইনি বিভাগ সূত্রে জানা গেছে, চিকিৎসকেরা জানিয়েছেন, মোকসেদা তিন ছেলে ও তিন মেয়েসন্তান প্রসব করেন। সন্তানেরা ২৭ সপ্তাহ পূর্ণ হওয়ার আগেই জন্ম নেয়। জন্মের সময় প্রত্যেকের ওজন ছিল ৬০০ থেকে ৯০০ গ্রামে মধ্যে। এ কারণে তাদের সবার অবস্থাই ছিল সংকটজনক।
আরও পড়ুনঢাকা মেডিকেলে একসঙ্গে ছয় সন্তানের জন্ম, নবজাতকদের অবস্থা সংকটাপন্ন২২ ঘণ্টা আগেঢাকা মেডিকেল কলেজ হাসপাতালের নবজাতক বিভাগে আইসিইউতে পর্যাপ্ত শয্যা খালি না থাকায় তিনজনকে অন্য একটি বেসরকারি হাসপাতালে ভর্তি করা হয়। বর্তমানে বেঁচে থাকা একমাত্র নবজাতকটি বেসরকারি হাসপাতালে আছে।