আই/ও সম্মেলনে চলচ্চিত্র নির্মাণের এআই টুল, কোডিং এজেন্টসহ যেসব প্রযুক্তির ঘোষণা দিল গুগল
Published: 22nd, May 2025 GMT
গুগল আই/ও সম্মেলনে জেমিনির হালনাগাদ সংস্করণের পাশাপাশি চলচ্চিত্র নির্মাণের জন্য এআই টুল, অ্যাসিনক্রোনাস এআই কোডিং এজেন্টসহ এআইভিত্তিক বিভিন্ন পণ্য ও প্রযুক্তি দেখিয়েছে গুগল। গত মঙ্গলবার শুরু হওয়া দুই দিনের এ সম্মেলনে গুগল সার্চের এআই মোড, ডিপ রিসার্চ, ক্যানভাস, জিমেইল, গুগল মিটসহ ইমাজেন ৪, ভিও ৩ এবং লিরিয়া ২ এআই মডেল ও টুলের নতুন সংস্করণও প্রদর্শন করেছে প্রতিষ্ঠানটি। আই/ও সম্মেলনে প্রদর্শন করা নতুন প্রযুক্তি ও সুবিধাগুলো জেনে নেওয়া যাক।
জেমিনি ২.৫ ফ্ল্যাশ ও প্রো
সম্মেলনে এআই মডেল জেমিনি ২.৫ ফ্ল্যাশ ও প্রোতে নতুন সুবিধা যুক্তের ঘোষণা দিয়েছে গুগল, যার মধ্যে অন্যতম হলো ‘ডিপ থিঙ্ক’। বিশ্লেষণধর্মী সুবিধাটি এআই ব্যবহারকারীদের প্রশ্নের উত্তর দেওয়ার আগে একাধিক সম্ভাব্য উত্তর তৈরি করে রাখতে পারে। এর ফলে ব্যবহারকারীরা চাইলে বিভিন্ন কাজের উপযোগী প্রয়োজনীয় উত্তর জানতে পারবেন। প্রাথমিকভাবে নির্দিষ্ট কিছু ব্যবহারকারী জেমিনি এপিআইয়ের মাধ্যমে সুবিধাটি ব্যবহারের সুযোগ পাবেন। এ সুবিধার পাশাপাশি নেটিভ অডিও আউটপুট ও উন্নত নিরাপত্তাব্যবস্থাও যুক্ত করা হয়েছে জেমিনির নতুন মডেলগুলোয়।
চলচ্চিত্র নির্মাণের এআই টুল ‘ফ্লো’‘ফ্লো’ নামের নতুন এআই টুলটি সিনেমার কৃত্রিম দৃশ্য ও ক্লিপ তৈরি করতে পারে। এটি গুগলের উন্নত এআই মডেল ভিও, ইমাজেন ও জেমিনির মাধ্যমে ব্যবহারকারীদের নির্দেশমতো সিনেমার দৃশ্য তৈরি করে দেবে। শুধু তা–ই নয়, ব্যবহারকারীরা চাইলে কৃত্রিমভাবে তৈরি সিনেমার দৃশ্যগুলো সম্পাদনা, ক্যামেরা অ্যাঙ্গেল নিয়ন্ত্রণ ও ভিজ্যুয়াল ব্যবস্থাপনা করতে পারবেন।
ভিও ৩, ইমাজেন ৪ এবং লিরিয়া ২ভিও ৩ হলো গুগলের নতুন টেক্সট-টু-ভিডিও জেনারেটর। লেখা থেকে ভিডিও তৈরি করতে সক্ষম ভিডিও জেনারেটরটির মাধ্যমে এবার রাস্তায় চলা গাড়ির শব্দ, পাখির ডাক যুক্তের পাশাপাশি বিভিন্ন চরিত্রের মুখে সংলাপ শোনা যাবে। অন্যদিকে ইমাজেন ৪ এখন ২কে রেজল্যুশনের ছবি তৈরি করতে পারবে এবং তাতে সূক্ষ্ম বিষয়বস্তু যেমন পানির ফোঁটা বা পশুর লোমও স্পষ্ট দেখা যাবে। এ ছাড়া মিউজিক জেনারেটর লিরিয়া ২–এর মাধ্যমে ইউটিউব শর্টস তৈরি করতে পারবেন নির্মাতারা।
নতুন কোডিং এজেন্ট ‘জুলস’জেমিনি ২.৫ প্রো–নির্ভর ‘জুলস’ মূলত একটি এআই কোডিং এজেন্ট, যা নিজে থেকে কোড পড়ে বুঝতে পারার পাশাপাশি নতুন কোডও লিখতে পারে। এর ফলে ব্যবহারকারীরা কোডিং এজেন্টটির মাধ্যমে কোডিংয়ের বিভিন্ন তথ্য জানার পাশাপাশি নিজে থেকেই ত্রুটি শনাক্ত করতে পারবে। ব্যাকগ্রাউন্ডে স্বয়ংক্রিয়ভাবে কাজ করায় কোডিংয়ের ব্যাখ্যা, পরিকল্পনা ও পরিবর্তিত কোডের বিবরণও জানাতে পারে জুলস।
জেমিনিতে নতুন সুবিধাজেমিনি লাইভ অপশনে নতুন করে ক্যামেরা ও স্ক্রিন শেয়ার সুবিধা যুক্ত করা হয়েছে। এর ফলে ফোনের পর্দায় বা ক্যামেরায় দেখা ছবির বিষয়ে জেমিনির সঙ্গে সরাসরি কথা বলা যাবে। এ ছাড়া জেমিনির ডেস্কটপ সংস্করণ আনারও ঘোষণা দিয়েছে গুগল। প্রাথমিকভাবে এসব সুবিধা শুধু যুক্তরাষ্ট্রে বসবাসকারী এআই প্রো ও আলট্রা গ্রাহকদের জন্য উন্মুক্ত করা হবে।
গুগল সার্চে এআই মোডগুগল তাদের সার্চ ইঞ্জিনকে সম্পূর্ণভাবে এআইভিত্তিক করার ঘোষণা দিয়েছে। এর ফলে ব্যবহারকারীদের সার্চ অভিজ্ঞতা বর্তমানের তুলনায় আরও উন্নত হবে। এআই মোড মূলত একধরনের পরিপূর্ণ এআই সার্চ সুবিধা, যার মাধ্যমে যেকোনো বিষয়ের ফলোআপ প্রশ্ন করার পাশাপাশি ওয়েব লিংক বিশ্লেষণ এবং ব্যবহারকারীর ধরন অনুযায়ী অনুসন্ধান করা যাবে।
এআই মোডে ভার্চ্যুয়াল কেনাকাটাএআই মোডে পণ্য খোঁজার সময় ব্যবহারকারীদের সামনে ‘শপিং গ্রাফ’ নামে নতুন একটি প্যানেল প্রদর্শন করবে গুগল। এর ফলে গুগলে বর্তমানের তুলনায় আরও বেশি পছন্দ অনুযায়ী ছবি ও তথ্য দেখা যাবে। পছন্দের পোশাক কেনার আগে ভার্চ্যুয়াল ট্রাই-অন সুবিধাও পাওয়া যাবে, যা কাজে লাগিয়ে পোশাকটি মানাবে কি না, তা ভার্চ্যুয়ালি পরখ করা যাবে।
সূত্র: ইন্ডিয়ান এক্সপ্রেস
উৎস: Prothomalo
কীওয়ার্ড: ব যবহ র এআই ট ল এআই ম ড ক ত কর র নত ন
এছাড়াও পড়ুন:
আই/ও সম্মেলনে চলচ্চিত্র নির্মাণের এআই টুল, কোডিং এজেন্টসহ যেসব প্রযুক্তির ঘোষণা দিল গুগল
গুগল আই/ও সম্মেলনে জেমিনির হালনাগাদ সংস্করণের পাশাপাশি চলচ্চিত্র নির্মাণের জন্য এআই টুল, অ্যাসিনক্রোনাস এআই কোডিং এজেন্টসহ এআইভিত্তিক বিভিন্ন পণ্য ও প্রযুক্তি দেখিয়েছে গুগল। গত মঙ্গলবার শুরু হওয়া দুই দিনের এ সম্মেলনে গুগল সার্চের এআই মোড, ডিপ রিসার্চ, ক্যানভাস, জিমেইল, গুগল মিটসহ ইমাজেন ৪, ভিও ৩ এবং লিরিয়া ২ এআই মডেল ও টুলের নতুন সংস্করণও প্রদর্শন করেছে প্রতিষ্ঠানটি। আই/ও সম্মেলনে প্রদর্শন করা নতুন প্রযুক্তি ও সুবিধাগুলো জেনে নেওয়া যাক।
জেমিনি ২.৫ ফ্ল্যাশ ও প্রোসম্মেলনে এআই মডেল জেমিনি ২.৫ ফ্ল্যাশ ও প্রোতে নতুন সুবিধা যুক্তের ঘোষণা দিয়েছে গুগল, যার মধ্যে অন্যতম হলো ‘ডিপ থিঙ্ক’। বিশ্লেষণধর্মী সুবিধাটি এআই ব্যবহারকারীদের প্রশ্নের উত্তর দেওয়ার আগে একাধিক সম্ভাব্য উত্তর তৈরি করে রাখতে পারে। এর ফলে ব্যবহারকারীরা চাইলে বিভিন্ন কাজের উপযোগী প্রয়োজনীয় উত্তর জানতে পারবেন। প্রাথমিকভাবে নির্দিষ্ট কিছু ব্যবহারকারী জেমিনি এপিআইয়ের মাধ্যমে সুবিধাটি ব্যবহারের সুযোগ পাবেন। এ সুবিধার পাশাপাশি নেটিভ অডিও আউটপুট ও উন্নত নিরাপত্তাব্যবস্থাও যুক্ত করা হয়েছে জেমিনির নতুন মডেলগুলোয়।
চলচ্চিত্র নির্মাণের এআই টুল ‘ফ্লো’‘ফ্লো’ নামের নতুন এআই টুলটি সিনেমার কৃত্রিম দৃশ্য ও ক্লিপ তৈরি করতে পারে। এটি গুগলের উন্নত এআই মডেল ভিও, ইমাজেন ও জেমিনির মাধ্যমে ব্যবহারকারীদের নির্দেশমতো সিনেমার দৃশ্য তৈরি করে দেবে। শুধু তা–ই নয়, ব্যবহারকারীরা চাইলে কৃত্রিমভাবে তৈরি সিনেমার দৃশ্যগুলো সম্পাদনা, ক্যামেরা অ্যাঙ্গেল নিয়ন্ত্রণ ও ভিজ্যুয়াল ব্যবস্থাপনা করতে পারবেন।
ভিও ৩, ইমাজেন ৪ এবং লিরিয়া ২ভিও ৩ হলো গুগলের নতুন টেক্সট-টু-ভিডিও জেনারেটর। লেখা থেকে ভিডিও তৈরি করতে সক্ষম ভিডিও জেনারেটরটির মাধ্যমে এবার রাস্তায় চলা গাড়ির শব্দ, পাখির ডাক যুক্তের পাশাপাশি বিভিন্ন চরিত্রের মুখে সংলাপ শোনা যাবে। অন্যদিকে ইমাজেন ৪ এখন ২কে রেজল্যুশনের ছবি তৈরি করতে পারবে এবং তাতে সূক্ষ্ম বিষয়বস্তু যেমন পানির ফোঁটা বা পশুর লোমও স্পষ্ট দেখা যাবে। এ ছাড়া মিউজিক জেনারেটর লিরিয়া ২–এর মাধ্যমে ইউটিউব শর্টস তৈরি করতে পারবেন নির্মাতারা।
নতুন কোডিং এজেন্ট ‘জুলস’জেমিনি ২.৫ প্রো–নির্ভর ‘জুলস’ মূলত একটি এআই কোডিং এজেন্ট, যা নিজে থেকে কোড পড়ে বুঝতে পারার পাশাপাশি নতুন কোডও লিখতে পারে। এর ফলে ব্যবহারকারীরা কোডিং এজেন্টটির মাধ্যমে কোডিংয়ের বিভিন্ন তথ্য জানার পাশাপাশি নিজে থেকেই ত্রুটি শনাক্ত করতে পারবে। ব্যাকগ্রাউন্ডে স্বয়ংক্রিয়ভাবে কাজ করায় কোডিংয়ের ব্যাখ্যা, পরিকল্পনা ও পরিবর্তিত কোডের বিবরণও জানাতে পারে জুলস।
জেমিনিতে নতুন সুবিধাজেমিনি লাইভ অপশনে নতুন করে ক্যামেরা ও স্ক্রিন শেয়ার সুবিধা যুক্ত করা হয়েছে। এর ফলে ফোনের পর্দায় বা ক্যামেরায় দেখা ছবির বিষয়ে জেমিনির সঙ্গে সরাসরি কথা বলা যাবে। এ ছাড়া জেমিনির ডেস্কটপ সংস্করণ আনারও ঘোষণা দিয়েছে গুগল। প্রাথমিকভাবে এসব সুবিধা শুধু যুক্তরাষ্ট্রে বসবাসকারী এআই প্রো ও আলট্রা গ্রাহকদের জন্য উন্মুক্ত করা হবে।
গুগল সার্চে এআই মোডগুগল তাদের সার্চ ইঞ্জিনকে সম্পূর্ণভাবে এআইভিত্তিক করার ঘোষণা দিয়েছে। এর ফলে ব্যবহারকারীদের সার্চ অভিজ্ঞতা বর্তমানের তুলনায় আরও উন্নত হবে। এআই মোড মূলত একধরনের পরিপূর্ণ এআই সার্চ সুবিধা, যার মাধ্যমে যেকোনো বিষয়ের ফলোআপ প্রশ্ন করার পাশাপাশি ওয়েব লিংক বিশ্লেষণ এবং ব্যবহারকারীর ধরন অনুযায়ী অনুসন্ধান করা যাবে।
এআই মোডে ভার্চ্যুয়াল কেনাকাটাএআই মোডে পণ্য খোঁজার সময় ব্যবহারকারীদের সামনে ‘শপিং গ্রাফ’ নামে নতুন একটি প্যানেল প্রদর্শন করবে গুগল। এর ফলে গুগলে বর্তমানের তুলনায় আরও বেশি পছন্দ অনুযায়ী ছবি ও তথ্য দেখা যাবে। পছন্দের পোশাক কেনার আগে ভার্চ্যুয়াল ট্রাই-অন সুবিধাও পাওয়া যাবে, যা কাজে লাগিয়ে পোশাকটি মানাবে কি না, তা ভার্চ্যুয়ালি পরখ করা যাবে।
সূত্র: ইন্ডিয়ান এক্সপ্রেস