সোরা (টেক্সট-টু-ভিডিও মডেল)
টোকিওর একটি রাস্তায় হাঁটা এক মহিলার ভিডিও, যা সোরা তৈরি করেছে | |
উন্নয়নকারী | ওপেনএআই |
---|---|
প্রাথমিক সংস্করণ | ৯ ডিসেম্বর ২০২৪ |
প্ল্যাটফর্ম | ওপেনএআই |
ধরন | টেক্সট-টু-ভিডিও মডেল |
ওয়েবসাইট | sora |
কৃত্রিম বুদ্ধিমত্তা |
---|
বিষয়ক একটি ধারাবাহিকের অংশ |
![]() |
সোরা হল একটি টেক্সট-টু-ভিডিও মডেল, যা ওপেনএআই দ্বারা বিকশিত হয়েছে। এই মডেল ব্যবহারকারীর প্রম্পট থেকে স্বয়ংক্রিয়ভাবে ছোট ভিডিও তৈরি করতে পারে এবং বিদ্যমান ছোট ভিডিওর দৈর্ঘ্য বাড়াতেও সক্ষম। ২০২৪ সালের ডিসেম্বর মাসে এটি জনসাধারণের জন্য প্রকাশিত হয়, এবং এটি চ্যাটজিপিটি প্লাব ও চ্যাটজিপিটি প্রো ব্যবহারকারীদের জন্য উপলব্ধ করা হয়।[১][২]
ইতিহাস
[সম্পাদনা]সোরা চালুর আগে একাধিক টেক্সট-টু-ভিডিও মডেল তৈরি হয়েছিল, যার মধ্যে মেটা'র মেক-এ-ভিডিও, রানওয়ে'র জেন-২ এবং গুগলের'র লুমি অন্যতম। এর মধ্যে লুমিরি, ফেব্রুয়ারি ২০২৪-এর হিসাব অনুযায়ী[হালনাগাদ] এখনও গবেষণা পর্যায়ে রয়েছে।[৩] ওপেনএআই, যা সোরা তৈরি করেছে, তারা ২০২৩ সালের সেপ্টেম্বরে ডাল-ই ৩ প্রকাশ করেছিল, যা তাদের টেক্সট-টু-ইমেজ মডেলগুলোর তৃতীয় সংস্করণ।[৪]
সোরা নামটি এর নির্মাতারা জাপানি শব্দ "সোরা" (空) থেকে নিয়েছে, যার অর্থ "আকাশ"। এটি এর সীমাহীন সৃজনশীল সম্ভাবনাকে বোঝানোর জন্য নির্বাচিত হয়েছে।[৫] ২০২৪ সালের ১৫ ফেব্রুয়ারি, ওপেনএআই প্রথমবার সোরা-তে তৈরি বেশ কয়েকটি উচ্চ-রেজুলেশন ভিডিও প্রকাশ করে। এর মধ্যে ছিল একটি SUV যা পাহাড়ি রাস্তায় চলছে, একটি মোমবাতির পাশে থাকা "ছোট তুলতুলে দানব" অ্যানিমেশন, বরফ পড়া অবস্থায় টোকিওর রাস্তায় হাঁটতে থাকা দুই ব্যক্তি এবং ক্যালিফোর্নিয়ার গোল্ড রাশের কৃত্রিম ঐতিহাসিক ফুটেজ। সংস্থাটি জানিয়েছে, সোরা সর্বোচ্চ এক মিনিট দীর্ঘ ভিডিও তৈরি করতে পারে।[৩] এরপর, ওপেনএআই সোরা-এর প্রযুক্তিগত দিক নিয়ে একটি প্রতিবেদন প্রকাশ করে, যেখানে এই মডেল প্রশিক্ষণের বিভিন্ন পদ্ধতির ব্যাখ্যা দেওয়া হয়।[৬][৭] ওপেনএআই-এর CEO স্যাম অল্টম্যান এরপর টুইটার-এ একাধিক পোস্ট করেন, যেখানে তিনি ব্যবহারকারীদের অনুরোধ অনুযায়ী সোরা-তে তৈরি ভিডিও শেয়ার করেন।
তথ্যসূত্র
[সম্পাদনা]- ↑ "Sora | OpenAI"। openai.com (ইংরেজি ভাষায়)। সংগ্রহের তারিখ ২০২৪-১২-০৯।
- ↑ Wang, Gerui। "How Sora And AI Videos Transform Media: Strengths And Challenges"। Forbes (ইংরেজি ভাষায়)। সংগ্রহের তারিখ ২০২৪-১২-২৪।
- ↑ ক খ Levy, Steven (ফেব্রুয়ারি ১৫, ২০২৪)। "OpenAI's Sora Turns AI Prompts Into Photorealistic Videos"। Wired। ফেব্রুয়ারি ১৫, ২০২৪ তারিখে মূল থেকে আর্কাইভ করা। সংগ্রহের তারিখ ফেব্রুয়ারি ১৬, ২০২৪।
- ↑ Lacy, Lisa (ফেব্রুয়ারি ১৫, ২০২৪)। "Meet Sora, OpenAI's Text-to-Video Generator"। CNET। ফেব্রুয়ারি ১৬, ২০২৪ তারিখে মূল থেকে আর্কাইভ করা। সংগ্রহের তারিখ ফেব্রুয়ারি ১৬, ২০২৪।
- ↑ Metz, Cade (ফেব্রুয়ারি ১৫, ২০২৪)। "OpenAI Unveils A.I. That Instantly Generates Eye-Popping Videos"। The New York Times। ফেব্রুয়ারি ১৫, ২০২৪ তারিখে মূল থেকে আর্কাইভ করা। সংগ্রহের তারিখ ফেব্রুয়ারি ১৫, ২০২৪।
- ↑ Brooks, Tim; Peebles, Bill; Holmes, Connor; DePue, Will; Guo, Yufei; Jing, Li; Schnurr, David; Taylor, Joe; Luhman, Troy; Luhman, Eric; Ng, Clarence Wing Yin; Wang, Ricky; Ramesh, Aditya (ফেব্রুয়ারি ১৫, ২০২৪)। "Video generation models as world simulators"। OpenAI। ফেব্রুয়ারি ১৬, ২০২৪ তারিখে মূল থেকে আর্কাইভ করা। সংগ্রহের তারিখ ফেব্রুয়ারি ১৬, ২০২৪।
- ↑ উদ্ধৃতি ত্রুটি:
<ref>
ট্যাগ বৈধ নয়;ars
নামের সূত্রটির জন্য কোন লেখা প্রদান করা হয়নি