മെച്ചപ്പെടുത്തലുകളുമായി ഓപ്പൺഎഐയുടെ വീഡിയോ മോഡൽ സോറ 2: ഗൂഗിളിന്‍റെ വിയോ 3 മോഡലിന് വെല്ലുവിളിയാകുമോ?

കൂടുതൽ മെച്ചപ്പെടുത്തലുകളുമായാണ് ഓപ്പൺഎഐ സോറ 2 പുറത്തിറക്കിയത്. എന്നാൽ ഇതിന് വിയോ 3 മോഡലിനെ മറികടക്കാനാകുമോ എന്ന ചോദ്യമാണ് ഉയരുന്നത്.

Sora 2 can generate videos with audio (Image credit: OpenAI)
By ETV Bharat Tech Team

Published : October 2, 2025 at 4:12 PM IST

2 Min Read
ഹൈദരാബാദ്: ഗൂഗിളിന്‍റെ ജെനറേറ്റീവ് എഐ മോഡൽ വിയോ 3യെ നേരിടാൻ ഓപ്പൺഎഐ. എഐ വീഡിയോ ജനറേഷൻ മോഡൽ സോറ 2 പുറത്തിറക്കി കൊണ്ടാണ് ഓപ്പൺഎഐ അങ്കം കുറിച്ചത്. ചാറ്റ്ജിപിടി നിർമ്മിച്ച ഓപ്പൺഎഐയുടെ പുതിയ മോഡൽ നിരവധി പുതിയ സവിശേഷതകളും മെച്ചപ്പെടുത്തലുകളുമായാണ് വരുന്നത്.

2024 ഫെബ്രുവരിയിൽ പുറത്തിറങ്ങിയ ആദ്യത്തെ സോറ മോഡലിൽ കൂടുതൽ മെച്ചപ്പെടുത്തലുകളുമായാണ് സോറ 2 പുറത്തിറക്കിയത്. വിയോ 3 പോലെ സോറ 2 മോഡലും ഓഡിയോയെ പിന്തുണയ്ക്കും. ഹൈപ്പർ-റിയലിസ്റ്റിക് വീഡിയോകൾ സൃഷ്‌ടിക്കാനും സോറ 2 മോഡലിന് കഴിയും.

സോറ 2 എഐ മോഡലിന്‍റെ കഴിവുകൾ കാണിക്കുന്ന നിരവധി ഉദാഹരണങ്ങൾ ഓപ്പൺഎഐ പ്രദർശിപ്പിച്ചിട്ടുണ്ട്. ഇത് നിർമിക്കാൻ ഉപയോഗിച്ച ടെക്‌സ്റ്റ് പ്രോംപ്‌റ്റുകളും ഓപ്പൺഎഐ തന്നെ പങ്കുവെച്ചിട്ടുണ്ട്. സിനിമാറ്റിക്, കാർട്ടൂൺ, ആനിമേഷൻ എന്നിങ്ങനെ നിരവധി ശൈലികളിൽ സ്ഥിരത നിലനിർത്തിക്കൊണ്ട് തന്നെ ഒന്നിലധികം ഷോട്ടുകൾ ഉൾക്കൊള്ളുന്ന വീഡിയോകൾ നിർമിക്കാൻ കഴിയും.

വിയോ 3 മോഡലിനെ മറികടക്കുമോ?

സോറ 2 എഐ മോഡൽ ഉപയോഗിച്ച് നിർമിച്ച ഉദാഹരണവും സോറ 2 അനൗൺസ്‌മെന്‍റ് വീഡിയോയും പരിശോധിക്കുമ്പോൾ മനസിലാക്കുന്നത് ആദ്യത്തെ എഐ വീഡിയോ ജനറേഷൻ മോഡലിൽ നിന്നും ധാരാളം മെച്ചപ്പെടുത്തലുകളുമായാണ് ഓപ്പൺഎഐ പുതിയ മോഡൽ പുറത്തിറക്കിയതെന്നാണ്. എങ്കിൽ പോലും ഈ മോഡൽ ജെമിനൈയുടെ വിയോ 3 മോഡലിനെ മറികടക്കാൻ സാധ്യതയില്ല.

Sora 2 can generate videos in a wide variety of styles (Image credit: OpenAI)

എഐ വീഡിയോ ജനറേഷനിൽ ഓഡിയോ ജനറേഷൻ, സങ്കീർണ്ണമായ ചലനങ്ങൾ, റിയലിസ്റ്റിക് ഫിസിക്‌സ് എന്നിവയ്‌ക്കുള്ള ഒരു ബദൽ മാത്രമായിരിക്കും സോറ 2. എന്നിരുന്നാലും ഉപയോക്താക്കൾക്ക് ഒരു വീഡിയോയിൽ സ്വന്തം അവതാർ സൃഷ്‌ട്ടിക്കാൻ കഴിയുന്ന കാമിയോ ഫീച്ചർ സോറ 2 മോഡലിലുണ്ട്. ഉപയോക്താക്കൾക്ക് തല ചലിപ്പിക്കുകയോ സംസാരിക്കുകയോ ചെയ്‌തുകൊണ്ട് ചെറിയ വീഡിയോ റെക്കോർഡ് ചെയ്‌ത് സ്വന്തം അവതാർ നിർമിക്കാവുന്നതാണ് ഈ ഫീച്ചർ.

സൂക്ഷ്‌മമായി പരിശോധിച്ചാൽ, സിന്തറ്റിക് വീഡിയോകളിൽ ചെറിയ പ്രശ്‌നങ്ങളും കാണാം. റോബോട്ടിക് ശബ്‌ദം, വീഡിയോയിലെ കഥാപാത്രത്തിന്‍റെ പെട്ടെന്നുള്ള ചലനങ്ങൾ, ഇടയ്ക്കിടെ കൈകാലുകൾ ശരിയായ രീതിയിലല്ലാതെ വരുക എന്നിവ ഇതിന് ഉദാഹരണമാണ്.

While the model handled complex movements, it failed towards the end (Image credit: OpenAI)

പ്രോംപ്റ്റിനനുസരിച്ച് വീഡിയോ നിർമിക്കുമ്പോൾ, സോറ 2 വസ്‌തുക്കളെ രൂപാന്തരപ്പെടുത്തുകയോ, യാഥാർത്ഥ്യത്തെ മാറ്റുകയോ ചെയ്യില്ലെന്ന് ഓപ്പൺഎഐ അവകാശപ്പെടുന്നുണ്ട്. എങ്കിലും പുതിയ മോഡലിന്‍റെ പോരായ്‌മകളും ഓപ്പൺഎഐ അംഗീകരിക്കുന്നുണ്ട്."മോഡൽ ഇപ്പോഴും പൂർണതയിലെത്തിയിട്ടില്ല. ധാരാളം തെറ്റുകൾ വരുത്തുന്നുണ്ട്. പക്ഷേ വീഡിയോ ഡാറ്റയിലെ ന്യൂറൽ നെറ്റ്‌വർക്കുകൾ കൂടുതൽ വർദ്ധിപ്പിക്കുന്നത് വഴി നിർമിക്കുന്ന വീഡിയോ യാഥാർത്ഥ്യത്തെ അനുകരിക്കുന്നതിലേക്ക് എത്തിച്ചേരാൻ കഴിയും"; ഓപ്പൺഎഐ പറയുന്നു.

പുതിയ സോറ 2 എഐ വീഡിയോ മോഡലിലേക്കുള്ള ആക്‌സസ് ഓപ്പൺഎഐയുടെ പുതിയ ടിക്‌-ടോക് സ്റ്റൈൽ സോഷ്യൽ മീഡിയ ആപ്പ് വഴി സൗജന്യമായി ലഭ്യമാകും. നിലവിൽ ഇത് യുഎസിലും കാനഡയിലും ഐഒഎസ് ഉപകരണങ്ങളിൽ മാത്രമേ ലഭ്യമാകൂ. ഉപയോക്താക്കൾക്ക് ആവശ്യമായ പ്രോംപ്‌റ്റ് നൽകി എഐ വീഡിയോകൾ നിർമിക്കാനും സുഹൃത്തുക്കളുമായി പങ്കിടാനും ഈ ആപ്പ് വഴി സാധിക്കും.

വീഡിയോകൾ നിർമിക്കുന്നതിന് ഉപയോക്താക്കൾക്ക് ടെക്സ്റ്റ് പ്രോംപ്റ്റ് നൽകുകയോ, ഇൻപുട്ട് വീഡിയോ അപ്‌ലോഡ് ചെയ്യുകയോ ചെയ്യാം. കാമിയോ സവിശേഷത ഉപയോഗിച്ച് സ്വന്തം വീഡിയോ അല്ലാതെ, മറ്റുള്ളവരുടെ വീഡിയോകൾ നിർമിക്കാൻ ആപ്പ് ഉപയോക്താക്കളെ അനുവദിക്കില്ല. ഇത് ഉറപ്പാക്കാൻ കാമിയോ സവിശേഷത ഉപയോഗിക്കുന്നതിന് മുൻപ് ഐഡന്‍റിറ്റി വെളിപ്പെടുത്താൻ ആപ്പ് ഉപയോക്താക്കളോട് ആവശ്യപ്പെടുന്നുണ്ട്.

TAGGED:

എഡിറ്റേഴ്സ് പിക്ക്

എഡിറ്റേഴ്സ് പിക്ക്

പ്രവാസികള്‍ക്ക് ആശ്വാസമായി കെവൈസി വിവാഹ രജിസ്‌ട്രേഷന്‍! ലോകത്തെവിടെയിരുന്നും തദ്ദേശ ഭരണസ്ഥാപനത്തില്‍ വിവാഹം രജിസ്റ്റര്‍ ചെയ്യാം, ഇരുകയ്യും നീട്ടി സ്വീകരിച്ച് യുവത

ആധാറിന് പ്രായം പതിനഞ്ച്; ലോകത്തെ ഏറ്റവും വലിയ ബയോമെട്രിക് തിരിച്ചറിയല്‍ സംവിധാനം നേരിടുന്ന വെല്ലുവിളികളും നേട്ടങ്ങളും അറിയാം

ഭൂമിക്ക് 24,000കിളിക്കൂടുകളും അന്‍പതിനായിരം പനത്തൈകളും സമ്മാനിച്ച ഒരു പക്ഷി മനുഷ്യനെ പരിചയപ്പെടാം

ഗോവര്‍ദ്ധന്‍ റാം സ്‌മൃതി മന്ദിരം സാഹിത്യ തീര്‍ത്ഥാടന കേന്ദ്രമായി മാറുന്നു

ETV Bharat Logo

