7

ElevenLabs از هوش مصنوعی خیره‌کننده‌ای برای تولید صدا رونمایی کرد

[ad_1]

راه اندازی با هوش مصنوعی یازده آزمایشگاه چند هفته پس از انتشار مدل گفتار سنتز شده جلوه های صوتی، همچنین یک ابزار متن باز در اختیار کاربران قرار داده است که پتانسیل آن را نشان می دهد. این ابزار تولید کننده صوتی هوش مصنوعی به سازندگان اجازه می دهد تا جلوه های صوتی را برای ویدیوهای خود ایجاد کنند.

هوش مصنوعی ElevenLabs برای تولید صدا

مطابق با گزارش های موجودهنگامی که برای استفاده از این ابزار یک ویدیوی جدید آپلود می کنید، چهار فریم در فواصل یک ثانیه ارائه می شود. سپس این فریم ها همراه با فرمان به مدل GPT-4o ارسال می شوند تا یک درخواست جدید دریافت کنند. این اعلان توسط API جلوه‌های صوتی برای تولید جلوه صوتی از متن استفاده می‌شود.

در نهایت صدای تولید شده با ویدیوی کاربر ترکیب می شود تا فایل قابل دانلود او ارائه شود. همچنین لازم به ذکر است که در حال حاضر حداکثر 22 ثانیه ویدیو از این ابزار قابل دانلود است.

استفاده از این ابزار بسیار ساده است. شما فقط باید ویدیوی خود را بدون صدا آپلود کنید و ElevenLabs AI چهار گزینه با صدا در اختیار شما قرار می دهد. احتمالاً می‌توان انتظار داشت که این هوش مصنوعی در آینده به سیستم‌های بزرگ‌تر اضافه شود تا سازندگان بتوانند از سیستم تولید صدای آن استفاده کنند.

آمار ریشی، مدیر طراحی Eleven Labs، می گوید:

سازندگان ویدئوهای هوش مصنوعی اغلب به دنبال جلوه‌های صوتی عالی هستند و ما فکر می‌کنیم که می‌توانیم با درک فریم‌های ویدیوهایشان و سپس ارائه بهترین خروجی، روند کار آنها را تسریع کنیم.

اونم همینطور ویدئو به اشتراک گذاشت که فناوری ElevenLabs به همراه Luma AI و Hedra برای ساخت آن استفاده شده است.

در حالی که توسعه دهندگان به کد این ابزار در قسمت دسترسی دارند GitHub برای دسترسی، ElevenLabs یک وب سایت جدید راه اندازی کرد Sound Effects API دارم سعی می کنم.

[ad_2]

نوشته های مشابه

دکمه بازگشت به بالا