ElevenLabs از هوش مصنوعی خیرهکنندهای برای تولید صدا رونمایی کرد
[ad_1]
راه اندازی با هوش مصنوعی یازده آزمایشگاه چند هفته پس از انتشار مدل گفتار سنتز شده جلوه های صوتی، همچنین یک ابزار متن باز در اختیار کاربران قرار داده است که پتانسیل آن را نشان می دهد. این ابزار تولید کننده صوتی هوش مصنوعی به سازندگان اجازه می دهد تا جلوه های صوتی را برای ویدیوهای خود ایجاد کنند.
هوش مصنوعی ElevenLabs برای تولید صدا
مطابق با گزارش های موجودهنگامی که برای استفاده از این ابزار یک ویدیوی جدید آپلود می کنید، چهار فریم در فواصل یک ثانیه ارائه می شود. سپس این فریم ها همراه با فرمان به مدل GPT-4o ارسال می شوند تا یک درخواست جدید دریافت کنند. این اعلان توسط API جلوههای صوتی برای تولید جلوه صوتی از متن استفاده میشود.
در نهایت صدای تولید شده با ویدیوی کاربر ترکیب می شود تا فایل قابل دانلود او ارائه شود. همچنین لازم به ذکر است که در حال حاضر حداکثر 22 ثانیه ویدیو از این ابزار قابل دانلود است.
استفاده از این ابزار بسیار ساده است. شما فقط باید ویدیوی خود را بدون صدا آپلود کنید و ElevenLabs AI چهار گزینه با صدا در اختیار شما قرار می دهد. احتمالاً میتوان انتظار داشت که این هوش مصنوعی در آینده به سیستمهای بزرگتر اضافه شود تا سازندگان بتوانند از سیستم تولید صدای آن استفاده کنند.
آمار ریشی، مدیر طراحی Eleven Labs، می گوید:
سازندگان ویدئوهای هوش مصنوعی اغلب به دنبال جلوههای صوتی عالی هستند و ما فکر میکنیم که میتوانیم با درک فریمهای ویدیوهایشان و سپس ارائه بهترین خروجی، روند کار آنها را تسریع کنیم.
اونم همینطور ویدئو به اشتراک گذاشت که فناوری ElevenLabs به همراه Luma AI و Hedra برای ساخت آن استفاده شده است.
در حالی که توسعه دهندگان به کد این ابزار در قسمت دسترسی دارند GitHub برای دسترسی، ElevenLabs یک وب سایت جدید راه اندازی کرد Sound Effects API دارم سعی می کنم.
[ad_2]