انویدیا مدل هوش مصنوعی Fugatto را معرفی کرد
این مدل امکان ویرایش فایلهای صوتی از پیش ساخته شده را نیز دارد.
به گزارش چابک آنلاین به نقل از دیجیاتو، انویدیا بهتازگی مدل هوش مصنوعی جدیدی به نام Fugatto را معرفی کرده است که میتواند دستورات متنی کاربران را به صدا تبدیل یا با استفاده از این دستورها، فایلهای صوتی را ویرایش کند.
Fugatto هنوز بهصورت عمومی در دسترس کاربران قرار نگرفته است
به گفته انویدیا، مدل «Foundational Generative Audio Transformer Opus 1» یا بهاختصار Fugatto میتواند دستوراتش را بهصورت متنی از کاربران دریافت کرده و منطبق با این دستورات، فایلهای صوتی بسازد. کاربران همچنین میتوانند از Fugatto برای ویرایش فایلهای صوتی ازپیشساخته شده نیز استفاده کنند.
این مدل هوش مصنوعی توسط تیمی از متخصصان این حوزه در سراسر جهان ساخته شده. همچنین انویدیا میگوید که این موضوع باعث قویتر شدن قابلیتهای چندزبانی و چندلهجهای Fugatto شده است.
«رافائل واله»، یکی از محققان این پروژه و مدیر تحقیقات صوتی کاربردی در انویدیا، دراینباره میگوید قصد آنها ساخت مدلی بوده که صدا را مانند انسانها درک و تولید کند. انویدیا برخی از سناریوهای احتمالی برای استفاده از این مدل در دنیای واقعی را فهرست کرده که Fugatto میتواند برای آنها کاربردی باشد.
برای مثال، تولیدکنندگان موسیقی میتوانند از این مدل هوش مصنوعی برای تولید نمونههای اولیه یک آهنگ استفاده کرده و سپس بهراحتی آن را ویرایش کنند. مردم عادی، تولیدکنندگان محتوا و توسعهدهندگان بازیهای ویدیویی نیز میتوانند نهایت استفاده را از قابلیتهای مدل Fugatto ببرند. البته Fugatto هنوز بهصورت عمومی در دسترس کاربران قرار ندارد، و انویدیا نیز نگفته که چه زمانی دسترسی عمومی به آن فراهم میشود.
شرکتهای متا و گوگل نیز پیشازاین مدلهای هوش مصنوعی مشابهی را معرفی کرده بودند که میتوانست دستورات متنی کاربران را به صدا تبدیل کند. مدل هوش مصنوعی گوگل MusicLM نام دارد و کاربران میتوانند از طریق وبسایت AI Test Kitchen به آن دسترسی داشته باشند.