"Hãy tưởng tượng một nhạc sĩ chuyên nghiệp có thể khám phá tác phẩm mới mà không cần chơi một nốt nào trên nhạc cụ, hay một doanh nghiệp muốn thêm nhạc nền vào video quảng cáo mới nhất. Đó là khi AudioCraft phát huy tác dụng", đại diện Meta cho biết.
Theo Meta, AudioCraft tích hợp ba nền tảng AI của hãng gồm MusicGen, AudioGen và EnCodec. MusicGen là AI do Meta phát triển từ năm ngoái với khả năng tạo âm nhạc từ văn bản đầu vào, trong khi AudioGen chuyên về về hiệu ứng âm thanh và cũng tạo âm thanh từ văn bản, chẳng hạn mô phỏng tiếng chó sủa, còi xe, bước chân trên sàn gỗ. EnCodec là bộ giải mã âm thanh dựa trên AI được giới thiệu tháng 10/2022, hỗ trợ nén và giải nén các tệp âm thanh mà không làm giảm chất lượng. AI này cũng cho phép tạo nhạc chất lượng cao mà không cần sử dụng lượng văn bản đầu vào lớn. Tất cả được gói gọn trong AudioCraft, giúp tạo âm thanh chất lượng cao, tính nhất quán lâu dài và dễ sử dụng.
Meta cho biết EnCodec đã được đào tạo từ cơ sở dữ liệu hơn 20.000 giờ âm nhạc. Tất cả do Meta sở hữu hoặc được cấp phép đặc biệt cho mục đích huấn luyện AI.
Đến nay, các công cụ AI tạo sinh đã có thể tạo ra hình ảnh và video với độ chân thực rất cao từ văn bản. Tuy nhiên, lĩnh vực âm thanh đang tụt lại phía sau do độ khó cao hơn.
Các công cụ AI tạo âm nhạc, ảnh, video hiện nhận phản ứng trái chiều. Trong khi một số nghệ sĩ sử dụng để giảm thời gian cho công việc, đa phần chỉ trích vì hành vi vi phạm bản quyền. Ở lĩnh vực âm nhạc, bài hát Heart on My Sleeve do AI tạo đã gây sốt với hơn 20 triệu lượt nghe hồi tháng 4, nhưng bị các hãng đĩa cáo buộc đánh cắp sở hữu trí tuệ. Ngày 17/4, hầu hết nền tảng như Apple, Spotify, Soundcloud, Deezer đã xóa ca khúc khỏi hệ thống của mình.
Theo giới chuyên gia, sự xuất hiện của các mô hình AI tạo sinh đặt ra thách thức lớn đối với ngành công nghiệp âm nhạc khi các hãng phải vật lộn với vấn đề phức tạp về bản quyền. Đầu tháng 4, Financial Times đưa tin hãng thu âm Universal Music Group đã gửi thông báo cho các dịch vụ phát trực tuyến như Spotify và Apple với mục đích kêu gọi chặn dịch vụ AI lấy giai điệu và lời bài hát từ các ca khúc đang nắm bản quyền.