Theo OpenAI, ChatGPT có thể tương tác bằng giọng nói theo phong cách của một trong năm nhân vật mặc định. Bên cạnh đó, AI cũng có thể xử lý hình ảnh khi người dùng nhập vào. Công ty cho biết tính năng trò chuyện là bổ sung quan trọng nhằm thu hút nhiều người tương tác và sử dụng ChatGPT hơn.
"Đó là thách thức lớn của chúng tôi", Peter Deng, Phó chủ tịch phụ trách mảng Sản phẩm tiêu dùng của OpenAI, cho biết. "Một trong những công việc khó khăn nhất là sử dụng công nghệ mà chúng tôi đang sở hữu để biến nó trở nên đơn giản hơn để tiếp cận 300-400 triệu người dùng tiếp theo".
Trong bản cập nhật mới, ChatGPT có thể tranh luận với người dùng bằng giọng nói, kể chuyện hoặc nói to nội dung họ nhập vào bằng văn bản. Theo bản thử nghiệm được Washington Post dùng và đánh giá, các phản hồi có "giọng điệu nhìn chung có vẻ mang tính trò chuyện hơn so với các trợ lý ảo phổ biến như Google Assistant, Alexa hay Siri".
Trên blog ngày 25/9, OpenAI nhấn mạnh tính năng trò chuyện mới "mở ra cánh cửa cho nhiều ứng dụng sáng tạo và tập trung vào khả năng tiếp cận".
Với tính năng hình ảnh, người dùng có thể chụp ảnh mọi thứ xung quanh, sau đó yêu cầu ChatGPT phân tích ảnh để "khắc phục sự cố khiến lò nướng không khởi động, xem trong tủ lạnh còn những loại thực phẩm nào để lên kế hoạch cho bữa ăn, hoặc phân tích biểu đồ phức tạp cho dữ liệu liên quan đến công việc". Tính năng này tương tự Google Lens của Alphabet.
Dự kiến, cập nhật mới trên ChatGPT sẽ có mặt cho người dùng trong hai tuần tới, nhưng mới chỉ dành cho những người đăng ký gói Plus và Enterprise.
OpenAI thành lập năm 2016, trong khi ChatGPT được tung ra cuối năm ngoái và nhanh chóng gây sốt nhờ khả năng trả lời các câu hỏi một cách tự nhiên. Bản cập nhật mới được đánh giá sẽ tăng cường sức mạnh lớn cho AI này, trở thành đối trọng đối với các trợ lý ảo truyền thống.
"Việc bổ sung khả năng thoại và hình ảnh đưa ChatGPT tiến xa hơn trên con đường trở thành một mô hình đa phương thức thực sự: một chatbot có thể 'nhìn' và 'nghe' thế giới, cũng như phản hồi bằng giọng nói và hình ảnh bên cạnh văn bản", Washington Post bình luận.
Trong khi đó, các nhà nghiên cứu AI đánh giá mô hình đa phương thức là giai đoạn cạnh tranh tiếp theo trong lĩnh vực trí tuệ nhân tạo. Chúng dự kiến được áp dụng cho nhiều lĩnh vực trong đời sống, như trên smartphone, TV, xe hơi, loa thông minh.
Ngày 25/9, Amazon cũng cho biết đã ký thỏa thuận đầu tư bốn tỷ USD vào một công ty khởi nghiệp AI có tên Anthropic. Đây là thỏa thuận lớn nhất trong lĩnh vực trí tuệ nhân tạo kể từ khi Microsoft đổ hơn 10 tỷ USD vào OpenAI. Tuần trước, Amazon cũng bổ sung tính năng "trò chuyện" bằng chatbot cho loa Alexa, nhưng bị nhận xét còn hạn chế.