OpenAI ra mắt GPT-4o: cải thiện khả năng xử lý văn bản, âm thanh và hình ảnh

(vfo.vn) OpenAI đã ra mắt GPT-4o (“o”: “omni”) - mô hình ngôn ngữ lớn đa phương thức (LLM) mới nhất của hãng có những cải tiến lớn trong việc tạo (xử lý) nội dung văn bản, giọng nói và hình ảnh để mang lại sự tương tác tự nhiên hơn giữa người dùng và AI.​
GPT-4o.jpg

OpenAI tuyên bố mô hình AI mới của họ có thể phản hồi với âm thanh đầu vào chỉ trong 232 mili giây (ms) và phản hồi văn bản nhanh hơn đáng kể trong các lời nhắc không phải tiếng Anh với sự hỗ trợ cho hơn 50 ngôn ngữ. OpenAI có thể chuyển đổi giọng nói giống robot hơn. GPT-4o cũng có thể phản hồi theo thời gian thực và quan sát môi trường xung quanh thông qua camera trên thiết bị của người dùng. GPT-4o có thể dịch hơn 50 ngôn ngữ theo thời gian thực. GPT-4o có thể hoạt động như một trợ lý trợ năng cho người khiếm thị.​

OpenAI đã giới thiệu các tính năng của GPT-4o trong buổi phát trực tiếp (livestream). Quý độc giả có thể xem tất cả bản demo các tính năng GPT-4o mới trên kênh YouTube của OpenAI, cụ thể video dưới đây.​

Bài viết này chỉ cung cấp thông tin ngắn gọn về GPT-4o. Nếu cần tham khảo thông tin toàn bộ bài tin tức “OpenAI đã ra mắt GPT-4o”, quý độc giả có thể truy cập trang web: openai.com/index/gpt-4o-and-more-tools-to-chatgpt-free​

Tham khảo: GSMArera

 
Sửa lần cuối bởi điều hành viên:
  • Chủ đề
    gpt-4o openai
  • Thống kê

    Chủ đề
    101,162
    Bài viết
    468,240
    Thành viên
    340,011
    Thành viên mới nhất
    thezuan84
    Top