OpenAI vừa giới thiệu mô hình GPT-4o mới: Chatbot AI nay đã nói được và hơn thế nữa

Nội dung bài viết

    0%

    OpenAI vừa giới thiệu mô hình GPT-4o mới: Chatbot AI nay đã nói được và hơn thế nữa

    Mặc dù GPT-4 hiện đang là mô hình chủ lực để vận hành ChatGPT Plus - phiên bản cao cấp mà người dùng phải trả phí để trải nghiệm, nhưng CEO của OpenAI, Sam Altman vẫn xem nó là mô hình "ngốc nghếch" và thừa nhận rằng mọi người vẫn đang sử dụng nó rất nhiều.

    Tuy nhiên, trong sự kiện ra mắt sản phẩm tối qua, OpenAI đã thể hiện quyết tâm cải thiện bằng cách giới thiệu một mô hình Generative AI mới cao cấp mang tên GPT-4o, với chữ "o" là viết tắt của "omni" (toàn năng), nhấn mạnh vào khả năng mới của mô hình này trong việc xử lý cả văn bản, hội thoại và video.

    GPT-4o sẽ dần được triển khai trên các sản phẩm của OpenAI dành cho cả nhà phát triển và người dùng trong vài tuần tới. Đồng thời, người dùng của ChatGPT Plus cũng sẽ được trải nghiệm mô hình mới này ngay từ hôm nay.

    Không chỉ giao tiếp bằng văn bản, với GPT-4o, ChatGPT có thể tiếp nhận đầu vào bằng nhiều phương thức khác nhau

    Không chỉ giao tiếp bằng văn bản, với GPT-4o, ChatGPT có thể tiếp nhận đầu vào bằng nhiều phương thức

    Mira Murati, Kỹ sư trưởng của OpenAI, đã nói rằng GPT-4o không chỉ cung cấp trí thông minh "tương đương với GPT-4", mà còn nâng cao khả năng của GPT-4 trên nhiều phương thức và phương tiện truyền thông.

    "Với khả năng suy luận xuyên suốt giọng nói, văn bản và hình ảnh," CTO Murati chia sẻ trong một buổi trình bày trực tuyến tại văn phòng OpenAI ở San Francisco. "Điều này vô cùng quan trọng, bởi chúng ta đang nhìn vào tương lai của sự tương tác giữa con người và máy móc."

    Trong khi GPT-4 Turbo, mô hình "tiên tiến nhất" trước đó của OpenAI, đã được đào tạo để có thể phân tích hình ảnh và văn bản để thực hiện các nhiệm vụ như trích xuất văn bản từ hình ảnh hoặc mô tả nội dung của chúng, GPT-4o còn có khả năng thêm vào cả giọng nói.

    Điều này cho phép ChatGPT làm gì?

    Nhờ GPT-4o, ChatGPT của OpenAI có thể cung cấp một trải nghiệm tương tác đáng kể hơn. Trước đây, nền tảng này đã có khả năng chuyển đổi văn bản thành giọng nói, nhưng với sự bổ sung của GPT-4o, khả năng này được cải thiện đáng kể, cho phép người dùng tương tác với ChatGPT như với một trợ lý thực sự.

    Ví dụ, người dùng có thể đặt câu hỏi cho ChatGPT, được nâng cấp bởi GPT-4o, và gián đoạn ChatGPT trong khi nó đang trả lời. OpenAI cho biết rằng GPT-4o có khả năng phản hồi "thời gian thực", và thậm chí có thể nhận ra những khác biệt nhỏ trong giọng nói của người dùng, để tạo ra các giọng nói khác nhau với "nhiều phong cách biểu cảm khác nhau" (bao gồm cả hát). Điều này mở ra cơ hội cho một trải nghiệm tương tác chân thực và đa dạng hơn với ChatGPT.

    Khả năng nhận diện và phân tích hình ảnh của ChatGPT trên mô hình mới được cải tiến vượt trội

    Khả năng nhận diện và phân tích hình ảnh của ChatGPT trên mô hình mới được cải tiến vượt trội

    GPT-4o cũng cải thiện khả năng xử lý hình ảnh của ChatGPT. Bây giờ, với một bức ảnh hoặc màn hình máy tính, ChatGPT có thể nhanh chóng đáp ứng các câu hỏi liên quan, từ các chủ đề như "Đoạn mã này đang thực hiện thao tác gì?" đến "Nhãn hiệu của chiếc áo sơ mi này là gì?".

    Mira Murati nói rằng các tính năng này sẽ tiếp tục được phát triển trong tương lai. Hiện tại, GPT-4o có thể nhìn vào một bức ảnh chứa menu bằng một ngôn ngữ khác và dịch nó, nhưng trong tương lai, mô hình có thể cho phép ChatGPT "xem" trận đấu thể thao trực tiếp và giải thích luật chơi.

    OpenAI cũng khẳng định rằng GPT-4o sẽ hỗ trợ nhiều ngôn ngữ hơn, với hiệu suất cải thiện cho khoảng 50 ngôn ngữ. Và trên API của OpenAI và dịch vụ Azure OpenAI của Microsoft, GPT-4o nhanh gấp đôi, giá rẻ hơn một nửa và có tỷ lệ giới hạn cao hơn so với GPT-4 Turbo, theo thông tin từ công ty.

    Hiện tại, tính năng giọng nói vẫn chưa có trong GPT-4o API cho tất cả khách hàng. OpenAI, với lý do nguy cơ lạm dụng, dự định sẽ giới thiệu hỗ trợ cho khả năng xử lý âm thanh mới của GPT-4o cho "một nhóm đối tác đáng tin cậy nhỏ" trong vài tuần tới. Nhưng nếu khả năng giao tiếp đa phương tiện mới thực sự hiệu quả như OpenAI tuyên bố, có lẽ đã đến lúc người dùng không cần bàn phím nữa để giao tiếp với máy móc.

    Xuất hiện trên cả phiên bản miễn phí

    GPT-4o đã được tích hợp vào cả phiên bản miễn phí của ChatGPT, bắt đầu từ hôm nay, và cung cấp cho người đăng ký gói ChatGPT Plus và Đội ngũ trả phí của OpenAI một giới hạn tin nhắn "cao gấp năm lần". (OpenAI lưu ý rằng ChatGPT sẽ tự động chuyển sang GPT-3.5, một mô hình cũ hơn và ít mạnh mẽ hơn, khi người dùng đạt đến giới hạn tin nhắn.) Trải nghiệm ChatGPT với giọng nói được nâng cấp nhờ GPT-4o sẽ ra mắt phiên bản alpha cho người dùng Plus trong tháng tiếp theo, cùng với các tùy chọn dành cho doanh nghiệp.

    ChatGPT hiện đã có phiên bản desktop dành cho MacOS, giúp người dùng làm việc liền mạch hơn

    ChatGPT hiện đã có phiên bản desktop dành cho MacOS, giúp người dùng làm việc liền mạch hơn

    Hơn nữa, người dùng của phiên bản miễn phí của ChatGPT cũng có quyền truy cập vào GPT Store, nơi cung cấp các công cụ và chatbot từ bên thứ ba được xây dựng trên nền tảng AI của OpenAI - một tính năng trước đây chỉ dành cho người dùng trả phí.

    Trong một thông báo liên quan, OpenAI đã thông báo rằng họ đang làm mới giao diện web của ChatGPT với màn hình chính có "hướng đối thoại" và một bố cục tin nhắn mới. Họ cũng giới thiệu phiên bản desktop của ChatGPT cho MacOS, cho phép người dùng đặt câu hỏi qua phím tắt hoặc chụp và thảo luận về ảnh chụp màn hình. Phiên bản cho Windows dự kiến sẽ ra mắt trong năm nay.

    Phiên bản dành cho desktop cũng giúp lập trình viên làm việc tiện lợi hơn

    Trước khi GPT-4o ra mắt hôm nay, nhiều báo cáo dự đoán rằng OpenAI sẽ công bố một công cụ tìm kiếm AI để cạnh tranh với Google và Perplexity. Tuy nhiên, rõ ràng OpenAI đã làm được nhiều hơn thế. Điều thú vị hơn nữa là việc OpenAI ra mắt mô hình mới diễn ra ngay trước sự kiện nhà phát triển của Google I/O một ngày, nơi có khả năng Google sẽ công bố các sản phẩm AI mới của mình.

    Lượt xem 93

    Bạn đang tìm đơn vị để

    Tư vấn giải pháp Thiết kế website, App Mobile & Quảng cáo số.

    Liên hệ ngay để nhân viên của A Website liên hệ tư vấn cho quý khách hàng.
    Bài viết liên quan