Lào Cai Online – Ngày 26/3, OpenAI chính thức ra mắt tính năng Images in ChatGPT, cho phép người dùng tạo ảnh trực tiếp trong chatbot mà không cần thông qua mô hình DALL-E như trước đây. Theo thông báo từ OpenAI, tính năng này hiện có sẵn cho người dùng miễn phí lẫn các gói đăng ký Plus, Pro và Team. Trước đó, ChatGPT đã hỗ trợ tạo hình ảnh nhưng bị giới hạn bởi mô hình DALL-E và chỉ cho phép tạo ba ảnh miễn phí mỗi ngày.
Hình ảnh AI sắc nét, chân thực hơn
Sự xuất hiện của công cụ mới nhanh chóng thu hút sự chú ý từ cộng đồng mạng. Nhiều người dùng thử và bất ngờ trước chất lượng hình ảnh được tạo ra. “Tôi không thể phân biệt được đây là ảnh AI nếu không có ghi chú. Chất lượng vượt xa những công cụ tôi từng sử dụng”, tài khoản Hoàng Vy chia sẻ trên Facebook. Một người dùng khác, Công Tâm, cảnh báo: “Từ nay, những gì bạn thấy trên mạng chưa chắc đã là thật”.
Không chỉ gây ấn tượng về độ chân thực, Images in ChatGPT còn nâng cao khả năng xử lý văn bản trong hình ảnh, hạn chế tình trạng chữ bị méo mó hoặc sai nội dung – một vấn đề thường gặp ở các trình tạo ảnh AI trước đây.

Công nghệ đột phá với “Binding”
Điểm đặc biệt của Images in ChatGPT là sử dụng GPT-4o – một trong những mô hình AI tiên tiến nhất hiện nay. Theo Gabriel Goh, trưởng nhóm nghiên cứu của OpenAI, công cụ này tích hợp công nghệ “Binding” giúp duy trì sự chính xác giữa thuộc tính và đối tượng trong ảnh.
Quảng Cáo
Ví dụ, nếu người dùng yêu cầu một ngôi sao xanh và một hình tam giác đỏ, các mô hình AI cũ có thể tạo nhầm ngôi sao đỏ. Nhưng với Binding, ChatGPT có thể tạo đúng từng chi tiết mà không nhầm lẫn giữa màu sắc và hình dạng, ngay cả khi có tới 15-20 đối tượng khác nhau trong cùng một ảnh.
Bên cạnh đó, công cụ mới sử dụng phương pháp hồi quy tự động, tạo ảnh theo từng bước từ trái sang phải và từ trên xuống dưới, thay vì mô hình khuếch tán như DALL-E. Cách tiếp cận này giúp hình ảnh có độ chính xác cao hơn, đặc biệt trong việc hiển thị văn bản.
Cải thiện nhưng vẫn có hạn chế
Trong buổi giới thiệu, OpenAI đã trình diễn một loạt ví dụ về khả năng tạo ảnh của ChatGPT, từ sơ đồ khoa học, truyện tranh nhiều khung đến hình nền trong suốt cho logo và thực đơn nhà hàng. Tuy nhiên, so với một số công cụ khác, Images in ChatGPT vẫn mất nhiều thời gian hơn để hoàn thành một bức ảnh.
Jackie Shannon, người phụ trách sản phẩm của ChatGPT, cho rằng đây là sự đánh đổi hợp lý. “Chúng tôi sẽ tiếp tục tối ưu hóa tốc độ, nhưng chất lượng hình ảnh hiện tại đã đủ để bù đắp cho vài giây chờ đợi”, cô chia sẻ trên blog chính thức của OpenAI.

Đối phó với nguy cơ lạm dụng AI
Trước lo ngại về deepfake và nội dung không phù hợp, OpenAI khẳng định đã tích hợp các biện pháp bảo vệ nghiêm ngặt trong hệ thống. Images in ChatGPT có thể phát hiện và từ chối các yêu cầu tạo hình ảnh mang tính lừa đảo hoặc khiêu dâm.
Ngoài ra, mỗi hình ảnh do AI tạo ra sẽ gắn kèm siêu dữ liệu C2PA, cho phép người dùng kiểm tra nguồn gốc và xác định tính xác thực của ảnh. “Dù không có hệ thống nào hoàn hảo, chúng tôi cam kết tiếp tục nâng cấp các biện pháp bảo vệ”, Shannon nhấn mạnh.
Với bước tiến mới này, ChatGPT không chỉ là một chatbot hội thoại mà còn dần trở thành công cụ sáng tạo mạnh mẽ, mở ra nhiều ứng dụng tiềm năng trong thiết kế, truyền thông và giáo dục.
Quảng Cáo Liên Quan