Bản cập nhật ChatGPT mới nhất từ OpenAI đã mang đến một trong những nâng cấp đáng giá nhất, đặc biệt là cải thiện vượt trội về khả năng tạo hình ảnh của mô hình GPT-4o. Giờ đây, thay vì phải chuyển sang DALL-E 3, bạn có thể trực tiếp tạo ra những hình ảnh chất lượng cực cao với GPT-4o ngay trong cùng một cuộc trò chuyện. Tuy nhiên, có một điểm cần lưu ý cho người dùng ChatGPT miễn phí – ít nhất là ở thời điểm hiện tại.
GPT-4o: Bước Tiến Vượt Bậc Trong Công Nghệ Tạo Ảnh AI
Mô hình GPT-4o của OpenAI hiện là lựa chọn mặc định cho hầu hết các cuộc trò chuyện trên ChatGPT, được đánh giá là “Tuyệt vời cho hầu hết các câu hỏi”. GPT-4o thực sự đáp ứng một lượng lớn thông tin với tốc độ và độ chính xác đáng kinh ngạc, nhưng trước đây chỉ dừng lại ở văn bản.
Sau bản cập nhật vào ngày 25 tháng 3 năm 2025, GPT-4o đã có thể tạo ra những hình ảnh chất lượng cao với chi tiết đáng kinh ngạc, thậm chí vượt trội hơn hẳn so với mô hình mà nó gần như thay thế là DALL-E 3. Hơn nữa, GPT-4o giờ đây có thể thực hiện các thao tác chỉnh sửa và điều chỉnh hình ảnh vượt xa khả năng của DALL-E 3. Các tính năng như chỉnh sửa hình ảnh, điều chỉnh màu sắc và phong cách, thay đổi tinh tế, thêm/bớt đối tượng tiền cảnh và hậu cảnh, cùng nhiều khả năng khác đều đã trở nên khả thi.
Hình ảnh một thợ săn quái vật giả tưởng với mái tóc trắng và vết sẹo đang mua sắm tại siêu thị hiện đại, tạo bởi DALL-E 3.
Phiên bản hình ảnh thợ săn quái vật tương tự, nhưng được tạo bởi GPT-4o với chất lượng và chi tiết vượt trội.
Khả năng tạo văn bản trong hình ảnh cũng được cải thiện đáng kể. Trước đây, việc tạo văn bản của DALL-E 3 không phải là thế mạnh (dù đây cũng không phải là điểm mạnh của hầu hết các mô hình AI tạo ảnh). Giờ đây, GPT-4o có thể tạo ra các infographic chi tiết với phần giải thích đầy đủ về gần như mọi chủ đề. Vị trí văn bản trong hình ảnh nay cũng rất chính xác, sử dụng các kiểu chữ và hướng cụ thể mà không lo tạo ra những hình ảnh AI bị mờ nhòe. Việc giữ nguyên chi tiết cũng là một cải tiến rõ ràng khác, với các đặc điểm cụ thể dễ dàng được chuyển từ hình ảnh này sang hình ảnh khác mà không khiến ChatGPT thay đổi hoàn toàn cảnh hoặc tạo ra một hình ảnh hoàn toàn mới.
Hình ảnh một người đàn ông giống Einstein đang thưởng thức kem tại Công viên Trung tâm, được tạo bởi DALL-E 3.
Hình ảnh người đàn ông giống Einstein ăn kem tại Central Park, được tạo bởi GPT-4o với cải thiện đáng kể về chi tiết và độ chân thực.
Một phần của việc nâng cấp chất lượng hình ảnh đến từ sự hợp tác của OpenAI với các công ty như Shutterstock và một nhóm các chuyên gia huấn luyện đã dành hàng giờ để xác định các lỗi mà GPT-4o mắc phải trong quá trình tạo hình ảnh. Trao đổi với The Wall Street Journal, nhà nghiên cứu chính Gabriel Goh giải thích rằng kỹ thuật học tăng cường này cho phép GPT-4o tuân thủ chính xác các hướng dẫn của con người trên một phạm vi rộng lớn các yêu cầu tạo hình ảnh, và quá trình này chỉ cần “hơn 100 nhân viên” để hoàn thành.
Khả năng tạo hình ảnh mới của ChatGPT thực sự rất ấn tượng. Mặc dù nó chưa hoàn hảo – không có công cụ tạo hình ảnh AI nào là hoàn hảo – nhưng đây là một bước nhảy vọt đáng kể về chất lượng so với các mô hình tạo ảnh AI như DALL-E 3, vốn hữu ích nhưng chưa thực sự vượt trội.
Ai Có Thể Trải Nghiệm Tính Năng Tạo Ảnh Mới Của GPT-4o?
Đáng tiếc, do nhu cầu sử dụng GPT-4o quá lớn, người dùng ChatGPT miễn phí một lần nữa phải chờ đợi tính năng mới này. Vào ngày 26 tháng 3 năm 2025, CEO của OpenAI, Sam Altman, đã xác nhận sự chậm trễ này mà không đưa ra thời gian cụ thể cho việc kết thúc.
Sự gia tăng đáng kể về mức độ quan tâm đã được dự đoán trước, nhưng không đến mức quá lớn như vậy. Điều này có nghĩa là bạn sẽ phải chờ đợi thêm một thời gian hoặc nâng cấp lên gói ChatGPT Plus với mức phí 20 đô la mỗi tháng. Công bằng mà nói, với những nâng cấp như thế này, việc nâng cấp lên ChatGPT Plus trở nên đáng giá hơn nhiều so với thời điểm ra mắt mô hình trước đó của OpenAI là GPT-4.5.
Cũng cần lưu ý rằng, như một phần của bản nâng cấp GPT-4o, DALL-E 3 sẽ trở thành “mô hình tạo hình ảnh cũ của OpenAI”. Điều này có nghĩa là OpenAI cuối cùng sẽ loại bỏ DALL-E 3 khỏi ChatGPT, mặc dù hiện tại chưa có thời gian biểu cụ thể cho sự thay đổi này.
Kết luận, bản cập nhật GPT-4o đã đưa khả năng tạo và chỉnh sửa hình ảnh của ChatGPT lên một tầm cao mới, mang lại sự linh hoạt và chất lượng vượt trội so với DALL-E 3. Dù người dùng miễn phí có thể phải chờ đợi, đây chắc chắn là một bước tiến quan trọng trong lĩnh vực AI tạo sinh. Với những cải tiến liên tục, ChatGPT đang khẳng định vị thế là công cụ AI hàng đầu, mang lại giá trị thực sự cho người dùng. Đừng quên theo dõi thuthuatmienphi.net để cập nhật những thông tin công nghệ mới nhất và sâu sắc nhất!