Kể từ khi ra mắt lần đầu, DALL-E đã có những bước tiến vượt bậc, biến đổi cách chúng ta tương tác với công nghệ tạo hình ảnh bằng trí tuệ nhân tạo. Tuy nhiên, bất chấp những cải tiến đáng kể, công cụ tạo ảnh AI này vẫn còn xa mới đạt đến sự hoàn hảo. Khi sử dụng DALL-E thường xuyên hơn, người dùng sẽ bắt đầu nhận ra nhiều vấn đề cố hữu, từ sự thiếu nhất quán cho đến việc không thể tạo ra kích thước ảnh chính xác như mong muốn.
Bài viết này, dựa trên những phân tích chuyên sâu và kinh nghiệm thực tế, sẽ đi sâu vào 9 vấn đề lớn mà DALL-E hiện đang gặp phải, đồng thời cung cấp cái nhìn tổng quan giúp bạn hiểu rõ hơn về những hạn chế của công cụ này và cách tận dụng nó hiệu quả hơn trên thuthuatmienphi.net.
1. Khó Khăn Với Văn Bản
Mặc dù trí tuệ nhân tạo vẫn còn nhiều hạn chế trong việc tạo văn bản trong hình ảnh, nhưng sau khi thử nghiệm hàng chục công cụ tạo ảnh AI khác nhau, DALL-E vẫn là một trong những cái tên gặp nhiều vấn đề nhất ở khía cạnh này. Bạn có thể đạt được kết quả tốt hơn với các yêu cầu đơn giản, nhưng ngay cả như vậy, phần mềm vẫn thường xuyên gặp khó khăn trong việc viết đúng dấu hoặc hiển thị các ký tự phức tạp.
Hình ảnh quán cà phê được tạo bởi DALL-E với chữ 'Café' bị lỗi dấu
Trong nhiều thử nghiệm, DALL-E cũng thường xuyên mắc lỗi chính tả, ngay cả khi người dùng đã cung cấp các câu lệnh rõ ràng và thử nhiều lần để khắc phục. Trong các trường hợp khác, văn bản bị méo mó hoặc không thể đọc được. Điều đáng chú ý là DALL-E cũng không thể tạo ra văn bản dễ đọc trên các đối tượng như biển báo đường phố hoặc các vật thể tương tự, làm giảm tính chân thực của hình ảnh.
2. Không Thay Đổi Kích Thước Ảnh Theo Yêu Cầu
DALL-E có khả năng tạo ra hình ảnh khá tốt, nhưng lại rất kém trong việc điều chỉnh kích thước ảnh khi được yêu cầu. Ví dụ, khi tôi yêu cầu phần mềm thay đổi kích thước hình ảnh cho các blog khác nhau, DALL-E chỉ đơn thuần tái tạo lại bức ảnh thay vì thực hiện thao tác thay đổi kích thước.
May mắn thay, việc cắt và thay đổi kích thước hình ảnh khá đơn giản với nhiều công cụ miễn phí như Canva. Tuy nhiên, sẽ tiện lợi hơn nhiều nếu người dùng có thể thực hiện thao tác này trực tiếp trong DALL-E mà không cần phụ thuộc vào phần mềm bên thứ ba.
3. Khó Tạo Ảnh Chân Thực
DALL-E không gặp quá nhiều vấn đề về độ sâu trường ảnh, nhưng khả năng tạo ra hình ảnh chân thực (photorealistic) của nó lại khá tệ. Chẳng hạn, khi tôi yêu cầu AI tạo hình ảnh một chú chó Golden Retriever trong khung cảnh núi non mà không chỉ định phong cách, kết quả thu được, mặc dù tốt, vẫn có vẻ như được tạo bởi AI.
Một chú chó Golden Retriever trong phong cảnh núi non, ảnh được tạo bằng DALL-E nhưng chưa đạt độ chân thực cao
Khi tôi yêu cầu DALL-E làm cho hình ảnh đó chân thực hơn, kết quả thậm chí còn tệ hơn và trông khá đáng sợ.
DALL-E cố gắng tạo ảnh chú chó Golden Retriever chân thực hơn nhưng kết quả lại trông giả và đáng sợ
Việc sử dụng Custom GPT chuyên về ảnh chân thực có thể cải thiện tình hình, nhưng yêu cầu tài khoản premium. Nếu không, các công cụ tạo ảnh AI khác như Adobe Firefly (được đánh giá cao) có thể là lựa chọn thay thế tốt hơn cho những ai cần ảnh chân thực.
4. Không Phản Hồi Với Lệnh Cấm
Một trong những cách hiệu quả để viết câu lệnh tốt hơn trong Midjourney, ChatGPT và các công cụ AI khác là chỉ rõ những gì bạn không muốn phần mềm làm. Trong nhiều trường hợp, điều này giúp tạo ra kết quả tốt hơn. Tuy nhiên, DALL-E lại là một ngoại lệ.
Trong nhiều trường hợp, tôi đã yêu cầu DALL-E không bao gồm một số yếu tố nhất định trong hình ảnh của mình. Thế nhưng, công cụ này vẫn thêm chúng vào. Đôi khi, việc tạo lại hình ảnh có thể khắc phục được, nhưng sẽ tốt hơn nếu không phải lặp lại thao tác này. Ngược lại, tôi hiếm khi gặp vấn đề này khi sử dụng Adobe Firefly.
5. Thiếu Nhất Quán Trong Một Số Lĩnh Vực
Nhiều công cụ tạo ảnh AI có những điểm yếu riêng; ví dụ, một số công cụ gặp khó khăn khi tạo hình ảnh bàn tay. DALL-E cũng mắc phải lỗi thiếu nhất quán ở nhiều khía cạnh khác nhau.
Mặc dù DALL-E rất tốt trong việc tạo ra các hình ảnh tổng thể, nhưng nó lại không phải lúc nào cũng xuất sắc khi tạo ra hình ảnh người đang cầm vật thể. Điều kỳ lạ là phần mềm này cũng kém trong việc tạo hình ảnh màn hình máy tính. Thông thường, bạn sẽ nhận được một tập hợp các hình dạng ngẫu nhiên. Yêu cầu phần mềm tắt màn hình máy tính đôi khi (nhưng không phải lúc nào cũng) giúp ích.
6. Phong Cách Hình Ảnh Không Đồng Nhất
DALL-E có khả năng tạo ra nhiều loại hình ảnh khác nhau, từ nghệ thuật AI trông giống tranh vẽ cho đến hình ảnh 3D. Tuy nhiên, sự đa dạng này đôi khi dẫn đến sự thiếu nhất quán trong phong cách.
Khi yêu cầu DALL-E tạo hình ảnh, bạn cần phải thật cụ thể về những gì bạn muốn. Nếu không, bạn có thể nhận được bất cứ thứ gì. Điều này không phải là vấn đề nếu bạn chỉ đang thử nghiệm ứng dụng, nhưng lại trở thành một rắc rối lớn nếu bạn muốn duy trì một phong cách nhất quán trên toàn bộ các hình ảnh của mình.
7. Kích Thước Vật Thể Bất Thường
Việc làm cho các vật thể trong hình ảnh có tỷ lệ phù hợp với đời thực là rất quan trọng nếu bạn quan tâm đến độ chính xác của bức ảnh. Thật không may, DALL-E đôi khi không thể làm cho các vật thể trông đúng như chúng nên có. Ví dụ, nếu bạn yêu cầu phần mềm tạo hình ảnh một người đang cầm điện thoại trong tay, chiếc điện thoại đôi khi sẽ quá lớn so với bàn tay người đó.
Hình ảnh người cầm điện thoại được tạo bởi DALL-E với kích thước điện thoại không cân đối so với người
Ban đầu, tôi nghĩ rằng việc yêu cầu phần mềm tạo hình ảnh góc rộng hơn sẽ giải quyết được vấn đề này, nhưng thực tế, nó lại làm mọi thứ tệ hơn, và nhân vật trông giả hơn. Việc thử các câu lệnh chỉnh sửa DALL-E khác nhau có thể hiệu quả với bạn, nhưng cá nhân tôi vẫn chưa tìm ra cách khắc phục triệt để vấn đề này.
8. Hạn Chế Khi Tạo Tài Liệu In Ấn (External Materials)
Ban đầu, tôi nghĩ DALL-E sẽ là một công cụ tuyệt vời để tạo lịch cá nhân hóa, thiệp sinh nhật, hình nền điện thoại và nhiều thứ khác. Tuy nhiên, tôi nhanh chóng nhận ra rằng phần mềm này không làm tốt trong lĩnh vực này.
Ví dụ, tôi đã cố gắng tạo bìa thiệp sinh nhật bằng DALL-E. Tôi muốn tạo một hình ảnh trong ứng dụng và sau đó tải lên một dịch vụ in ấn. Thật không may, tôi liên tục nhận được một thiết kế bao gồm chính hình ảnh thiệp sinh nhật bên trong bức ảnh đã tạo.
Lỗi DALL-E 3 khi tạo thiệp sinh nhật: Thiết kế bao gồm hình ảnh thiệp thay vì chỉ hình ảnh trang trí, kèm theo lỗi văn bản
Nếu bạn thực sự muốn sử dụng DALL-E cho các loại thiết kế này, tôi khuyên bạn không nên nói rằng bạn sẽ sử dụng nó trên thiệp sinh nhật. Thay vào đó, hãy chỉ định cụ thể những gì bạn muốn chương trình tạo ra. Sau đó, bạn có thể điều chỉnh kích thước hoặc thêm văn bản bằng một ứng dụng khác. Tốt nhất là chỉ tạo hình ảnh trong DALL-E và thêm văn bản sau này.
9. Ảnh Kém Chất Lượng Khi Yêu Cầu Nhiều Tùy Chọn
Đôi khi, người dùng không biết chính xác thiết kế AI nào mình muốn sử dụng. Trong những trường hợp này, việc nhờ các công cụ tạo ảnh tạo ra nhiều biến thể hình ảnh là một ý tưởng hợp lý. Tuy nhiên, theo kinh nghiệm cá nhân, DALL-E thường khá “lười biếng” khi cung cấp nhiều tùy chọn.
Trong nhiều trường hợp, các bức ảnh tôi nhận được thường trông rất giống nhau, không có nhiều sự khác biệt. Do đó, bạn cần phải thật cụ thể trong câu lệnh. Tôi cũng nhận thấy rằng việc tạo từng hình ảnh một sẽ hiệu quả hơn là yêu cầu nhiều biến thể cùng lúc.
Kết Luận
Mặc dù tôi rất thích sử dụng DALL-E nói chung, phần mềm này vẫn chưa hoàn hảo và bạn chắc chắn sẽ gặp phải một số vấn đề đã nêu. Chẳng hạn, nó kém trong việc tạo ra hình ảnh chân thực mà không có Custom GPT, và thường xuyên không loại trừ các yếu tố mà tôi không mong muốn trong hình ảnh.
Tuy nhiên, tôi vẫn khuyên bạn nên thử DALL-E. Hãy tự mình trải nghiệm để xem những vấn đề này có xuất hiện với bạn hay không, và khám phá những ưu điểm mà công cụ này mang lại. Hãy cùng chia sẻ những trải nghiệm của bạn với DALL-E trong phần bình luận bên dưới nhé!