Skip to content

Thủ Thuật Miễn Phí

  • Sample Page

Thủ Thuật Miễn Phí

  • Home » 
  • Thủ Thuật Máy Tính » 
  • ChatGPT 4o: Đột Phá Khả Năng Tạo Ảnh, Vượt Xa DALL-E Đến Mức Nào?

ChatGPT 4o: Đột Phá Khả Năng Tạo Ảnh, Vượt Xa DALL-E Đến Mức Nào?

By Administrator Tháng 8 18, 2025 0
Bàn tay lỗi của AI DALL-E khi chơi hợp âm E thứ trên đàn guitar
Table of Contents

OpenAI vừa tung ra bản nâng cấp khổng lồ cho khả năng tạo hình ảnh của ChatGPT, và đây là một trong những khoảnh khắc khiến người ta phải chớp mắt, nhìn lại, rồi bắt đầu tự hỏi về ranh giới giữa thực và ảo. Với vai trò là một chuyên gia công nghệ tại thuthuatmienphi.net, tôi sẽ không lãng phí thời gian của bạn với những con số, kích thước mô hình, hay bao nhiêu giờ GPU mà mô hình mới này tiêu tốn. Thay vào đó, tôi sẽ trực tiếp chỉ cho bạn thấy những gì công nghệ này có thể làm – và cách nó vượt trội hơn hẳn so với mô hình DALL-E cũ.

Chúng ta hãy cùng so sánh trực tiếp, từng hạng mục, để thấy rõ sự khác biệt ấn tượng mà ChatGPT 4o mang lại trong lĩnh vực tạo ảnh AI.

1. Thử Thách Khó Nhằn: Tay và Ngón Tay

Ban đầu, AI tạo hình ảnh đã khiến chúng ta kinh ngạc khi nó trở nên phổ biến. Nhưng rồi… chúng ta nhìn kỹ hơn. Dấu hiệu nhận biết đặc trưng của một hình ảnh do AI tạo ra thường là bàn tay và cấu trúc ngón tay kỳ lạ, sai lệch. Vậy còn cách nào tốt hơn để kiểm tra các mô hình này ngoài việc yêu cầu chúng tạo ra một hợp âm guitar?

Để dành phần hay nhất cho cuối cùng, tôi đã yêu cầu mô hình DALL-E gốc thực hiện trước, sau đó là công cụ tạo hình ảnh mới được tích hợp vào mô hình ChatGPT 4o.

Bàn tay lỗi của AI DALL-E khi chơi hợp âm E thứ trên đàn guitarBàn tay lỗi của AI DALL-E khi chơi hợp âm E thứ trên đàn guitar

Đây là những gì DALL-E đã tạo ra. Mặc dù DALL-E có những hạn chế nhất định, nhưng ở đây, nó thực sự xử lý các ngón tay và cấu trúc giải phẫu chung khá ổn. Tuy nhiên, bản thân hợp âm thì lại không đúng chút nào. Bàn tay đặt quá cao trên cần đàn để có thể chơi hợp âm E thứ. Nếu bạn phóng to một chút, bạn sẽ nhận ra cây đàn guitar có nhiều hơn bảy dây. Khoảng cách giữa các dây cũng không đều.

Với những điểm đó, hãy cùng chuyển sang ChatGPT 4o.

Khả năng tạo ảnh bàn tay chân thực của ChatGPT 4o khi chơi guitarKhả năng tạo ảnh bàn tay chân thực của ChatGPT 4o khi chơi guitar

Tôi có thể nói đùa rằng đây thực chất là một bức ảnh cũ từ thời tôi còn chơi guitar. ChatGPT 4o thực sự tuyệt vời đến vậy. Sáu dây, khoảng cách đều nhau, và hợp âm có thể thực sự là E thứ. Tôi thực sự ấn tượng.

2. Gương Mặt Lịch Sử Trong Bối Cảnh Hiện Đại

Sau khi đã kiểm tra chi tiết “tay và ngón tay”, hãy cùng thử nghiệm với những gương mặt quen thuộc. Tôi nghĩ chúng ta sẽ thử nghiệm với các nhân vật lịch sử vì họ sẽ không bị “xúc phạm”, và sẽ thú vị khi thấy họ trong một bối cảnh hiện đại.

Prompt: “Albert Einstein eating an ice cream in Central Park, wearing a casual shirt and suspenders.” (Albert Einstein đang ăn kem ở Central Park, mặc áo sơ mi thường ngày và quần có dây đeo.)

DALL-E tạo hình ảnh Einstein ăn kem với phong cách hoạt hình thiếu chân thựcDALL-E tạo hình ảnh Einstein ăn kem với phong cách hoạt hình thiếu chân thực

Thật đáng thất vọng. Công bằng mà nói, DALL-E đã cảnh báo tôi rằng nó không thể sử dụng hình ảnh chính Albert Einstein và sẽ tạo ra một người “rất giống” ông ấy. Một trong những dấu hiệu cổ điển của DALL-E là phong cách hoạt hình nhưng vẫn pha chút thực tế, điều này thể hiện rõ ràng ở đây.

Tòa nhà San Remo ở phía sau gợi ý rằng đây là Central Park, nhưng đó là điểm cộng duy nhất. Chuyển sang ChatGPT 4o.

ChatGPT 4o tạo hình ảnh Einstein ăn kem sống động và chi tiếtChatGPT 4o tạo hình ảnh Einstein ăn kem sống động và chi tiết

Nếu bạn áp dụng bộ lọc đen trắng, tôi có thể thuyết phục bạn rằng đây là một bức ảnh cổ điển có thật. Kem trên ốc quế trông rất thật, Albert toát lên vẻ bình thản đặc trưng của mình, và San Remo vẫn đứng sừng sững ở phía sau. Mọi thứ đều khớp. ChatGPT 4o đã làm rất tốt.

3. Nhân Vật Hư Cấu: Từ Vũ Trụ Giả Tưởng Đến Đời Thường

Giờ đây chúng ta đã thấy ChatGPT có thể vẽ các nhân vật lịch sử khá tốt. Vì khuôn mặt và con người vẫn là một trong những cách tốt nhất để kiểm tra căng thẳng một AI, hãy thử thêm một số nữa.

Prompt: “A figure similar to a Sith Lord calling for a taxi in George Square, Glasgow, with light rain and traffic lights in the background.” (Một nhân vật giống Chúa tể Sith gọi taxi ở Quảng trường George, Glasgow, với mưa nhẹ và đèn giao thông ở phía sau.)

Sith Lord được DALL-E tạo ra trong bối cảnh Glasgow, vẫn còn thiếu độ chân thựcSith Lord được DALL-E tạo ra trong bối cảnh Glasgow, vẫn còn thiếu độ chân thực

Tôi đã sử dụng từ “similar” (tương tự) để bot hợp tác mà không bị vướng mắc bản quyền. Kết quả của DALL-E khá ổn. Nhân vật này gợi nhớ đến một Sith, và các yếu tố còn lại tương đối chính xác.

Không có gì quá hoạt hình về nó, nhưng nó không có cảm giác thật. Muốn thật? Hãy xem những gì ChatGPT 4o đã tạo ra với cùng một yêu cầu:

ChatGPT 4o tạo hình ảnh Chúa tể Sith gọi taxi với không khí ấn tượng, dù có lỗi nhỏChatGPT 4o tạo hình ảnh Chúa tể Sith gọi taxi với không khí ấn tượng, dù có lỗi nhỏ

Tôi rất thích không khí của bức ảnh – ánh sáng, hạt mưa, sự hiện diện u ám của Chúa tể Sith. Mọi thứ đều ở đó. Vấn đề duy nhất là vị Chúa tể bóng tối của chúng ta đang đứng trên đường gọi taxi trong khi đối mặt với… vỉa hè. Ồ, và biển hiệu taxi ghi “TAXL”.

Bây giờ, hãy chuyển từ viễn tưởng tương lai sang viễn tưởng lịch sử. Một cái gì đó như:

Prompt: “A character similar to Geralt of Rivia shopping for groceries in a modern supermarket, pushing a cart and frowning at canned goods.” (Một nhân vật giống Geralt of Rivia đang mua sắm ở siêu thị hiện đại, đẩy xe hàng và cau mày nhìn đồ hộp đóng hộp.)

DALL-E tạo hình ảnh nhân vật giống Geralt of Rivia trong siêu thị, chữ viết không rõDALL-E tạo hình ảnh nhân vật giống Geralt of Rivia trong siêu thị, chữ viết không rõ

Không tệ chút nào. Hình ảnh vẫn mang phong cách hoạt hình tổng hợp và văn bản trên các hộp ngũ cốc hoàn toàn là những ký tự vô nghĩa, đúng như dự đoán.

ChatGPT 4o ban đầu từ chối yêu cầu vì vấn đề bản quyền – nhưng đã thành công ngay sau khi tôi thay đổi từ “similar to” thành “resembling” (tái hiện). Hãy chiêm ngưỡng:

ChatGPT 4o tái hiện nhân vật giống Geralt of Rivia (Henry Cavill) mua sắm siêu thựcChatGPT 4o tái hiện nhân vật giống Geralt of Rivia (Henry Cavill) mua sắm siêu thực

Tôi không nói nên lời. Giống như hầu hết mọi người, cách ChatGPT diễn giải Geralt về cơ bản chỉ là Henry Cavill, không phải phiên bản trong trò chơi điện tử – nhưng nó đã làm rất tốt. Nét cau mày rất chuẩn, và bối cảnh cũng rất tự nhiên.

Bức ảnh này có thể được dùng làm cảnh quay từ một quảng cáo crossover kỳ lạ. Và vâng, tôi đã đọc sách The Witcher trước khi bộ phim ra mắt.

4. Chuyển Thể Sang Phong Cách Hoạt Hình

Khả năng tạo hình ảnh của OpenAI không chỉ giới hạn ở chủ nghĩa hiện thực. Trong khi DALL-E luôn có xu hướng hơi “airbrushed” (hiệu ứng chỉnh sửa mịn màng) bất kể bạn yêu cầu gì, tôi quyết định đẩy cả hai mô hình vào chế độ hoạt hình hoàn chỉnh.

Prompt: “A cartoon-style pirate captain with a long red coat and a cybernetic arm, laughing on the deck of a flying ship. Transparent background.” (Một thuyền trưởng cướp biển phong cách hoạt hình với áo khoác đỏ dài và cánh tay máy, đang cười trên boong tàu bay. Nền trong suốt.)

Thuyền trưởng cướp biển hoạt hình của DALL-E với lỗi nền trong suốt và ngón tayThuyền trưởng cướp biển hoạt hình của DALL-E với lỗi nền trong suốt và ngón tay

DALL-E thực sự đã làm khá tốt ở đây – và nó thậm chí còn hiểu yêu cầu về nền trong suốt. Đại loại là vậy. Những gì chúng ta nhận được là mẫu bàn cờ caro trắng xám cổ điển thường có nghĩa là trong suốt… ngoại trừ ở đây, nó đã bị “nướng” vào hình ảnh. Vì vậy, hoàn toàn không trong suốt.

Ngoài ra, trớ trêu thay, bàn tay sinh học của tên cướp biển AI của chúng ta có bốn ngón trong khi cánh tay máy lại có năm ngón. Có lẽ hắn đã “mạ crom” sai cánh tay?

ChatGPT 4o tạo thuyền trưởng cướp biển hoạt hình sắc nét với nền trong suốt thậtChatGPT 4o tạo thuyền trưởng cướp biển hoạt hình sắc nét với nền trong suốt thật

Phiên bản của ChatGPT 4o cho cảm giác sắc nét và có chủ ý hơn. Phong cách tô màu khác – dù tốt hơn hay không thì tùy thuộc vào cảm nhận chủ quan – nhưng nó rõ ràng trông giống như một nghệ sĩ cố ý vẽ theo cách đó.

Nền cũng thực sự trong suốt. Bạn có thể in hình này lên áo phông, in ra, hoặc thậm chí biến nó thành sticker WhatsApp ngay lập tức.

5. Ám Ảnh Phản Chiếu và Gương

Gương phản chiếu – và những hình ảnh phản chiếu cần có logic không gian để trông tự nhiên. Tôi đưa ra một yêu cầu mà tôi biết DALL-E sẽ vấp ngã.

Prompt: “A modern bathroom sink with a toothbrush and razor on the counter, both visible in the mirror and real-world view—lighting is soft and even.” (Một bồn rửa phòng tắm hiện đại với bàn chải đánh răng và dao cạo trên quầy, cả hai đều hiển thị trong gương và trong tầm nhìn thực tế – ánh sáng mềm mại và đều.)

Bồn rửa phòng tắm hiện đại với bàn chải đánh răng và dao cạo, lỗi phản chiếu của DALL-EBồn rửa phòng tắm hiện đại với bàn chải đánh răng và dao cạo, lỗi phản chiếu của DALL-E

Đúng như dự đoán. Có một cái gì đó đang cố gắng là một hình ảnh phản chiếu từ vòi nước trong gương, nhưng nó quá dài. Bàn chải đánh răng đang bay lơ lửng, bên trong bồn rửa, và không tạo ra bất kỳ phản chiếu nào. DALL-E thực sự đã đội mũ bảo hiểm AI của mình cho thử thách này.

Phản chiếu đồ vật trong gương được cải thiện bởi ChatGPT 4o, dù vẫn còn sai sótPhản chiếu đồ vật trong gương được cải thiện bởi ChatGPT 4o, dù vẫn còn sai sót

Mô hình mới hơn làm tốt hơn nhiều trong việc làm cho hình ảnh có cảm giác thật, như một bức ảnh thực tế. Phản chiếu của vòi nước hơi lệch nhưng chấp nhận được. Sau đó là bàn chải đánh răng, nó có phản chiếu nhưng lại không tồn tại trong thế giới vật lý – giống như một ma cà rồng ngược.

Chưa có người thắng cuộc rõ ràng ở đây. Kết quả AI không nhất quán, vì vậy tôi đã cho cả hai một thử thách khác tham vọng hơn một chút:

Prompt: “A woman standing in front of a full-length mirror in a sunlit bedroom, her outfit and pose mirrored exactly, with visible reflection of the window behind her.” (Một người phụ nữ đứng trước gương toàn thân trong phòng ngủ ngập nắng, trang phục và tư thế của cô ấy được phản chiếu chính xác, với hình ảnh phản chiếu rõ ràng của cửa sổ phía sau cô ấy.)

DALL-E thất bại hoàn toàn khi tạo hình ảnh người phụ nữ và phản chiếu qua gươngDALL-E thất bại hoàn toàn khi tạo hình ảnh người phụ nữ và phản chiếu qua gương

… Tôi thậm chí không muốn mất công phân tích cái này nữa. Thưa quý vị, nếu bạn muốn làm cho DALL-E trông tệ hại, chỉ cần thêm từ “mirror” (gương) vào yêu cầu của bạn. Chuyển tiếp thôi.

ChatGPT 4o tạo ảnh người phụ nữ và gương, phản chiếu có cải thiện nhưng vẫn ảo diệuChatGPT 4o tạo ảnh người phụ nữ và gương, phản chiếu có cải thiện nhưng vẫn ảo diệu

Đúng như mong đợi, phiên bản của ChatGPT 4o trông thực tế hơn nhiều – nhưng có lẽ hơi siêu thực lần này? Tư thế và trang phục của người phụ nữ được phản chiếu, nhưng chỉ một phần, giống như hiệu ứng “pop-out” 3D của Photoshop. Các góc phản chiếu cũng bị lệch. AI vẫn chưa thể xử lý logic không gian một cách hoàn hảo.

6. Chi Tiết Ô Tô và Cảnh Đường Phố

Tôi là một người đam mê xe hơi. Khi các công cụ tạo hình ảnh AI lần đầu xuất hiện, một trong những điều đầu tiên tôi thử là tạo ảnh ô tô. Kết quả hồi đó không tốt, nhưng với mô hình mới này, tôi phải thử lại.

Prompt: “A 2006 Ford GT and a Peugeot 206 behind a red traffic light on Wall Street, New York, midday.” (Một chiếc Ford GT đời 2006 và một chiếc Peugeot 206 phía sau đèn giao thông màu đỏ trên phố Wall, New York, vào giữa trưa.)

DALL-E tạo cảnh xe Ford GT và Peugeot 206 trên Phố Wall với phong cách hoạt hình và nhiều lỗiDALL-E tạo cảnh xe Ford GT và Peugeot 206 trên Phố Wall với phong cách hoạt hình và nhiều lỗi

Lại là DALL-E với phong cách hoạt hình ngày càng khó chịu của nó. Chiếc Peugeot nằm trên vỉa hè, đèn giao thông mà tôi yêu cầu lại quay mặt vào các tòa nhà, và biển số xe đều là những ký tự vô nghĩa.

ChatGPT 4o tạo cảnh xe Ford GT 2006 và Peugeot 206 sống động, chi tiết chân thựcChatGPT 4o tạo cảnh xe Ford GT 2006 và Peugeot 206 sống động, chi tiết chân thực

Kết quả của ChatGPT 4o tốt hơn đáng kể. Những chiếc xe được mô tả chính xác – ngay cả nắp bánh xe của chiếc Peugeot cũng rất đúng chỗ và đúng thời đại. Kiểu chi tiết đó không phải là ngẫu nhiên. Nhưng nó còn tốt hơn nữa:

Cảnh đường phố chân thực với Ford GT và Peugeot 206 do ChatGPT 4o tạo ra, chất lượng như ảnh chụpCảnh đường phố chân thực với Ford GT và Peugeot 206 do ChatGPT 4o tạo ra, chất lượng như ảnh chụp

Tôi thực sự có thể sử dụng bức ảnh này làm hình nền điện thoại của mình. Ánh sáng, bố cục, phản chiếu – tất cả đều hoàn hảo. Ngoại trừ sự trống vắng kỳ lạ của đường phố, bức ảnh này có thể dễ dàng được coi là một bức ảnh thật.

7. Gót Chân Achilles: Văn Bản và Chữ Viết

Cuối cùng, chúng ta nhắm vào gót chân Achilles của mọi công cụ tạo hình ảnh. Hầu hết các AI tạo hình ảnh đều gặp khó khăn trong việc thể hiện văn bản một cách chính xác. Đến bây giờ, bạn đã thấy đủ các ký tự vô nghĩa từ DALL-E trong các ví dụ trước để hiểu ý tôi.

Để làm cho nó thú vị hơn – và nhất quán – tôi đã thêm yêu cầu bức thư phải chứa văn bản bài phát biểu của Vua Terenas gửi Arthas từ Warcraft III.

Prompt: “A handwritten letter on aged paper with cursive script, resting next to a fountain pen and an ink bottle. (Include King Terenas’ speech to Arthas from Warcraft III).” (Một bức thư viết tay trên giấy cũ với chữ viết thảo, đặt cạnh một cây bút máy và lọ mực. (Bao gồm bài phát biểu của Vua Terenas gửi Arthas từ Warcraft III).)

DALL-E tạo thư viết tay với chữ viết khó đọc, nhòeDALL-E tạo thư viết tay với chữ viết khó đọc, nhòe

DALL-E đã làm những gì nó làm tốt nhất với văn bản: biến nó thành những ký tự nhòe, không thể đọc được. Nó đã cố gắng viết đúng một số từ, và không khí chung khá ổn – bút máy và lọ mực trông chắc chắn.

ChatGPT 4o tạo thư viết tay với nội dung văn bản chính xác, rõ ràng từng chữChatGPT 4o tạo thư viết tay với nội dung văn bản chính xác, rõ ràng từng chữ

ChatGPT 4o đã làm hoàn hảo – từng từ một, với chữ viết thảo rõ ràng. Chính xác đến từng chữ. So với DALL-E, đây là một bước nhảy vọt đáng kể. Xin chúc mừng, OpenAI.

AI tạo hình ảnh đã đi một chặng đường dài – và điều đó thể hiện rõ. ChatGPT 4o giống như mô hình đầu tiên thực sự hiểu rõ về ánh sáng, kết cấu và ngữ cảnh.

Tại thời điểm này, câu hỏi thực sự còn lại là: các biện pháp bảo vệ của ChatGPT mạnh đến mức nào? Tôi đã dễ dàng vượt qua các hạn chế bản quyền của nó. Sẽ mất bao lâu trước khi ai đó “jailbreak” ChatGPT và bắt đầu tạo ra bất kỳ nội dung nào họ muốn bằng cách sử dụng mô hình có khả năng phi thường này? Hãy cùng theo dõi những bước tiến tiếp theo của công nghệ AI tạo hình ảnh và chia sẻ cảm nhận của bạn về những bức ảnh mà ChatGPT 4o đã tạo ra!

Share
facebookShare on FacebooktwitterShare on TwitterpinterestShare on Pinterest
linkedinShare on LinkedinvkShare on VkredditShare on ReddittumblrShare on TumblrviadeoShare on ViadeobufferShare on BufferpocketShare on PocketwhatsappShare on WhatsappviberShare on ViberemailShare on EmailskypeShare on SkypediggShare on DiggmyspaceShare on MyspacebloggerShare on Blogger YahooMailShare on Yahoo mailtelegramShare on TelegramMessengerShare on Facebook Messenger gmailShare on GmailamazonShare on AmazonSMSShare on SMS
Post navigation
Previous post

Microsoft Office Cơ Bản Miễn Phí Trên Windows: Cách Dùng và Những Hạn Chế Cần Biết

Next post

Giải Phóng Chuột: 9 Phím Tắt Windows Nâng Tầm Năng Suất Làm Việc

Administrator

Related Posts

Categories Thủ Thuật Máy Tính ChatGPT 4o: Đột Phá Khả Năng Tạo Ảnh, Vượt Xa DALL-E Đến Mức Nào?

9 Ứng Dụng Tối Ưu Windows Gọn Nhẹ: Tăng Năng Suất Vượt Trội

Categories Thủ Thuật Máy Tính ChatGPT 4o: Đột Phá Khả Năng Tạo Ảnh, Vượt Xa DALL-E Đến Mức Nào?

Ngủ Đông (Hibernate) Trên Windows: Giải Pháp Tối Ưu Năng Lượng Hay Lời Đồn Đại?

Categories Thủ Thuật Máy Tính ChatGPT 4o: Đột Phá Khả Năng Tạo Ảnh, Vượt Xa DALL-E Đến Mức Nào?

9 Cách Tối Ưu Windows 11: Khắc Phục Mọi Phiền Toái Để Trải Nghiệm Hoàn Hảo

Leave a Comment Hủy

Recent Posts

  • 9 Ứng Dụng Tối Ưu Windows Gọn Nhẹ: Tăng Năng Suất Vượt Trội
  • Ngủ Đông (Hibernate) Trên Windows: Giải Pháp Tối Ưu Năng Lượng Hay Lời Đồn Đại?
  • 9 Cách Tối Ưu Windows 11: Khắc Phục Mọi Phiền Toái Để Trải Nghiệm Hoàn Hảo
  • 10 Mẹo Copy Paste Microsoft Word Hiệu Quả: Nắm Vững Định Dạng & Tiết Kiệm Thời Gian
  • Amazon Inspire Bị Khai Tử: Tại Sao Nền Tảng “TikTok của Amazon” Thất Bại?

Recent Comments

Không có bình luận nào để hiển thị.
Copyright © 2025 Thủ Thuật Miễn Phí - Powered by Nevothemes.
Offcanvas
Offcanvas

  • Lost your password ?