Trong vài năm gần đây, các trình tạo ảnh AI đã mang đến nhiều bất ngờ và cả những trải nghiệm mới lạ, từ OpenAI, Imagen, Adobe Firefly cho đến DALL-E 3 và nhiều công cụ khác. Khi công nghệ ngày càng phát triển, chúng ta dường như có nhiều lựa chọn hơn để tinh chỉnh kết quả đầu ra. Giờ đây, Google Labs đã ra mắt Whisk – một công cụ đột phá cho phép bạn tải lên hình ảnh để làm cơ sở định hướng, thay vì chỉ dựa vào các prompt văn bản truyền thống. Công cụ này hứa hẹn mở ra một kỷ nguyên mới trong việc tương tác với trí tuệ nhân tạo để tạo ra nội dung thị giác.
Whisk Google Labs: Cách Thức Hoạt Động Của AI Tạo Ảnh Từ Hình Ảnh Tham Chiếu
Nếu bạn đang sinh sống tại Hoa Kỳ, bạn có thể trải nghiệm Whisk từ Google Labs, được Google mô tả là một “thử nghiệm trong AI tạo sinh”. Điểm độc đáo của Whisk nằm ở khả năng bổ sung hình ảnh làm tham chiếu, thay vì chỉ phụ thuộc vào các prompt văn bản mô tả. Nền tảng này sẽ yêu cầu bạn cung cấp ba đặc điểm chính: chủ thể (subject), cảnh (scene) và phong cách (style). Sau đó, công cụ sẽ “trộn” (whisk) những thành phần này lại với nhau để tạo ra một hình ảnh hoàn hảo theo ý muốn của bạn.
Whisk được xây dựng trên nền tảng Imagen 3, mô hình tạo ảnh tiên tiến và mới nhất của Google, đảm bảo chất lượng hình ảnh và khả năng sáng tạo vượt trội.
Google không loại bỏ hoàn toàn khả năng nhập prompt văn bản trên Whisk. Bạn vẫn có tùy chọn viết prompt riêng cho từng trong ba danh mục (chủ thể, cảnh, phong cách) hoặc thêm một ghi chú chung. Hơn nữa, bạn có thể tinh chỉnh hình ảnh sau khi Whisk đưa ra kết quả ban đầu. Chẳng hạn, nếu bạn tạo một tấm thiệp Giáng sinh phong cách cổ điển với hình ảnh một chú mèo nằm trong tuyết, sau khi xem kết quả, bạn có thể nảy ra ý tưởng thêm những bông tuyết nhỏ để hoàn thiện tác phẩm.
Mỗi khi bạn thêm hoặc tạo một hình ảnh trong bất kỳ ba danh mục nào của Whisk, nền tảng này sẽ tự động tạo ra một mô tả văn bản chi tiết về nó. Điều này có nghĩa là nếu bạn muốn thêm hoặc chỉnh sửa một hình ảnh hiện có, bạn chỉ cần tùy chỉnh phần mô tả văn bản đã được tự động tạo.
Văn bản đối thoại trên nền tảng tạo ảnh AI Whisk cho phép chỉnh sửa prompt văn bản tự động
Cuối cùng, nếu bạn cảm thấy bí ý tưởng, bạn có thể ngẫu nhiên hóa các thành phần thị giác bằng cách chọn biểu tượng xúc xắc. Đối với những tác phẩm phức tạp hơn, Whisk cũng cho phép bạn thêm nhiều hơn một tham chiếu cho chủ thể, cảnh hoặc phong cách.
Khi đã hài lòng với kiệt tác của mình, bạn có thể lưu tác phẩm trực tiếp trên nền tảng hoặc tải về để sử dụng cục bộ.
Whisk Có Đáng Để “Thử” Hay Không?
Với vô số lựa chọn tạo ảnh AI tiên tiến hiện nay, từ các công cụ giúp nâng cao chất lượng ảnh cho đến việc sản xuất các tác phẩm “nguyên bản”, công cụ mới của Google thoạt nhìn có vẻ chỉ là một chiêu trò. Tuy nhiên, cách Whisk tận dụng các tham chiếu hình ảnh trong quá trình tạo tác phẩm là độc đáo, và tôi có thể thấy rõ giá trị của nó trong các kịch bản sáng tạo và chuyên nghiệp.
Giả sử bạn đang làm một bản trình bày dự án (pitch deck) và cần những hình ảnh có phong cách tương tự với một tham chiếu bạn đã có. Thay vì cố gắng diễn giải lại tham chiếu đó bằng lời, bạn có thể đơn giản tải file lên, kèm theo một mô tả văn bản ngắn gọn về những thay đổi bạn muốn có trong hình ảnh mới.
Để phân biệt Whisk với các phần mềm AI tạo ảnh khác, Google đã xác định rằng nền tảng này được thiết kế cho mục đích khám phá, chứ không phải để tinh chỉnh chi tiết. Trong khi các sản phẩm khác có thể phù hợp hơn cho các chỉnh sửa “pixel-perfect”, Whisk lại tối ưu cho quá trình lên ý tưởng và động não:
“Chúng tôi xây dựng nó để khám phá ý tưởng thị giác nhanh chóng, không phải để chỉnh sửa từng pixel. Đây là về việc khám phá các ý tưởng theo những cách mới và sáng tạo, cho phép bạn thử nghiệm hàng chục lựa chọn và tải về những gì bạn yêu thích.”
Thành thật mà nói, đôi khi chúng ta rất khó để tìm được từ ngữ phù hợp. Tin tôi đi, tôi liên tục phải cố gắng tìm kiếm những từ ngữ diễn tả chính xác ý tưởng của mình. Đối với tôi, đây chính là yếu tố mang lại tiềm năng to lớn cho Whisk, cho tất cả những lúc việc nói “Tôi muốn một hình ảnh trông giống như thế này” dễ dàng hơn nhiều.
Tài liệu tham khảo: