Google Gemini, một trong những mô hình AI văn bản thành hình ảnh mạnh mẽ nhất hiện nay, trước đây chỉ cung cấp tính năng tạo hình người một cách hạn chế trên các ứng dụng của mình, chủ yếu dành cho người dùng trả phí. Tuy nhiên, điều này đã thay đổi, mở ra cơ hội trải nghiệm công nghệ AI tiên tiến cho đông đảo người dùng Việt Nam.
Người Dùng Gemini Miễn Phí Giờ Đây Có Thể Tạo Ảnh Người
Nếu bạn đã từng sử dụng các ứng dụng Gemini trên web, máy tính để bàn hoặc di động, chắc hẳn bạn đã trải nghiệm khả năng tạo hình ảnh của nó thông qua mô hình Imagen 3 của Google. Công cụ này đã được Google phát hành rộng rãi cho tất cả người dùng vào tháng 8 năm 2024, với các tùy chọn đa dạng từ “phong cảnh chân thực” đến “cảnh đất sét kỳ ảo”, theo thông báo trên trang Google’s The Keyword.
Tuy nhiên, việc tạo hình ảnh có chứa người lại là một câu chuyện khác. Google đã giới hạn tính năng cụ thể này cho các thuê bao trả phí, bao gồm người dùng Gemini Advanced, Business và Enterprise. Nếu bạn sở hữu một tài khoản miễn phí, việc yêu cầu Gemini tạo ra một hình ảnh có người sẽ nhận được thông báo: “Việc tạo hình ảnh người chỉ có sẵn khi truy cập sớm với Gemini Advanced.”
Hiện tại, kể từ tháng 2 năm 2025, hầu hết người dùng Gemini miễn phí đã có thể tạo hình ảnh có người một cách thành công. Mặc dù vậy, nếu bạn vẫn nhận được thông báo lỗi, có thể tính năng này đang trong quá trình triển khai dần, bắt đầu với người dùng tại Mỹ và sử dụng Gemini với ngôn ngữ tiếng Anh.
Người dùng yêu cầu Gemini tạo ảnh một phụ nữ đang ăn kem
Cần lưu ý rằng theo các nguyên tắc của Gemini, bạn vẫn không thể tạo ra hình ảnh chân thực của những người có thể nhận dạng được hoặc trẻ em. Điều này nhằm đảm bảo tính an toàn và đạo đức trong việc sử dụng AI.
Hiệu Năng Của Imagen 3 Trên Mô Hình Gemini Flash 2.0 Thế Nào?
Cũng trong tháng 2 năm 2025, Google đã phát hành rộng rãi mô hình Gemini nhanh nhất của mình, Gemini 2.0 Flash, cho người dùng miễn phí. Google mô tả mô hình này là một “cỗ máy làm việc hiệu quả cao”, điều này mang lại nhiều tín hiệu tích cực cho khả năng tạo hình ảnh. Theo lẽ thường, việc tạo hình ảnh AI đòi hỏi nhiều năng lượng và thời gian hơn so với tạo văn bản thông thường. Vì vậy, về lý thuyết, hình ảnh AI có thể đạt chất lượng cao hơn khi được hỗ trợ bởi một mô hình mạnh mẽ hơn.
Chất lượng hình ảnh trở nên đặc biệt quan trọng khi thể hiện con người. Chúng ta đều từng chứng kiến những hình ảnh người do AI tạo ra trong giai đoạn đầu với những bàn tay biến dạng, thừa ngón hay đôi mắt trống rỗng đáng sợ. Do đó, sự nghi ngại ban đầu về khả năng của công cụ tạo ảnh AI miễn phí của Google là hoàn toàn dễ hiểu.
Gemini tạo ra một loạt ảnh AI minh họa
Trái ngược với những lo ngại ban đầu, tôi đã thực sự ấn tượng với khả năng của Gemini khi xử lý các yêu cầu tạo hình ảnh có người. Đặc biệt khi xét đến việc đây là một dịch vụ miễn phí, những lần thử tạo ảnh đầu tiên đều cho ra kết quả chất lượng cao, chân thực và phù hợp với mô tả đã cung cấp.
Hình ảnh AI do Gemini tạo ra về một phụ nữ đang ăn kem
Một điểm cộng đáng chú ý là bạn có thể yêu cầu Gemini tiếp tục chỉnh sửa một hình ảnh mà không cần phải bắt đầu lại từ đầu mỗi lần. Điều này giúp tối ưu hóa quá trình sáng tạo và đạt được kết quả mong muốn dễ dàng hơn.
Việc truy cập Imagen 3 qua Gemini miễn phí chắc chắn là một bước tiến thú vị, nhưng việc phải tránh tạo hình ảnh người từng là một hạn chế đáng kể. Bản cập nhật mới nhất của Google đã mở rộng đáng kể “sân chơi”, biến dịch vụ miễn phí của Gemini thành một đối thủ đáng gờm cho các dịch vụ trả phí như Midjourney. Mặc dù các dịch vụ trả phí vẫn sẽ có nhiều tùy chọn nâng cao hơn, chẳng hạn như kích thước hình ảnh tùy chỉnh, nhưng cách tiếp cận của Gemini rất dễ sử dụng và sẵn sàng đáp ứng nhu cầu ngay lập tức. Với nhiều tính năng miễn phí như vậy, thật khó để không tự hỏi liệu việc truy cập sớm có còn đủ sức thuyết phục người dùng trả phí cho Gemini Advanced hay không.