Tạo video trong Gemini và Whisk bằng Veo 2

(vfo.vn) Thời gian gần đây, Google giới thiệu công cụ hỗ trợ người dùng Gemini Advanced giúp chuyển đổi các đoạn văn bản thành video có độ phân giải cao với thời lượng 8 giây. Whisk Animate cũng được triển khai với khả năng biến hình ảnh tĩnh thành các đoạn phim hoạt hình với thời lượng tương tự. Cả hai tính năng này hiện đã sẵn sàng cho người dùng đăng ký Google One AI Premium.

Người dùng Gemini Advanced hiện đã có thể tạo và chia sẻ video nhờ vào Veo 2 - mô hình video hiện đại nhất của Google. Ngay trong Gemini, người dùng có thể chuyển đổi các câu lệnh văn bản thành video. Bên cạnh đó, Google Labs cũng cung cấp Veo 2 thông qua Whisk, một thử nghiệm AI tạo sinh cho phép người dùng sản xuất hình ảnh mới dựa trên câu lệnh văn bản hoặc hình ảnh và nay còn có thể chuyển chúng sang định dạng video.

Veo 2 đánh dấu một bước cải tiến trong lĩnh vực sáng tạo video, được thiết kế để sản xuất các video có độ phân giải cao và mang tính điện ảnh. Nhờ khả năng nắm bắt các quy tắc vật lý thực tế và chuyển động của con người, Veo 2 có có thể tạo ra những chuyển động mượt mà cho nhân vật, các cảnh quay sống động hơn theo nhiều chủ đề và phong cách khác nhau.

Để tạo video, người dùng cần chọn Veo 2 từ menu các mô hình trong Gemini (vị trí tùy chọn này trên giao diện có thể thay đổi trong quá trình phát triển). Tính năng này sẽ tạo ra một đoạn video dài tám giây với độ phân giải 720p, được xuất ra dưới định dạng MP4 với tỷ lệ khung hình ngang 16:9. Google cho biết số lượng video có thể tạo mỗi tháng là giới hạn, và Google sẽ thông báo ngay khi người dùng sắp đạt đến giới hạn này.​
Anh-minh-hoa-cho-bai-viet.jpg
Google Gemini Advanced cho phép người dùng có thể tạo video từ câu lệnh văn bản

Người dùng chỉ cần diễn tả cảnh quay mà họ hình dung – có thể là một mẩu chuyện ngắn, một ý tưởng hình ảnh, hay một khung cảnh cụ thể – Gemini sẽ hiện thực hóa các ý tưởng đó. Người dùng mô tả càng tỉ mỉ, thành phẩm video cuối cùng càng được hiệu quả hơn (nội dung video được chính xác hơn).

Việc chia sẻ video trên điện thoại cũng rất đơn giản. Theo đó, người dùng chỉ cần ấn nút "chia sẻ" để đăng tải những đoạn video ngắn lên các nền tảng phổ biến như TikTok và YouTube Shorts.

Tính năng tạo video hiện đang được triển khai cho người dùng Gemini Advanced toàn cầu, trên cả nền tảng web và di động. Đặc quyền này dành riêng cho những người đã đăng ký gói Google One AI Premium, với đầy đủ hỗ trợ ngôn ngữ mà Gemini hiện có.

Whisk, một thử nghiệm từ Google Labs ra mắt vào tháng 12/2024, giúp người dùng khám phá và hình dung những ý tưởng mới thông qua cả câu lệnh bằng văn bản và hình ảnh. Người dùng đã có thể biến ý tưởng của họ thành hiện thực với tính năng Whisk Animate.

Whisk Animate mang đến khả năng biến những bức ảnh tĩnh của bạn thành các đoạn video tám giây nhờ công nghệ Veo 2. Tính năng này đã được cung cấp cho người dùng đăng ký Google One AI Premium tại hơn 60 quốc gia.

Google cho biết hãng đã triển khai những biện pháp quan trọng để đảm bảo trải nghiệm sáng tạo video an toàn. Điều này bao gồm quy trình red teaming và đánh giá chuyên sâu nhằm ngăn chặn việc tạo ra nội dung vi phạm các quy định của chúng tôi. Ngoài ra, mọi video được tạo bằng Veo 2 đều được gắn dấu SynthID, một loại hình mờ kỹ thuật số được nhúng vào từng khung hình, cho biết rõ đây là video do AI tạo ra.

Google cũng cho biết “Sản phẩm đầu ra của Gemini phần lớn dựa vào yêu cầu từ người dùng, và tương tự như bất kỳ công cụ AI tạo sinh nào khác, đôi khi có thể xuất hiện nội dung mà một số người dùng cho là không phù hợp”.​

Thông tin từ Google

 
  • Chủ đề
    gemini veo 2 whisk
  • Top