Những mô hình AI 'tạo video như thật' mới ra mắt
Hình ảnh được tạo từ Midjourney V1. Video: Midjourney
Sora của OpenAI mở màn cho xu hướng AI tạo video từ văn bản hoặc ảnh vào tháng 2 năm ngoái. Tuy nhiên, thị trường này chỉ thực sự bùng nổ trong nửa đầu năm nay khi nhiều công cụ được nâng cấp mạnh về tính năng và chất lượng.
ByteDance Seedance 1.0
Ra mắt ngày 18/6, Seedance 1.0 được một số chuyên gia đánh giá là AI tạo video từ văn bản và hình ảnh mạnh mẽ nhất hiện nay. Công cụ giúp người dùng chuyển đổi các câu lệnh đơn giản, ngắn gọn thành đoạn phim chất lượng cao mà không cần yêu cầu phức tạp.
Theo ByteDance, công ty đã tìm ra cách tách biệt thông tin về không gian và thời gian trong video bằng cách "mã hóa" vị trí, giúp AI học từ chữ viết và hình ảnh, tối ưu hóa để cho ra các cảnh quay mượt. Artificial Analysis, nền tảng chuyên phân tích và đánh giá hiệu suất mô hình AI, nhận định Seedance 1.0 vượt Veo 3 của Google, Sora của OpenAI hay Kling 2.0 của Kuaishou về nhiệm vụ biến văn bản và ảnh thành video.
Seedance 1.0 giới hạn độ dài 5 giây, thấp hơn mức 8 giây của Veo 3, nhưng thời gian sản xuất video nhanh hơn với 40 giây. Điểm trừ là nó chưa có tính năng tạo âm thanh khớp với nội dung.
Midjourney V1
V1 trình làng ngày 19/6, được đánh giá có độ chân thực cùng tính sáng tạo cao và chi phí thấp. Mỗi video cũng có độ dài 5 giây, nhưng người dùng có thể nhấn nút tạo thêm bốn lần, mỗi lần bốn giây, tức video cuối cùng có thể đạt tổng cộng 21 giây.
Midjourney phát hành V1 qua Discord và website, tính phí với ba gói gồm Basic 10 USD/tháng, Pro 60 USD/tháng và Mega 120 USD/tháng. TheoTechCrunch, video từ mô hình này có độ sáng tạo cao, "hiểu" ý đồ người tạo chỉ sau vài câu lệnh nhưng tốc độ tạo chưa cao. Ngoài ra, Midjourney cũng tính phí cao hơn 8 lần so với tạo ảnh thông thường.
Runway Gen 4
Gen 4 trình làng đầu tháng 4, được Runway giới thiệu có thể tạo cảnh và người nhất quán, điều những mô hình AI trước đó chưa làm được. "Bằng cách sử dụng tài liệu tham khảo trực quan kết hợp câu lệnh hướng dẫn, Gen-4 cho phép người dùng tạo hình ảnh và video với phong cách, chủ đề, địa điểm thống nhất, liên tục và khả năng kiểm soát trong câu chuyện", đại diện Runway nói khi đó.
Cũng theo công ty, Gen-4 có thể tái hiện chính xác nhân vật, địa điểm, sau đó ghép cảnh quay từ nhiều góc nhìn và vị trí theo ý muốn người dùng. Kết quả là cảnh trở nên liền mạch, đồng thời "giữ nguyên phong cách, tâm trạng và các yếu tố điện ảnh đặc trưng của từng khung hình". Gen-4 hiện được triển khai cho người dùng trả phí và doanh nghiệp.
Kuaishou Kling AI 2.0
Ra mắt tháng 4, Kling AI 2.0 cũng được Kuaishou (Trung Quốc) giới thiệu là mô hình video "mạnh nhất thế giới". Theo Gai Kun, Phó chủ tịch Kuaishou, mô hình được nâng cấp với các khả năng theo sát hướng dẫn từ người dùng, hiểu nhanh, chất lượng hình ảnh và chuyển động cao, cảm giác chân thực và thẩm mỹ.
Phiên bản đầu tiên của Kling AI được giới thiệu đầu năm ngoái sau khi Sora trình làng. Theo Gai, Kling hiện có hơn 22 triệu người dùng toàn cầu, tạo ra hơn 168 triệu video và 344 triệu hình ảnh.
Google Veo 3
So với các phiên bản trước, Veo 3 được Google bổ sung khả năng kết hợp âm thanh với hình ảnh, gồm lời thoại giữa các nhân vật. Theo CNBC, đây là điểm khác biệt quan trọng khi hầu hết công cụ khác trên thị trường chủ yếu cung cấp video không có âm thanh, hoặc chỉ trên nền nhạc.
Người dùng có thể sử dụng Veo 3 độc lập hoặc qua ứng dụng làm phim AI Flow. Công cụ sử dụng AI tạo ảnh từ văn bản Imagen và Gemini để tạo clip dài 8 giây với đầu vào là lời nhắc, ảnh hoặc video. Flow cũng đi kèm bộ công cụ xây dựng cảnh, cho phép người dùng ghép các đoạn phim, tinh chỉnh thành đoạn nội dung và liền mạch.
Theo: vnexpress.net
Tin cùng chuyên mục
- Nokia chuẩn bị triển khai 5G tại Việt Nam 24.09.2024 | 13:58 PM
- Sinh động các chương trình trực tiếp tại Fanpage Báo Tuyên Quang online 03.01.2023 | 08:16 AM
- Thực hiện quy định về chuẩn hóa thông tin thuê bao di động 31.03.2023 | 16:13 PM
- Hưởng ứng ngày Chuyển đổi số quốc gia 10/10Chuyển đổi số vì một cuộc sống tốt đẹp hơn 09.10.2022 | 21:42 PM
- Sở Thông tin và Truyền thông: Diễn tập ứng phó sự cố an toàn thông tin mạng năm 2022 04.10.2022 | 17:30 PM
- Hướng dẫn trẻ em sử dụng mạng internet an toàn và hiệu quả 05.08.2022 | 08:27 AM
- Người dùng nên cập nhật Chrome 92 ngay để vá 9 lỗ hổng nghiêm trọng 21.08.2021 | 15:47 PM
- UBND tỉnh nghe báo cáo dự thảo đề án chuyển đổi số tỉnh Thái Bình giai đoạn 2021 - 2025, định hướng đến năm 2030 21.07.2021 | 19:16 PM
- Thiết bị đầu tiên chuyển suy nghĩ thành câu nói 19.07.2021 | 09:47 AM
- Tại sao không gộp các ứng dụng chống dịch thành một 'super app' 19.07.2021 | 09:48 AM
Xem tin theo ngày
-
Hoàn thành xuất sắc sứ mệnh lịch sử góp phần quan trọng thực hiện thắng lợi các nhiệm vụ chính trị của tỉnh
- Phấn đấu hoàn thành ở mức cao nhất các chỉ tiêu kinh tế - xã hội tạo nền tảng thuận lợi cho tỉnh Thái Bình hợp nhất với tỉnh Hưng Yên cùng đất nước vươn mình
- Bứt phá, vươn lên mạnh mẽ hơn, hướng tới mục tiêu phát triển nhanh, giàu mạnh bền vững và thịnh vượng
- Kỳ họp thứ mười HĐND tỉnh khóa XVII, nhiệm kỳ 2021 – 2026 thông qua nhiều nghị quyết quan trọng và thành công tốt đẹp
- Tăng cường chuyển đổi số để nâng cao hiệu quả công tác kiểm tra, giám sát của Đảng
- Nêu cao tinh thần trách nhiệm, phát huy trí tuệ, đoàn kết, dân chủ, quyết định đúng đắn các vấn đề, góp phần vào thành công của kỳ họp
- Khai mạc trọng thể kỳ họp thứ mười, HĐND tỉnh khóa XVII, nhiệm kỳ 2021 - 2026
- Tuyên chiến với tội phạm sản xuất, lưu hành, kinh doanh hàng giả
- Gặp mặt cán bộ thành phố Thái Bình qua các thời kỳ
- Quyết liệt thực hiện chuyển đổi số liên thông để đáp ứng yêu cầu sắp xếp tổ chức bộ máy của hệ thống chính trị