AI tạo video từ văn bản thách thức ngành điện ảnh

Thứ Bảy, 17/02/2024, 08:31 [GMT+7]

Trong thời đại mà những tiến bộ công nghệ đang phát triển mạnh mẽ, OpenAI một lần nữa đã tạo ra làn sóng vừa phấn khởi vừa lo sợ với việc ra mắt Sora, mô hình tạo video siêu thực dài đến một phút chỉ với vài dòng văn bản ngắn gọn.

OpenAI gọi công cụ nói trên là Sora có nghĩa là “bầu trời” trong tiếng Nhật để gợi lên ý tưởng về tiềm năng sáng tạo vô hạn của công nghệ. Theo Reece Hayden, nhà phân tích cấp cao của công ty nghiên cứu thị trường ABI Research, dù các mô hình chuyển văn bản thành video đã “trình làng” trước đó nhưng điều làm nên sự khác biệt đáng kinh ngạc của Sora chính là độ dài và độ chính xác của các video mà nó tạo ra. Bước đột phá này báo trước sự chuyển đổi trên thị trường giải trí kỹ thuật số, đặc biệt đánh dấu bước xâm lấn lớn đầu tiên vào kinh đô điện ảnh Hollywood.

Đẹp như thước phim Hollywood

Tháng 4-2023, Runway AI, công ty khởi nghiệp ở Mỹ, tiết lộ công nghệ cho phép mọi người tạo video, chẳng hạn như về chú chó trò chuyện trên điện thoại thông minh, chỉ bằng cách nhập một câu lệnh. Song, các video chỉ dài 4 giây, liên tục mờ, giật, méo mó gây khó chịu người xem. Song, chúng là dấu hiệu rõ ràng cho thấy AI sẽ tạo ra những video ngày càng thuyết phục. Và đúng như dự đoán, chỉ 10 tháng sau, OpenAI tiết lộ hệ thống tương tự có thể tạo ra các video trông như thể được trích xuất lấy ra từ phim Hollywood.

Theo New York Times, đoạn video ngắn được Sora tạo nên từ những gợi ý văn bản: “Thành phố Tokyo xinh đẹp đầy tuyết thật nhộn nhịp. Máy ảnh di chuyển qua con phố nhộn nhịp của thành phố, theo chân một số người đang tận hưởng tuyết rơi tuyệt đẹp và mua sắm tại các quầy hàng gần đó. Những cánh hoa anh đào tuyệt đẹp đang bay trong gió cùng với những bông tuyết”.

Điều bất ngờ là các video do Sora tạo ra chân thực đến mức đáng kinh ngạc cho thấy khả năng đáng nể của mô hình này, duy trì chất lượng hình ảnh và tính nhất quán trong khi tuân thủ câu lệnh. Nó cho phép chuyển đổi các cảnh quay, gồm cận cảnh, theo dõi và chụp từ trên không, cũng như thay đổi bố cục cảnh quay. Mô hình này cũng có thể tạo video dựa trên hình ảnh tĩnh hoặc mở rộng cảnh quay hiện có bằng chất liệu mới.

OpenAI vẫn chưa phát hành Sora ra công chúng vì họ vẫn nỗ lực tìm hiểu mối nguy hiểm của công cụ vừa thú vị vừa đáng ngại này. Hiện, Sora chỉ được chia sẻ cho một nhóm nhỏ các học giả và các nhà nghiên cứu bên ngoài khác, những người sẽ là “red team”, thuật ngữ chỉ việc tìm kiếm những cách công cụ có thể bị lạm dụng. Ngoài ra, công cụ sẽ từ chối các lời nhắc vi phạm chính sách sử dụng, bao gồm cả những lời nhắc yêu cầu bạo lực cực đoan, hình ảnh người nổi tiếng hoặc tài sản trí tuệ của người khác.

Những lo ngại đầu tiên

Đội ngũ OpenAI đang giải quyết những thiếu sót của Sora hiện nay. Thực tế, dù các video có thể rất ấn tượng nhưng chúng không phải lúc nào cũng hoàn hảo và có thể bao gồm những hình ảnh phi logic như cảnh ai đó ăn bánh quy nhưng lại không có vết cắn ngay sau đó. Bên cạnh đó, công ty có kế hoạch hợp tác với nhóm chuyên gia để thử nghiệm mô hình mới nhất và xem xét kỹ lưỡng các lĩnh vực khác nhau, gồm thông tin sai lệch, nội dung thù địch và thành kiến; đồng thời xây dựng các công cụ giúp phát hiện thông tin sai lệch.

Rõ ràng, không thể phủ nhận chất lượng tuyệt vời với các video do Sora tạo ra. Sora có thể hỗ trợ đáng kể các nhà làm phim dày dạn kinh nghiệm tăng tốc trong công việc. Thông thường để sản xuất các video này, đội ngũ quay phim hoặc họa sĩ hoạt hình thực sự sẽ mất hàng giờ đồng hồ. Tuy nhiên, Sora có thể sẽ gây đảo lộn ngành công nghiệp điện ảnh tương tự như cách ChatGPT và trình tạo hình ảnh Midjourney gây “sốc” thế giới biên tập và thiết kế.

Theo cuộc khảo sát 300 nhà lãnh đạo trên khắp Hollywood vào tháng 1-2024, 3/4 số người được hỏi cho biết các công cụ AI đã hỗ trợ việc loại bỏ, cắt giảm hoặc hợp nhất việc làm tại công ty của họ. Trong 3 năm tới, ước tính gần 204.000 vị trí sẽ bị ảnh hưởng bất lợi. Các vị trí kỹ sư âm thanh, diễn viên lồng tiếng, nghệ sĩ lên ý tưởng, hiệu ứng hình ảnh và các công việc hậu kỳ khác có thể bị thay thế nếu công nghệ này tiếp tục phát triển.

Bên cạnh đó, sự ra đời của Sora có thể dẫn đến tình trạng lan tràn thông tin sai lệch trực tuyến, khiến việc xác định đâu là sự thật trên internet càng phức tạp hơn. Oren Etzioni, Giáo sư chuyên về AI tại Đại học Washington, lo ngại công nghệ này sẽ ảnh hưởng các cuộc bầu cử có tính cạnh tranh sít sao. OpenAI đã gắn thẻ các video do hệ thống tạo ra bằng các hình mờ để xác định chúng được tạo bởi AI nhưng vẫn có thể xuất hiện tình trạng “lách luật”.

THƯ LÊ

;