Công nghệ AI mới của Google có thể tạo ra đoạn video ngắn từ một tấm ảnh

Các nhà khoa học máy tính tại DeepMind (thuộc Google) đã thành công trong việc nâng tầm AI khi thông báo ra mắt Transframer, công nghệ có thể tạo ra đoạn video ngắn chỉ từ nguyên liệu là một bức ảnh. Hứa hẹn sẽ mang lại thay đổi tích cực cho nhân loại.
"Transframer" này là một framework có cách hoạt động tương tự như "Transformer" (cũng là một AI framework).
Để bạn đọc dễ hình dung, framework là thuật ngữ trong lập trình, chứa các đoạn code đã được tạo ra sẵn, các nhà phát triển có thể đem về phát triển thêm để tạo ra phần mềm của riêng mình (giống như "móng" của căn nhà).
Transformer được giới thiệu vào năm 2017, là một kiến trúc mạng nơ-ron nhân tạo, với đặc điểm là "văn hay chữ tốt" khi có khả năng viết văn bản và so sánh với các chữ khác để tạo thành một câu có ý nghĩa, mượt mà về cách hành văn.

Transformer cho tới bây giờ vẫn đang được "deep learning" (học hỏi sâu bằng cách cho đọc thật nhiều loại văn bản) bởi TensorFlow và PyTorch. Hứa hẹn sẽ được ứng dụng vào mảng dịch thuật để tối ưu hóa thời gian và chi phí.

Trở lại với nhân vật chính Transframer, công nghệ này có thể dùng "nguyên liệu đầu vào" là hình ảnh, cũng như các thông tin liên quan là ngữ cảnh, chú thích để tạo ra đoạn video ngắn.
Kết quả, chúng ta sẽ được đoạn video quay 360 độ xung quanh tấm ảnh nguyên liệu, với phối cảnh có độ chính xác cao, điều hay ho nhất là không cần các thông tin liên quan tới địa lý.

Công nghệ này được cho chạy thử trên AI của Google DeepMind, đầu tiên AI sẽ phân tích tấm ảnh để lấy các thông tin cần thiết (ví dụ như xe cộ, con người, đường và cây cối). Kế tiếp, AI xác định khung hình của bức tranh để dự đoán ra cảnh vật xung quanh, dần dần tạo ra được khung cảnh 360 độ.
Độ chính xác của khung cảnh 360 độ đó lại tùy thuộc vào nguyên liệu đầu vào, như đã nói lúc nãy, đó là ngữ cảnh, chú thích và các thông tin liên quan khác.

Framework này đã tạo ra một bước nhảy vọt về công nghệ dựng video, nhất là với lượng dữ liệu ít ỏi như vậy. Transframer đã cho thấy kết quả đầy hứa hẹn khi được cho kiểm tra hiệu năng bằng các bài "test" như "phân loại ngữ nghĩa", "phân loại hình ảnh" và "dự đoán luồng quang học".

Về mặt ứng dụng, hoàn toàn có thể trông đợi vào Transframer, hãy thử tưởng tượng các nhà lập trình trò chơi điện tử 3D, để tạo ra một màn chơi, họ phải thiết kế khung cảnh ở cả 4 hướng, nhưng chỉ cần Transframer và nguyên liệu đầu vào, công sức, thời gian và chi phí sẽ giảm xuống rất nhiều.

Các bạn nghĩ sao về Transframer? Để lại bình luận bên dưới nhé!
Nếu các bạn thích theo dõi tin tức mới về công nghệ, hãy tham khảo các mẫu điện thoại pin "khủng" ở nút cam bên dưới nhé, đều là phân phối chính hãng, giá ưu đãi và khuyến mãi hấp dẫn!
XEM ĐIỆN THOẠI PIN KHỦNG CHÍNH HÃNG
Nguồn: TechSpot
Xem thêm:


ĐĂNG NHẬP
Hãy đăng nhập để comment, theo dõi các hồ sơ cá nhân và sử dụng dịch vụ nâng cao khác trên trang Tin Công Nghệ của
Thế Giới Di Động
Tất cả thông tin người dùng được bảo mật theo quy định của pháp luật Việt Nam. Khi bạn đăng nhập, bạn đồng ý với Các điều khoản sử dụng và Thoả thuận về cung cấp và sử dụng Mạng Xã Hội.