Ồ không, phòng thí nghiệm AI của Samsung có thể tạo video về bạn từ một ảnh tĩnh
Công ty gần đây đã cho thấy AI cho phép nó chạm vào mặt rối của người khác trên cơ thể người khác chỉ bằng một bức ảnh để tham khảo.
BỞI MARK WILSON2 PHÚT ĐỌC
Hai năm trước, một phần mềm AI mới, được phân phối tự do có tên là Deep Deepfakes đã cho phép công chúng làm tan chảy thực tế bằng cách đặt đầu của bất kỳ ai lên cơ thể của người khác trong bất kỳ video nào. Deepfakes rất mạnh mẽ, đáng sợ và chỉ cần nhiều lao động mà thế giới của chúng ta chưa nổ tung. Thách thức lớn nhất của AI là để công nghệ hoạt động một cách thuyết phục, bạn phải thu thập hàng trăm video và hình ảnh để tạo ra một khuôn mẫu kỹ thuật số của người bạn muốn mạo danh.
Nhưng điều gì sẽ xảy ra nếu việc tạo một bản sao kỹ thuật số không yêu cầu tất cả công việc này? Điều gì nếu bạn có thể giả mạo ai đó từ một bức ảnh? Đó là lời hứa của nghiên cứu mới từ phòng thí nghiệm AI của Samsung . Bắt đầu chỉ với một bức ảnh, kỹ thuật AI mới nhất của Samsung có thể biến hình ảnh 2D thành một video chuyển động đầy thuyết phục. Họ có hoạt hình Britney Spears, Neil Patrick Harris, Marilyn Monroe, thậm chí là chính Mona Lisa.
Hệ thống của họ tìm hiểu hình dạng cốt lõi của khuôn mặt của ai đó trông như thế nào để nó có thể áp dụng giống như mặt nạ cho khuôn mặt của người khác trong video kiểu nói chuyện (như các cuộc phỏng vấn hoặc độc thoại selfie trên YouTube).
Không giống như Deepfakes, sử dụng một kỹ thuật gọi là GAN (hoặc mạng đối thủ thế hệ), trong đó một AI vẽ hình để cố gắng đánh lừa một AI khác cho đến khi nó thực sự giả mạo, hệ thống của Samsung bắt đầu bằng cách quét các mốc trên khuôn mặt của ai đó để hiểu cách họ sẽ di chuyển về một khung. Những gì nó nhìn thấy là một đường vẽ đơn giản của mũi, miệng, mắt, lông mày và một chiếc cằm, bản phác thảo trông giống như một bức chân dung Matisse. Và bức chân dung đó thông báo cho tất cả các nhà máy kỹ thuật số xảy ra tiếp theo, những gì các nhà nghiên cứu gọi là múa rối. Đào tạo hệ thống trên một bức ảnh duy nhất có thể hoạt động tốt hoặc hoạt động khủng khiếp. Nhưng tám bức ảnh hoạt động tốt hơn. Và 32 bức ảnh trông khá hoàn hảo, trong mắt tôi.
Tất nhiên, hầu hết chúng ta sẽ không bao giờ nhìn thấy con rối đằng sau công nghệ này. Chúng ta chỉ nhìn thấy sản phẩm hoàn chỉnh, không biết rằng một người đang mặc đồ của người khác như Arya Stark trong Game of Thrones.
Nhưng bây giờ, nghiên cứu của Samsung chỉ là: Nghiên cứu. Các kỹ thuật có sẵn công khai, nhưng không có công cụ phần mềm thân thiện với người dùng để biến khoa học đó thành một cỗ máy giả mạo tức thời. Vâng, chưa. Cho rằng bạn có thể triển khai kỹ thuật này với một bức ảnh duy nhất, có vẻ như đó là loại AI đang chờ đợi để trở thành ứng dụng ngớ ngẩn hoặc kỳ lạ tiếp theo hoặc chỉ là ứng dụng dễ nhớ. Và nếu năm cuối cùng của phần mềm đã dạy chúng ta bất cứ điều gì, thì có rất nhiều mối quan tâm trong việc thương mại hóa loại công nghệ khiến Deepfakes trở thành một cảm giác internet.
BỞI MARK WILSON2 PHÚT ĐỌC
Hai năm trước, một phần mềm AI mới, được phân phối tự do có tên là Deep Deepfakes đã cho phép công chúng làm tan chảy thực tế bằng cách đặt đầu của bất kỳ ai lên cơ thể của người khác trong bất kỳ video nào. Deepfakes rất mạnh mẽ, đáng sợ và chỉ cần nhiều lao động mà thế giới của chúng ta chưa nổ tung. Thách thức lớn nhất của AI là để công nghệ hoạt động một cách thuyết phục, bạn phải thu thập hàng trăm video và hình ảnh để tạo ra một khuôn mẫu kỹ thuật số của người bạn muốn mạo danh.
Nhưng điều gì sẽ xảy ra nếu việc tạo một bản sao kỹ thuật số không yêu cầu tất cả công việc này? Điều gì nếu bạn có thể giả mạo ai đó từ một bức ảnh? Đó là lời hứa của nghiên cứu mới từ phòng thí nghiệm AI của Samsung . Bắt đầu chỉ với một bức ảnh, kỹ thuật AI mới nhất của Samsung có thể biến hình ảnh 2D thành một video chuyển động đầy thuyết phục. Họ có hoạt hình Britney Spears, Neil Patrick Harris, Marilyn Monroe, thậm chí là chính Mona Lisa.
Hệ thống của họ tìm hiểu hình dạng cốt lõi của khuôn mặt của ai đó trông như thế nào để nó có thể áp dụng giống như mặt nạ cho khuôn mặt của người khác trong video kiểu nói chuyện (như các cuộc phỏng vấn hoặc độc thoại selfie trên YouTube).
Không giống như Deepfakes, sử dụng một kỹ thuật gọi là GAN (hoặc mạng đối thủ thế hệ), trong đó một AI vẽ hình để cố gắng đánh lừa một AI khác cho đến khi nó thực sự giả mạo, hệ thống của Samsung bắt đầu bằng cách quét các mốc trên khuôn mặt của ai đó để hiểu cách họ sẽ di chuyển về một khung. Những gì nó nhìn thấy là một đường vẽ đơn giản của mũi, miệng, mắt, lông mày và một chiếc cằm, bản phác thảo trông giống như một bức chân dung Matisse. Và bức chân dung đó thông báo cho tất cả các nhà máy kỹ thuật số xảy ra tiếp theo, những gì các nhà nghiên cứu gọi là múa rối. Đào tạo hệ thống trên một bức ảnh duy nhất có thể hoạt động tốt hoặc hoạt động khủng khiếp. Nhưng tám bức ảnh hoạt động tốt hơn. Và 32 bức ảnh trông khá hoàn hảo, trong mắt tôi.
Tất nhiên, hầu hết chúng ta sẽ không bao giờ nhìn thấy con rối đằng sau công nghệ này. Chúng ta chỉ nhìn thấy sản phẩm hoàn chỉnh, không biết rằng một người đang mặc đồ của người khác như Arya Stark trong Game of Thrones.
Nhưng bây giờ, nghiên cứu của Samsung chỉ là: Nghiên cứu. Các kỹ thuật có sẵn công khai, nhưng không có công cụ phần mềm thân thiện với người dùng để biến khoa học đó thành một cỗ máy giả mạo tức thời. Vâng, chưa. Cho rằng bạn có thể triển khai kỹ thuật này với một bức ảnh duy nhất, có vẻ như đó là loại AI đang chờ đợi để trở thành ứng dụng ngớ ngẩn hoặc kỳ lạ tiếp theo hoặc chỉ là ứng dụng dễ nhớ. Và nếu năm cuối cùng của phần mềm đã dạy chúng ta bất cứ điều gì, thì có rất nhiều mối quan tâm trong việc thương mại hóa loại công nghệ khiến Deepfakes trở thành một cảm giác internet.
Nhận xét
Đăng nhận xét