Mẹo nhỏ: Để tìm kiếm chính xác các bài viết có nội dung hữu ích dành cho độc giả, hãy search trên Google với cú pháp: "Từ khóa" + "thaoyenblog". (Ví dụ: thiệp tân linh mục thaoyenblog). Tìm kiếm ngay
36 lượt xem

thaoyenblog tiết lộ một AI tạo clip dựa trên lời nhắc văn bản -THAOYEN

thaoyenblog tiết lộ một AI tạo clip dựa trên lời nhắc văn bản

Mặc dù hiệu ứng khá thô sơ, khối hệ thống này cung cấp tầm nhìn sơ lược về những gì tới đây đối với trí tuệ nhân tạo tổng hợp và đây là bước rõ tiếp theo từ khối hệ thống AI chuyển văn bản thành hình ảnh sẽ gây ra sự phấn khích lớn trong năm nay.

Thông báo của thaoyenblog về make-A-clip, vẫn chưa được thông báo rộng rãi rãi, có khả năng sẽ thúc đẩy những phòng thực nghiệm AI khác phát hành phiên bản của riêng họ. Nó cũng đặt ra một số câu hỏi lớn về đạo đức.

Chỉ trong tháng trước, phòng thực nghiệm AI OpenAI sẽ cung cấp khối hệ thống AI chuyển văn bản thành hình ảnh DALL-E mới nhất cho tất cả mọi người và công ty khởi nghiệp AI Stability.AI sẽ tung ra Stable Diffusion, một khối hệ thống chuyển văn bản thành hình ảnh mã . mở.

tuy nhiên AI chuyển văn bản thành clip đi kèm với một số thử thách lớn hơn. thứ nhất, những mô hình này cần một lượng lớn sức mạnh tính toán. Chúng là một công cụ tính toán thậm chí còn lớn hơn so với những mô hình AI chuyển văn bản thành hình ảnh lớn, tận dụng hàng triệu hình ảnh để đào tạo, bởi vì chỉ để ghép một clip ngắn lại cần hàng trăm hình ảnh. Điều đó có tức là chỉ có những công ty công nghệ lớn mới đủ khả năng xây dựng những khối hệ thống này cho tương lai gần. Chúng cũng khó đào tạo hơn vì ko có tập dữ liệu quy mô lớn về clip chất lượng tốt cao được ghép nối với văn bản.

Để giải quyết vấn đề này, thaoyenblog sẽ phối kết hợp dữ liệu từ ba bộ dữ liệu hình ảnh và clip mã . mở để đào tạo mô hình của nó. Tập hợp dữ liệu hình ảnh văn bản tiêu chuẩn của những hình ảnh tĩnh được gắn nhãn sẽ giúp AI tìm hiểu những mục tiêu được gọi là gì và chúng trông như thế nào. Và một cơ sở dữ liệu clip sẽ giúp nó tìm hiểu cách những vật thể đó được nghĩ rằng dịch chuyển trên thế giới. Sự phối kết hợp của hai cách tiếp cận sẽ giúp make-A-clip, được mô tả trong một bài báo ko được nhận định ngang hàng được xuất bản ngày ngày hôm nay, tiết ra những clip từ văn bản trên quy mô lớn.

Tanmay Gupta, một nhà khoa học phân tích thị giác máy tính tại Viện Trí tuệ Nhân tạo Allen, cho biết hậu quả của thaoyenblog rất hứa hẹn. những clip được chia sẻ cho thấy mô hình có thể chụp những hình dạng makeup khi máy ảnh quay. Mô hình cũng có một số luận điểm về chiều sâu và sự hiểu biết về ánh sáng. Gupta cho biết một số chi tiết và chuyển động được thực hiện một cách tinh vi và thuyết phục.

Tuy nhiên, “có rất nhiều chỗ để hiệp hội phân tích cải thiện, không giống nhau nhất nếu những khối hệ thống này được tận dụng để chỉnh sửa clip và tạo nội dung chuyên nghiệp,” ông nói thêm. không giống nhau nhất, vẫn tồn tại khó khăn để mô hình hóa những tương tác phức tạp Một trong những mục tiêu.

Trong clip được tạo bởi lời nhắc “Bức tranh vẽ bằng bút lông của một nghệ sĩ trên canvas”, bút vẽ dịch chuyển trên khung vẽ, tuy nhiên những nét vẽ trên khung vẽ ko thực tế. “Tôi rất thích thấy những mô hình này thành công trong việc tiết ra một chuỗi tương tác, ví dụ như ‘Người đàn ông nhặt một cuốn sách từ kệ, đeo kính và ngồi xuống để đọc nó trong những lúc uống một tách cafe,'” Gupta nói.

Thảo Yến Blog CỘNG ĐỒNG VÀ CHIA SẺ ĐÁNH GIÁ, bạn là người yêu thích nội dung bài viết này. Hãy tặng cho chúng tôi xin 1 lượt Like, Share nhé. Xin cảm ơn Thảo Yến Blog chuyên RIVIU, Chia sẻ, Đánh giá, chọn lọc địa điểm, dịch vụ, công ty uy tín và chất lượng. Đặt quảng cáo tại đây zalo chính thức.

Bài viết cùng chủ đề:

Bài viết mới cập nhật:

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *