实际文本到视频模型。
真实且一致地合成新视频。通过将图像或文本提示的构图和样式应用于源视频 (视频到视频) 的结构。或者,只使用文字 (文本到视频)。就像拍新的东西,什么都不拍。
Neural frames
InVideo
Manga TV
Quench AI
TokkingHeads
Phenaki