LTX Studio是由知名AI平台Lightricks(Facetune、Videoleap和Photoleap背后的公司)推出的一款创新的生成式AI电影制作和视频短片生成平台,允许用户仅通过输入文本描述就能够生成超过25秒的微电影视频。LTX Studio提供了一个可视化的专业视频控制台,用户可以通过这个控制台对视频的多个方面进行精准控制,包括镜头切换、角色设计、场景一致性、摄像机角度、灯光效果等。
LTX Studio目前处于免费内测,Lightricks计划在3月27日开启LTX Studio的第一批公开测试,感兴趣的用户可以前往其官网(https://ltx.studio/)点击Join the Waitlist并填写邮箱免费申请试用。
HART(Hybrid Autoregressive Transformer)是麻省理工学院研究团队推出的自回归视觉生成模型。能直接生成1024×1024像素的高分辨率图像,质量媲美扩散模型。HART基于混合Tokenizer技术,将自动编码器的连续潜在表示分解为离散token和连续token,其中离散token负责捕捉图像的主要结构,连续token专注于细节。
AI教程资讯
2025-02-02
WebDreamer是俄亥俄州立大学和Orby AI研究团队推出的基于模型规划的网络智能体,基于大型语言模型(LLMs),特别是GPT-4o,作为世界模型预测网站上的交互结果。框架模拟可能的用户行为和结果,帮助网络代理在复杂的网络环境中进行有效的规划和决策。
AI教程资讯
2025-02-02
Kandinsky-3是基于潜在扩散模型的文本到图像(T2I)生成框架,以高质量和逼真度在图像合成领域脱颖而出。Kandinsky-3能适应多种图像生成任务,包括文本引导的修复 扩展、图像融合、文本-图像融合及视频生成等。研究者们推出一个简化版本的T2I模型版本,该版本在保持图像质量的同时,将推理速度提高3倍,仅需4步逆向过程即可完成。
AI教程资讯
2025-02-02
CAVIA是苹果公司、得克萨斯大学奥斯汀分校、谷歌联合推出的多视角视频生成框架,能将单一输入图像转换成多个时空一致的视频序列。框架基于引入视角集成注意力模块,增强视频的视角一致性和时间连贯性,支持用户精确控制相机运动,同时保留对象运动。
AI教程资讯
2025-02-02