AI工具

SDXL-Lightning – 字节跳动推出的文本到图像生成模型

SDXL-Lightning是由字节跳动的研究团队推出的一种基于扩散模型的文本到图像生成技术,旨在解决传统扩散模型在图像生成速度和计算成本上的局限性。该模型基于 ...

VideoPoet – 谷歌推出的AI视频生成模型

VideoPoet是由谷歌的研究团队开发的一种基于大模型的AI视频生成方案,支持从文本、图像或视频输入中合成高质量的视频内容,并生成匹配的音频。VideoPoet的核...

DiT – 基于Transfomer架构的扩散模型

DiT(Diffusion Transformers)是一种新型的扩散模型,由William Peebles(Sora的研发负责人之一) 与纽约大学助理教授谢赛宁提出,结合了去噪扩散概率模型(...

Boximator – 字节推出的控制视频生成中对象运动的框架

Boximator是有字节跳动的研究团队开发的一种视频合成技术,旨在生成丰富且可控的运动,以增强视频合成的质量和控制性。该技术通过引入两种类型的约束框(硬框...

V-JEPA:Meta推出的视觉模型,可以通过观看视频来学习理解物理世界

V-JEPA是由Meta的研究人员推出的一种新型的视频自监督学习方法,它专注于通过特征预测来学习视频的视觉表示。这种方法的核心思想是让模型能够预测视频中一个...

Depth Anything – Tiktok等推出的单目深度估计模型

Depth Anything是由来自Tiktok、香港大学和浙江大学的研究人员推出的一个为单目深度估计设计的深度学习模型,旨在处理各种情况下的图像并估计其深度信息。该...

AnimateDiff – 扩展文生图模型生成动画的框架

AnimateDiff是由上海人工智能实验室、香港中文大学和斯坦福大学的研究人员推出的一款将个性化的文本到图像模型扩展为动画生成器的框架,其核心在于它能够利用...

MotionCtrl – 腾讯等推出的视频生成模型的运动控制器

MotionCtrl是由来自腾讯和香港大学等机构的研究人员推出的一个为视频生成模型设计的统一且灵活的运动控制器,能够独立地控制视频中的相机运动和物体运动视角...

Genmo – AI生成视频、图片和动画的平台

Genmo是一个专注于人工智能的创意平台,用户可以在 Genmo 上创建视频、动画、图像等。该平台提供了一系列的工具和服务,旨在帮助用户通过AI技术轻松创作和分...

Make-A-Character:阿里开源的AI 3D数字人生成框架

Make-A-Character(简称Mach)是一个由阿里巴巴集团智能计算研究院开发的一个人工智能3D数字人生成框架,旨在通过文本描述快速创建逼真的3D角色。该系统特别...
1 15 16 17 18 19 24