AI文章资讯中心 | 第 38 页

Follow-Your-Click – 腾讯等开源的图像到视频模型，可生成局部动画

Follow-Your-Click是一个由来自腾讯公司（混元团队）联合清华大学和香港科技大学的研究人员共同研发的图像到视频（Image-to-Video，简称I2V）生成模型，允许...

AI工具

5个月前

ComflowySpace是一款专为简化和增强AI图像及视频生成工具使用体验而设计的开源软件，基于ComfyUI和Stable Diffusion，旨在提供一个更加用户友好和高效的工作...

AI工具

5个月前

Pix2Gif是由微软研究院的研究人员提出的一个基于运动引导的扩散模型，专门用于将静态图像转换成动态的GIF动画/视频。该模型通过运动引导的扩散过程来实现图像...

AI工具

5个月前

Transformer Debugger (TDB) 是由 OpenAI 的对齐团队（Superalignment）开发的一款工具，旨在帮助研究人员和开发者更深入地理解和分析 Transformer 模型的内...

AI工具

5个月前

ELLA（Efficient Large Language Model Adapter，高效的大模型适配器）是由腾讯的研究人员推出的一种新型方法，旨在提升文本到图像生成模型在处理复杂文本提...

AI工具

5个月前

PixArt-Σ是由来自华为诺亚方舟实验室、大连理工大学和香港大学的研究人员推出的一个基于扩散Transformer架构（DiT）的文生图模型，专门设计用于从文本提示直...

AI工具

5个月前

Moondream是一个免费开源的小型的人工智能视觉语言模型，虽然参数量小但可以提供高性能的视觉处理能力，可在本地计算机甚至移动设备或 Raspberry Pi 上运行，...

AI工具

6个月前

AtomoVideo是由阿里巴巴的研究团队提出的一个高保真图像到视频（I2V）生成框架，旨在从输入的静态图像生成高质量的视频内容。该框架能够保持生成视频与给定参...

AI工具

6个月前

ResAdapter是由字节跳动的研究人员推出的一种为扩散模型（如Stable Diffusion）设计的分辨率适配器，允许这些图像生成模型生成具有任意分辨率和宽高比的图像...

AI工具

6个月前

ScreenAI是一个由谷歌的研究团队推出的可读屏AI视觉语言模型，专门设计用于理解和处理用户界面（UI）和信息图表。该模型基于PaLI架构结合了视觉和语言处理的...

AI工具

6个月前