AI项目和框架

AI工具集介绍和收录了当前流行的AI研究项目和框架，紧跟最新AI领域的进展，解读AI研究论文和方法框架，帮你快速了解这些项目的工作原理。

新ControlNeXt – AI图像和视频可控生成框架

ControlNeXt是一种新型的AI图像和视频可控生成框架，由香港中文大学和商汤科技联合开发。采用轻量化控制模块和创新的交叉归一化技术，大幅降低计算资源和训练...

AI项目和框架

24小时前

AI Scientist是Sakana AI推出的首个全自动科学发现AI系统。能独立完成从创意生成、编码、实验执行到撰写科学论文的整个研究流程。

AI工具

1天前

VITA是腾讯优图实验室推出的全球首个开源多模态大语言模型（MLLM），能理解和处理视频、图像、文本和音频。基于Mixtral 8×7B模型，扩展了中文词汇量，进行了...

AI项目和框架

2天前

Linly-Dubbing是一个开源的智能视频多语言AI配音和翻译工具，能自动将视频内容翻译成多种语言，并生成字幕。通过WhisperX和FunASR进行精准语音识别，基于Edge...

AI项目和框架

2天前

Cradle是面向通用计算机控制（General Computer Control, GCC）的多模态AI Agent框架，由昆仑万维携手北京智源人工智能研究院、新加坡南洋理工大学、北京大学...

AI项目和框架

2天前

ORMBG是开源的AI图像分割工具，由开发者schirrmacher在GitHub上发起。ORMBG专注于从图片中准确去除背景，用先进的图像处理技术，实现对图像中前景和背景的精...

AI项目和框架

2天前

HumanVid是香港中文大学和上海人工智能实验室共同推出的高质量数据集，专为人类图像动画训练设计。结合了现实世界视频和合成数据，通过精心设计的规则筛选高...

AI项目和框架

2天前

HoloDreamer是北京大学联合鹏城实验室推出的AI文本驱动3D场景生成框架。通过两个核心模块：风格化全景图生成和增强两阶段全景图重建，从文本描述中快速生成沉...

AI项目和框架

2天前

Buzz是一款基于OpenAI Whisper模型构建的离线语音转文字工具，适用于Windows、macOS和Linux系统。Buzz能将麦克风输入或音频、视频文件实时转换为文字，支持多...

AI工具

2天前

LabelU 是一款开源的多模态数据标注工具，支持图像、视频和音频的标注，具备拉框、多边形、标点、标线、分类、描述等图像标注能力，能满足目标检测、图像分类...

AI工具

2天前

1 2 3 … 19