AI工具

MetaGPT – 多个AI智能体协作分工的框架

MetaGPT是一个创新的元编程框架,结合了大语言模型和多智能体协作系统,旨在通过模拟人类工作流程来解决复杂问题。该框架的核心在于将标准化操作程序(SOPs)...

DiffusionGPT – 开源的大模型驱动的文本到图像生成系统

DiffusionGPT是由来自字节跳动与中山大学的研究人员推出的一个开源的大模型(LLM)驱动的文本到图像生成系统,旨在解决文生图领域无法处理不同的输入或者仅限...

MusicFX – 谷歌推出的免费的AI音乐生成工具

Google MusicFX是谷歌推出的一款免费的人工智能音乐生成工具,基于谷歌的MusicLM模型和DeepMind的水印技术SynthID,可以创作长达70秒的曲子和loop循环。该工...

OLMo – 艾伦AI研究所开源的完全开放的大语言模型框架

OLMo(Open Language Model)是由Allen AI(AI2,艾伦AI研究所)开发的一个完全开源开放的大型语言模型(LLM)框架,设计初衷是为了通过开放研究,促进学术界...

ImageFX – 谷歌推出的人工智能图像生成工具

Google ImageFX是谷歌最新推出的一款人工智能图像生成工具,基于谷歌的 DeepMind 实验室开发的一个先进的文本到图像的生成模型 — Imagen 2。ImageFX 的设计目...

IP-Adapter – 腾讯开源的文本到图像扩散模型适配器

IP-Adapter(Image Prompt Adapter)是一种专门为预训练的文本到图像扩散模型(如Stable Diffusion)设计的适配器,目的是让文生图模型能够利用图像提示来生...

360AI搜索 – 360推出的新一代答案引擎

360AI搜索是360公司推出的一款集成了人工智能技术的搜索引擎,类似于Perplexity被设计为新一代答案引擎,旨在为用户提供更加精准、全面和智能的搜索体验。当...

Follow Your Pose – 开源的姿态全可控视频生成框架

Follow Your Pose是由清华大学、香港科技大学、腾讯AI Lab以及中科院的研究人员开源的一个基于文本到视频生成的框架,允许用户通过文本描述和指定的人物姿态...

Lepton Search – 开源的对话式AI搜索引擎项目

Lepton Search是由原阿里巴巴技术副总裁和AI科学家贾扬清创办的Lepton AI应用构建平台开源的一个对话式AI搜素引擎,该项目基于调用Lepton平台上的云端人工智...

Vary-toy:开源的小型视觉多模态模型

Vary-toy是一个小型的视觉语言模型(LVLM),由来自旷视、国科大、华中大的研究人员共同提出,旨在解决大型视觉语言模型(LVLMs)在训练和部署上的挑战。对于...
1 16 17 18 19 20 24