MusicFX – 谷歌推出的免费的AI音乐生成工具

Google MusicFX是谷歌推出的一款免费的人工智能音乐生成工具,基于谷歌的MusicLM模型和DeepMind的水印技术SynthID,可以创作长达70秒的曲子和loop循环。该工...

OLMo – 艾伦AI研究所开源的完全开放的大语言模型框架

OLMo(Open Language Model)是由Allen AI(AI2,艾伦AI研究所)开发的一个完全开源开放的大型语言模型(LLM)框架,设计初衷是为了通过开放研究,促进学术界...

ImageFX – 谷歌推出的人工智能图像生成工具

Google ImageFX是谷歌最新推出的一款人工智能图像生成工具,基于谷歌的 DeepMind 实验室开发的一个先进的文本到图像的生成模型 — Imagen 2。ImageFX 的设计目...

IP-Adapter – 腾讯开源的文本到图像扩散模型适配器

IP-Adapter(Image Prompt Adapter)是一种专门为预训练的文本到图像扩散模型(如Stable Diffusion)设计的适配器,目的是让文生图模型能够利用图像提示来生...

360AI搜索 – 360推出的新一代答案引擎

360AI搜索是360公司推出的一款集成了人工智能技术的搜索引擎,类似于Perplexity被设计为新一代答案引擎,旨在为用户提供更加精准、全面和智能的搜索体验。当...

Follow Your Pose – 开源的姿态全可控视频生成框架

Follow Your Pose是由清华大学、香港科技大学、腾讯AI Lab以及中科院的研究人员开源的一个基于文本到视频生成的框架,允许用户通过文本描述和指定的人物姿态...

Lepton Search – 开源的对话式AI搜索引擎项目

Lepton Search是由原阿里巴巴技术副总裁和AI科学家贾扬清创办的Lepton AI应用构建平台开源的一个对话式AI搜素引擎,该项目基于调用Lepton平台上的云端人工智...

Vary-toy:开源的小型视觉多模态模型

Vary-toy是一个小型的视觉语言模型(LVLM),由来自旷视、国科大、华中大的研究人员共同提出,旨在解决大型视觉语言模型(LVLMs)在训练和部署上的挑战。对于...

ActAnywhere – Adobe推出的AI视频背景生成模型

ActAnywhere是一个由斯坦福大学和Adobe Research的研究人员共同开发的视频生成模型,旨在解决视频背景生成的问题,特别是在需要将前景主体(如人物)与新背景...

DemoFusion – 免费开源的图像分辨率超清增强框架

DemoFusion是一个旨在低成本进行高分辨率图像生成的技术框架,通过扩展现有的开源生成人工智能模型(如Stable Diffusion),使得这些模型能够在不进行额外训...
1 40 41 42 43 44 52