AI项目和框架

AI工具集介绍和收录了当前流行的AI研究项目和框架,紧跟最新AI领域的进展,解读AI研究论文和方法框架,帮你快速了解这些项目的工作原理。

GPT-4o Long Output模型 – OpenAI最新推出的超长输出模型

GPT-4o Long Output模型是OpenAI最新推出的超长输出AI模型,支持高达64k tokens的长文本输出,相当于约200页小说。相较于原GPT-4o模型,输出能力提升16倍,但...

Llama3.1 – Meta最新发布的最强开源AI模型

Llama 3.1是Meta最新发布的开源AI模型,包括8B、70B和405B三个版本,其中405B版本以其4050亿参数量成为目前最大的开源模型之一。Llama 3.1支持128K的上下文长...

LivePortrait – 快手推出的开源人像动画生成框架

LivePortrait是快手推出的开源人像动画生成框架,专注于高效、可控地将驱动视频的表情和姿态迁移至静态或动态人像,创造出富有表现力的视频。该技术通过隐式...

DCLM-7B – 苹果公司与合作团队推出的开源小模型

DCLM-7B是由苹果公司联合研究团队推出的70亿参数开源小模型,性能超越Mistral-7B,接近Llama 3和Gemma。最近,苹果公司作为 DataComp-LM(DCLM)项目的研究机...

STORM AI – 斯坦福大学推出的开源AI写作工具

STORM AI 是斯坦福大学推出的开源AI写作工具,可在几秒钟内将一个主题转换为长篇文章/研究论文,完全免费,是 Perplexity Pages 的一种 替代品 。STORM AI 利...

Mem0 – 一款开源的大语言模型记忆增强工具

Mem0 是一款开源的大语言模型记忆增强工具,能够让 AI 拥有长期、适应性强的记忆。通过自适应记忆系统,AI能实现跨应用记住用户的偏好和交互,提供连贯且不断...

Chameleon – Meta推出的图文混合多模态开源模型

Chameleon 是 Meta(Facebook 的母公司)的人工智能研究团队 FAIR(Facebook AI Research)发布的一个能理解和生成任意序列的图像和文本的混合多模态模型。拥...

FunAudioLLM – 阿里巴巴通义团队推出的开源语音大模型

FunAudioLLM是阿里巴巴通义实验室推出的开源语音大模型项目,包含SenseVoice和CosyVoice两个模型。SenseVoice擅长多语言语音识别和情感辨识,支持超过50种语...

MimicMotion – 腾讯联合上海交大推出的AI视频生成框架

MimicMotion是腾讯与上海交通大学合作推出的AI视频生成框架。用户只需提供一张图片和一段参考视频,即可一键生成逼真的人类动作视频,适用于舞蹈、运动等多种...

EchoMimic – 阿里推出的开源数字人项目,赋予静态图像以生动语音和表情

EchoMimic是阿里蚂蚁集团推出的AI数字人开源项目,赋予静态图像以生动语音和表情。通过深度学习模型结合音频和面部标志点,创造出高度逼真的动态肖像视频。不...
1 5 6 7 8 9 19