AI文章资讯中心 | 第 9 页

SEED-Story – 腾讯推出的多模态故事生成模型

SEED-Story是腾讯联合香港科技大学、香港中文大学推出的多模态故事生成模型。基于多模态大语言模型（MLLM），能预测文本和视觉token，通过视觉de-tokenizer生...

AI项目和框架

2周前

PhotoMaker V2是腾讯推出的AI图像生成框架，能在极短的时间内生成逼真的人物照片。与初代相比，V2版本在角色的一致性和可控性上实现了显著提升，用户可以通过...

AI项目和框架

2周前

CogVideoX是智谱AI最新推出的开源AI视频生成模型，与智谱AI的商业产品“清影”同源。CogVideoX支持英文提示词，能生成6秒长、每秒8帧、分辨率为720*480的视频。...

AI项目和框架

2周前

Heeyo是一款专为3至11岁儿童设计的智能AI学习伙伴，提供2000多种互动学习游戏，涵盖阅读、科学、智力问答等。Heeyo AI学习伙伴支持20种语言，由顶尖教育机构...

AI工具

2周前

360AI助手是360集团联合15家国内顶尖AI大模型厂商共同推出的创新产品。整合了包括Kimi、智谱AI、豆包、商汤科技、讯飞星火、文心一言、通义千问等多个AI大模...

AI工具

2周前

MinerU是上海人工智能实验室OpenDataLab团队推出的开源智能数据提取工具，专注于复杂PDF文档的高效解析与提取。MinerU能将包含图片、公式、表格等元素的多模...

AI工具

2周前

Amuse 2.0是AMD最新推出的AI图像生成工具，专为AMD硬件优化，支持在PC上生成高质量图像。Amuse 2.0具备设计模式，能够将用户草图和文本提示转化为图像，同时...

AI工具

2周前

FoleyCrafter是上海人工智能实验室和香港中文大学（深圳）共同推出的AI视频配音框架，FoleyCrafter能自动听出视频中的动作，配上恰到好处的声音效果。不管是...

AI项目和框架

2周前

Whisper-Medusa是aiOla推出的开源AI语音识别模型，结合了OpenAI的Whisper技术与aiOla的创新，Whisper-Medusa引入了多头注意力机制，实现了并行处理，显著提升...

AI项目和框架

2周前

Tora是阿里推出的AI视频生成框架，基于轨迹导向的扩散变换器（DiT）技术，将文本、视觉和轨迹条件融合，生成高质量且符合物理世界动态的视频内容。Tora由轨迹...

AI项目和框架

2周前