SEED-Story – 腾讯推出的多模态故事生成模型

SEED-Story是腾讯联合香港科技大学、香港中文大学推出的多模态故事生成模型。基于多模态大语言模型(MLLM),能预测文本和视觉token,通过视觉de-tokenizer生...

PhotoMaker V2 – 腾讯推出的AI图像生成框架

PhotoMaker V2是腾讯推出的AI图像生成框架,能在极短的时间内生成逼真的人物照片。与初代相比,V2版本在角色的一致性和可控性上实现了显著提升,用户可以通过...

CogVideoX – 智谱AI推出的开源AI视频生成模型

CogVideoX是智谱AI最新推出的开源AI视频生成模型,与智谱AI的商业产品“清影”同源。CogVideoX支持英文提示词,能生成6秒长、每秒8帧、分辨率为720*480的视频。...

Heeyo – 专为3至11岁儿童设计的智能AI学习伙伴

Heeyo是一款专为3至11岁儿童设计的智能AI学习伙伴,提供2000多种互动学习游戏,涵盖阅读、科学、智力问答等。Heeyo AI学习伙伴支持20种语言,由顶尖教育机构...

360AI助手 – 360联合15家大模型厂商推出的AI助手产品

360AI助手是360集团联合15家国内顶尖AI大模型厂商共同推出的创新产品。整合了包括Kimi、智谱AI、豆包、商汤科技、讯飞星火、文心一言、通义千问等多个AI大模...

MinerU – OpenDataLab推出的开源智能数据提取工具

MinerU是上海人工智能实验室OpenDataLab团队推出的开源智能数据提取工具,专注于复杂PDF文档的高效解析与提取。MinerU能将包含图片、公式、表格等元素的多模...

Amuse AI – AMD推出的AI图像生成工具

Amuse 2.0是AMD最新推出的AI图像生成工具,专为AMD硬件优化,支持在PC上生成高质量图像。Amuse 2.0具备设计模式,能够将用户草图和文本提示转化为图像,同时...

FoleyCrafter – 上海人工智能实验室推出的AI视频配音框架

FoleyCrafter是上海人工智能实验室和香港中文大学(深圳)共同推出的AI视频配音框架,FoleyCrafter能自动听出视频中的动作,配上恰到好处的声音效果。不管是...

Whisper-Medusa – aiOla推出的开源AI语音识别模型

Whisper-Medusa是aiOla推出的开源AI语音识别模型,结合了OpenAI的Whisper技术与aiOla的创新,Whisper-Medusa引入了多头注意力机制,实现了并行处理,显著提升...

Tora – 阿里推出的AI视频生成框架

Tora是阿里推出的AI视频生成框架,基于轨迹导向的扩散变换器(DiT)技术,将文本、视觉和轨迹条件融合,生成高质量且符合物理世界动态的视频内容。Tora由轨迹...
1 7 8 9 10 11 52