Gemini Live – 谷歌推出的多模态AI语音助手

Gemini Live是谷歌推出的智能语音助手,具有自然语言理解和多模态识别能力,支持图像、视频和语音交互。用户可通过语音指令控制,实现日常任务自动化。Gemini...

Clapper – 免费开源的可视化AI视频编辑工具

Clapper 是一款免费开源的可视化AI视频编辑工具,由 HuggingFace 的AI前端工程师 Julian Bilcke 开发。集成多种生成式 AI 技术,用户通过交互式、迭代和直观...

醒蓝AI – AI照片生成工具,支持一键生成AI形象照

醒蓝AI是一款AI照片生成工具,支持一键生成AI形象照,用户能够轻松制作工作形象照、写真照、证件照和AI换脸照片。醒蓝AI还提供API接口和定制化解决方案,满足...

Falcon Mamba 7B – 首个通用Mamba开源AI大模型

Falcon Mamba 7B是阿联酋技术创新研究所(TII)推出的开源AI大模型,性能超越了Meta的Llama 3.1-8B等模型。Falcon Mamba 7B采用编码器-解码器结构和多头注意...

ASAM – vivo公司推出的AI图像分割模型

ASAM(Adversarial Adjustment of Segment Anything Model)是vivo公司推出的AI图像分割模型,通过对抗性调整来增强原有SAM模型的性能。ASAM用自然对抗性示例...

MDT-A2G – 复旦&腾讯优图推出的AI模型,可根据语音同步生成手势

MDT-A2G是复旦大学和腾讯优图联合推出的AI模型,专门用于根据语音内容同步生成相应的手势动作。MDT-A2G模仿人类在交流时自然产生的手势,计算机能更加生动和...

Genie – Cosine AI推出的AI编程助手

Genie是Cosine AI推出的AI编程助手,能像人类一样快速解决软件编程问题,仅需84秒即可完成代码编写和运行。Genie能模仿人类程序员的思考方式,自动解析问题、...

Mini-Monkey – 华科联合华南理工推出的多模态AI模型

Mini-Monkey是华中科技大学和华南理工大学联合推出的轻量级多模态AI模型。采用多尺度自适应切分策略(MSAC)和尺度压缩机制(SCM),有效解决了传统图像切分...

MotionClone – 文本驱动的AI视频动作克隆框架

MotionClone是文本驱动的AI视频动作克隆框架,通过时间注意力机制从参考视频中克隆动作,结合文本提示词生成新视频。能处理复杂的全局相机运动和精细的局部肢...

ReSyncer – 清华联合百度推出的AI视频编辑工具

ReSyncer是清华大学和百度联合推出的AI视频编辑工具,通过音频驱动生成与声音同步的高质量嘴唇动作视频。ReSyncer用Style-SyncFormer分析声音并创建3D面部模...
1 2 3 4 5 6 52