AI文章资讯中心 | 第 4 页

Gemini Live – 谷歌推出的多模态AI语音助手

Gemini Live是谷歌推出的智能语音助手，具有自然语言理解和多模态识别能力，支持图像、视频和语音交互。用户可通过语音指令控制，实现日常任务自动化。Gemini...

AI工具

5天前

Clapper 是一款免费开源的可视化AI视频编辑工具，由 HuggingFace 的AI前端工程师 Julian Bilcke 开发。集成多种生成式 AI 技术，用户通过交互式、迭代和直观...

AI工具

6天前

醒蓝AI是一款AI照片生成工具，支持一键生成AI形象照，用户能够轻松制作工作形象照、写真照、证件照和AI换脸照片。醒蓝AI还提供API接口和定制化解决方案，满足...

AI工具

6天前

Falcon Mamba 7B是阿联酋技术创新研究所（TII）推出的开源AI大模型，性能超越了Meta的Llama 3.1-8B等模型。Falcon Mamba 7B采用编码器-解码器结构和多头注意...

AI项目和框架

6天前

ASAM（Adversarial Adjustment of Segment Anything Model）是vivo公司推出的AI图像分割模型，通过对抗性调整来增强原有SAM模型的性能。ASAM用自然对抗性示例...

AI项目和框架

6天前

MDT-A2G是复旦大学和腾讯优图联合推出的AI模型，专门用于根据语音内容同步生成相应的手势动作。MDT-A2G模仿人类在交流时自然产生的手势，计算机能更加生动和...

AI项目和框架

6天前

Genie是Cosine AI推出的AI编程助手，能像人类一样快速解决软件编程问题，仅需84秒即可完成代码编写和运行。Genie能模仿人类程序员的思考方式，自动解析问题、...

AI工具

6天前

Mini-Monkey是华中科技大学和华南理工大学联合推出的轻量级多模态AI模型。采用多尺度自适应切分策略（MSAC）和尺度压缩机制（SCM），有效解决了传统图像切分...

AI项目和框架

6天前

MotionClone是文本驱动的AI视频动作克隆框架，通过时间注意力机制从参考视频中克隆动作，结合文本提示词生成新视频。能处理复杂的全局相机运动和精细的局部肢...

AI项目和框架

6天前

ReSyncer是清华大学和百度联合推出的AI视频编辑工具，通过音频驱动生成与声音同步的高质量嘴唇动作视频。ReSyncer用Style-SyncFormer分析声音并创建3D面部模...

AI项目和框架

6天前