AI工具

xAI为Grok AI助手推出的新图像生成模型

Aurora是xAI为AI助手Grok新增的图像生成模型。Aurora擅长创建逼真的图像,擅长人物肖像。Aurora能生成包括公共和版权人物在内的图像(如米老鼠)。Aurora 的...
阅读原文

One Shot, One Talk:中科大与香港理工携手打造创新动态图像生成技术,实现实时创作与智能化设计

One Shot, One Talk是先进的图像生成技术,能从单张图片中生成具有个性化细节的全身动态说话头像,支持逼真的动画效果,包括自然的表情变化和生动的身体动作...
阅读原文

办公小浣熊2.0:智能协作新体验,商汤AI办公助手赋能创作空间

办公小浣熊2.0是商汤科技推出的AI办公助手,集成数据分析、文档解析、智能规划和内容创作等AI功能。工具基于一站式创作空间,让用户在平台内完成所有工作任务...
阅读原文

智谱 AI 免费开放图像理解大模型

GLM-4V-Flash是智谱AI推出的专注于图像理解的AI模型,提供免费的API接口,支持用户上传图片URL或Base64编码图片获取详细的图像描述。模型简化图像分析流程,...
阅读原文

海螺AI Audio:智能语音合成助手打造自然流畅对话体验

海螺AI Audio是MiniMax推出的AI语音合成工具,能创建逼真的多语言、多声音和多情感的语音。用户只需提供30秒的音频素材,可以克隆特定人的声音,支持12种语言...
阅读原文

Meta AI推出的纯文本语言模型

Llama 3.3是Meta AI推出的70B 参数模型,大型多语言预训练语言模型,性能与40B参数的Llama 3.1相当。模型专为多语言对话优化,支持英语、德语、法语、意大利...
阅读原文

面试通:全方位AI面试助手,提升算法能力与简历优化的智能工具

面试通是基于AI技术的面试辅助工具,专为求职者设计,提高面试成功率。面试通能实时识别面试官的问题,快速生成专业回答,让求职者在面试中表现得更加自信和...
阅读原文

紫荆AI医生:清华推出42位AI医生覆盖21个科室的智能医疗平台

紫荆AI医生是清华大学智能产业研究院孵化的紫荆智康推出的AI医疗平台。系统基于Agent Hospital(也被称为“清华AI医院”),能模拟真实医院环境和患者病例,让A...
阅读原文

TensorOpera 开源的小语言模型系列

Fox-1是TensorOpera推出的一系列小型语言模型(SLMs),包括Fox-1-1.6B和Fox-1-1.6B-Instruct-v0.1。Fox-1模型在3万亿个网络抓取的文档数据上预训练,在50亿...
阅读原文

PaliGemma 2:DeepMind推出性视觉语言模型,实现跨媒体理解与生成

PaliGemma 2是Google DeepMind基于Gemma 2语言模型家族推出的新一代视觉语言模型(VLM),作为PaliGemma模型的升级版。结合SigLIP-So400m视觉编码器和不同规...
阅读原文

哈工大联合鹏城实验室推出的智能体框架

Optimus-1是哈尔滨工业大学(深圳)和鹏城实验室推出的智能体框架,能解决在开放世界环境中完成长期任务的挑战。框架结合结构化知识和多模态经验,让智能体更...
阅读原文

金数据:智能在线考试系统实现高效出题与自动化阅卷

金数据是AI在线考试软件,通过AI技术实现快速出题、自动组卷和智能阅卷。只需输入提示词或导入文档,可自动生成题库并组卷,大幅提高工作效率。支持在线考试...
阅读原文

AI虚拟社交平台,与虚拟角色沉浸式文字或语音交流

悬河是AI虚拟角色社交平台,支持用户与AI虚拟角色进行文字或语音交流,享受定制化的社交和情感支持。可以根据自己的喜好,选择或创建专属的AI角色,进行个性...
阅读原文

AI图片处理工具,支持多功能多格式图像编辑服务

photoeditor是基于人工智能技术的在线图片编辑工具,通过AI算法和图像处理技术,提供一系列丰富高效的图片编辑功能。支持JPG、PNG、WEBP、HEIC格式的照片,能...
阅读原文

ClearerVoice-Studio:智能语音处理框架助力多场景应用的高效解决方案

ClearerVoice-Studio 是阿里巴巴达摩院通义实验室开源的语音处理框架,集成语音增强、分离和音视频说话人提取等功能。框架基于复数域深度学习算法,有效消除...
阅读原文