AI工具

Moshi

Moshi是由法国的的人工智能研究实验室Kyutai推出的一款端到端实时音频多模态AI模型,拥有听、说、看的能力,并能模拟70种不同的情绪和风格进行交流。作为对标...
阅读原文

Kimi浏览器插件

Kimi浏览器插件是月之暗面科技有限公司推出的一款官方工具,它集成了即时问答、全文摘要和划线互动等实用功能。用户可以轻松划线提问,获取上下文相关答案,...
阅读原文

EchoMimic

EchoMimic是阿里蚂蚁集团推出的AI数字人开源项目,赋予静态图像以生动语音和表情。通过深度学习模型结合音频和面部标志点,创造出高度逼真的动态肖像视频。不...
阅读原文

MimicMotion

MimicMotion是腾讯的研究人员推出的一个高质量的人类动作视频生成框架,利用置信度感知的姿态引导技术,确保视频帧的高质量和时间上的平滑过渡。此外,MimicM...
阅读原文

FunAudioLLM

FunAudioLLM是阿里巴巴通义实验室推出的开源语音大模型项目,包含SenseVoice和CosyVoice两个模型。SenseVoice擅长多语言语音识别和情感辨识,支持超过50种语...
阅读原文

GPT-4o mini

GPT-4o mini 是 OpenAI 最新推出的一款AI大模型,提供更高效、更具成本效益的解决方案。这款新模型替代 GPT-3.5,成为市场上最具成本效益的小型模型。GPT-4o ...
阅读原文

盘盘单词

盘盘单词是百度网盘推出的AI英语学习微信小程序。采用生成式AI技术,分析用户百度网盘的照片,提取关键元素,自动生成与用户生活紧密相关的英语单词和例句,...
阅读原文

STORM AI

STORM AI 是斯坦福大学推出的开源AI写作工具,可在几秒钟内将一个主题转换为长篇文章/研究论文,完全免费,是 Perplexity Pages 的一种 替代品 。STORM AI 利...
阅读原文

PixVerse V2

PixVerse V2是爱诗科技最新发布的AI视频生成产品,基于Diffusion+Transformer(DiT)架构,提供更长、更一致、更有趣的视频生成体验。引入自研时空注意力机制...
阅读原文

智谱清影

智谱清影是智谱AI最新推出的AI视频生成工具,用户只需输入文本或上传图片,30秒内即可生成6秒视频。支持多种风格和背景音乐,适用于个人创作和专业制作。

Kimi PPT助手

Kimi PPT助手是月之暗面联合AiPPT推出的一键生成PPT服务。用户只需通过语音或文字指令,Kimi就能理解需求,自动生成幻灯片,提供布局和色彩搭配建议,帮助用...
阅读原文

CrushOn AI

CrushOn AI 是 Peekaboo Game Limited 推出的 AI 角色扮演聊天应用,允许用户与 AI 生成的角色进行深入对话和角色扮演。自 2023 年 9 月发布后,用户量激增,...
阅读原文

GPT-4o Long Output模型

GPT-4o Long Output模型是OpenAI最新推出的超长输出AI模型,支持高达64k tokens的长文本输出,相当于约200页小说。相较于原GPT-4o模型,输出能力提升16倍,但...
阅读原文

MindSearch

MindSearch是上海人工智能实验室联合研发团队推出的开源AI搜索框架,结合了大规模信息搜集和整理能力。利用InternLM2.5 7B对话模型,MindSearch能在3分钟内从...
阅读原文

Get笔记

Get笔记是得到推出的免费AI实时语音转文字小程序。具备高准确率的语音识别技术,帮助用户将语音快速转换为文本,提供文本润色功能,优化笔记内容。用户界面简...
阅读原文