AI工具

AI文本转语音工具,支持多语言转换、调整语速、音调、情感表达

Speechelo是先进的AI文本转语音软件,能将文本内容迅速转换成自然、逼真的人类语音。Speechelo能在语音中添加语调,提供超过30种听起来像人类的声音,支持24...
阅读原文

博查推出的语义排序模型

Bocha Semantic Reranker是博查AI推出的语义排序模型,能提升搜索应用和RAG应用中的搜索结果准确性。Bocha Semantic Reranker模型基于文本语义,对初步排序的...
阅读原文

AI写作工具,快速生成高质量多类型的电子邮件文案

Hoppy Copy是基于AI技术帮助营销人员撰写和优化电子邮件营销内容的平台。Hoppy Copy提供AI文案生成、编辑工具、通讯制作、序列计划、竞争对手监测、垃圾邮件...
阅读原文

Veo 2:高分辨率4K视频生成的先进AI模型,助力创意无限

Veo 2 是 Google DeepMind 推出的 AI 视频生成模型,能根据文本或图像提示生成高质量视频内容。Veo 2支持高达 4K 分辨率的视频制作,理解镜头控制指令,能模...
阅读原文

百度文库推出的智能学习助手

AI考研宝典是百度文库推出的智能学习助手,专为考研学生打造。AI考研宝典集成AI拍图写作、智能问答、文档总结、时政速记、英语作文美化等功能,能提升学习效...
阅读原文

清华开源的双臂机器人扩散基础模型

RDT(Robotics Diffusion Transformer)是清华大学AI研究院TSAIL团队推出的全球最大的双臂机器人操作任务扩散基础模型。RDT具备十亿参数量,能在无需人类操控...
阅读原文

AI浏览器助手,实时分析浏览器内容、提供建议和自动撰写邮件等功能

TwinMind 是智能AI侧边栏助手,基于理解用户的视觉和听觉输入提升工作效率。支持无缝集成至用户喜爱的平台,提供实时转录和内容理解功能。TwinMind强调隐私保...
阅读原文

AI英文论文写作工具,百万篇学术文献训练而成

Paperpal是AI英文写作工具,集成了语言编辑、文本改写与生成、投稿检查等核心功能,基于经过数百万篇已发表学术文章训练的AI技术,提供实时、特定学科的语言...
阅读原文

阿里开源的语音生成大模型

CosyVoice 2.0 是阿里巴巴通义实验室推出的CosyVoice语音生成大模型升级版,模型用有限标量量化技术提高码本利用率,简化文本-语音语言模型架构,推出块感知...
阅读原文

AI内容整理和创作平台,快速从网页、视频、播客等来源中提取信息

YouMind是AI驱动的内容整理和创作平台,支持用户从网页、视频、播客等多种来源中提取和保存信息,并将信息转化为创意作品。YouMind基于Anthropic、OpenAI和Me...
阅读原文

AI视频创作平台,从文案、分镜脚本、编辑的全流程AI赋能

ShowBiz AI 是当虹科技推出的专业级AI视频创作平台,基于BlackEye多模态视听大模型,专为视频创作而设计。ShowBiz AI具备文本转动画的能力,简化动画制作流程...
阅读原文

无问芯穹开源的端侧全模态理解模型

Megrez-3B-Omni是无问芯穹推出的全球首个端侧全模态理解开源模型,能处理图像、音频和文本三种模态数据。Megrez-3B-Omni在多个主流测试集上展现出超越34B模型...
阅读原文

无需微调的推理框架,提升扩散模型生成能力首次实现8K分辨率图像

FreeScale是南洋理工大学、阿里巴巴集团和复旦大学推出无需微调的推理框架,提升预训练扩散模型生成高分辨率图像和视频的能力。FreeScale基于处理和融合不同...
阅读原文

西工大联合微软和香港大学推出的说唱乐生成模型

Freestyler是西北工业大学计算机科学学院音频、语音与语言处理小组(ASLP@NPU)、微软及香港中文大学深圳研究院大数据研究所共同推出的说唱乐生成模型,能直...
阅读原文

Snap联合港科大等机构推出的移动端文生图模型

SnapGen是Snap Inc、香港科技大学、墨尔本大学等机构联合推出的文本到图像(T2I)扩散模型,能在移动设备上快速生成高分辨率(1024x1024像素)的图像,且只需...
阅读原文