标签:语义理解

MMSearch

MMSearch是一个用于评估大型多模态模型(LMMs)作为AI搜索引擎能力的基准测试。包括一个MMSearch-Engine框架和MMSearch测试集,后者包含300个问题,涵盖14个...
阅读原文

商汤小浣熊

商汤小浣熊是商汤科技推出的“小浣熊”系列AI智能助手,已为数十万用户提供了数十亿次智能辅助服务,其中包括代码小浣熊和办公小浣熊,分别助力开发者轻松驾驭...
阅读原文

Sharly

Sharly 是一款先进的人工智能文档分析工具,专为研究人员、法律专家、项目经理和需要高效内容总结的专业人士设计。通过快速分析和整合大量文档信息,帮助用户...
阅读原文

neural frames

neural frames是一款基于人工智能的文本转视频工具,能将文字提示转换成动态内容,实现AI动画生成。适用于数字艺术、音乐视频和广告行业,提供了多种神经网络...
阅读原文

BANTER AI

BanterAI 是一个创新的AI平台,基于先进的技术让用户与名人的虚拟克隆体进行实时语音对话。平台提供一个沉浸式的体验,用户与喜欢的艺人、演员或历史人物的克...
阅读原文

CleanS2S

CleanS2S是一个流式语音到语音(S2S)交互智能体原型,提供高质量、实时的语音交互体验。CleanS2S项目基于单文件实现,简化配置和理解过程,便于用户和研究人...
阅读原文

Claude 3.5 Haiku

Claude 3.5 Haiku 是 Anthropic 公司推出的一款新型人工智能模型,保持与前代 Claude 3 Haiku 相近的速度和成本的同时,实现了在各项能力上的提升,在多项基...
阅读原文

Perplexity macOS客户端

Perplexity macOS客户端是Perplexity最新推出的AI搜索工具客户端版本,利用大模型提供精确的答案和更好的网页内容总结。Perplexity macOS客户端的特点是实时...
阅读原文

OpenSPG

OpenSPG是蚂蚁集团联合OpenKG社区推出的基于SPG框架的知识图谱引擎。OpenSPG融合LPG的结构性和RDF的语义性,克服RDF/OWL语义复杂难以落地的问题,继承LPG结构...
阅读原文

D-Edit

D-Edit是基于图像和文本的多功能图像编辑框架,基于预训练的扩散模型和独特的提示(prompts)实现对图像中特定项目的精确控制和编辑。框架能处理包括基于图像...
阅读原文

Amphion

Amphion是开源的音频、音乐和语音生成工具包,是香港中文大学(深圳)副教授武执政团队联合上海人工智能实验室和深圳市大数据研究院共同推出的。工具包支持可...
阅读原文

PromptPort

PromptPort是为ChatGPT用户设计的平台,专注于提示词的创作、优化和分享。PromptPort提供丰富的提示词库,用户直接用或根据需求进行创作和优化。平台支持网页...
阅读原文

Trag

Trag是AI代码审查工具,支持用户输入纯英文规则,在数秒内自动审查每个拉取请求。主要面向开发团队和个人开发者,解决传统代码审查过程中耗时、不一致和效率...
阅读原文

RuBii

RuBii是AI驱动的二次元角色创作平台,支持用户设计和定制个性化的虚拟角色,进行互动。在RuBii平台上,用户能探索和发现社区成员创造的角色,参与互动故事,...
阅读原文

pipio

pipio是视频自动AI配音工具,能保留原始声音的同时进行视频翻译,精确匹配说话者的唇部运动,使新语言的配音看起来自然无痕。pipio口型匹配技术提升33%、零损...
阅读原文
1234