标签:语义理解

Ovis1.6

Ovis1.6是阿里国际AI团队推出的多模态大模型,在多模态权威综合评测基准OpenCompass上取得了优异的成绩,特别是在30亿参数以下的模型中综合得分排名第一,超...
阅读原文

Llama 3.2

Llama 3.2是Meta公司最新推出的开源AI大模型系列,包括小型和中型视觉语言模型(11B和90B参数)以及轻量级纯文本模型(1B和3B参数)。Llama 3.2模型专为边缘...
阅读原文

GraphReasoning

GraphReasoning是一种基于人工智能技术将大量科学论文转换成知识图谱的方法。通过结构化分析,计算节点度、识别社区及其连通性,评估关键节点的中心性,来揭...
阅读原文

Phidias

Phidias是一个先进的3D内容生成模型,将检索增强生成(RAG)的概念引入到3D建模领域。模型能基于用户提供的或从大型数据库中检索到的3D参考模型,辅助生成新...
阅读原文

CapsWriter-Offline

CapsWriter-Offline是一款高效的PC端离线语音输入和字幕转录工具,支持用户通过简单的按键操作实现实时语音转文字。软件适合快速记录和转写大量语音信息的场...
阅读原文

MMSearch

MMSearch是一个用于评估大型多模态模型(LMMs)作为AI搜索引擎能力的基准测试。包括一个MMSearch-Engine框架和MMSearch测试集,后者包含300个问题,涵盖14个...
阅读原文

商汤小浣熊

商汤小浣熊是商汤科技推出的“小浣熊”系列AI智能助手,已为数十万用户提供了数十亿次智能辅助服务,其中包括代码小浣熊和办公小浣熊,分别助力开发者轻松驾驭...
阅读原文

Sharly

Sharly 是一款先进的人工智能文档分析工具,专为研究人员、法律专家、项目经理和需要高效内容总结的专业人士设计。通过快速分析和整合大量文档信息,帮助用户...
阅读原文

neural frames

neural frames是一款基于人工智能的文本转视频工具,能将文字提示转换成动态内容,实现AI动画生成。适用于数字艺术、音乐视频和广告行业,提供了多种神经网络...
阅读原文

BANTER AI

BanterAI 是一个创新的AI平台,基于先进的技术让用户与名人的虚拟克隆体进行实时语音对话。平台提供一个沉浸式的体验,用户与喜欢的艺人、演员或历史人物的克...
阅读原文

CleanS2S

CleanS2S是一个流式语音到语音(S2S)交互智能体原型,提供高质量、实时的语音交互体验。CleanS2S项目基于单文件实现,简化配置和理解过程,便于用户和研究人...
阅读原文

Claude 3.5 Haiku

Claude 3.5 Haiku 是 Anthropic 公司推出的一款新型人工智能模型,保持与前代 Claude 3 Haiku 相近的速度和成本的同时,实现了在各项能力上的提升,在多项基...
阅读原文

Perplexity macOS客户端

Perplexity macOS客户端是Perplexity最新推出的AI搜索工具客户端版本,利用大模型提供精确的答案和更好的网页内容总结。Perplexity macOS客户端的特点是实时...
阅读原文

OpenSPG

OpenSPG是蚂蚁集团联合OpenKG社区推出的基于SPG框架的知识图谱引擎。OpenSPG融合LPG的结构性和RDF的语义性,克服RDF/OWL语义复杂难以落地的问题,继承LPG结构...
阅读原文

D-Edit

D-Edit是基于图像和文本的多功能图像编辑框架,基于预训练的扩散模型和独特的提示(prompts)实现对图像中特定项目的精确控制和编辑。框架能处理包括基于图像...
阅读原文