Bark

Bark是Suno AI 推出的开源文本到音频模型,能生成逼真的多语言语音和多种音频类型,包括音乐、背景噪音等,同时支持非语言交流如笑声和哭泣。Bark提供预训练...
阅读原文

eSearch

eSearch是一款开源的跨平台AI桌面应用,集成了截屏、OCR识别、搜索翻译、贴图、以图搜图和屏幕录制等功能。eSearch基于Electron框架开发,适用于Linux、Windo...
阅读原文

Sapiens

Sapiens是Meta实验室推出的AI视觉模型,专为理解图片和视频中的人类动作设计。支持二维姿势预估、身体部位分割、深度估计和表面法线预测等任务,采用视觉转换...
阅读原文

TrackGo

TrackGo是先进的可控AI视频生成技术,通过用自由形状的遮罩和箭头,为用户提供了一种灵活而精确的机制来控制视频中对象的运动。技术的核心是TrackAdapter,一...
阅读原文

GPT Pilot

GPT Pilot 是一款AI编程工具,通过模仿人类开发者的工作流程,帮助从零开始构建应用程序。能编写代码、调试程序、与用户讨论问题,并请求代码审查,是真正的 ...
阅读原文

AskHackers

AskHackers是一个面向开发者的AI搜索工具,专注于技术领域的问答。通过分析Hacker News的评论区,基于AI技术自动生成问题的答案,为用户提供了一种新的获取编...
阅读原文

mPLUG-Owl3

mPLUG-Owl3是阿里巴巴推出的先进通用多模态大模型,专为理解和处理多图及长视频设计。在保持准确性的同时,显著提升了推理效率,能在4秒内分析完2小时电影。
阅读原文

Lingo

Lingo 是西湖心辰推出的国内首个端到端语音大模型,在技术上具备实时打断、实时指令控制、超级拟人、能说会唱等能力,拥有比 GPT-4o 更出色的中文语音效果。
阅读原文

度豆

度豆是百度推出的仿真人AI社交APP,24小时陪你聊天。度豆提供多样化的AI数字人角色与用户进行互动,用户可以通过文字、语音或图片与AI伙伴交流,享受个性化的...
阅读原文

AIChatru.ru

AIChatru.ru 是一个提供多种顶尖大模型的免费在线AI聊天平台。用户可以直接在AIChatru.ru 上使用 GPT4o mini、GPT-4o、Claude 3.5 Sonnet 和 Claude Opus,无...
阅读原文

山海大模型

山海大模型是云知声推出的多模态AI大模型,具备丰富的知识储备和多模态交互能力。山海大模型能通过文本、音频、图像等多种形式与用户进行实时互动,提供信息...
阅读原文

Amazon Q

Amazon Q是亚马逊推出的专为IT专业人士和开发人员设计的AI助手,通过自然语言处理和机器学习技术,帮助用户快速获取信息、解决问题并提高工作效率。能连接多...
阅读原文

AIEditor

AIEditor是面向 AI 的下一代富文本编辑器,AIEditor基于 Web Component 开发,支持 Layui、Vue、React、Angular、Svelte 等几乎任何前端框架。AIEditor适配了...
阅读原文

SuperCraft

SuperCraft是一个创新的无限协作画布的AI设计平台,基于生成式AI技术将草图转化为高质量的实物产品。允许用户从手绘草图或文本提示开始,快速将想法转化为逼...
阅读原文

Omages

Omages是一个开源的3D模型生成项目,基于图像扩散技术将3D形状的几何和纹理信息编码进64x64像素的2D图像中,从而简化3D建模流程。
阅读原文