标签:自然语言处理

Agent-S

Agent-S 是创新的代理框架,旨在基于图形用户界面(GUI)实现人机交互的自动化。Agent-S 基于模拟人类的操作方式,用鼠标和键盘直接与计算机交互,处理复杂的...
阅读原文

Voiceflow

Voiceflow是一个无代码对话式人工智能平台,旨在帮助用户快速创建和部署AI代理,以自动化客户服务和提升用户体验。通过直观的拖放界面,用户可以设计复杂的对...
阅读原文

scenario

scenario是一个专为游戏开发者设计的AI平台,基于先进的人工智能技术,可以帮助用户快速生成风格一致且高质量的游戏资产,如角色、场景和道具等。用户可以上...
阅读原文

fal

al是一个面向开发者的AI平台,专注于生成音频、视频和图像。fal提供高性能的推理引擎,支持实时应用,采用灵活的按需付费模式。fal支持跨平台集成,提供实时...
阅读原文

PodLM

PodLM是一款创新的AI播客生成器,基于先进的AI技术,让用户能轻松地将网页内容、文本或文档转换成高质量的播客节目。工具提供一个用户友好的界面,没有音频制...
阅读原文

Baichuan-Omni

Baichuan-Omni 是由百川智能推出的一款开源的 7B 多模态大型语言模型(MLLM),能同时处理和分析图像、视频、音频和文本等多种模态的数据。Baichuan-Omni 提...
阅读原文

VAPI

VAPI是一个为开发者设计的语音AI平台,基于提供简单易用的API,让开发者快速将语音识别和语音合成功能集成到各种应用中。VAPI 基于先进的机器学习技术,确保...
阅读原文

podlm-public

podlm-public是一个开源AI播客工具,旨在创建一个中文版的NotebookLM替代品,专门用在将任意URL转换成播客内容,再推送到小宇宙平台。项目基于先进的AI技术,...
阅读原文

Langotalk

Langotalk是一个创新的在线语言学习平台,基于AI技术为语言学习者提供个性化和沉浸式的学习体验。平台支持20多种语言,如英语、西班牙语、法语、德语、意大利...
阅读原文

textomap

textomap是一个创新的智能在线工具,能将文本内容快速转换成交互式地图。用户输入基于位置的文本,比如旅游行程、博客文章或新闻报道,textomap能自动识别地...
阅读原文

Final Round AI

Final Round AI 是先进的AI面试助手,专门设计帮助求职者准备和执行面试,提供AI面试助手、简历生成和模拟面试服务,为用户提供实时反馈和专业建议。平台能生...
阅读原文

FunASR

FunASR是由阿里巴巴达摩院开源的语音识别工具包,提供包括语音识别(ASR)、语音活动检测(VAD)、标点恢复、语言模型、说话人验证、说话人分离及多说话人ASR...
阅读原文

CleanS2S

CleanS2S是一个流式语音到语音(S2S)交互智能体原型,提供高质量、实时的语音交互体验。CleanS2S项目基于单文件实现,简化配置和理解过程,便于用户和研究人...
阅读原文

Hallo2

Hallo2是复旦大学、百度公司和南京大学共同推出的音频驱动视频生成模型。能将单张参考图片和持续几分钟的音频输入结合起来,基于可选的文本提示调节肖像表情...
阅读原文

Ministral 3B/8B

Ministral 3B和8B是由Mistral AI推出的两款新型AI小模型,专为设备端计算和边缘使用场景设计。在知识、常识、推理、功能调用和效率方面为10亿参数以下的类别...
阅读原文
1565758596067