标签:自然语言处理

VAPI

VAPI是一个为开发者设计的语音AI平台,基于提供简单易用的API,让开发者快速将语音识别和语音合成功能集成到各种应用中。VAPI 基于先进的机器学习技术,确保...
阅读原文

podlm-public

podlm-public是一个开源AI播客工具,旨在创建一个中文版的NotebookLM替代品,专门用在将任意URL转换成播客内容,再推送到小宇宙平台。项目基于先进的AI技术,...
阅读原文

Langotalk

Langotalk是一个创新的在线语言学习平台,基于AI技术为语言学习者提供个性化和沉浸式的学习体验。平台支持20多种语言,如英语、西班牙语、法语、德语、意大利...
阅读原文

textomap

textomap是一个创新的智能在线工具,能将文本内容快速转换成交互式地图。用户输入基于位置的文本,比如旅游行程、博客文章或新闻报道,textomap能自动识别地...
阅读原文

Final Round AI

Final Round AI 是先进的AI面试助手,专门设计帮助求职者准备和执行面试,提供AI面试助手、简历生成和模拟面试服务,为用户提供实时反馈和专业建议。平台能生...
阅读原文

FunASR

FunASR是由阿里巴巴达摩院开源的语音识别工具包,提供包括语音识别(ASR)、语音活动检测(VAD)、标点恢复、语言模型、说话人验证、说话人分离及多说话人ASR...
阅读原文

CleanS2S

CleanS2S是一个流式语音到语音(S2S)交互智能体原型,提供高质量、实时的语音交互体验。CleanS2S项目基于单文件实现,简化配置和理解过程,便于用户和研究人...
阅读原文

Hallo2

Hallo2是复旦大学、百度公司和南京大学共同推出的音频驱动视频生成模型。能将单张参考图片和持续几分钟的音频输入结合起来,基于可选的文本提示调节肖像表情...
阅读原文

Ministral 3B/8B

Ministral 3B和8B是由Mistral AI推出的两款新型AI小模型,专为设备端计算和边缘使用场景设计。在知识、常识、推理、功能调用和效率方面为10亿参数以下的类别...
阅读原文

Any Summary

Any Summary是一款基于人工智能技术的文档总结工具,能快速分析和总结长文本、音频或视频文件。用户可以上传文件或提供链接,Any Summary将用AI技术提取关键...
阅读原文

Sana

SANA是由NVIDIA、麻省理工学院和清华大学共同推出的文本到图像生成框架,能高效地生成高达4096×4096分辨率的高清晰度图像。SANA基于深度压缩自编码器、线性扩...
阅读原文

通义仁心

通义仁心是阿里巴巴集团旗下的一个面向医疗健康领域的人工智能服务平台。基于先进的AI技术,提供专业、精准、有效的医疗健康信息解答服务。平台通过自然语言...
阅读原文

Lingua

Lingua 是 Meta AI推出的一个轻量级且独立的代码库,旨在助力大规模训练语言模型。基于易于修改的 PyTorch 组件,便于研究人员尝试新的模型架构、损失函数和...
阅读原文

PDFtoChat

PDFtoChat 是一个开源的创新AI项目,支持用户基于自然语言对话的方式与 PDF 文件互动。工具基于最新的 AI 技术,包括 Together AI 和 Mixtral,理解用户的查...
阅读原文

Napkins.dev

Napkins.dev是一个创新的开源项目,基于AI技术将用户的截图或线框图快速转换成可运行的网页应用程序。该、项目背后依托于Meta的Llama 3.1 405B大型语言模型和...
阅读原文
1394041424349