标签:自然语言处理

FunASR

FunASR是由阿里巴巴达摩院开源的语音识别工具包,提供包括语音识别(ASR)、语音活动检测(VAD)、标点恢复、语言模型、说话人验证、说话人分离及多说话人ASR...
阅读原文

CleanS2S

CleanS2S是一个流式语音到语音(S2S)交互智能体原型,提供高质量、实时的语音交互体验。CleanS2S项目基于单文件实现,简化配置和理解过程,便于用户和研究人...
阅读原文

Hallo2

Hallo2是复旦大学、百度公司和南京大学共同推出的音频驱动视频生成模型。能将单张参考图片和持续几分钟的音频输入结合起来,基于可选的文本提示调节肖像表情...
阅读原文

Ministral 3B/8B

Ministral 3B和8B是由Mistral AI推出的两款新型AI小模型,专为设备端计算和边缘使用场景设计。在知识、常识、推理、功能调用和效率方面为10亿参数以下的类别...
阅读原文

Any Summary

Any Summary是一款基于人工智能技术的文档总结工具,能快速分析和总结长文本、音频或视频文件。用户可以上传文件或提供链接,Any Summary将用AI技术提取关键...
阅读原文

Sana

SANA是由NVIDIA、麻省理工学院和清华大学共同推出的文本到图像生成框架,能高效地生成高达4096×4096分辨率的高清晰度图像。SANA基于深度压缩自编码器、线性扩...
阅读原文

通义仁心

通义仁心是阿里巴巴集团旗下的一个面向医疗健康领域的人工智能服务平台。基于先进的AI技术,提供专业、精准、有效的医疗健康信息解答服务。平台通过自然语言...
阅读原文

Lingua

Lingua 是 Meta AI推出的一个轻量级且独立的代码库,旨在助力大规模训练语言模型。基于易于修改的 PyTorch 组件,便于研究人员尝试新的模型架构、损失函数和...
阅读原文

PDFtoChat

PDFtoChat 是一个开源的创新AI项目,支持用户基于自然语言对话的方式与 PDF 文件互动。工具基于最新的 AI 技术,包括 Together AI 和 Mixtral,理解用户的查...
阅读原文

Napkins.dev

Napkins.dev是一个创新的开源项目,基于AI技术将用户的截图或线框图快速转换成可运行的网页应用程序。该、项目背后依托于Meta的Llama 3.1 405B大型语言模型和...
阅读原文

Flair.ai

Flair.ai 是一款基于AI技术帮助用户创建高质量产品摄影图的在线设计工具。支持用户与团队成员实时协作,用拖放功能添加产品、道具和3D资产,调整光线和相机角...
阅读原文

有挂

有挂是一款创新的浏览器AI插件,基于自然语言处理技术,使用户用简单的命令或对话修改网页内容,无需任何编程知识。插件支持Chrome、Edge和Arc浏览器,具备个...
阅读原文

Glarity

Glarity是一款基于ChatGPT技术的浏览器扩展工具,它能够为YouTube视频和Google搜索结果等网页内容提供自动摘要和多语言翻译。这款工具支持多种网站,包括新闻...
阅读原文

麦芽岛

麦芽岛是由科大讯飞推出的一款AI虚拟角色互动聊天应用。用户可以创建和自定义虚拟角色,与之进行沉浸式对话,模拟情感陪伴和剧情互动。用户可以设定角色的外...
阅读原文

Fluid

Fluid是由Google DeepMind和MIT共同推出的文本到图像的自回归生成模型,基于连续标记和随机生成顺序的方法,在视觉质量和评估性能上取得突破性进展。模型在扩...
阅读原文
1293031323339