标签:多语言支持

LongVILA

LongVILA是一个面向长视频理解的视觉语言AI模型,由英伟达、MIT、UC 伯克利、得克萨斯大学奥斯汀分校共同开发。通过算法和系统的共同设计,实现了在大量GPU上...
阅读原文

Offline Chat

Offline Chat是一款支持离线本地运行的AI聊天应用,专为 iOS 设备设计。完全在设备上运行,无需互联网连接,确保用户数据隐私安全。支持加载和查询私人文档,...
阅读原文

SpicyChat

SpicyChat是一个提供角色扮演聊天的AI应用,支持用户与150,000个聊天机器人进行互动,并且可以创建自己个性化的虚拟角色,享受深入的个性化对话和情感体验。...
阅读原文

EasyOCR

EasyOCR 是一个功能强大的开源OCR(光学字符识别)项目,支持80多种语言和多种书写系统,包括中文、阿拉伯文和西里尔文。基于深度学习技术,提供高精度的文字...
阅读原文

Candy.ai

Candy.ai 是一款人工智能驱动的聊天应用,提供虚拟伴侣进行自然对话和角色扮演。通过高级NLP技术实现个性化互动,支持语音消息和情感支持。
阅读原文

Yodayo

Yodayo是一个面向动漫爱好者和虚拟主播(VTubers)的在线AI艺术创作平台。用户可以通过输入提示词和选择模型,轻松生成高质量的动漫风格艺术作品。
阅读原文

STranslate

STranslate是专为Windows用户设计的多功能翻译和OCR工具。支持多种语言翻译,具备划词、截图、监听剪贴板等多种翻译方式,并提供多家翻译服务接口。还拥有基...
阅读原文

Eagle

Eagle是英伟达推出的多模态大模型,擅长处理高达1024×1024像素的图像,显著提升视觉问答和文档理解能力。Eagle模型采用多专家视觉编码器架构,通过简单高效的...
阅读原文

什么是语音识别(Speech Recognition)

语音识别(Speech Recognition)也称为自动语音识别(ASR),是一种将人类语音转换成文本或命令的高技术。通过特征提取、模式匹配和模型训练等步骤,使机器能...
阅读原文

什么是语音合成(Speech Synthesis)

语音合成(Speech Synthesis)是一种将文本信息转换为口语的技术。模拟人类发音机制,通过分析文本内容,提取语言特征,再利用声学模型转换成声音信号,最终...
阅读原文

Melty

Melty是一款开源AI编程助手,专为提升开发者的编码效率和代码质量而设计。Melty通过实时理解开发者的编程活动,从终端操作到 GitHub 交互,提供智能协作和代...
阅读原文

Yi-Coder

Yi-Coder是零一万物推出的开源编程助手系列模型,专为提升代码生成、理解、调试和补全等任务的效率而设计。Yi-Coder系列模型包含1.5B和9B两种参数规模的版本...
阅读原文

BIT.AI

BIT.AI 是一个先进的文档协作平台,基于人工智能技术来提升团队的文档创建、协作和知识管理效率。该平台提供实时协作功能、智能文档和维基编辑器、丰富的第三...
阅读原文

ChatLearn

ChatLearn 是由阿里云推出的一个灵活、易用、高效的大规模Alignmant 训练框架。ChatLearn是为了支持大型语言模型(LLMs)的 Alignment 训练而设计的。ChatLea...
阅读原文

Durable

Durable 是创新的 AI 网站构建器和小型企业软件,Durable通过提供快速、简便的网站搭建服务,让小企业和个人创业者能够轻松地将业务迁移到线上。用户无需具备...
阅读原文
1789101126