标签:多语言支持

MNN

MNN(Mobile Neural Network)是阿里巴巴集团开源的轻量级深度学习推理框架,为移动端、服务器、个人电脑、嵌入式设备等多种设备提供高效的模型部署能力。MNN...
阅读原文

Valley

Valley是字节跳动推出的多模态大模型,用于处理涉及文本、图像和视频数据的多样化任务。Valley在内部电子商务和短视频基准测试中取得了最佳成绩,并在OpenCom...
阅读原文

cobalt

cobalt是开源的流媒体下载工具,提供纯净、简洁无广告的体验。cobalt支持全平台视频、音频和图片下载,包括主流视频网站、社交媒体和音乐平台。cobalt提供个...
阅读原文

CogAgent-9B

CogAgent-9B是基于 GLM-4V-9B 训练的专用Agent任务模型,仅依赖屏幕截图作为输入,无需HTML等文本表征。CogAgent-9B支持高分辨率图像处理,具备双语(中英文...
阅读原文

Diff-Instruct

Diff-Instruct是先进的知识转移方法,用于从预训练的扩散模型中提取知识,指导其他生成模型的训练。它基于一种新的散度度量——积分Kullback-Leibler (IKL) 散...
阅读原文

DeepSeek V3

DeepSeek V3是知名私募巨头幻方量化旗下人工智能公司深度求索(DeepSeek)开源的最新版AI模型,在多语言编程能力上的进步显著。在aider多语言编程测评中的表...
阅读原文

Browser Use

Browser Use是专门为大语言模型服务的智能浏览器工具,创新的Python工具库,让AI代理能像人类一样自然地浏览和操作网页。Browser Use支持多标签页管理、视觉...
阅读原文

ChiChat

ChiChat是AI驱动的智能助手平台,提供个人知识库、语音处理和创意图像生成服务。ChiChat集成多个前沿模型,用户能用自然语言与智能系统互动。ChiChat支持o1和...
阅读原文

Acedit

Acedit是AI驱动的Chrome浏览器扩展程序,帮助求职者准备面试。通过实时检测面试中的问题并提供AI生成的回答建议,帮助用户提升面试技巧。用户可以上传LinkedI...
阅读原文

什么是光学字符识别(Optical Character Recognition, OCR)

光学字符识别(Optical Character Recognition,OCR)是一种将文本图像转换为机器可读格式的技术。通过自动数据提取,能快速识别扫描文档、相机图像和图像PDF...
阅读原文

ASAL

ASAL(Automated Search for Artificial Life)是用基础模型自动化搜索人工生命(ALife)系统。ASAL是Sakana AI及MIT、OpenAI等机构联合推出的,主要基于三种...
阅读原文

Midscene.js

Midscene.js是基于AI技术的自动化SDK,通过用大型语言模型(LLM)简化UI自动化测试中的命令。用户用自然语言描述交互步骤或预期数据格式,Midscene.js将执行...
阅读原文

OmniAudio-2.6B

OmniAudio-2.6B是Nexa AI推出的音频语言模型,专为边缘部署设计,能实现快速且高效的音频文本处理。OmniAudio-2.6B是具有2.6亿参数的多模态模型融合Gemma-2-2...
阅读原文

Leya:多国法律支持的智能法律服务平台助力律师高效审查、搜索与起草文件

Leya 是专为法律专业人士设计的AI法律服务平台,基于集成AI工具优化法律工作流程。Leya能自动化重复性任务,聚合信息,并提供对法律资源及用户数据的一站式访...
阅读原文

MisoraAI

Misora AI是先进的人工智能搜索引擎,提供快速且准确的搜索结果。通过深度学习和自然语言处理技术,能理解用户的查询意图,从其数据库中检索相关信息。Misora...
阅读原文
1212223242558