开源 - 第 4 页

Vibe Coder

Vibe Coder 是一款开源的 VS Code 扩展，用于探索基于语音的 AI 编程体验。

Scira

Scira 是一个极简主义的 AI 驱动搜索引擎，帮助用户在互联网上查找信息。

leapfusion-hunyuan-image2video

一种新颖的图像到视频采样技术，基于Hunyuan模型实现高质量视频生成。

Janus-Pro-1B

Janus-Pro-1B 是一个统一多模态理解和生成的自回归框架。

OmniParser-v2.0

OmniParser 是一款通用屏幕解析工具，可将 UI 截图转换为结构化格式，提升基于 LLM 的 UI 代理性能。

Aya Vision 32B

Aya Vision 32B 是一个支持多语言的视觉语言模型，适用于OCR、图像描述、视觉推理等多种用途。

IMM

Inductive Moment Matching 是一种新型的生成模型，用于高质量图像生成。

LiteAvatar

一个基于音频驱动的实时2D聊天头像生成模型，可在仅使用CPU的设备上实现30fps的实时推理。

Firefox Translations Models

为Firefox浏览器翻译功能优化的CPU加速神经机器翻译模型。

百聆

百聆是一个类似GPT-4o的语音对话机器人，通过ASR+LLM+TTS实现，低配置也可运行，支持打断。

DeepSeek-R1-Distill-Llama-70B

DeepSeek-R1-Distill-Llama-70B 是一款基于强化学习优化的大型语言模型，专注于推理和对话能力。

SmolVLM-500M-Instruct

SmolVLM-500M 是一个轻量级多模态模型，能够处理图像和文本输入并生成文本输出。

Exa & Deepseek Chat App

一个开源的聊天应用，使用Exa的API进行网络搜索，结合Deepseek R1进行推理。

Next.js Chatbot Template

一个开源的AI聊天机器人模板，使用Next.js和Vercel的AI SDK构建。

Coding-Tutor

探索大型语言模型作为编程辅导工具的潜力，提出Trace-and-Verify工作流。

Open Multi-Agent Canvas

一个开源的多智能体聊天界面，支持在一个动态对话中管理多个智能体。

Aya Vision 8B

8亿参数的多语言视觉语言模型，支持OCR、图像描述、视觉推理等功能

Flex.1-alpha

一个基于文本生成图像的预训练模型，具有80亿参数和Apache 2.0开源许可。

DeepSeek-R1-Distill-Qwen-32B

DeepSeek-R1-Distill-Qwen-32B 是一款高性能的开源语言模型，适用于多种文本生成任务。

s1-32B

s1是一个基于Qwen2.5-32B-Instruct微调的推理模型，仅用1000个样本进行训练。

SiYuan

隐私优先，自托管的全开源个人知识管理系统

easegen-front

开源数字人课程制作平台

easegen-admin

开源数字人课程制作平台

InternLM3-8B-Instruct

InternLM3-8B-Instruct是一个开源的80亿参数指令模型，用于通用用途和高级推理。

Chat With Media

CWM是一款开源软件，使与PDF文件聊天变得轻松。

MegaParse

文件解析器，专为LLMs解析PDF、Docx、PPTx等文档。

Knowledge Table

开源工具，简化从非结构化文档中提取和探索结构化数据。

Tülu 3

开源的先进语言模型后训练框架

diagen

一键生成数据的直观反射图

vectrix-graphs

一个用于多模型嵌入的图形库，支持多种模型和数据类型的可视化

DocDecoder.app

使用AI技术，快速总结网站法律政策。

Srcbook

开源、自托管、AI驱动的应用构建器。