GGUF量化支持,优化ComfyUI原生模型性能
Go语言库,用于嵌入式向量搜索和语义嵌入
一个基于Llama模型的量化版本,用于对话和幻觉检测。
EXAONE 3.5系列的7.8B参数双语生成模型
高性能的量化语言模型