Kandinsky 5.0
Kandinsky 5.0 是俄罗斯 AI 研究实验室 AI-Forever 开发的文本到视频生成模型,具有强大的生成能力和高效的性能表现。核心版本 Kandinsky 5.0 Video Lite 是...
MAI-Image-1
MAI-Image-1是微软推出的首款自研图像生成式AI模型。模型以“创作者导向”为核心设计理念,擅长生成逼真的自然光照效果和复杂场景图像,如闪电、风景等。与一些...
Youtu-Embedding
Youtu-Embedding 是腾讯优图实验室开源的面向企业级应用的通用文本表示模型。模型通过大规模语料训练和创新的微调框架,具备强大的语义理解能力,能胜任文本...
LLaVA-OneVision-1.5
LLaVA-OneVision-1.5 是开源的多模态模型,通过高效训练和高质量数据实现高性能、低成本和强复现性。采用自研的 RICE-ViT 作为视觉编码器,结合 2D 旋转位置...
MineContext
MineContext 是字节跳动开源的主动式上下文感知 AI 工具,通过挖掘数字生活中的“方块”,帮助用户高效管理知识和信息。每 5 秒截取一次屏幕,经过处理后,批量...
NeuTTS Air
NeuTTS Air 是 Neuphonic 开发的超拟真、可离线运行的 TTS(文本到语音)模型。具备高拟真语音合成能力,声音自然流畅,几乎能以假乱真。支持本地运行,提供 ...
粤公网安备 44011502001135号