标签:智能文本生成

AnyText

AnyText是阿里巴巴智能计算研究院的团队推出的一个基于扩散的多语言视觉文本生成和编辑模型,专注于在图像中渲染准确和连贯的文本。AnyText包括两个主要元素...
阅读原文

Grok-1

Grok-1 是由马斯克旗下的人工智能初创公司 xAI 开发的一款大型语言模型,是一个混合专家(MoE)模型,拥有 3140 亿参数,使其成为目前参数量最大的开源大语言...
阅读原文

OpenELM

OpenELM是Apple苹果公司最新推出的系列高效开源的语言模型,包括OpenELM-270M、OpenELM-450M、OpenELM-1_1B和OpenELM-3B不同参数规模的版本。该大模型利用层...
阅读原文

SAM 2

SAM 2(Segment Anything Model 2)是Meta推出的AI对象分割模型,专注于实时图像和视频对象分割。具备零样本泛化能力,能准确分割未知对象,并通过统一架构同...
阅读原文

GLM-4-long

GLM-4-long 是智谱AI推出的200万字长文本模型,现已在 智谱AI开放平台 BigModel 上开放API调用。支持超长输入专为处理超长文本和记忆型任务设计,上下文长度...
阅读原文

AIEditor

AIEditor是面向 AI 的下一代富文本编辑器,AIEditor基于 Web Component 开发,支持 Layui、Vue、React、Angular、Svelte 等几乎任何前端框架。AIEditor适配了...
阅读原文

Durable

Durable 是创新的 AI 网站构建器和小型企业软件,Durable通过提供快速、简便的网站搭建服务,让小企业和个人创业者能够轻松地将业务迁移到线上。用户无需具备...
阅读原文

Jina-embeddings-v3

Jina-embeddings-v3 是 Jina AI 推出的一款先进的文本嵌入模型,专为多语言数据处理和长文本上下文检索任务设计。模型拥有 5.7 亿参数,支持长达 8192 个 tok...
阅读原文

cogvlm2-llama3-caption

cogvlm2-llama3-caption模型是一个基于CogVLM2架构的视频描述生成模型。模型用于理解视频内容,自动生成描述视频内容的文本标题或字幕。
阅读原文

Dezgo

Dezgo是一个文本到图像的人工智能艺术生成器,支持用户通过输入文本描述生成高质量的图像。基于先进技术,如Stable Diffusion,Dezgo能提供快速、详细且无失...
阅读原文

Sharly

Sharly 是一款先进的人工智能文档分析工具,专为研究人员、法律专家、项目经理和需要高效内容总结的专业人士设计。通过快速分析和整合大量文档信息,帮助用户...
阅读原文

Illuminate

Illuminate 是一个由谷歌开发的项目,能将学术论文转化为人工智能生成的音频讨论。项目基于谷歌强大的语言模型 Gemini,将论文内容转换成引人入胜的对话,使...
阅读原文

CleanS2S

CleanS2S是一个流式语音到语音(S2S)交互智能体原型,提供高质量、实时的语音交互体验。CleanS2S项目基于单文件实现,简化配置和理解过程,便于用户和研究人...
阅读原文

Napkins.dev

Napkins.dev是一个创新的开源项目,基于AI技术将用户的截图或线框图快速转换成可运行的网页应用程序。该、项目背后依托于Meta的Llama 3.1 405B大型语言模型和...
阅读原文

BiGR

BiGR是一种新型的条件图像生成模型,用紧凑的二进制潜在代码进行生成训练,增强图像的生成质量和表示能力。作为首个在同一框架内统一生成和判别任务的模型,B...
阅读原文
123