标签:文本生成

AI赚钱副业~AI生成影视解说,半个月涨粉变现3.5W+!

这两年大家都在感叹生活不易,然而我想说的是,机会还是有的,但问题不在于有没有,而在于你是否能够认准机会,然后抓住它。 接触过很多咨询项目的人,发现...

Kimi长文生成器:Kimi推出的智能写作助手为长文本创作提供支持

Kimi 长文生成器是Kimi推出的长文本写作助手,入口在Kimi+中"长文本生成器"。支持生成长达20万字的文本内容。能理解用户的需求,快速生成结构清晰...
阅读原文

SWE-Kit:基于开源框架打造个性化软件工程AI助手

SWE-Kit 是Composio 推出的开源框架, 简化软件工程 AI 代理的开发过程。SWE-Kit提供无头 IDE 环境和 AI 原生工具,用于构建自定义编码代理,支持与多种代理...
阅读原文

text.cortex:运用AI写作工具提升复杂文本任务的质量

text.cortex是集成的AI写作辅助工具,基于浏览器扩展增强用户的写作工作流程。它提供文本重写、扩展句子、创建长篇内容、文本摘要、信息研究、多语言翻译及语...
阅读原文

塔猫ChatPPT – AI PPT生成工具,智能分析自动配图、生成完整演示文稿

塔猫ChatPPT是基于AI技术的智能PPT生成工具,能通过用户输入的关键词、大纲或完整文稿,一键生成结构清晰、设计专业的PPT文档 。用户无需具备专业的设计技能...
阅读原文

什么是NLP自然语言处理?定义、重要性、发展和应用 – AI百科

NLP(Natural Language Processing),即自然语言处理,是计算机科学的一个领域,重点是创建能够理解人类语音和语言的计算机和软件。NLP使用人工智能和机器学...
阅读原文

Perplexity – AI搜索引擎,使用聊天的方式进行搜索

Perplexity AI是一款聊天机器人式的搜索引擎,允许用户用自然语言提出问题,并使用生成式AI技术从各种来源收集获取信息并给出答案。该AI搜索引擎将人工智能与...
阅读原文

DiffusionGPT – 开源的大模型驱动的文本到图像生成系统

DiffusionGPT是由来自字节跳动与中山大学的研究人员推出的一个开源的大模型(LLM)驱动的文本到图像生成系统,旨在解决文生图领域无法处理不同的输入或者仅限...
阅读原文

Mistral Large – Mistral AI发布的一款先进的大语言模型

Mistral Large是由法国人工智能公司Mistral AI开发的一款先进的大型语言模型(LLM),具备顶级的推理能力,能够处理复杂的多语言推理任务,包括文本理解、转...
阅读原文

EMO – 阿里推出的AI肖像视频生成框架

EMO(Emote Portrait Alive)是一个由阿里巴巴集团智能计算研究院的研究人员开发的框架,一个音频驱动的AI肖像视频生成系统,能够通过输入单一的参考图像和语...
阅读原文

TextDiffuser-2 – 微软等推出的AI图像文本渲染融合框架

Text-Diffuser 2是由来自微软研究院、香港科技大学和中山大学的研究人员最新推出的一个基于扩散模型的文本渲染方法,旨在解决图像扩散模型生成文字时在灵活性...
阅读原文

Claude 3 – Anthropic推出的第三代大模型和AI聊天机器人

Claude 3是人工智能初创公司Anthropic开发的新一代人工智能模型,旨在提供先进的认知能力和智能处理任务。Claude 3模型家族包括三个不同级别的模型,按性能强...
阅读原文

Llama 3 – Meta开源推出的新一代大语言模型

Llama 3是Meta公司最新开源推出的新一代大型语言模型(LLM),包含8B和70B两种参数规模的模型,标志着开源人工智能领域的又一重大进步。作为Llama系列的第三...
阅读原文

CogVLM2 – 智谱AI推出的新一代多模态大模型

CogVLM2是由智谱AI推出的新一代多模态大模型,在视觉和语言理解方面实现了显著的性能提升,支持高达8K的文本长度和1344*1344分辨率的图像输入,具备强大的文...
阅读原文

Gemma 2 – 谷歌DeepMind推出的新一代开源人工智能模型

Gemma 2是谷歌DeepMind推出的新一代开源人工智能模型,包含90亿和270亿参数版本。该模型以卓越的性能、高效的推理速度和广泛的硬件兼容性为特点,能够与参数...
阅读原文

Moshi – 法国AI实验室Kyutai开发的实时音频多模态模型

Moshi是由法国的的人工智能研究实验室Kyutai推出的一款端到端实时音频多模态AI模型,拥有听、说、看的能力,并能模拟70种不同的情绪和风格进行交流。作为对标...
阅读原文
1235