标签:文本生成

LLM2LLM

LLM2LLM是创新的迭代数据增强策略,旨在提升大型语言模型(LLM)在数据稀缺情况下的性能。方法通过基于一个强大的教师模型来生成合成数据,增强学生模型的训...
阅读原文

AutoRAG

AutoRAG是中国科学院计算技术研究所(ICT/CAS)、中国科学院的人工智能安全重点实验室及中国科学院大学的研究人员共同推出的新型自主迭代检索模型,专为大型...
阅读原文

什么是上下文嵌入(Contextual Embedding)

上下文嵌入(Contextual Embedding)是一种将词汇映射到向量空间的技术,它为每个词生成一个基于其上下文的表示。这些表示能够捕捉词汇在不同上下文中的多样...
阅读原文

ModernBERT

ModernBERT是Answer.AI、LightOn、约翰斯·霍普金斯大学、英伟达和HuggingFace联合推出的现代编码器-only Transformer模型,是对经典BERT模型的一次重大升级。...
阅读原文

Diff-Instruct

Diff-Instruct是先进的知识转移方法,用于从预训练的扩散模型中提取知识,指导其他生成模型的训练。它基于一种新的散度度量——积分Kullback-Leibler (IKL) 散...
阅读原文

什么是视觉语言模型(Vision-Language Models, VLMs)

视觉语言模型(Vision-Language Models, VLMs)是一种多模态人工智能系统,它结合了图像和文本的处理能力,以执行高级视觉语言任务,如视觉问答(Visual Ques...
阅读原文

AI Chinese

AI Chinese是嗨你好教育推出的AI双语教学中文学习平台,基于AI技术为外国人提供在线中文学习解决方案。平台模拟中国真人老师在线授课,在TikTok用短视频和直...
阅读原文

HelloMeme:面部表情与姿态迁移技术驱动的Stable Diffusion 1.5模型实现全新创作体验

HelloMeme是基于最新的Diffusion生成技术的框架,实现表情与姿态的迁移,HelloMeme集成空间编织注意力(Spatial Knitting Attentions)机制,基于Stable Diff...
阅读原文

Bamba-9B

Bamba-9B是IBM、普林斯顿大学、卡内基梅隆大学和伊利诺伊大学香槟分校联合推出的,基于Mamba2架构的仅解码语言模型模型。模型在完全开放的数据集上训练,能提...
阅读原文

OpenAI o3

OpenAI o3模型是继o1之后的新一代推理模型,包括o3和o3-mini两个版本。o3在某些条件下接近于通用人工智能(AGI),在ARC-AGI基准测试中得分高达87.5%,远超人...
阅读原文

RWKV-7

RWKV-7是RWKV系列的最新大模型架构版本,超越了传统的attention和linear attention范式,具有更灵活的状态演化能力,能在相同算力消耗下解决attention无法解...
阅读原文

RWKV-7:RWKV系列大模型架构提升上下文学习能力的创新产品特性解析

RWKV-7是RWKV系列的最新大模型架构版本,超越了传统的attention和linear attention范式,具有更灵活的状态演化能力,能在相同算力消耗下解决attention无法解...
阅读原文

OpenAI o3:OpenAI推出超强推理模型,智能提升与创新思维的完美结合

OpenAI o3模型是继o1之后的新一代推理模型,包括o3和o3-mini两个版本。o3在某些条件下接近于通用人工智能(AGI),在ARC-AGI基准测试中得分高达87.5%,远超人...
阅读原文

Emoji AI:个性化AI表情包生成器,让你的情感随时随地生动表达

Emoji AI是AI驱动的表情包制作应用,主打卡通风格,提供搜索和文生图功能,让用户能快速创建个性化表情。Emoji AI特别推出节日主题表情,适应不同文化和节日...
阅读原文

AI安全防线全面崩溃:Anthropic揭示的越狱技术震撼业界!

原标题:Anthropic 发现了一种 AI 越狱方法,安全护栏崩塌,文本视觉语音全部沦陷 文章来源:夕小瑶科技说 内容字数:4865字引言 近年来,Best-of-N (BoN) 方...
阅读原文
12349