向量 - 第 6 页

详解！大语言模型中的检索增强生成RAG技术

直播预告 | 1月17日晚7点，「多模态大模型线上闭门会」正式开讲！阿里巴巴通义实验室 NLP 高级算法专家严明参与出品，携手刘兆洋、李彦玮、文束三位青年学者...

阅读原文

AIGC动态

2年前 (2024)

吵了一年，我来下个结论：纯向量数据库和向量插件都没有未来！

作者｜张颖峰导读：向量数据库的争议差不多一年了，但我们一直缺少一篇能透彻讲解向量数据库相关问题的文章，这导致在这个领域的讨论一直没有得到充分的澄...

阅读原文

AIGC动态

2年前 (2024)

百川智能RAG方案总结：搜索出生的百川智能大模型RAG爬坑之路

直播预告 | 1月17日晚7点，「多模态大模型线上闭门会」正式开讲！阿里巴巴通义实验室 NLP 高级算法专家严明参与出品，携手刘兆洋、李彦玮、文束三位青年学者...

阅读原文

AIGC动态

2年前 (2024)

梅隆网红数据库教授：我的毕业生都很难自己找到工作

作者｜Andy Pavlo 编译｜核子可乐策划｜冬梅本文是由世界知名数据库行业专家 Andy Pavlo 教授撰写的 2023 年数据库回顾文章。最近几年，每一个岁末或年初，...

阅读原文

AIGC动态

2年前 (2024)

语言模型是如何感知时间的？「时间向量」了解一下

机器之心报道编辑：赵阳语言模型究竟是如何感知时间的？如何利用语言模型对时间的感知来更好地控制输出甚至了解我们的大脑？最近，来自华盛顿大学和艾伦人工...

阅读原文

AIGC动态

2年前 (2024)

Softmax注意力与线性注意力的优雅融合，Agent Attention推动注意力新升级

机器之心专栏作者：韩东辰来自清华大学的研究者提出了一种新的注意力范式——代理注意力 (Agent Attention)。近年来，视觉 Transformer 模型得到了极大的发展...

阅读原文

AIGC动态

3年前 (2023)

通向一般人工智能的桥梁之一未来十年的人工智能和超维向量计算

来源：CreateAMind 退休教授熊墨淼美国德州大学公共卫生学院，生物统计和数据科学系，人类遗传中心德州大学休斯顿健康卫生中心，德州大学安徳森癌症中心生...

阅读原文

AIGC动态

3年前 (2023)

大模型+搜索构建完整技术栈，百川智能用搜索增强给企业定制化下了一剂「猛药」

机器之心报道机器之心编辑部用好企业知识库是大模型应用破局的关键。从 ChatGPT 最初发布算起，虽然大模型的热潮已经持续了一年多，但大部分时间依然停留在...

阅读原文

AIGC动态

3年前 (2023)

百川发布全新Baichuan2-Turbo系列API产品：构建“大模型+搜索增强”技术栈，解决99% 定制化需求

作者 | 褚杏娟 12 月 19 日，百川智能宣布开放基于搜索增强的 Baichuan2-Turbo 系列 API，包含 Baichuan2-Turbo-192K 及 Baichuan2-Turbo。在支持 192K 超长...

阅读原文

AIGC动态

3年前 (2023)

支持5000万tokens！百川发布全新API产品，解决99%定制化需求

半年 toB 商业化探索后，百川智能给出了针对大量定制化需求的产品解决方案。 12 月 19 日，百川智能发布基于搜索增强的 Baichuan2-Turbo 系列 API，包含 Baic...

阅读原文

AIGC动态

3年前 (2023)

大模型推理效率无损提升3倍，滑铁卢大学、北京大学等机构发布EAGLE

机器之心专栏机器之心编辑部大语言模型（LLM）被越来越多应用于各种领域。然而，它们的文本生成过程既昂贵又缓慢。这种低效率归因于自回归解码的运算规则：每...

阅读原文

AIGC动态

3年前 (2023)

没必要非得固守纯向量数据库！专访亚马逊云科技数据库和迁移副总裁 Jeff Carter

采访｜ Kevin 作者｜Tina、芳芳生成式 AI 时代的到来催生了向量数据库日益增长的需求和应用。亚马逊云科技也在多种数据库服务上实现向量搜索功能，并且他...

阅读原文

AIGC动态

3年前 (2023)

线上开售！大模型时代的向量数据库 AI 技术论坛圆满收官

致力于助力大模型技术升级的“大模型时代的向量数据库”——机器之心 AI 技术论坛日前圆满收官。活动当日，北京海淀文津国际酒店论坛现场门庭若市，来自全国十余...

阅读原文

AIGC动态

3年前 (2023)

矩阵模拟！Transformer大模型3D可视化，GPT-3、Nano-GPT每一层清晰可见

新智元报道编辑：桃子好困【新智元导读】Transformer大模型工作原理究竟是什么样的？一位软件工程师打开了大模型的矩阵世界。黑客帝国中，「矩阵模拟」的世...

阅读原文

AIGC动态

3年前 (2023)

一文读懂Embeding技术

大数据文摘受权转载自数据派THU作者：陈之炎编辑：王菁Embedding 技术是一种将高维数据映射到低维空间的方法，通常用于将离散的、非连续的数据转换为连续的向...

阅读原文

AIGC动态

3年前 (2023)

标签：向量