标签:知识
5分钟搭建大模型应用!腾讯将「实用主义」贯彻到底|甲子光年
让企业像搭积木一样构建大模型应用,简单可上手。作者|伍月编辑|栗子 在经历了一年多的技术锤炼后,大模型正在迈向真刀真枪抢落地的关键阶段。 对于更多企...
ICML 2024 | 大语言模型预训练新前沿:「最佳适配打包」重塑文档处理标准
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
今日arXiv最热NLP大模型论文:揭露大语言模型短板,北京大学提出推理测试基准
夕小瑶科技说 原创作者 | Richard人工智能领域又一里程碑时刻!北京大学、北京智源人工智能研究院等机构联合推出大型事件推理评测基准 。这是首个同时在知识...
“驯服”不受控的大模型,要搞定哪些事?| 专访达观数据副总裁王文广
采访嘉宾|王文广,达观数据副总裁 作者 | 华卫 GPT 爆火一年多后,无论在国内、外,“几乎所有领域都需要用大模型重构”的论调已深入人心。中国 200 多家厂商...
肖仰华|生成式语言模型与通用人工智能:内涵、路径与启示
来源:信息化协同创新专委会 作者简介肖仰华,复旦大学计算机科学技术学院教授、博导,上海市数据科学重点实验室主任。研究方向为知识图谱、知识工程、大数据...
手机秒变超脑!微软Phi-3已经超越主流大模型!
点击上方蓝字关注我们“微软phi-3系列语言模型,尤其phi-3-mini,凭借创新数据集(精选网络数据与合成数据)和高效训练,实现小模型媲美Mixtral 8x7B、GPT-3.5...
无任务学习及在机器人任务和规划中的应用
大数据文摘授权转载自中国人工智能学会 作者:张宪琦,范晓鹏摘 要: 本文提出了无任务学习的方法,阐述了其与现有方法(包括自监督学习、迁移学习、模仿学习...
一款超强悍、免费文档识别AI工具,开启内测!论文/PPT/书籍/财报等各种文档都能识别解析
夕小瑶科技说 分享作者 | ccAI 创业公司NoEdgeAI近期开始了他们的文档解析工具Doc2X的内测。 Doc2X 能够提取各种文档,包括书籍,论文,财报,教辅,幻灯片中...
Llama架构比不上GPT2?神奇token提升10倍记忆?
机器之心专栏 机器之心编辑部一个 7B 规模的语言模型 LLM 能存储多少人类知识?如何量化这一数值?训练时间、模型架构的不同将如何影响这一数值?浮点数压缩 ...
中科院发布大模型想象增强法IAG,无需外部资源,想想就能变强
夕小瑶科技说 原创作者 | 松果 引言:探索知识增强的新方法在人工智能领域,尤其是自然语言处理(NLP)的子领域——问答系统(QA)中,知识的获取和利用一直是...
传奇程序员Kent Beck:LLM如何放大程序员技能 | 极客时间
Sora 的惊艳亮相、ChatGPT 的迅速崛起、Gemini 的强势跟进以及国内的百模大战,以至于大家谈 AI 色变,仿佛下一秒就会“被下岗”。 但我的朋友们,真的没必要过...
剑桥团队开源:赋能多模态大模型RAG应用,首个预训练通用多模态后期交互知识检索器
机器之心专栏 机器之心编辑部PreFLMR模型是一个通用的预训练多模态知识检索器,可用于搭建多模态RAG应用。模型基于发表于 NeurIPS 2023 的 Fine-grained Late...
释放 LLM 进行复杂化学推理的能力,一种简单而有效的提示策略 StructChem
将 ScienceAI设为星标 第一时间掌握 新鲜的 AI for Science 资讯编辑 |X 人工智能有望改变化学领域。LLM 在解决简单的化学问题,如分子分类和性质预测,取得...