标签：模型

纽约大学研究表明：大模型并没有利用思维链的推理能力，它只是加了计算！

思维链技术，可能要被推翻了！来自纽约大学的最新研究表明：大模型并没有利用思维链的推理能力，它只是偷偷加了计算！来源：悦智网红极一时的思维链技术，可...

阅读原文

AIGC动态

2年前 (2024)

大语言模型何时需要检索？UCLA提出全新自监督选择性检索策略

来源：PaperWeekly 作者：吴迪单位：UCLA 研究方向：自然语言处理前言最近一年开始做知识增强语言模型的方向。暑假去到了 AWS AI 的 CodeWhisperer 组实习，...

阅读原文

AIGC动态

2年前 (2024)

OpenAI新作署名Ilya，提取1600万个特征看透GPT-4大脑！

新智元报道编辑：乔杨好困【新智元导读】今天，OpenAI发布了一篇GPT-4可解释性的论文，似乎是作为前两天员工联名信的回应。网友细看论文才发现，这居然是已...

阅读原文

AIGC动态

2年前 (2024)

斯坦福天才少女一年缔造5亿美元独角兽！Pika再获8000万美元融资，金牌团队阵容首度曝光

新智元报道编辑：编辑部【新智元导读】斯坦福天才少女郭文景的Pika，在成立一年之际再获一笔8000万美元融资。团队成员也首次曝光，6位IOI金牌得主，包揽9块...

阅读原文

AIGC动态

2年前 (2024)

全球开源新王Qwen2-72B诞生，碾压Llama3-70B击败国产闭源模型！AI圈大佬转疯了

新智元报道编辑：编辑部【新智元导读】一夜之间，全球最强开源模型再次易主。万众瞩目的Qwen2-72B一出世，火速杀进开源LLM排行榜第一，美国最强开源模型Llam...

阅读原文

AIGC动态

2年前 (2024)

AI 第一次高考：记得作文要龙头猪肚凤尾

随着人工智能技术的飞速发展，AI写作能力逐渐受到关注。高考作文作为衡量学生语言表达、思维逻辑和文化素养的重要标准，自然成为了各大人工智能模型测试和对...

阅读原文

AIGC动态

2年前 (2024)

9家AI相关公司获融资；3大科技巨头被曝将面临反垄断调查；Vidu重大更新，生成32秒视频，支持音视频合成丨AI情报局

01 融资快报透彻未来宣布完成近亿元A+轮融资：透彻未来致力于使用大数据及人工智能为病理图像提供的智能判别、诊断、预测，并提供最优化的解决方案。本轮融资...

阅读原文

AIGC动态

2年前 (2024)

产业级AI原生应用的「超级外挂」，应用已在200+行业场景落地

衡宇白交发自凹非寺量子位 | 公众号 QbitAI今年AI领域的热门词汇，非”AI原生应用”莫属。而现在，这个浪潮之巅的方向，又一件神兵利器有了成绩单证明——百...

阅读原文

AIGC动态

2年前 (2024)

AI创业酱紫卷？想让陆奇看上眼，挑战个Sora/Transformer再说

衡宇发自凹非寺量子位 | 公众号 QbitAI奇绩创坛的路演日舞台上，第一次出现了模型产品首发—— Sora级视频生成大模型YiSu-Beta，原生时长可达16s，宣称其懂物...

阅读原文

AIGC动态

2年前 (2024)

OpenAI公开GPT-4思维的新方法，Ilya也参与了！

西风发自凹非寺量子位 | 公众号 QbitAIOpenAI研究如何破解GPT-4思维，公开超级对齐团队工作，Ilya Sutskever也在作者名单之列。该研究提出了改进大规模训...

阅读原文

AIGC动态

2年前 (2024)

与AlphaFold3持平！国产抗体设计生成式AI大模型发布，能同时预测抗原抗体复合物结构和抗体从头设计

百奥几何投稿量子位 | 公众号 QbitAIAlphaFold3引起的浪潮下，一个新的抗体设计生成式AI大模型浮出水面。名为GeoFlow，能够同时用于抗原-抗体复合物结构预...

阅读原文

AIGC动态

2年前 (2024)

OpenAI新研究GPT-4大脑，分解1600万个特征打开“黑匣子”，Ilya 、Jan Leike也参与了！

夕小瑶科技说原创作者 | 付奶茶 6月7日凌晨，OpenAI在官网发布了一个新的研究成果，首次破解GPT-4的神经网络活动。通过改进大规模训练稀疏自动编码器将GPT-4...

阅读原文

AIGC动态

2年前 (2024)

从 0 到 1 构建了一个属于自己的大模型，跑通了 | 极客时间

就在前段时间的两会上，“人工智能”再次被提及，并成为国家战略的焦点。这一举措预示着在接下来的十年到十五年里，人工智能将获得巨大的发展红利。同时意味着...

阅读原文

AIGC动态

2年前 (2024)

阿里云重磅发布开源模型Qwen2，性能超Llama3-70及国内众多闭源模型

整理 | 褚杏娟 6月7日，阿里云更新技术博客，并重磅发布开源模型 Qwen2-72B，性能超过美国最强的开源模型 Llama3-70B，也超过文心 4.0、豆包 pro、混元 pro ...

阅读原文

AIGC动态

2年前 (2024)

字节跳动代码生成 Copilot 产品的应用和演进

演讲嘉宾 | 刘夏大语言模型在代码生成领域取得了令人瞩目的进展。本文整理自字节跳动产品研发和工程架构部的代码智能助手架构师刘夏在 AICon 2024 北京的演...

阅读原文

AIGC动态

2年前 (2024)

1…177 178179180 181…483