标签:提示
ICML2024: 华中科大发现大模型具有自我认知
夕小瑶科技说 原创作者 | 谢年年不知道大家是否记得之前传到沸沸扬扬的Bing的 Sydney事件。 起因是一位网友晒出了其与Bing的聊天记录,其中Bing自述自己名叫S...
ECCV 2024 | 提升GPT-4V、Gemini检测任务性能,你需要这种提示范式
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
我们从过去一年的大模型构建过程中学到的经验
作者 | Eugene Yan、Bryan Bischof、Charles Frye、Hamel Husain、Jason Liu 和 Shreya Shankar 翻译 | 王强 策划 | 褚杏娟 当下正是使用大型语言模型(LLM...
Claude更新王炸功能:一键生成、评估、优化提示词!
直播预告 | 7月23日14点,「智猩猩在线研讨会 NVIDIA AI for Science 专场」将开讲,两位专家将分别以《AI 驱动下的新能源材料研究与发现》、《NVIDIA Modulu...
13.11 和 13.8 哪个大,不只是人类,为什么连大模型也翻车了?
以下文章转载自公众号「量子位」,Founder Park 略有增删。7月12日晚,《歌手 2024》第十期竞演排名公布,每位选手的名字后是得票率,有观众在社交媒体评论区...
Reddit传疯的Claude 3.5 Artifacts 的核心系统提示词!Code效果猛增
夕小瑶科技说 原创作者 | 付奶茶不知道大家有没有注意到,6月20号推出的Claude 3.5 Sonnet在性能上又有了巨大的突破! 值得注意的是,这次更新中引入了一个名...
Claude 3.5核心编码prompt揭秘,全网码农沸腾!四步法,最新V2版放出
新智元报道编辑:桃子 【新智元导读】最核心的Claude 3.5编码系统提示,火遍Reddit社区。就在刚刚,原作者发布了进化后的第二版,有的网友已经将其加入工作流...
大模型集体失智!9.11和9.9哪个大,几乎全翻车了
梦晨 一水 发自 凹非寺量子位 | 公众号 QbitAI没眼看……“9.11和9.9哪个大”这样简单的问题,居然把主流大模型都难倒了?? 强如GPT-4o,都坚定地认为9.11更大。...
大模型权威测试被曝翻车!更偏袒GPT-4等闭源模型,连提示词都区别对待
白交 发自 凹非寺量子位 | 公众号 QbitAI大模型权威测试,翻车了?! HuggingFace都在用的MMLU-PRO,被扒出评测方法更偏向闭源模型,被网友直接在GitHub Issu...
人人可做提示工程师!Claude上新:一键生成、测试和评估prompt
机器之心报道 编辑:陈陈、小舟不会写 prompt 的看过来。在构建 AI 应用时,prompt 质量对结果有着重大影响。但制作高质量的 prompt 具有挑战性,需要研究者...
Claude编程支持一键共享,第一批网友已经开始晒作品了
克雷西 发自 凹非寺量子位 | 公众号 QbitAIClaude 3.5上新的“工坊模式”(Artifacts)再次更新,写完的网页应用支持一键分享了! 不用自建服务器,不用部署后...
复旦大学:一个小技巧探测大模型的知识边界,有效消除幻觉
夕小瑶科技说 原创作者 | Zicy 孔子说“知之为知之,不知为不知,是知也”,目前的大模型非常缺乏这个能力。虽然大模型拥有丰富的知识,但它仍然缺乏对自己知识...
Runway 的 Gen-3 向所有用户开放付费使用,网友:免费的可灵更香
作者 | 赵明华 7 月 2 日凌晨,著名生成式 AI 平台 Runway 在官网宣布,其文生视频模型 Gen-3 Alpha 向所有用户开放使用。而就在上周,Runway 才宣布 Gen-3 A...
ML工程师一次微调7个模型,击败OpenAI GPT-4
新智元报道编辑:好困庸庸 【新智元导读】「微调你的模型,获得比GPT-4更好的性能」不只是说说而已,而是真的可操作。最近,一位愿意动手的ML工程师就把几个...
CVPR'24:文生图提示词自动优化,还发现三个小窍门,人大度小满等机构出品
PAE团队 投稿至 凹非寺量子位 | 公众号 QbitAI文生图也有自己的prompt优化工具了。 我们都知道,大模型输出的质量,很大程度上依赖于输入的prompt。尤其在文...