标签:分词
AI赚钱副业~AI生成影视解说,半个月涨粉变现3.5W+!
这两年大家都在感叹生活不易,然而我想说的是,机会还是有的,但问题不在于有没有,而在于你是否能够认准机会,然后抓住它。 接触过很多咨询项目的人,发现...
走近宋柔教授:78岁仍在科研前线,在语言学高校里的计算语言学家
InfoQ 特约作者 |秦海龙写在最前宋柔,北京语言大学信息科学学院教授,语言学及应用语言学博士生导师,北京工业大学计算机应用博士生导师。北京语言大学信息...
LLM实践系列-数据去重之Simhash&Minhash分析与实现
讲座预告11月1日上午10点,南开大学在读博士李森茂,将以《基于扩散模型编码器模块的推理加速》为主题进行直播讲解,欢迎扫码报名~今天给大家带来知乎@真中合...
大神Karpathy:我给大模型「SQL注入」攻击,简直不要太轻松
机器之心报道 编辑:杜伟、泽南大模型的安全性,可以说是「有很大进步空间」。 AI 大牛 Andrej Karpathy 又来科普知识了,这次的主题是「利用特殊 token 对 L...
关于Tokenizer的一些感想
原文:https://zhuanlan.zhihu.com/p/695307425 在现有Transformer作为大模型框架下,万物tokenizer将会是一个必然的趋势! 01为什么我们需要Token化?tokeni...
英伟达Mistral AI联袂出击!120亿小模型王者强势登场,碾压Llama 3单张4090可跑
新智元报道编辑:耳朵 桃子 【新智元导读】GPT-4o mini头把交椅还未坐热,Mistral AI联手英伟达发布12B参数小模型Mistral Nemo,性能赶超Gemma 2 9B和Llama 3...
小模型卷起来了:Mistral联合英伟达开源12B小模型,128k上下文
机器之心报道 机器之心编辑部小模型,正在成为 AI 巨头的新战场。今天凌晨,OpenAI 突然发布了 GPT-4o 的迷你版本 ——GPT-4o mini。这个模型替代了原来的 GPT-...
抄袭瓜!斯坦福作者已删库跑路!面壁和刘知远老师的最新回应
夕小瑶科技说 原创作者 | 海野 好家伙,AI大模型圈爆料不断,没想到今天最猛的料还是抄袭的瓜啊。 5月29日,一个斯坦福团队高调宣称,只需要500美元,就可以...
Meta发布多模态模型Chameleon:34B、类GPT-4o、性能接近GPT-4V
GPT-4o 的横空出世,再次创立了一个多模态模型发展的新范式。OpenAI 将其称为「首个『原生』多模态」模型,意味着 GPT-4o 与以往所有的模型,都不尽相同。传...
大神Karpathy强推,分词领域必读:自动钓鱼让大模型“发疯”的token,来自Transformer作者创业公司
鱼羊 发自 凹非寺量子位 | 公众号 QbitAI关于大模型分词(tokenization),大神Karpathy刚刚推荐了一篇必读新论文。 主题是:自动检测大模型中那些会导致“故...
今日arXiv最热大模型论文:首个面向AI的python编程框架,提升大模型编程能力新思路
夕小瑶科技说 原创作者 | 谢年年高级编程语言Python有两个受众:一是编译和执行程序的机器,二是阅读、理解和编写程序的人类。机器关注程序的语义操作,而人...
LLM爆发的一周!Apple开源OpenELM(270M、450M、1.1B 和 3B)
Apple今天发布并开源OpenELM系列模型(270M、450M、1.1B 和 3B)!还包括了在公开可用数据集上训练和评估语言模型的完整框架,包括训练日志、多个checkpoint ...
开源模型打败GPT-4!LLM竞技场最新战报,Cohere Command R+上线
新智元报道编辑:alan 【新智元导读】近日,LLM竞技场更新了战报,Command R+推出不到一周,就成了历史上第一个击败了GPT-4的开源模型!目前,Command R+已经...
1000行C语言搓出GPT-2!AI大神Karpathy新项目刚上线就狂揽2.5k星
新智元报道编辑:桃子 好困 【新智元导读】训大模型的方法可能要被革新了!AI大神Karpathy发布的新项目仅用1000行的C语言训完GPT-2,而不再依赖庞大的GPT-2库...
60行代码,从头开始构建GPT!最全实践指南来了
新智元报道编辑:桃子 【新智元导读】GPT早已成为大模型时代的基础。国外一位开发者发布了一篇实践指南,仅用60行代码构建GPT。60行代码,从头开始构建GPT? ...
复旦发布多模态大模型AnyGPT,文图语乐样样行
夕小瑶科技说 原创作者 | 芒果 引言:多模态语言模型新篇章在人工智能领域,多模态语言模型的发展正迎来新的篇章。传统的大型语言模型(LLM)在理解和生成人...
12