llama
-
将上下文长度扩展到256k,无限上下文版本的LongLLaMA来了?
今年 2 月,Meta 发布的 LLaMA 大型语言模型系列,成功推动了开源聊天机器人的发展。因为 LLaMA 比之前发布的很多大模型参数少(参数量从 70 亿到 650 亿不等)…
-
过去三个月,LLaMA系模型发展如何?指令微调的核心问题又是什么?
符尧(yao.fu@ed.ac.uk),爱丁堡大学 (University of Edinburgh) 博士生,本科毕业于北京大学。 ChatGPT 大火之后,在 2023 年 2…
-
LLaMa被玩坏,网友做「无限制版」BasedGPT,直言灭绝人类只需5步!
本月早些时候,4chan的成员在网上泄露了Meta的大型语言模型LLaMa,发布了一个副本供所有人下载。 在这之后,一位研究人员便利用这个泄露,创建了一个Discord机器人,这样…
-
开发者笑疯了! LLaMa惊天泄露引爆ChatGPT平替狂潮,开源LLM领域变天
谁能想到,一次意外的LLaMA泄漏,竟点燃了开源LLM领域最大的创新火花。 一系列表现出色的ChatGPT开源替代品——「羊驼家族」,随后眼花缭乱地登场。 开源和基于 API 的分…
-
300美元平替ChatGPT!斯坦福130亿参数「小羊驼」诞生
继Meta的LLaMA模型开源后,AI界研究人员就在这个模型基础上衍生出许多版本。 前段时间,斯坦福发布了Alpaca,是由Meta的LLaMA 7B微调而来,仅用了52k数据,性…
-
轻量版ChatGPT训练方法开源!仅用3天围绕LLaMA打造,号称训练速度比OpenAI快15倍
基于Meta模型打造的轻量版ChatGPT,这就来啦? Meta宣布推出LLaMA才三天,业界就出现了把它打造成ChatGPT的开源训练方法,号称比ChatGPT训练速度最高快15…
-
给语言大模型加上综合视听能力,达摩院开源Video-LLaMA
视频在当今社交媒体和互联网文化中扮演着愈发重要的角色,抖音,快手,B 站等已经成为数以亿计用户的热门平台。用户围绕视频分享自己的生活点滴、创意作品、有趣瞬间等内容,与他人互动和交流…
-
微调7B模型只用单GPU!通用多模态工具LLaMA-Adapter拆掉门槛,效果惊人
LLaMA-Adapter,现在已经完全解锁了。 作为一个通用的多模态基础模型,它集成了图像、音频、文本、视频和3D点云等各种输入,同时还能提供图像、文本和检测的输出。 相比于之前…
-
LeCun转赞:在苹果M1/M2芯片上跑LLaMA!130亿参数模型仅需4GB内存
前不久,Meta前脚发布完开源大语言模型LLaMA,后脚就被网友放出了无门槛下载链接,「惨遭」开放。 消息一出,圈内瞬间就热闹了起来,大家纷纷开始下载测试。 但那些手头没有顶级显卡…
-
ChatGPT和Bard太贵,介绍八个免费开源的大模型解决方案!
1.LLaMA LLaMA项目包含了一组基础语言模型,其规模从70亿到650亿个参数不等。这些模型在数以百万计的token上进行训练,而且它完全在公开的数据集上进行训练。结果,LL…
-
Meta开源的ChatGPT平替到底好不好用?测试结果、加料改装方法已出炉,2天5.2k星
ChatGPT 的持续爆火,早已让各大科技公司坐不住了。 就在刚刚过去的一周,Meta「开源」了一个新的大模型系列 ——LLaMA(Large Language Mode…
-
训练个中文版ChatGPT没那么难:不用A100,开源Alpaca-LoRA+RTX 4090就能搞定
2023 年,聊天机器人领域似乎只剩下两个阵营:「OpenAI 的 ChatGPT」和「其他」。 ChatGPT 功能强大,但 OpenAI 几乎不可能将其开源。「其他」阵营表现欠…