微调

人工智能

0代码微调大模型火了，只需5步，成本低至150块

0代码微调一个大模型，成本不到20美元（人民币约144元）？过程也非常简单，只需5步。如LLaMA、GPT、StableLM等爆火的开源生成式模型，都能搞定。图片这就是Mo…

2020.12.3.0:19、 ҉
2023年7月18日
000
人工智能

首次：微软用GPT-4做大模型指令微调，新任务零样本性能再提升

我们知道，从谷歌 T5 模型到 OpenAI GPT 系列大模型，大语言模型（LLMs）已经展现出了令人印象深刻的泛化能力，比如上下文学习和思维链推理。同时为了使得 LLMs 遵循…

8815
2023年7月17日
000
人工智能

650亿参数，8块GPU就能全参数微调：邱锡鹏团队把大模型门槛打下来了

在大模型方向上，科技巨头在训更大的模型，学界则在想办法搞优化。最近，优化算力的方法又上升到了新的高度。大型语言模型（LLM）彻底改变了自然语言处理（NLP）领域，展示了涌现、顿悟…

shiba
2023年7月17日
000
人工智能

首次：微软用GPT-4做大模型指令微调，新任务零样本性能再提升

我们知道，从谷歌 T5 模型到 OpenAI GPT 系列大模型，大语言模型（LLMs）已经展现出了令人印象深刻的泛化能力，比如上下文学习和思维链推理。同时为了使得 LLMs 遵循…

至死不渝
2023年7月17日
000
人工智能

Diffusion预训练成本降低6.5倍，微调硬件成本降低7倍！Colossal-AI完整开源方案低成本加速AIGC产业落地

如何更好、更快和更便宜地实现训练、微调 AIGC 模型，已成为 AIGC 商业化和应用爆发的最大痛点。 Colossal-AI 基于在大模型民主化的专业技术积累，开源完整 Stab…

572654062
2023年7月15日
000
人工智能

30亿跑赢GPT-3的1750亿，谷歌新模型引热议，然而却把Hinton年龄搞错了

人工智能一个重要的目标是开发泛化能力强的模型。在自然语言处理（NLP）领域中，预训练语言模型在这方面取得了重大进展。这类模型往往通过微调来适应新的任务。近日，来自谷歌的研究者分析…

校长
2023年7月15日
000
前端后端

QLoRa：利用GPU微调大型语言模型

点击参加51CTO网站内容调查问卷译者 | 崔皓审校 | 重楼摘要文章介绍了QLoRa（Quantized LLMs with Low-Rank Adapters），一种在…

6000
2023年7月15日
000