撰稿 | 王瑞平
审校 | 云昭
最近,“百模大战”又打响了…
一枝独秀不是春。OpenAI 发布 ChatGPT 也仅仅只是开始。理性的玩家,往往并不会正面硬刚。毕竟,最终比拼的是各家应用场景落地能力。
百花齐放,美在当下。刚过去的 6 月,前有 “360 智脑 4.0、360 AI 数字人”亮相,后有火山引擎大模型服务平台“火山方舟”惊艳登台。
终于,伴随着炎炎烈日的酷暑感,7 月,大模型的持续狂热氛围似乎迎来了更重磅的一波动作!以 Open AI、华为、百度为代表的科技巨头又开始“各自放大招了”!简直叹为观止。
1、OpenAI 狂送大礼包
GPT-4 API 面向付费用户开放
OpenAI 昨天突然推出大礼包,GPT-4 API 向所有 API 付费用户开放,部分版本明年正式退役。
这意味着,所有付费用户都可以访问具有 8K tokens 上下文的 GPT-4 API 。此外,OpenAI 计划在本月底前向新的开发人员开放访问权限,并根据计算资源开始调高速率限制。
目前,OpenAI 正在对 GPT-4 和 GPT-3.5 Turbo 进行微调功能测试,预计该功能会在今年晚些时候推出。
此外,OpenAI 宣布将会在 6 个月内淘汰一批使用 Completions API 的旧型号,比如,GPT-3 及其衍生版本。
图:旧模型和新模型(来源:Open AI)
该计划会从 2024 年 1 月 4 日开始施行,以“优化计算能力”。旧版本将被计算效率更高的新“基础版 GPT-3”模型替代。使用旧模型的开发者必须在 1 月 4 日之前手动升级,而希望在 1 月 4 日之后继续使用旧模型开发者需要在 GPT-3 模型中重新微调。
与此相关的是,OpenAI 也宣布其 DALL-E 2 和 Whisper API 正式可用。DALL-E 2 是 OpenAI 的图像生成模型,“Whisper”是该公司的语音转文本模型。OpenAI 表示:“我们将为之前微调过模型的用户提供支持,以尽可能使过渡更加顺利。在未来几周内,我们将与使用这些旧模型的开发者联系,并在新的模型准备进行早期测试时提供更多信息。”值得注意的是,即使是当今最好的生成式人工智能模型,GPT-4 也并非完美,会在推理过程中出现错误。不过,随着更多开发者可以调用其API,相信它还会带来更多惊喜,让我们期待一下吧!
2、华为:“盘古大模型3.0”亮相更有应用模型登上 Nature
一直以来,“盘古大模型”都吊足了大家的胃口,今日,在“2023世界人工智能大会(WAIC)”上发布“盘古大模型3.0”,新一轮角逐又要开始了。模型面向 ToB/ToG 政企端客户,服务于生产活动和科研创新,发挥出人工智能的价值。
据搜狐报道,华为预计会在今天下午 14:50 开始介绍盘古大模型,15:30 至16:00 揭秘盘古大模型如何从基础大模型炼成行业大模型,以及基础大模型全栈创新。据悉,此次华为盘古大模型将迎来重大升级,其全栈创新和行业大模型的“炼成术”也将首次对外公布。
图片
在技术方面,“盘古大模型”包括 5 个基础系列大模型:中文语言(NLP)大模型、视觉(CV)大模型、多模态大模型、科学计算大模型和图识神经网络(Graph)大模型,构成了盘古大模型的基本结构。
与 ChatGPT 等外国 AIGC 大预言模型相比,中文语言大模型更注重针对中文语言的优化。而超过 30 亿参数的视觉大模型首次实现模型按需抽取,首次兼顾判别与生成能力。
图识神经网络大模型首创“图+网络”融合技术,在工艺优化、时序预测、智能分析等场景有广泛应用。而多模态大模型则具备图像和文本的跨模态理解、检索与生成能力。
除了以上五个基础大模型(L0)以外,盘古大模型还在不断的进化,共分为L0、L1、L2 三个层级。其中,L0 指基础大模型,L1 指针对垂直领域的行业大模型,L2 则是指面向更加细分应用场景的推理模型。
模型充分展示出其应用能力,7 月 6 日,Nature 杂志正刊发表了华为云盘古大模型研发团队论文:《三维神经网络用于精准中期全球天气预报》(《Accurate medium-range global weather forecasting with 3D neural networks》)。
《自然》审稿人对该成果给予高度评价:“华为云盘古气象大模型让人们重新审视气象预报模型的未来,模型的开放将推动该领域的发展。”
图片
图:华为云盘古气象大模型研究成果在 Nature 正刊发表(来源:Nature)
华为云盘古气象大模型作为首个精度超过传统数值预报方法的 AI 模型,速度相比传统数值预报提速 10000 倍以上。
气象模型能够提供全球气象秒级预报,其气象预测结果包括位势、湿度、风速、温度、海平面气压等,可以直接应用于多个气象研究细分场景,欧洲中期预报中心和中央气象台等都在实测中发现盘古预测的优越性。
截至目前,盘古大模型已深入金融、制造、政务、电力、煤矿、医疗、铁路等 10 多个行业,支撑起 400 多个 AI 业务场景的应用落地。对于新模型的功能,你可以自己去亲测一番,整体感觉更适合中国用户。
3、文心一言App上架苹果应用市场,评分不低
最近,百度开发的大语言模型“文心一言App“上架苹果应用市场,获得体验资格的网友可以直接通过 App 体验职场办公、制作 PPT、写代码等多种 AIGC(人工智能生成内容)功能。未获得体验资格的网友需要排队等候。
该应用在发布之初只有网页版可以使用。遗憾的是,文心一言App 并没有上架安卓应用市场,但其官网提供安装包下载服务。
图片
在苹果应用商店中,17 岁以上用户可使用 App。该软件采用一对一的对话式聊天场景,能够与人对话互动,回答问题,协助创作,同时在文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成等多个应用场景中高效便捷地帮助人们获取信息、知识和灵感。
目前该应用有近三百个评分,满分五分的评分中获得了 4.2 的评分,以五星评分居多,评分数量居其次的是一星评分。在“效率”类应用中已热度已攀升至第二位,免费应用总榜第 66 名。
文心一言于今年 3 月中旬开启内测。而 4 月初,“百度 AI”微信公众号发文称,有不法分子通过苹果 App store 等渠道推出假冒“文心一言” App。百度已对苹果公司及相关开发者团队发起诉讼。
该文章表示:文心一言暂未在任何渠道推出官方 App,苹果应用商店和其他应用商店中所看到的所有“文心一言App”都是假冒的,所谓的“文心一言收费下载”“文心一言付费会员”“文心一言内购激活码”等都是骗局。
但当前,苹果应用商店中已经无法搜索到文心一言的高仿软件,此前就曾出现过一批顶着文心一言名称的应用混淆视听,也曾出现消费者被盗版 AI 软件误导,向盗版软件付费充值,但软件使用体验极差的问题。
4、写在最后:“百模大战”还在继续
目前,中国紧跟潮流,已进入大模型快速发展期。从全球已经发布的大模型分布来看,中美两国数量合计占全球总数的超 80%,美国在大模型数量方面居全球之首,中国目前则已进入大模型快速发展期,与美国保持同步增长态势。据不完全统计,目前中国 10 亿参数规模以上的大模型已发布 79 个。
在用户对 AI 大模型产品狂热的同时,“文心一言 App”假冒事件也给我们敲响了警钟。这并不是个例,在各手机应用商店中,确实存在不少真假难辨的 AI 应用产品。
比如,在苹果应用商店中还能搜索到一款名为“chatGTP”的 AI 聊天机器人,与OpenAI 开发的 AI 聊天机器人“ChatGPT”相似度颇高,大量使用者表示该软件存在充值了终身会员依旧不能正常使用的问题,还有用户反映该软件没有售后反馈渠道,充值会员出现的问题不能得到解决。
此外,中国短期大规模落地大模型受成本制约。厂商在将大模型应用到实际产品中时,需要考虑到计算资源需求、数据隐私和安全性等问题,涉及到较大的资源投入与监管风险。
有些专家认为,聚焦细分领域有可能让成本降低,让大模型在领域落地和成本优化方面进展更快才能真正普惠更多用户。
有些专家对此持相反观点,认为:细分行业只存在于“中模型”,不存在于”大模型“,只有覆盖多个行业、通用才叫大模型,毕竟“百模大战”最终拼的是场景落地能力。
文章版权声明
1 原创文章作者:5827,如若转载,请注明出处: https://www.52hwl.com/85167.html
2 温馨提示:软件侵权请联系469472785#qq.com(三天内删除相关链接)资源失效请留言反馈
3 下载提示:如遇蓝奏云无法访问,请修改lanzous(把s修改成x)
4 免责声明:本站为个人博客,所有软件信息均来自网络 修改版软件,加群广告提示为修改者自留,非本站信息,注意鉴别