(潇冷/文)新事物的发展总要经历一个由小到大、由不完善到完善的过程。大模型亦是如此,比如从单模态到多模态,又比如从简单的生文、生图、生视频到更为复杂的、更大参数规模的多模态,再比如从完善大模型底层技术到大模型应用层的商业化落地。
图源:网络
然而,大模型在持续壮大的过程中也伴随着各种各样路线探讨:大模型与“小模型”、模型开源与闭源、技术路线与市场路线。在笔者看来,无论哪种路线都有助于人工智能行业的发展,所探讨的是当下的大模型发展的最优解。
①大模型一方面追求“大”,另一方面追求“小”
今年年初,红衣教主周鸿祎就大模型发展趋势发表了自己的观点,其中提到,今年大模型一方面追求“大”,另一方面也追求“小”。他坦言,小规模的大模型将很快搭载在手机和各种联网设备上。“未来手机里的个人助理、服务于家庭的人形机器人,都将由这类”小“模型驱动。”
图源:网络
而这次演讲也仅过去半年时间,伴随着一个又一个“小模型”的发布,一个全新开辟的战场就此诞生。在刚过去的一周内GPT-4o mini和Mistral NeMo二连发将人们的视线转移至小模型上,而前OpenAI和特斯拉AI研究员Andrej Karpathy也预判未来的模型将会更小,但仍然变得更智能。
在发展初期,追求大模型成为主流趋势,这背后有多重驱动力。数据爆炸的时代要求模型具备处理海量信息的能力,而计算能力的提升,特别是GPU等高性能硬件的发展,为大型模型的训练提供了可能。大模型通过海量数据训练,展现出卓越的性能和精度,同时在语言理解、生成及泛化能力上表现突出。然而,随着技术发展,大模型也面临高昂的部署成本和资源消耗挑战,促使业界开始探索小模型的发展路径。
图源:网络
Karpathy等专家指出,当前的大模型虽强大,但往往“虚胖”,记忆了大量无关紧要的信息。未来趋势在于通过高质量训练数据集,训练出规模更小、能力更强、更具推理能力的小模型。这一过程类似于从海量数据中提取精华,实现模型的“瘦身”。
OpenAI等机构的实践表明,利用大模型生成和清洗数据,再训练小模型,已成为一种有效策略。这一趋势不仅有助于降低模型成本,还促进了AI技术的广泛应用。同时,业界普遍认为,数据质量是AI训练成功的关键,无论是真实数据还是合成数据,都将对模型性能产生深远影响。
②大模型开源路线与闭源路线的又一次交锋
如今,大模型赛道的开源与闭源之争,已成为AI商业化下半场的核心焦点。在不久前的2024世界人工智能大会上,刘庆峰、李彦宏、王坚、朱啸虎、傅盛等大佬发表不同观点,再次引发外界对大模型路线的关注。事实上,无论是国内还是国外,这场围绕模型源代码、模型权重及训练数据是否公开的战争已持续一年半,双方各执一词,未决胜负。
百度创始人、董事长兼首席执行官李彦宏(图源:网络)
具体来看,百度创始人、董事长兼首席执行官李彦宏表示,模型开源无法做到众人拾柴火焰高,商业化闭源模型最能打。模型开源与代码开源不同,无法做到众人拾柴火焰高。激烈竞争环境中,商业化闭源模型最具竞争力。
阿里云CTO周靖人表示,两年前阿里决定通义大模型将开源开放。“到今天,通义千问已经实现真正意义上的全尺寸、全模态开源,拉平了开源、闭源模型之间的差距。”
阿里云CTO周靖人(图源:网络)
在我们通过分析可以发现,开源模型凭借其开放性、创新力与透明度,有力推动了技术普惠与社区共建。闭源模型则以卓越性能、专业服务与知识产权保护,满足了市场对高端技术解决方案的需求。双方的争执更多的是路线之争。
在笔者看来,无论是闭源所代表的核心技术掌控与竞争优势强化,还是开源所赋予的快速技术进步与创新生态共建,都将在大模型领域的未来发展进程中发挥不可或缺的作用。未来哪个技术路线将更胜一筹,将有待市场的检验。
③技术路线与市场路线之争
持续烧钱的大模型领域目前挣钱的也许只有英伟达。根据此前富国银行统计,英伟达目前在数据中心AI市场拥有98%的市场份额,而AMD仅有1.2%的市场份额,英特尔则只有不到1%。在持续烧钱与营收压力下,为数不少的企业开始寻求商业化、场景化落地。于是,在国内便诞生技术路线与市场路线之争。
图源:网络
一方以月之暗面创始人杨植麟为代表的技术路线。他们大多为技术出身,思维模式倾向于硅谷模式,对AGI(人工通用智能)及scaling law(规模定律)抱有坚定信仰,坚信随着技术的飞跃与成本的下降,大模型将解锁无限应用潜力。
另一方则以周鸿祎、朱啸虎为代表的市场路线,他们认为技术需通过开源合作与快速商业化实现价值最大化。主张利用中国独有的海量数据与应用场景构建竞争壁垒,强调在现有技术基础上进行增值服务的开发,以实现即时变现。
技术路线与市场路线的分歧还在于对开源与闭源模型未来发展趋势的看法。技术路线坚信,闭源模型的优势将持续扩大,而市场路线则认为开源模型终将缩小甚至消除这一差距。这种世界观的对立,使得双方对各自策略的坚信不疑,并各自规划着未来的战略蓝图。
在笔者看来,大模型行业的繁荣不仅仅是技术或市场的单方面胜利,而是两者深度融合、相互促进的结果。技术的不断创新为市场提供了更加丰富、高效的解决方案,而市场的反馈和需求又进一步推动了技术的迭代和升级。这种良性循环不仅促进了行业的快速发展,也为社会经济的整体进步注入了新的动力。
④写在最后
新技术的发展离不开持续创新者的一次又一次尝试,无论是大模型、小模型,还是模型开源、闭源,抑或是技术路线、市场路线,都将助推大模型产业的发展。而笔者也相信,在这些企业的实践下,大模型正不断从技术附加工具,转向引领行业变革、助力企业降本增效、普惠大众的阶段,进而助推千行百业数字化转型。
(8866512)
友情提示
本站部分转载文章,皆来自互联网,仅供参考及分享,并不用于任何商业用途;版权归原作者所有,如涉及作品内容、版权和其他问题,请与本网联系,我们将在第一时间删除内容!
联系邮箱:1042463605@qq.com