开源闭源?并非二选一
21世纪经济报道记者孔海丽、实习生牛淑锐 北京报道
百度公关“一号位”璩静的舆论风波,将百度再次置于“魏则西事件”的阴影下,不乏用户谈论甚至质疑起这家公司的“赚钱基因”和价值观选择。
图片来源于网络,如有侵权,请联系删除
而就在不久前,百度老板李彦宏,刚刚因“AI大模型开源没有闭源好,开源大模型会越来越落后”的论断陷入争议。这番言论的出现节点,恰好赶在号称“最强开源大模型”Llama3发布前,为此,甚至有半个AI圈的从业人士站到了李彦宏的另一面。
五一之前,国内通义千问也宣布开源1100亿参数模型Qwen1.5-110B。根据官方公布的评测结果,Qwen1.5-110B 在各项基准测试中表现出色,在综合实力上比Llama-3-70B和Mixtral-8x22B略胜一筹。
随着人工智能技术的发展,全球大模型的角力场上不断涌现新玩家,时至今日,开源闭源之争依然不时上演。李彦宏曾在内部讲话中表示,闭源模型在能力上会持续地领先,而不是一时地领先,大模型开源意义不大,闭源是能够赚到钱的。后续的Create 2024百度AI开发者大会上,他继续给开源泼了冷水:“开源模型会越来越落后。”
图片来源于网络,如有侵权,请联系删除
对此,360集团创始人周鸿祎反应比较激烈,他在哈佛的演讲中表示:“我是一直相信开源的,至于网上有些名人胡说八道,你们别被忽悠了,他说开源不如闭源好?连说这话的公司自己都是借助了开源的力量才成长到今天。”
周鸿祎还说:“没有开源就没有Linux,没有PHP,没有MySQL,甚至没有互联网。包括在人工智能的发展上,如果没有当初谷歌开源Transformer,就不会有OpenAI和GPT。我们都是受益于开源成长起来的个人和公司。”
吃瓜群众“看热闹不嫌事儿大”,判定周鸿祎在“炮轰”李彦宏。周鸿祎为此做过澄清:“这两天有人挑事儿,说我攻击李厂长。我不是针对李厂长,我还是从产业发展的角度来看开源和闭源。”
其实,开源模型能否超越闭源模型的议题早就争论不休。此前,埃隆·马斯克旗下的人工智能初创公司xAI的大模型Grok官宣开源,点燃了开源闭源之争的导火索,马斯克更是多次公开指责“OpenAl”不够“Open” 。
百家争鸣,多派交锋
李彦宏强调,一年前文心一言刚刚发布时,百度内部有过非常激烈的讨论,最后大家的决定是不开源。当时的判断是,市场上一定会有开源的模型,而且是不止一家会开源。在这种情况下,多百度一家开源不多,少百度一家开源也不少。要开源还得自己去维护一套开源的版本,这是不划算的。“闭源才能走通商业模式。”李彦宏认为。
“开源大模型发展了一年,速度已经超过了闭源。”周鸿祎持相反的观点,这是市场经济下的集中力量办大事,也就是人多力量大。在开源社区里,为了一个共同的目标,凝聚起全球上千家公司、数十万程序员和工程师,一起来解决问题,开发力量是一个闭源公司的数百倍。而且在开源的文化里,大家不用重复发明轮子,一个人在另一个人想法基础上快速改进,研发速度也特别快。
公开资料显示,开源与闭源是模型开发领域中两种不同的代码公开方式。开源指源代码对外公开,任何人都可以查看、修改和重新分发,其开放性和透明性允许用户自由地查看和修改代码,从而促进协作与创新。
闭源则相反,指源代码不对外公开,只有开发商拥有修改权利,开发商掌握着源代码的控制权,用户只能通过提出反馈或放弃使用来影响软件的改进方向。
Hugging Face创始人Clem Delangue认为,在大模型的百舸争流中,如果没有开放科学,没有开源,比如说谷歌没有分享他们“attention is all you need”的论文、Bert 论文、原生扩散论文,我们可能要过 30、40、50 年才能够达到今天的水平。
生数科技联合创始人兼CEO唐家渝则看好闭源。唐家渝在“2024中国生成式AI大会”上提到:“开源、闭源都有各自可以做的商业生态,但是从模型能力的提升,或者持续保持领先地位来说,闭源还是会走到开源的前面。”
不过,也有人站在“双轮驱动”的角度看问题。针对大模型开源闭源的路线选择,百川智能CEO王小川认为,开源和闭源并不像手机中iOS或者安卓操作系统只能二选一,开源确实容易“建立人品”,“朋友多多的”,也是为商业化做准备。从To B角度,开源闭源其实都需要。未来80%的企业会用到开源的大模型,因为闭源没有办法对产品做更好地适配,或者成本特别高,闭源可以给剩下的20%提供服务。二者不是竞争关系,而是在不同产品中互补的关系。
自Llama 2出现后,国内外科技巨头开源的节奏可谓如“雨后春笋”般涌现,开源的势头直逼闭源,让不少人出现了新的洞见。Hugging Face创始人Clem Delangue的预言“OpenAI不足为惧,开源会慢慢赶上来”似乎逐渐被印证。
21世纪经济报道记者梳理发现,开源模型不在少数。安卓系统、 Chrome 和 Firefox等网页浏览器、xAI的模型Grok-1、eta的大语言模型Llama系列、智源“悟道”大模型、百川智能大模型、阿里的通义千问模型等都选择了开源。OpenAI开发的ChatGPT、百度文心大模型、Anthropic的Claude等则选择了闭源。不过,从现实依据考量,不少公司选择了“双管齐下”的道路。
IBM中国数据与人工智能首席架构师徐孝天告诉21世纪经济报道记者:“目前放眼全球,大模型开源模式模型能力弱于闭源模型,但是就商业化角度而言,闭源不一定优于开源,这牵涉到技术生态的问题。”
徐孝天认为,开源更容易打造生态,但是闭源有利于技术保护。走开源还是闭源取决于企业的技术层次,如果谋求世界第一,闭源是更好的选择,其余的可能开源更合适。“国内目前还需要开源合作来得到更好的数据源,否则闭门造车很快会被世界先进技术甩开。”他说。
徐孝天强调,对于技术的发展,尤其在国内,更重要的还是要共同合作,采取开源的模型先追赶世界一流水平。
不是“非此即彼”的单选题
被称为“欧洲大模型之光”的Mistral AI,自推出闭源模型Mistral Large后,于今年初又开源了一款拥有1760亿参数的巨型模型Mixtral 8x22B。一位AI大模型创业者曾向21世纪经济报道记者表示,公司最终都要走商业化路径,Mistral把小点的模型开源,大点的模型闭源,效果好的用来赚钱,这也是正常的。
如李彦宏所言,闭源有真正的商业模式,能够赚到钱,能够赚到钱才能聚集算力和聚集人才。同时,闭源在成本上更有优势,在同等能力下,闭源模型的推理成本更低、响应速度也更快;在同等参数情况下,闭源模型的能力也能更强。
致力于全面开花的百川智能发布了Baichuan-7B、Baichuan-13B开源大模型后,又推出了Baichuan-53B闭源大模型。当被问及为什么没有继续开源,王小川称:“模型变大之后没有再开源,因为部署起来成本会非常高,就使用闭源模式让大家在网上调用API。”
今年2月份,谷歌罕见地改变了“大模型闭源”策略,用“Gemma”系列杀入开源领域。官方技术报告显示,Gemma 是一个轻量级的 SOTA 开放模型系列,在语言理解、推理和安全方面表现出了强劲的性能。
徐孝天分析称,走开源还是闭源取决于企业的技术层次,当各家模型的技术实力不相上下时,开源合作是必要的;但当一方拥有了足够的实力时,闭源赚钱也是情理之中的事。
开源模型的头部企业Meta创始人马克·扎克伯格在专访中表示:“如果模型最终更像是产品本身,这时候,是否开源就是一个更棘手的经济考量了。从不被看好,到逆风翻盘,也许换个赛道,Meta不会有今天的成就。”扎克伯格的话,侧面反映出无论开源还是闭源,都不是只能选其一的单选题。
艾瑞咨询发布的《AIGC系列报告——中国AIGC产业全景报告》表示,闭源LLM可为B端用户和C端消费者持续提供优质的模型开发及应用服务;开源LLM可从研究角度促进广大开发者和研究者的探索创新,从商用角度加速大模型的商业化进程与落地效果。未来开源和闭源的LLM会并存和互补,为大模型发展共同创造出多元协作的繁荣生态。
在这场开源与闭源的博弈中,开源与闭源并非正负两面,非得分出个高下。阿里研究院认为,大模型开源与闭源,没有优劣之分,要找寻技术与商业的平衡点。正如周鸿祎所言,开源和闭源是两种不同的商业模式,没有必要相互贬低。安卓和iOS,Linux和Windows都是一个开源一个闭源,也都活得很好。AI浪潮下,一切皆有可能。
具体到国内AI企业对开源还是闭源的路线选择,徐孝天更建议国内厂商们目前以开源合作寻求更好的进步,否则闭门造车很快会被世界先进技术甩开。