开源闭源？并非二选一

admin 阅读：57966 2024年05月08日

21世纪经济报道记者孔海丽、实习生牛淑锐北京报道

百度公关“一号位”璩静的舆论风波，将百度再次置于“魏则西事件”的阴影下，不乏用户谈论甚至质疑起这家公司的“赚钱基因”和价值观选择。

开源闭源？并非二选一
图片来源于网络，如有侵权，请联系删除

而就在不久前，百度老板李彦宏，刚刚因“AI大模型开源没有闭源好，开源大模型会越来越落后”的论断陷入争议。这番言论的出现节点，恰好赶在号称“最强开源大模型”Llama3发布前，为此，甚至有半个AI圈的从业人士站到了李彦宏的另一面。

五一之前，国内通义千问也宣布开源1100亿参数模型Qwen1.5-110B。根据官方公布的评测结果，Qwen1.5-110B 在各项基准测试中表现出色，在综合实力上比Llama-3-70B和Mixtral-8x22B略胜一筹。

随着人工智能技术的发展，全球大模型的角力场上不断涌现新玩家，时至今日，开源闭源之争依然不时上演。李彦宏曾在内部讲话中表示，闭源模型在能力上会持续地领先，而不是一时地领先，大模型开源意义不大，闭源是能够赚到钱的。后续的Create 2024百度AI开发者大会上，他继续给开源泼了冷水：“开源模型会越来越落后。”

开源闭源？并非二选一
图片来源于网络，如有侵权，请联系删除

对此，360集团创始人周鸿祎反应比较激烈，他在哈佛的演讲中表示：“我是一直相信开源的，至于网上有些名人胡说八道，你们别被忽悠了，他说开源不如闭源好？连说这话的公司自己都是借助了开源的力量才成长到今天。”

周鸿祎还说：“没有开源就没有Linux，没有PHP，没有MySQL，甚至没有互联网。包括在人工智能的发展上，如果没有当初谷歌开源Transformer，就不会有OpenAI和GPT。我们都是受益于开源成长起来的个人和公司。”

吃瓜群众“看热闹不嫌事儿大”，判定周鸿祎在“炮轰”李彦宏。周鸿祎为此做过澄清：“这两天有人挑事儿，说我攻击李厂长。我不是针对李厂长，我还是从产业发展的角度来看开源和闭源。”

其实，开源模型能否超越闭源模型的议题早就争论不休。此前，埃隆·马斯克旗下的人工智能初创公司xAI的大模型Grok官宣开源，点燃了开源闭源之争的导火索，马斯克更是多次公开指责“OpenAl”不够“Open” 。

百家争鸣，多派交锋

李彦宏强调，一年前文心一言刚刚发布时，百度内部有过非常激烈的讨论，最后大家的决定是不开源。当时的判断是，市场上一定会有开源的模型，而且是不止一家会开源。在这种情况下，多百度一家开源不多，少百度一家开源也不少。要开源还得自己去维护一套开源的版本，这是不划算的。“闭源才能走通商业模式。”李彦宏认为。

“开源大模型发展了一年，速度已经超过了闭源。”周鸿祎持相反的观点，这是市场经济下的集中力量办大事，也就是人多力量大。在开源社区里，为了一个共同的目标，凝聚起全球上千家公司、数十万程序员和工程师，一起来解决问题，开发力量是一个闭源公司的数百倍。而且在开源的文化里，大家不用重复发明轮子，一个人在另一个人想法基础上快速改进，研发速度也特别快。

公开资料显示，开源与闭源是模型开发领域中两种不同的代码公开方式。开源指源代码对外公开，任何人都可以查看、修改和重新分发，其开放性和透明性允许用户自由地查看和修改代码，从而促进协作与创新。

闭源则相反，指源代码不对外公开，只有开发商拥有修改权利，开发商掌握着源代码的控制权，用户只能通过提出反馈或放弃使用来影响软件的改进方向。

Hugging Face创始人Clem Delangue认为，在大模型的百舸争流中，如果没有开放科学，没有开源，比如说谷歌没有分享他们“attention is all you need”的论文、Bert 论文、原生扩散论文，我们可能要过 30、40、50 年才能够达到今天的水平。

生数科技联合创始人兼CEO唐家渝则看好闭源。唐家渝在“2024中国生成式AI大会”上提到：“开源、闭源都有各自可以做的商业生态，但是从模型能力的提升，或者持续保持领先地位来说，闭源还是会走到开源的前面。”

不过，也有人站在“双轮驱动”的角度看问题。针对大模型开源闭源的路线选择，百川智能CEO王小川认为，开源和闭源并不像手机中iOS或者安卓操作系统只能二选一，开源确实容易“建立人品”，“朋友多多的”，也是为商业化做准备。从To B角度，开源闭源其实都需要。未来80%的企业会用到开源的大模型，因为闭源没有办法对产品做更好地适配，或者成本特别高，闭源可以给剩下的20%提供服务。二者不是竞争关系，而是在不同产品中互补的关系。

自Llama 2出现后，国内外科技巨头开源的节奏可谓如“雨后春笋”般涌现，开源的势头直逼闭源，让不少人出现了新的洞见。Hugging Face创始人Clem Delangue的预言“OpenAI不足为惧，开源会慢慢赶上来”似乎逐渐被印证。

21世纪经济报道记者梳理发现，开源模型不在少数。安卓系统、 Chrome 和 Firefox等网页浏览器、xAI的模型Grok-1、eta的大语言模型Llama系列、智源“悟道”大模型、百川智能大模型、阿里的通义千问模型等都选择了开源。OpenAI开发的ChatGPT、百度文心大模型、Anthropic的Claude等则选择了闭源。不过，从现实依据考量，不少公司选择了“双管齐下”的道路。

IBM中国数据与人工智能首席架构师徐孝天告诉21世纪经济报道记者：“目前放眼全球，大模型开源模式模型能力弱于闭源模型，但是就商业化角度而言，闭源不一定优于开源，这牵涉到技术生态的问题。”

徐孝天认为，开源更容易打造生态，但是闭源有利于技术保护。走开源还是闭源取决于企业的技术层次，如果谋求世界第一，闭源是更好的选择，其余的可能开源更合适。“国内目前还需要开源合作来得到更好的数据源，否则闭门造车很快会被世界先进技术甩开。”他说。

徐孝天强调，对于技术的发展，尤其在国内，更重要的还是要共同合作，采取开源的模型先追赶世界一流水平。

不是“非此即彼”的单选题

被称为“欧洲大模型之光”的Mistral AI，自推出闭源模型Mistral Large后，于今年初又开源了一款拥有1760亿参数的巨型模型Mixtral 8x22B。一位AI大模型创业者曾向21世纪经济报道记者表示，公司最终都要走商业化路径，Mistral把小点的模型开源，大点的模型闭源，效果好的用来赚钱，这也是正常的。

如李彦宏所言，闭源有真正的商业模式，能够赚到钱，能够赚到钱才能聚集算力和聚集人才。同时，闭源在成本上更有优势，在同等能力下，闭源模型的推理成本更低、响应速度也更快；在同等参数情况下，闭源模型的能力也能更强。

致力于全面开花的百川智能发布了Baichuan-7B、Baichuan-13B开源大模型后，又推出了Baichuan-53B闭源大模型。当被问及为什么没有继续开源，王小川称：“模型变大之后没有再开源，因为部署起来成本会非常高，就使用闭源模式让大家在网上调用API。”

今年2月份，谷歌罕见地改变了“大模型闭源”策略，用“Gemma”系列杀入开源领域。官方技术报告显示，Gemma 是一个轻量级的 SOTA 开放模型系列，在语言理解、推理和安全方面表现出了强劲的性能。

徐孝天分析称，走开源还是闭源取决于企业的技术层次，当各家模型的技术实力不相上下时，开源合作是必要的；但当一方拥有了足够的实力时，闭源赚钱也是情理之中的事。

开源模型的头部企业Meta创始人马克·扎克伯格在专访中表示：“如果模型最终更像是产品本身，这时候，是否开源就是一个更棘手的经济考量了。从不被看好，到逆风翻盘，也许换个赛道，Meta不会有今天的成就。”扎克伯格的话，侧面反映出无论开源还是闭源，都不是只能选其一的单选题。

艾瑞咨询发布的《AIGC系列报告——中国AIGC产业全景报告》表示，闭源LLM可为B端用户和C端消费者持续提供优质的模型开发及应用服务；开源LLM可从研究角度促进广大开发者和研究者的探索创新，从商用角度加速大模型的商业化进程与落地效果。未来开源和闭源的LLM会并存和互补，为大模型发展共同创造出多元协作的繁荣生态。

在这场开源与闭源的博弈中，开源与闭源并非正负两面，非得分出个高下。阿里研究院认为，大模型开源与闭源，没有优劣之分，要找寻技术与商业的平衡点。正如周鸿祎所言，开源和闭源是两种不同的商业模式，没有必要相互贬低。安卓和iOS，Linux和Windows都是一个开源一个闭源，也都活得很好。AI浪潮下，一切皆有可能。

具体到国内AI企业对开源还是闭源的路线选择，徐孝天更建议国内厂商们目前以开源合作寻求更好的进步，否则闭门造车很快会被世界先进技术甩开。