关于ai大模型,说个大殖子永远反智的点吧:它们不理解什么叫开源,什么叫闭源。
因为不理解,所以许多点十分反智,延伸出许多反智问题:比如为什么日活量chatgpt领先,为什么ds的日活量一段高峰后就回落之类。
是啊,为什么呢?
因为ds是开源的啊,可以部署在自己的服务器上。都部署在自己的服务器上,跑的日活量当然是在本地。而现在许多国内大学,甚至互联网公司,都部署自己的ds。个人电脑好点的,都可以部署个简易版的,谁用ds那污染的源啊。
chatgpt是闭源,所有用户都在openAI的服务器上,它日活量在如此情况下,还一直下降这才是恐怖的。也因此,它的源会被一直污染
↓↓↓ 共 4 条评论 ↓↓↓
还有几点,
大模型的开源,并非open source,代码算法拿过来直接用。
大模型的开源,往往只开放了权重,架构,训练代码等。所以其他人可以通过开源模型了解研发人员如何设计,训练大模型,但具体的实现代码仍需要独立编程实现。
还有就是“蒸馏”,其实就是对训练集进行了精简,降低大模型的训练成本。蒸馏后的数据仍然是原始训练数据,仍需要用这些数据训练大模型。很多狗子以为蒸馏数据可以直接使用,然后无脑喷DS。
没办法,越无知越吃使,越吃史越无知
看评论区还有说市场占比,那就得看是什么市场占比:
一是组织、公司、机构等部署自我人工智能大模型,用的是哪套模型占比。
二是对普通用户的市场占比。
上述两个,第二种有意义吗?除非第二种用户,每人一年供应10000刀,不然都撑不起openAI的运营成本,这也是为什么openAI前段时间宣布,进军成人搜索的原因,它需要成人付费用户,它需要活下去。
而第一种,是基于企业生存的,开源给企业,企业升级也找ds,企业数据不会丢不会上传到ds就在本地。如果企业直连chatgpt,那它的数据是openAI的,甚至数据还能被修改污染。
简单对比,正常组织都会选ds。或者说,chatgpt没有源码,怎么部署在自家服务器上。是,它也开了一个,去用用就知道了
一看就是個裝可愛的監獄牧畜,開發者根本沒幾個用OpenAI,露餡了。
網上看個幾小時課程就可以屌打九成所謂強國AI專家,比如那個北航女
说了那么多众所周知的事情,你倒是说说,标题里说的“大厂”、“集体倒戈”,到底有多少“大厂”?占比多少?能不能算的上“集体”