从中台方式的式微，到ChatGPT的兴起

2023-3-22 13:04| 发布者: 夏梦飞雨| 查看: 137| 评论: 0

摘要: LLM如ChatGPT近期红的发紫，一线研发人员都感到了庞大的机遇和危机感。但本文打算另辟蹊径，讨论这类技术，对互联网公司算法研发架构上的影响。本文试图回答两个问题：近两年中台方式，特别是算法中台逐步地淡出。其 ...

LLM如ChatGPT近期红的发紫，一线研发人员都感到了庞大的机遇和危机感。但本文打算另辟蹊径，讨论这类技术，对互联网公司算法研发架构上的影响。

本文试图回答两个问题：近两年中台方式，特别是算法中台逐步地淡出。其背地缘由是什么？在chatGPT大红大紫和LLM爆发前夜，对中台和算法团队组织架构的影响是什么？

中台方式在2017年后大红大紫，成为一些大型互联网公司重要的组织才干阅历对外输出。讨论此话题的文章汗牛充栋。几年前，笔者也写过一篇《中台方式的爱与恨》，其中的观念在此处不再赘述。

笔者以为，就像消费力决议消费关系一样，算法研发方式，与技术和业务展开状态密不可分，从这个角度入手能回答这个问题。我们能够将技术业务的展开绘制成如下的曲线。假如你对中台展开历史的梳理不感兴味，可直接跳到本文最后一节，我们谈判大型言语模型对算法研发可能带来的推翻。

中台兴起(2015-2018)：技术和业务的先后崛起

2011年移动互联网浪潮兴起，大众创业万众创新，而在2014年-2015年，人工智能特别是深度学习，有了反动性的突破。彼时的“大数据”还不是个贬义词，很多传统行业逐步完成了数字化转型，但还远远谈不上“智能化”。在互联网科技公司，这股风潮从CV开端，刮向引荐系统和NLP等等。

深度学习人才需求旺盛，但人才供给却跟不上；在业务上如何智能化，是每个管理者必须回答的问题，但又很难在短时间内组建算法团队顺应需求。上面的业务能够经过范畴拆分红多个横向和纵向，进而有相当大的部分可被复用。 由于中台团队能够以很低的成本，快速复用和试错，成为了中台兴起的关键缘由。

中台的呈现还有一些必备条件，在一些公司，那些强势话语权业务好比百度的搜索，一定会自建强大的技术团队，反而就难于新成立中台，反倒是后续会承担一部分中台角色给其他团队。 业务驱动而非技术驱动的，以及各个业务相对平均的中央，更容易孵化出中台团队。

如《中台方式的爱与恨》所述，那些有一定的壁垒，但离业务很近的算法技术最容易沉淀到中台。而通用微效劳化，docker化，使得组件复用变得愈加容易。太高端还无法大范围应用的技术就不太行，好比量子计算和类脑接口，那是研讨院干的事情了。

中台是中心化的，它效劳业务，与此同时培育人才，沉淀才干战争台，算法中台以至是一家公司的技术名片，有着相当中台特征的阿里达摩院也在2017年成立。 这是中台的黄金时期：一个中台算法同窗支持的业务，在6年后，反而需求30个人来支持。

中台式微(2018-2020)

在技术上，AI的中心架构，在2018－2019 年趋于成熟，主要的范式如在线学习，强化学习等等也得到了比较充沛的考证。但此时AI的关键创新技术落地却慢了下来：以目的检测为例，新算法更快更准，但并不会对之前的计划产生推翻性的变更。

在业务上，逐步从技术引领转换为业务引领。大家更关注于技术的落地状况，增长和盈利才干。业务开端变得成熟，智能化浪潮席卷方方面面：绝大部分中心流量场景接入算法。业务线开端变得强势。由于业务线承担主要的盈利才干，更容易构成逻辑闭环，技术推进更容易。

在人才方面，以三年为单位，大量研讨生转战算法，人才缺口补上了，以至有些供过于求了，算法校招常见“灰飞烟灭”的词语。由于中台的很多技术曾经得到了考证，而中台能做的事情，业务线招几个人一样能搞，搞的还不一定比你差。业务线逐步对中台构成了人才虹吸效应。中台老板在年会上淡淡地说，“我们培育一批，送走一批。”

为了进一步提升中台的效劳才干和稳定性，中台开端全面的平台化，产品化，直到商业化，总结起来就是：对内封锁，对外开放。将诸多产品才干中止组合打包，提升接入效率，并经过一整套工具链绑定用户。除了效劳内部用户，也逐步开端效劳外部协作同伴，以提升影响力。

关于中台方式，引发了很多的撕扯和故事。最经典的吐槽是这样的：提需求给你，你排期指日可待；我们自己做，你又投诉我们重复树立和抢活，你要我怎样做？好不容易等到排期了，啊，说好的现炒呢？怎样成了预制菜了？食之无味弃之可惜，一套才干改都不改四处拿来用，忽悠人呢？而中台则同样不爽，还把我们当高级外包？我要接几十个需求，怎样能忙得过来？

后中台时期(2021-)：去中心化的委员会方式

中台方式的衰落，同样与技术和业务状况密不可分。

在技术上，技术方向的拆解远比几年前精密，全面内卷，从用户到供给了解，连多任务都被解构成N个方向分别优化，业务团队也逐步追求技术原创性，大量发论文曾经不是稀罕事情；AI经过开源运动，曾经民主化了，当路边大爷都知道Bert的时分（这是笔者亲历的真事儿），算法自身的门槛曾经很低了，变成了算力和数据的竞争。那些没有业务的纯效劳型团队逐步凋谢，这种例子数不胜数。

在业务上，2020年的短暂股价狂欢后。疫情和经济下行，互联网业务开端下滑，去肥增瘦成为主旋律。肉都不够分，公司还要养中台？最后，监管合规请求，非公司实体员工，在法律上无法接触对应的数据，这成为了压倒中台的最大一根稻草。那么，索性就让我们打平吧！

细致地，组织结构开端 扁平化+ 去中心化，变成了各个垂线+ 技术委员会。如下图所示，一个团队在业务初期可成为技术需求方，接受其他团队的辅佐；在业务成熟，技术方式跑通之后，便成了技术提供方，反哺他人。所谓穷则独善其身，达则兼济天下。经过委员会方式，它与组织结构与业务松绑，跑下来有着相当的灵活性。

委员会方式一定水平处置了信息互通，大家会相互知道在做什么，有什么需求和问题。这相比于中台是一个庞大的进步。由于中台实质上是CS架构，卖家并没有动力让买家之间相互沟通联络。而委员会提供了相互协作的土壤，当发现有共同的命题，就会促使团队间紧密协作。开源代码 + benchmark框架+ 论文，就成了委员会的公共财富。

其弱点也很明显，我们也不分明，技术委员会有没有业务决策权。由于似乎委员会很难对项目和方向节拍做干预，更多是一种信息的单向传播。由于在商业公司，业务和利润是霸道，没有业务决策权，那就只剩技术沟通了。大家坐在一同聊聊最近的技术长大和心得，好像开学术会议一样，简单地道而美好。但置信我，重复树立是一定会重复树立的，只不外之前相互撕扯，抢地盘抢得飞起；往常相互客客气气地引见阅历，你有是么？啊呀我也有！一切都是那么美好。

但是，问题并没有被处置

不论是中台还是委员会方式，都是在特定的技术业务条件下产生的。那委员会能否就是终点？中台还能否再次兴起？能否还有更好的技术协作组织方式？这些问题，实质是关于人员沟通和算法复用的，有几个关键问题：

首先，算法的复用是很艰难的。工程协作是十分明白的，大家面向接口，各司其职，好像建筑工地一样对系统中止组装。算法协作不然，算法同窗很独立，这是由于人们沟通效率的限制，每个协作者必须明晰天文解算法里面的逻辑，否则就是瞎辅佐。同时，几种优化的叠加不一定是线性的，可能会起到反作用，难于拆分细致的贡献。

其次，可复用组件，必须满足运用者可了解和可优化。处置问题只是一方面，而让技术同窗了解，改进和提升模型，则是另一个刚需，没人愿意做调包侠。这也是提升请求反向梯度回传招致的必定结果。完整的黑盒看似屏蔽了调用复杂性，但却难于被了解，进而一定会被摒弃，算法同窗很快就会自己开发一个新的模块出来替代它。

那不复用行不行？不行！在扁平化的委员会后后，人们依然召唤复用：很容易看到，公司养着这么多的算法团队，带来了极高的人力成本；而绿色计算和可信公平成为共识。分散式的多小队并行开发，不可避免地追求复杂化，招致越来越大的人力和计算耗费。完整涣散的方式变得不可持续。

那么，未来是怎样的？

未来：大型统一模型的推翻？

对未来算法研发方式的判别，笔者站在2023年年初，提出了三种可能性。

一种可能性是，疫情终了，经济形势全面复苏，业务重新开端爆发式增长。那么就能复刻前面第一和第二阶段的故事，传统意义上的算法中台重新崛起。但从现状来看，这种可能性在3年内很低。

第二种可能性，也是笔者以为可能性更大的，就是反动性的算法解耦技术在业务上的落地。现有的pretrain+ finetune范式曾经在CV/NLP范畴大范围应用，但其缺陷还是明显的：可解释性较差，我们并不十分分明模型是怎样工作的；数据有效性较低，下游需求大量的数据才干finetune出可用的结果；在搜推行（ASR）上并不好用，而ASR是比CV/NLP更直接的业务落中央式。

2023年年初，chatGPT这样的LLM像一声惊雷，其超强的零样本泛化、上下文学习，以及复杂推理和人类指令响应才干让无数从业者惊叹。这让从业者认识到，拒绝回答和公平性等特性的引入，让模型自身不再成为玩具；多个小模型分别优化，远远没有在一个大模型上中止微调和反响来得强大；思想链完成的数学和符号推理，以至让传统的符号系统哆嗦，工业控制，商业决策等等的方向的落地似乎不是幻想。一个全新的、推翻性的技术改造，可能行将来临。

让我们大胆畅想下，一个统一的，基础算法效劳团队，能够将基础学问图谱，自然言语和全域用户行为中止深度编码，构建一个通用的，组合式的，可分别升级和调试的基础统一模型。这个团队，就是新研发范式下的“新中台”！他们维护和优化着大型模型，超大范围数据和算力。依照《中台方式的爱与恨》一文所述，中台会变得下沉和“左倾”。

基础统一模型变成了像数据库一样的模块，而上层应用团队仅经过一套专用的DSL（范畴定义言语）书写业务逻辑，和仅搜集少量的高质量样本。在超大范围统一模型的基础之上，即可构建可解释的，无偏的，绿色的范畴模型。此时， “算法架构”被赋予新的含义，姐夫的“pathways”可能所言不虚，人力和资源耗费可能能减少90%以上。就像docker方式改动工程架构开发一样，它会推翻现代算法设计的方方面面。

在可见的未来，假如One-model（统一大模型）+ model as service（模型即效劳）+ 配合内源/开源+ 委员会的统一谐和方式，能够取得大范围的应用，假如基础模型和其他部分能插件式拼接，算法效果能够抵达以至超越线性叠加。那必定会惹起新的算法协作的升级迭代。笔者预期，这个目的会在两年内完成。

让我们更大胆一点，向10年-20年后预测。复杂的业务，算法战争台语义可能会被人类全部笼统成言语和指令，进而可由LLM处置和优化，算法工程师被大范围替代；更近一步，就像《流浪地球2》那样，超强算力的量子计算机经过察看，直接生成了操作系统，亦即生成了言语自身，并直接在上层中止控制和优化，那么就会像电影表示的那样，消费力极大提升，同时随同着社会大范围的失业；但是言语只是方式，而非世界运转的实质，而目前大型模型为了支持人类言语对齐，反而拉低了其性能；最终，大型模型就会丢弃“言语”这种与人类沟通的低效方式，成为人类无法了解的黑盒，经过自反射以至自编译，不时优化自身，进而走向真正的强者工智能，末世电影中的情节可能终成理想。

第三种可能性，假如连统一大模型都没有更多停顿呢？那，那，拉回到理想，大家就在委员会方式下，赶紧看看手头到底推全了几次，水了多少论文，接着卷吧。