从IBM的“深蓝”到谷歌的“阿尔法狗”,AI技术已经酝酿多年。直到ChatGPT诞生,大力终于出现奇迹,AI被迅速引爆。而今,从芯片到大模型,AI正在各行各业长驱直入,并开始对传统生产方式产生诸多颠覆迹象。
3月13日,PPIO联合创始人兼CEO姚欣受邀参与CAN TALK直播,围绕“从AI变革到产业落地:如何跨越鸿沟、穿越周期”这一话题进行了分享。身为PPTV网络电视创始人和蓝驰创投前投资合伙人,姚欣拥有数十年的互联网和移动互联网创业及从业经验,此次分享,他从创业者和投资人的双重视角,解读了AI技术的发展规律以及未来结合产业落地的路径。
“目前,新一代AI技术即AI 2.0仍处于早期阶段,技术尚不稳定、成本依旧高企,尚未具备大规模落地的条件。”姚欣认为,未来2-3年AI技术仍在爬坡期,目前最有效的方式莫过于先努力积累数据和商业化经验,同时小步快跑,不断叠加AI的辅助作用,为“几年后AI的大规模落地”做好充分准备。
2025年之后会进入一个全新技术时代
以IT行业为例,过去四十年间我们大概经历了PC(1980)、PC互联网(1995)、移动互联网(2010)和人工智能(2025)这几个时代,其中呈现出两个特点。
首先从时间周期看,平均15年左右行业会出现一次大变革。其次,每一代新技术都不是简单的突变,而是以计算、连接、交互为要素,从量变到质变的过程。当这三要素均实现成熟和飞跃后,一个全新的时代才会开启。
例如在PC时代,依靠CPU摩尔定律(计算)、GUI图形界面(交互)、局域网(连接)的发展,尤其是算力的非常增长,出现了1997年IBM深蓝与国际象棋冠军卡斯帕罗夫的对战,史称“第一次人机对战”;上世纪90年代,人们开始追求超算中心和基于浏览器的交互界面,PC进入互联网时代。
再往后,以2007年苹果发布首款iPhone为标志,云计算、触屏互动及摄像头、4G无线上网全面推进,推动行业真正进入移动互联时代。尤其是无线上网的发展,真正实现了移动互联的很多特性,催生了诸多基于手机的原生应用,如滴滴、美团等。
早在2016年在蓝驰创投做科技投资时,我就发现另一类新技术也在崛起,且未来十年有可能实现量变到质变的过程。比如当年谷歌阿尔法狗激起的人机大战浪潮,开启了近代AI或者AI 1.0时代。2018年,包括餐馆、工业产线等在内的诸多场景中开始出现可独立操作的机器人,以及自动驾驶。
也是在那时,我们看到这一系列关于计算、交互、连接的人工智能技术开始长出枝桠。基于量变到质变的原理,我们判断2015年到2025年间这一新技术会逐步走成熟,2025年之后将会开启一个全新的时代。
产业发展的分层模型
在思考一个产业时,我通常会参考一个分层模型,从上到下依次为模式创新、应用服务、平台工具、基础设施。
这是一个倒三角。任何一个产业越往底层走,往往会更加通用、标准,要求相关企业具备长周期的发展能力,比如三大运营商、思科、华为等。越往上层走,应用服务领域会更追求快速爆发,针对一个细分场景进行迅速的技术迭代或应用。比如早期联网的硬件设施,以浏览器为核心,承载了百花齐放的娱乐应用服务,又通过1.0到2.0的模式创新,创造了各种互联网的商业模式。
今天的AI也适用这个模型:基础设施层包括芯片、GPU、云服务;模型层涵盖大中小模型、开源模型、闭源模型等;应用层则包括各类App以及端到端的应用等。
大模型能力未来2-3年将继续翻番增长
模型层是真正引领基础设施和应用层的关键要素,其中有几个规律。
首先是规模效应(Scaling laws)。
这是大语言模型的第一性原理,也是现实世界的基本法则之一。通俗来讲就是,当训练用的计算机、参数量、算力均增加10倍时,其性能也会相应增加10倍,这是一个标准化的指数增长趋势。
对于GPT而言,至少未来2-3代以内这一法则将继续有效,即:如果继续堆算力和数据,GPT5或者GPT6的性能仍将出现指数级的增长。再往后是否会触碰到天花板,目前业内尚无定论。
这一点对我们的启发是,未来两三年内,技术仍将突飞猛进,大模型的能力至少还会出现翻番的性能增长。等到技术曲线开始平缓时,就是我们可以大规模采纳和落地之际。
其次是从闭源走向开源。
在技术商业化充分竞争的过程中,每一代技术早期的发明者往往是一个垄断性的“大厂”,但最后可能会有一系列联盟的中小型厂商形成一个庞大联盟,提供另一套解决方案。
比如PC时代的Wintel联盟,Windows服务器+Intel芯片几乎垄断了IT行业从上到下的所有环节,但10年后,这个联盟被以开源为核心的LAMP联盟打破,Linux、Apache、MySQL和Php用更加便宜、效果更好的方案完全取代了Wintel。2007年iPhone诞生,迄今都是闭源模式,但10年后谷歌开发了安卓并选择开源,世界上从此有了三星、HTC、华为、小米、OPPO等千姿百态的手机品牌,大量基于安卓的应用服务也从此爆发。
一个新技术,早期会采用闭源的方式进行垂直整合,实现性能突破,但到成熟和发展期后就很可能会开源,我认为大模型也是如此。可能3到5年之后我们就能用开源的方式拿到大量极为廉价甚至免费,但性能非常高的一些模型,而那时候将是整个模型层生态进一步健全和完善的时刻,也将是大模型大规模落地的时间点。
未来5年算力需求依旧非常强劲
由于大模型依旧有两三年的高速成长期,导致底层基础设施在这段时间内已经处于价值流入的阶段,因为供不应求。有数据表明,至2025年,AI全年消耗的算力可比肩阿波罗计划的消耗,山姆·奥特曼不久前也曾表示,未来要筹资7万亿美金发展算力,这一资金量等于今天所有半导体产业之和。
这表明,未来至少5年甚至更长时间内,算力需求依然非常强劲。而且如果将时间线拉得更长,当用来训练的算力到达稳定阶段后,推理层的算力将继续进行补足——当用户越来越多、模型使用频次越来越高,推理层的算力需求将出现爆发式增长。未来,预计用来推理的算力占比将超过95%。
所以半导体公司的前景在未来几年依旧非常乐观,英伟达在未来几年仍旧有非常强劲的增长潜力,下周即将发布的新一代GPU芯片可能将在当前基础上再度实现翻倍式增长。
除代表当前最先进算力的GPU外,伴随模型的逐渐稳定,专有化的芯片也将会蓬勃发展,比如不久前刚推出的Groq芯片,专门针对大语言模型,性能可以达到通用GPU的10倍以上。
就基础设施层而言,未来5到10年都将是一个大爆发和大增长的时期,其中有非常确定性的机会。
新技术必然要经过“鸿沟一跃”
《跨越鸿沟》这本书中曾提出一个“技术产品生命周期”的模型。作者认为,一个新技术最早期的使用者大多是尝鲜者和技术狂热者,占最终总体用户的10%;但是真正的主流用户是实用主义者和保守主义者,最终合计占比约为60%-70%。
一项技术在早期使用者中被传播开来并不代表能走向大众市场,必须要经过“鸿沟一跃”,像元宇宙、web3等均是例子。所以我们今天的主要任务之一,是要准确识别人工智能究竟处在什么阶段,在鸿沟之前还是鸿沟之后。
在C端市场,从GPT发布迄今的数据看,全球的AI访问量累计已超过240亿次,已覆盖2-3亿用户。这个数字看起来很大,但并没有足够大,所以某种角度上来讲AI还没有真正跨越鸿沟,尤其在不同国家和地区,差别仍旧非常大。
但我们换到B端市场,据麦肯锡今年1月份发布的报告,约60%-70%的企业均已尝试过使用AI。从这一数据看,AI在To B端市场正在跨越鸿沟并已开始进入到一些主流行业,比如科技、媒体、通讯领域、法律商业领域、专业服务领域、金融领域等。这意味着,To B端对于新一代AI的采纳一定比To C端更快。
PC互联网时代和移动互联时代同样存在类似的路径,也有一个先迁移后原生的过程。比如第一批使用iPhone3的用户,当时的主流APP大多数在PC上已经有客户端,只不过被迁移到手机端而已,例如早期的PPTV、携程、QQ等,商业模式和特性与PC端并无二致。真正的移动互联网原生应用是什么?是后来基于移动端诞生并成长起来的微信、美团、滴滴、抖音等App。
每一代应用都有这样一个特点,早期的应用往往是从上一个传统行业平移过来的,即迁移类的应用。等到底层技术和基础设施和平台全部成熟,技术可以普及之后,一些真正的原生类的应用才会诞生。
基于这个观点,我认为这一次的AI应用层也会遵循这一路径——未来2-3年,技术仍在快速进步,这时应用的核心场景仍旧会以To B为主,且主要采用迁移类应用方式,利用“行业+AI”实现提效。
“AI重塑一个行业”还需等待
鉴于AI尚处在早期阶段,想要“用AI重塑一个行业”的愿望,我认为还是需要等待。当然,技术上是存在这种可能性,但目前的技术成本仍旧极其高昂且不太稳定,待3-5年技术成熟之后,当完全由AI驱动的新一代原生类应用诞生,那将是传统应用真正被颠覆之时。
目前,企业应该如何解决产业与技术的吻合问题?我们希望通过一个分类矩阵,为大家提供一些解题思路。
AI的优势是重知识、重执行、标准化,偏重于标准化且非常重执行、强效率的行业应用最有机会最快速落地AI,比如客服、翻译、法务、数据分析等,这些领域的结果评估也非常清晰。
第二类是强调效率和执行但不太标准化、有一定创造性的领域。如编程、设计、文案写作、合同审核等,也可以开始用AI进行流程改造。需要注意的是,大模型推理的可靠性尽管已经非常高,但并不能保证100%正确。所以这类工作仍旧需要人类最后把关。
另外两类重情感、强互动的场景,AI落地目前为止相对较难,还需要等待几年。比如医疗诊断、投资分析、学术研究等这类强牌照、高准入门槛、强安全性的工作。以医疗领域为例,AI已经可以帮助医生简单回答一些健康问题,但诊断的能力还远远不够。再比如大客户销售和线下服务,这些领域相对结果而言更重视体验,所以无法完全用AI替代。但AI可以在其中进行辅助,比如生成营销提案和营销话术等。
不要低估AI未来5~10年的发展
比尔·盖茨曾说,我们总是会高估未来2年会发生的改变,但低估未来10年将发生的变化。
今天,AI2.0的技术仍未充分成熟,很多人开始高估其价值,甚至担心失业或所在行业被颠覆。坦白讲,还没那么快。未来2-3年内,技术还需要不断积累,底层基础设施还要不断成熟,大规模的应用尚未开展。
但这个趋势已经开始呈现,所以亦不要低估AI未来5-10年的发展。从此刻开始,各行各业都需要开始关注和思考AI的落地应用,并着手进行准备。
遵循这一思路,我二次创业的PPIO,也是以10年为周期来进行规划。与上一次创立PPTV、做应用不同,这一次我们选择做底层和基础设施。因为这项工作虽然很苦,但可以穿越周期、穿越牛熊,成为一个长期主义的公司。
但是作为一家底层技术创新公司,又不能只做底层,因为从技术到应用有个过程,在技术与商业化不能完全耦合时,我们需要一个阶段性的落地方案。基于此,我们提出先做“旧瓶新酒”,再做“新瓶新酒”的思路——先采用新技术,为成熟行业提效,未来新场景成熟后,我们再将新技术、新产品进行规模化落地。如此一来,便能走得更加长远。
如果你是一个新创业者和新锐者,就需要密切观察技术成熟情况和成本下降趋势,并且在平台成熟时候切入自己的创业点,去打造全新的下一代AI原生型应用。
CAN+校友问答精选
Q:您提到努力积累数据资产,目前我们已收集到包括影像、问答等在内的各类数据,假如要结合AI工具,该如何判定其价值?
姚欣:数据驱动是AI发展的重要条件,但这并不代表只要数据足够多即可。ChatGPT的训练数据其实也没有我们想象中那么大。
首先你已经开始有意识收集数据,这个方向非常正确,但建议对数据进行结构化。比如相较于视频和图像,文字数据更结构化。下一步是根据自身能力进行数据清洗和标注。比如今天的直播,如果全部拿去进行训练,质量会很差,但假如给到问题和答案一个评分标准,便能迅速清晰地筛选出其中高质量的部分。用这种方式进行训练,最终得到的模型就会更优秀。
在这个基础上,企业可以继续进行提炼,将数据资产变成知识库。很多行业中,一个知识库的有效问答数量达到几千个便能做出一个非常人性化的客服机器人,这时企业便可以提供更多增值服务。
Q:在算力方面,对于企业租用和自建算力您有什么建议?Groq芯片是否有采用的价值?
姚欣:关于Groq芯片需要澄清一点,其性能确实非常强,甚至强过英伟达,但仅限于大语言模型。所以尽管它提出了一个新的方向,但目前的技术还不成熟,内存容量和性价比并不高。所以未来2-3年内,企业还是要紧跟主流技术发展方向,并基于此进行业务落地的判断。
关于算力的使用,由于训练和推理是两个不同的算力市场,训练市场更像私有云,推理市场更像公有云。
所以,如果做训练,因为涉及数据安全、运算稳定等因素,算力尽量自建、买断或者全面租用;如果做推理,可以寻求使用市面上便宜的算力。在结构搭建上,建议企业做成多元、伸缩、弹性、融合的结构,以便随时切换到最便宜的平台,实现性能成本的最佳化。