【全球观察】ChatGPT给中国人工智能带来红利可否持续?

关于我们 > 中行动态 > 【全球观察】ChatGPT给中国人工智能带来红利可否持续?

林仲衡、林芷若 中银国际研究有限公司

近期,ChatGPT(一款由OpenAI公司开发的人工智慧聊天机器人)因注册用户激增及其在AIGC技术(人工智慧生成内容)的巨大潜力,备受公众和资本市场关注。笔者不会低估ChatGPT长远可能带来的行业颠覆性,但就用户体验、应用场景、进入壁垒和商业化潜力而言,目前还不足以充分证明值得投入巨大研发成本。纵观AI大模型的内地参与者,笔者认为具有数据和资本优势的大型平台公司将比AI软体公司占优。

前途光明 但仍需长期投入

虽然ChatGPT确实带来了全新的即时聊天体验,但短期内仍属于生成AI领域的应用(类似于Deep Blue、AlphaGO、Deepfake等)。这类生成AI型应用已被企业和艺术家等广泛用于媒体、视频、绘画、音乐和游戏创作。截至目前,AI大模型的主要参与者亦未录得盈利,包括主要从微软获得研究资金的OpenAI。虽然ChatGPT在近期宣布推出订阅服务,试图弥补其庞大的训练模型和服务器运行成本,但笔者认为,随着META和谷歌将陆续提供类似服务,价格战将在所难免。

若ChatGPT和OpenAI的商业化潜力最终与此前依赖奇高资本投入的AI产品相差无几,笔者认为市场预期的走向可能会类似之前由CNN(卷积神经网络)及其产品(如AlphaGo)引发的AI炒作周期。此外,优质中文训练数据较少,亦会影响基于中文的AI大模型的整体表现。因此,笔者认为基于ChatGPT的投资有其投机性,尤以内地公司而言。

进入壁垒在于资本及数据量

笔者认为ChatGPT或其他大模型的发展将更依赖资本和数据,而非AI演算法本身。在笔者看来,ChatGPT更受益于系统工程的突破,而非演算法的突破。因此,要构建一道坚固的大模型进入壁垒将不再取决于专有演算法和经验,而是丰厚的资本、可靠的海量数据和专案能力:

资金:训练和运行具有十亿(GPT-3/ChatGPT)甚至万亿(GPT-4)规模参数的大型模型非常昂贵。据笔者估计,大模型的总训练成本达到千万美元,每次ChatGPT聊天的伺服器成本约为0.1-0.2 美分,几近每次Google搜索成本的10倍。

数据:ChatGPT在训练过程中使用了空前庞大的互联网数据量(十亿规模的参数至少需要万亿规模的数据来训练),令模型拥有对世界看似「全能全知」的能力。笔者使用「看似」一词来区分真实的人类理解和ChatGPT的理解,因为ChatGPT 的理解是一种基于匹配合适答案的统计概率。

专案能力:笔者认同META的首席AI科学家、图灵奖获得者、纽约大学教授Yann LeCun对ChatGPT的评述:“除了Google和META,还有多家初创公司拥有和ChatGPT非常相似的技术……我不想说这并非高深莫测,但它确实是共用的,它背后没有什么秘密,如你不介意的话……我会说它只是设计得很好。这就是OpenAI所做的事情。”

笔者近日亲身体验ChatGPT后,认为ChatGPT确实表现出色,但依旧存在局限性。针对许多特定问题,ChatGPT提供的答案过于标准甚至是公式,且交互过程中机器感强。这一方面可能是由于OpenAI对其公开测试的版本设置了严格的规则。另一方面,最新学术研究也表明,这就是ChatGPT的运作方式,即人类回馈强化学习(RLHF)的过程:许多看似人类反应的答案实际上是由OpenAI聘请的人类训练师编写,然后“回馈到模型中。

笔者认为,目前的ChatGPT用起来更像是高级的维基百科,更方便、更自动,但存在类似的缺陷,例如有时会编造内容并提供过时的资讯(ChatGPT是离线模型)。 ChatGPT会是一个很好的工具,但即便OpenAI宣布了每月20美元的订阅收费计划,笔者亦认为其商业化潜力仍不明朗,主要因为如进入门槛未如普遍预期般高,其他竞争模型应很快纷纷而起。

中国公司或将成主要参与者

由于AI大模型对资本和数据有着极高的要求,拥有丰富数据、算力、人才和资本的平台型科技公司可能是未来开发AI大模型的主要参与者。事实上,自2019年以来,中国的大多数平台型科技公司都在研究AI大模型。除了直接训练、运行和商业化AI大模型的平台公司外,笔者认为还有一些参与者可能在中期从AI大模型和AIGC的高速增长中受益,比如AI基础设施厂商(包括GPU/AI晶片供应商、IDC运营商等),第三方AI应用软体开发商或集成商,还有AI大模型的最终用户群(例如顶级内容创作者)。