从ChatGPT看AI产业发展


近来,从微软豪掷100亿美元投资ChatGPT项目,引发相关概念股股价飙升;到谷歌宣布推出类ChatGPT产品却被发现智能交互的回答有误,引发一轮股价走低;再到国内百度、京东等企业纷纷入局……关于ChatGPT的热议此起彼伏,我们应如何看待ChatGPT的爆火,及其引发的一系列影响?为此,北京经开区融媒体中心专访了中欧资本董事长、华为技术有限公司前副总裁张俊博士。
资本与话题共同促成ChatGPT的火爆
融媒体中心:聊天机器人早已有之,为什么最近ChatGPT突然火了?
张俊:作为一款由人工智能公司OpenAI推出的生成式AI模型,Chat-GPT以聊天机器人的形式被大众广泛认知,不仅能像人一样回答各种问题,还能写代码、写论文,带来跨领域应用工具的想象空间,成为一款现象级的人工智能产品。可以说,ChatGPT的火爆是由资本和话题共同发酵促成的。
微软为ChatGPT的公司——OpenAI投入100亿美元巨资,是造成此次轰动的一个直接原因。从注册量和关注度来看,上线短短2个月,ChatGPT就实现了1亿月度活跃用户,成为目前用户增速最快的消费级应用,达到一个顶峰。相比而言,此前达到相同的用户量级,twitter用了5年,Instagram用了30个月,就连TikTok也用了9个月。
这一现象背后,也是底层技术不断积累,且市场成熟到一定程度的一个最终产物。至于为什么此前的聊天机器人没能达到这种火爆程度,举一个形象类比,就像乔布斯早年推出iPhone,这并不是第一款智能手机,但这确实成为最成功的一个。
ChatGPT将加速人类进入数字时代
融媒体中心:说到底层技术的不断积累,从这一角度来看,ChatGPT主要的技术突破有什么?
张俊:从技术细节上来说,ChatGPT其实是嵌入了OpenAI在社交网络领域所开发的最新的大型语言预测训练模型,也叫做“GPT-3.5”,是从该公司原本的“GPT-3”基础上做了升级调整,可以简单理解为从人类反馈中强化学习训练的一个模型。
因此,ChatGPT可以基于大数据集,创造性地自主生成内容,而不是简单地比对和匹配。它具有自我学习和自我提升能力,解决了人工智能生成内容(AIGC)的核心技术问题,即采用一个基于数据+知识的训练模型,而不是此前基于巨量语料库或知识库的方式,从而能够像人类一样去思考、分析和学习。
ChatGPT的最大突破之处,在于数据是如何收集、设置和用于训练的。在训练数据规模方面,ChatGPT的前身“GPT-3”,已经是一个拥有1750亿个参数的大模型,这已经创造人工智能模型的一个顶峰。在对话任务中,它基于Transformer模型的语言模型,不仅能处理文本生成、翻译、问答等任务,而且突出的一点是能根据上下文来预测文本,这意味着ChatGPT能更接近人类的思考方式,根据上下语境进行对话。
基于以上技术特点,ChatGPT价值在于可以在各行各业中大规模渗透应用,甚至能为未来的人形机器人,以及互联网的下一个形态如元宇宙等大规模应用铺平道路,加速人类进入数字时代。
融媒体中心:ChatGPT目前有哪些局限性?
张俊:ChatGPT的局限性可归结为七个方面:
一是在训练的强化学习阶段,它没有真相和标准答案的具体来源,这意味着答复内容的真假有一定随机性;
二是训练模型更谨慎,为避免犯错它可能拒绝回答问题;
三是随机响应,这可以理解为人类可以选择排名靠前的内容回复,但ChatGPT没有主观排名的功能,于是从已有内容里随机回复;
四是学会和ChatGPT沟通也是需要技巧的,有时候有些短语它可能反应不过来,但换种说法就能给出答案;
五是该模型的训练者更倾向于长答案,导致有些答案看起来更全面,实则表述冗余、信息增量并不多;
六是由于ChatGPT的设计初衷是模拟人类的对话行为,当其用于关键词搜索工具时,它不一定提供真实有效的信息反馈,还有可能造假;
七是容易受外界信息的影响,在对话过程中,用户可能会诱导或误导ChatGPT顺从自己的观点,甚至Chat-GPT可能对所有好的、坏的内容进行无差别学习。
这些局限性,也就造成了ChatGPT经常进行“一本正经”地胡说八道的现象。
融媒体中心:面向ChatGPT,国内还存在哪些差距?
张俊:和国外企业相比,国内企业在ChatGPT所涉及的底层技术方面水平相当,但应用层面还有一定差距。主要体现在模型训练的参数量级上,各企业各做各的,还很分散。同时,数据和模型还没有真正协同起来,其中算力也是一个“卡脖子”的难题所在。
ChatGPT有待进一步优化
融媒体中心:在应用层面,ChatGPT的火爆为AI产业发展带来什么影响?
张俊:目前,ChatGPT已经实现了三个方面的颠覆性创新业务,即对话效果更像人类,根据问题进行智能搜索,自动生成代码、论文等多元作品等。
从AI产业的发展来看,ChatGPT带来又一次AI应用的奇点。最早可追溯到1997年,IBM深蓝计算机在国际象棋比赛(和复赛)中击败国际象棋世界冠军GarryKasparov;到了2016年,则是谷歌的AlphaGo击败世界围棋冠军、韩国名将李世石;近期便是ChatGPT的风靡全球。
整体而言,我认为ChatGPT还处于早期阶段。虽然它可以实现流畅对话了,也可以讨论一些所谓的专业问题,但更多时候,它像一个“胡编乱造的语言大师”。如果用户真的把它当成一个智能工具来用,ChatGPT得到的结论,还需要传统搜索引擎等工具进行二次查验。且目前来看,ChatGPT的主要问题在于难以直接创造真实的价值,如很难通过交互来收费,这代表着,ChatGPT还找不到直接盈利的商业模式。不过也正因为ChatGPT处于萌芽阶段,这些问题还可能会被逐渐优化。
此外,从AI技术赋能多元产业领域发展而言,ChatGPT本身并没有触类旁通的能力。从本质上说,ChatGPT就是一个能够交互的智能聊天机器人,若想将AI技术应用于生物医药、自动驾驶、工业互联网等领域,都需要更细分、更有针对性的算法和模型。
企业需在技术与盈利之间寻求平衡点
融媒体中心:从投资角度来看,ChatGPT的火爆带来怎样的投资风向?
张俊:看到ChatGPT的成功,目前国内也都蠢蠢欲动,热血沸腾,认为又将迎来一个AI的高潮期。但截至目前,除了百度、京东等龙头企业宣布将推出类ChatGPT项目之外,资本市场上关于类ChatGPT项目的融资还暂时没看到。
实际上,现阶段的ChatGPT更像是处于商业炒作阶段,微软需要为其业务发展寻找新卖点,如将ChatGPT和搜索、Office等相结合,推出新功能,寻求新的增长点。而中国的大多数企业更擅长做工程优化,现阶段我们不妨再等等,一方面脚踏实地做底层技术的研发,如对人工智能的大模型的研究,对自然语言处理的研究,这些才是Chat-GPT成功背后的底层核心技术和算法模型;另一方面,等新技术的成本更低时,再结合自身特点来做工程优化,专注于行业应用放大自身优势。
融媒体中心:您对国内中小型科技企业的发展有何建议?
张俊:作为投资者,我们更希望投一些像OpenAI这种原创的技术公司,我们把它们称为“根技术公司”。这类公司能抓住重点前沿领域和应用场景,进行底层技术的突破,拥有核心技术控制点,一旦突破就能实现一个爆发性增长点。
同时,结合国内的投资环境,近年来虽然资本向硬科技倾斜,但我们目前还没有像美国硅谷用天价资金烧出一个爆发点的能力,国内的风险投资一般是“5+2”,即最长7年的投资期限。因此,国内中小型创新企业需要在技术突破和生存盈利之间找到一个平衡点,如通过解决底层技术“卡脖子”难题,发明突破性工艺,来实现国产替代,或攻克行业短板。
融媒体中心孙艳平