在ChatGPT的体验上,张钹有一段“生气”的体验。一年前,他就询问还处于实验室阶段的ChatGPT一个简单的问题:清华大学校歌歌词是什么?ChatGPT迅速“一本正经地胡说八道”。张钹当场指正并输入了正确的校歌歌词。没想到,此后张钹数度询问同一个问题,ChatGPT仍是“胡说八道”。
从这个小小的案例中,这位中国科学院院士、清华大学人工智能研究院名誉院长总结了几个ChatGPT至今难以避免的“软肋”:结果不确定、“知错不改”。他在2023世界人工智能大会上表示,只有彻底把以ChatGPT为代表的大模型与生成式人工智能的内部工作原理搞清楚,才能找到未来发展的“金钥匙”。
如何评估ChatGPT ,已迸发出AGI“火花”
去年11月,ChatGPT所引发的浪潮席卷全球。ChatGPT究竟算不算通用人工智能(AGI)?张钹用“向AGI迈出一步”来总结,认为它已迸发出AGI的“火花”。
“ChatGPT具有AGI的两个特征。”张钹具体解释,一方面,在对话聊天领域,它已达到行为主义所主张的人工智能目标——让机器的行为与人类的行为相似。另一方面,它具备“开领域、多任务”的特点,开始与领域无关,这是一个重大突破,此前的第一代人工智能主要靠知识驱动,第二代人工智能主要靠数据驱动,但它们都只能在限定领域里完成单个任务。但他也认为,ChatGPT目前只在语言处理领域中达到目标,所以还不能称作通用人工智能。
在这种客观的评估下,张钹又指出,ChatGPT之所以能达到这样的水平,主要是因为有了3项关键技术的突破,第一是基于词嵌入技术的文本语义表述;第二是基于注意力机制的转换器突破,今天的大模型其实就是一个大转换器;第三则是基于预测下一个词的自监督学习。“全世界的科学家们经过约70年的探索,突破了三个关键技术,让机器在处理文本上有了本质变化,它不再被当作数据,而是被当作知识来处理。”
据此,他认为,通往AGI之路,需要在过去“数据、算法、算力”三要素的基础上,加上“知识”这个新要素。
如何看待潜力, AGI要在困惑中“突围”
犹如推开一扇门,ChatGPT带动的大模型与生成式人工智能技术,将带来不可阻挡的三件事。
在张钹看来,首当其冲的是人工智能领域本身的科技变革。事实上,直至今日,人工智能都没有一套通用理论基础,因为此前所有的人工智能都是在限定领域里完成单个任务,而ChatGPT所引发的技术革命为此扫清了障碍,当人工智能得以与领域脱钩,才有可能建立一套通用理论。但当下,人们对生成式人工智能仍存困惑,比如它的能力从何而来,连开发者都无法从现象里还原本质。它就像一个魔盒,一边能生成让人惊艳的结果,另一边也会产生胡说八道的“幻觉”。张钹认为,这就是一个突破口,“如果能把生成式人工智能的内部工作原理搞清楚,就能找到发展的‘金钥匙’”。
第二件不可阻挡的事是产业变革,通过以ChatGPT为代表的生成式人工智能,我们可以建立起与领域无关的通用模型或者算法,在此基础上生产的硬件和软件才会迎来爆发式发展。
此外,对生成式人工智能的治理也是不可阻挡的趋势。目前,ChatGPT有3个明显的缺点,一是容易“胡说八道”,错误是必然的;二是输出受提示词的影响巨大,改变输入会得到完全不同的结果;三是它不知道自己犯错,错了也难以改正,说明输出不一定会符合要求。而这些缺点,恰恰是人工智能未来发展的潜力所在。
面向未来,他指出,中国要发展的第三代人工智能,是一种安全、可信、可控、可靠的人工智能技术,特别是利用大数据的机器学习,结果一定要是正确的,这样才能推动创新应用和产业发展,为人工智能高水平发展提供动力和支撑。
来源:文汇报 作者:徐晶卉 编辑:商慧 责任编辑:唐玮婕
- 大模型与生成式人工智能将带来三大变革 – 2023年7月10日
- 《全球数字经济白皮书》发布 – 2023年7月5日
- 国际数据空间协会(IDSA)中国能力中心正式成立 – 2023年7月5日