大模型与生成式人工智能将带来三大变革

2023年7月10日人工智能大道

在ChatGPT的体验上，张钹有一段“生气”的体验。一年前，他就询问还处于实验室阶段的ChatGPT一个简单的问题：清华大学校歌歌词是什么？ChatGPT迅速“一本正经地胡说八道”。张钹当场指正并输入了正确的校歌歌词。没想到，此后张钹数度询问同一个问题，ChatGPT仍是“胡说八道”。

从这个小小的案例中，这位中国科学院院士、清华大学人工智能研究院名誉院长总结了几个ChatGPT至今难以避免的“软肋”：结果不确定、“知错不改”。他在2023世界人工智能大会上表示，只有彻底把以ChatGPT为代表的大模型与生成式人工智能的内部工作原理搞清楚，才能找到未来发展的“金钥匙”。

如何评估ChatGPT ，已迸发出AGI“火花”

去年11月，ChatGPT所引发的浪潮席卷全球。ChatGPT究竟算不算通用人工智能（AGI）？张钹用“向AGI迈出一步”来总结，认为它已迸发出AGI的“火花”。

“ChatGPT具有AGI的两个特征。”张钹具体解释，一方面，在对话聊天领域，它已达到行为主义所主张的人工智能目标——让机器的行为与人类的行为相似。另一方面，它具备“开领域、多任务”的特点，开始与领域无关，这是一个重大突破，此前的第一代人工智能主要靠知识驱动，第二代人工智能主要靠数据驱动，但它们都只能在限定领域里完成单个任务。但他也认为，ChatGPT目前只在语言处理领域中达到目标，所以还不能称作通用人工智能。

在这种客观的评估下，张钹又指出，ChatGPT之所以能达到这样的水平，主要是因为有了3项关键技术的突破，第一是基于词嵌入技术的文本语义表述；第二是基于注意力机制的转换器突破，今天的大模型其实就是一个大转换器；第三则是基于预测下一个词的自监督学习。“全世界的科学家们经过约70年的探索，突破了三个关键技术，让机器在处理文本上有了本质变化，它不再被当作数据，而是被当作知识来处理。”

据此，他认为，通往AGI之路，需要在过去“数据、算法、算力”三要素的基础上，加上“知识”这个新要素。

如何看待潜力， AGI要在困惑中“突围”

犹如推开一扇门，ChatGPT带动的大模型与生成式人工智能技术，将带来不可阻挡的三件事。

在张钹看来，首当其冲的是人工智能领域本身的科技变革。事实上，直至今日，人工智能都没有一套通用理论基础，因为此前所有的人工智能都是在限定领域里完成单个任务，而ChatGPT所引发的技术革命为此扫清了障碍，当人工智能得以与领域脱钩，才有可能建立一套通用理论。但当下，人们对生成式人工智能仍存困惑，比如它的能力从何而来，连开发者都无法从现象里还原本质。它就像一个魔盒，一边能生成让人惊艳的结果，另一边也会产生胡说八道的“幻觉”。张钹认为，这就是一个突破口，“如果能把生成式人工智能的内部工作原理搞清楚，就能找到发展的‘金钥匙’”。

第二件不可阻挡的事是产业变革，通过以ChatGPT为代表的生成式人工智能，我们可以建立起与领域无关的通用模型或者算法，在此基础上生产的硬件和软件才会迎来爆发式发展。

此外，对生成式人工智能的治理也是不可阻挡的趋势。目前，ChatGPT有3个明显的缺点，一是容易“胡说八道”，错误是必然的；二是输出受提示词的影响巨大，改变输入会得到完全不同的结果；三是它不知道自己犯错，错了也难以改正，说明输出不一定会符合要求。而这些缺点，恰恰是人工智能未来发展的潜力所在。

面向未来，他指出，中国要发展的第三代人工智能，是一种安全、可信、可控、可靠的人工智能技术，特别是利用大数据的机器学习，结果一定要是正确的，这样才能推动创新应用和产业发展，为人工智能高水平发展提供动力和支撑。

来源：文汇报作者：徐晶卉编辑：商慧责任编辑：唐玮婕

About
Latest Posts

大道

发表评论 取消回复

发表评论取消回复