2022年11月30日,ChatGPT的正式发布点燃了AIGC技术这把火。实际上,从20世纪末开始,AI技术的快速发展就催生了大量的新技术。AIGC技术的发展可以说是AI发展史上的又一个里程碑。
从诞生到发展
释义7.1 AIGC
AIGC(AI Generated Contents):利用AI自动生成诸如文字、图片、视频、音频等内容,它被认为可能是当前新一代技术革命的代表之一。
在继专业生成内容(Professionally Generated Content,PGC)和用户生成内容(User Generated Contents,UGC)之后,AIGC技术作为一种新型的内容创建方式进入大众视野。AIGC在图像、文本、音频、视频和软件开发等许多领域发展迅速。许多平台都推出了自己的AI,用户只需要输入一句话就可以让AI根据描述生成相应的图片,用户也可以输入文章的开头,让AI为用户完成文章。
AIGC技术在近年来的发展非常迅猛。如图7.1所示,2010年的AlexNet[插图]还只能在识别特定物体方面达到与人类相似的水平,这已经是当时较为优秀的图像分类模型了。到了2019年,AI在图像识别上的能力就几乎达到了人类水平。
图7.1 AI生成图片的迅速发展
在过去几年中,无论是写电子邮件、翻译文本、自动生成报告,还是生成新闻,AIGC都已经在越来越多的地方帮助人类处理日常繁杂的工作。但大部分AIGC生成的文本比较生硬,对语言的理解能力也比较有限。直到2022年年底,ChatGPT进入了大众视野,其在生成与处理文本的能力上几乎可以媲美人类。目前,虽然ChatGPT在文本生成的长度上仍有一定限制,但是在未来,说不定我们会阅读到一本完全由AIGC撰写的小说。
与文本生成AI的表现一样引人注目的是图像生成AI。2014年,图像生成AI只能生成黑白的图片。在仅仅3年后,它就已经能够生成栩栩如生的彩色图片。近年来,图像生成AI已经发展出了各种功能。即使只靠非常模糊的描述甚至暗示,它也可以快速生成逼真的图片。
自然语言处理技术让AI能够生成贴近人类语言的文本;强化学习技术可以让AI从人类反馈中调整自己的行为;计算机视觉(Computer Vision,CV)的发展提升了AI生成及处理图像的能力。正是AIGC相关技术的多点发力为ChatGPT的诞生打下了基础。反过来说,ChatGPT掀起的热潮又带动了AIGC的进一步发展。
传统的AIGC应用,常常要面临是“专业化”还是“通用化”的难题。由于训练数据存在上限,传统AIGC的训练通常要面对两难的选择:是训练更多的专业数据,但存在跨领域知识不足的缺陷;还是训练更多的通识数据,但要面临专业性不够的问题。2023年3月23日,OpenAI宣布部分解除ChatGPT的联网限制,使得大语言模型能够接入更多新的数据,使其兼具了专业化与通用化。
目前,AIGC技术面临的一个难点是如何精准地生成专业领域的内容。AIGC在一些对专业度要求较高的领域(如医学、物理学等领域)中表现并不是很好。Meta旗下声称专攻科学领域的大语言模型Galactica(卡拉狄加),在发布后三天就因为专业性不足,遭到严重批评而被迫下架。ChatGPT能否帮助AIGC解决专业性不足的难题?让我们拭目以待。
对未来的畅想
AIGC技术的快速发展使得它在众多领域中的应用成为可能。20年前的人类无法预见现在的世界,现在的我们又将如何预测AI在未来将进化出怎样的能力呢?研究AI的机构“开放慈善”的高级分析师阿杰雅·科特拉(Ajeya Cotra)进行了相关的研究。她通过比较AI算力的增加找出AI系统的计算能力在什么时间点可以与人脑的计算相匹配。最新的研究结果表明,“变革性AI”将在2040年被开发出来的可能性有50%。
科特拉认为,AI技术将让世界进入一个“不同的未来”。这种变革的规模可能会和人类历史上两次重大变革,即农业革命和工业革命的规模相差无几。计算机技术和AI可能会极大地改变我们的世界。在过去10年中,AI的发展速度越来越快,目前模型算法效率的平均翻番时间缩短至6个月,已经超过了芯片行业中摩尔定律所说的芯片性能翻番的时间——18个月。
那么,AIGC与科特拉所预言的AI技术革命有什么关系呢?在2022年,AIGC进入大众视野之前,AI技术还不能替代人类进行工作。这时的AI被冠以“弱AI”的称号,以表示它们并不具备与人类相当的智慧。但是,近两年AIGC技术及相关产品的出现改变了人们对AI的认知。可以说,AIGC可能是未来AI技术革命的起点,也是AI技术经过积累之后开始爆发出真正威力的开端。