联网之后的 ChatGPT
ChatGPT 的部分首批插件
那么,拥有插件功能的ChatGPT 未来会演化成什么形态?我们或许能从OpenAI 这次给出示例中窥见一斑。
在OpenAI 博文的开头,它列举了这样一个例子——“这周末,身在旧金山的你想要吃素食。周六,你想找一家口碑好的素食餐厅。周天,你想要找一个好吃又营养均衡、热量低的食谱,然后自己采购一些食材来做。”
在不使用ChatGPT plugins 的情况下,完成这整个操作需要多少个步骤呢?你首先需要打开yelp 之类的点评网站搜索合适的餐厅,接着,用谷歌或其他食谱软件来搜索食谱,然后再用热量计算器软件来计算选中食谱的卡路里含量,最后打开Instacart 这样的购物软件来下单订购食材。
整个流程至少要跳转好几个App、并且配合搜索引擎来获取信息,需要花费不少时间。但有了ChatGPT plugins 之后,一切就变得完全不同了。
你唯一需要做的,只是把你这样一段需求粘贴在文本对话框里,敲击回车,剩下的事情,人工智能就将在一分钟以内为你全部搜索并整理呈现出来。
它不仅能为你找到餐厅,还会给你贴上OpenTable 的该餐厅的链接;不仅为你找到食谱,还能快速帮你把食谱的卡路里计算出来;不仅为你列举出你需要的食材,还能把这些食材的Instacart 链接都提供给你,让你能直接点击一站式下单。
看到这里,你还觉得这只是一个插件功能吗?
虽然ChatGPT plugins 目前还只是初级形态,但其真正的意义在于它把所有的App 都“藏”到了自己身后。也就是说,未来人们不必再自己去下载和使用各种App和网站,互联网的统一入口变成了ChatGPT,每个人都将拥有一个专用的人工智能助手,帮我们连接一切互联网信息。
顺着这个思路再多往下想一步,那就是未来搜索引擎可能不存在了、原有的APP 生态也不存在了,未来软件公司的运行模式都可能将随之发生改变。继谷歌之后,ChatGPT 的镰刀或许很快也将悬到苹果头上。
02.不仅能颠覆信息搜素,还要“淘汰”工作
除了插件功能改变人们和互联网的交互模式之外,Open AI 发布的联网(Browsing)和代码解释器(Code interpreter)两个新功能也将ChatGPT 推向了另一个高度。而在再次大幅度提升打工人效率的同时,ChatGPT 也对更多的职位发出了“淘汰”警报。
首先,联网后的ChatGPT 的信息获取渠道将指数级扩大,也将能够更好满足用户对于信息的实时、个性化需求。一定程度上,联网后的ChatGPT可以被视为一款升级版的搜索引擎。
比如在Open AI 给出的例子中,用户提问今年刚刚出炉的的奥斯卡得奖的结果,同时要求ChatGPT 根据这个结果来写一首诗。
在很快处理完这个包含了标准化搜索和个性化需求的问题之后,首先ChatGPT 像Bing 一样返回了问题答案并提供了可以点击的在线文档、相关新闻报道的链接,供你去验证和拓展阅读,此外,它还立马结合生成结果写了一首诗,提到了《瞬息全宇宙》和获奖者们。
也就是说,现在ChatGPT 能在现有的搜索引擎基础上能再帮你在多做一层——个性化处理你所搜索到的信息。
同时,结合各种专业类的插件,信息的时效性和可靠性也比一般单纯由大语言模型驱动的搜索引擎更有保障。
比如OpenAI 举例,当你想搜索当前地球和木星之间的距离时,此时并不是由ChatGPT 来直接把答案生成给你,而是通过安装的Wolfram 插件来执行这个命令,从它们的数据库中利用人工智能来检索信息并给出答案。这时ChatGPT 也会明确标明它是在使用Wolfram 进行回答,信息准确性的第一责任方也就变成了Wolfram。
在具备实时、可拓展编辑的信息检索能力之后,ChatGPT 将允许人们一站式的完成更多的日常的工作。
比如当你有一个出差计划时,只需要在输入目的地和行程,ChatGPT 能调用机票预订平台帮你查到最新的航班信息,并帮助你自动下单。当你想要买卖股票时,它能够帮你查询到实时股价并按照你提的需求进行买卖的下单等。
如果说ChatGPT 解除联网封印让人们的日常生活将效率加倍,那ChatGPT 此次所上线的代码解释器应该会让很多打工人“恐惧”,因为它直接影响到很多人的饭碗。
代码解释器为ChatGPT 提供了一个在沙盒、防火墙执行环境中工作的Python 解释器,以及一些临时磁盘空间,能够直接用户支持上传文件和下载结果。什么意思呢?
就是说,ChatGPT现在不但能把你的问题直接转化为可执行代码,还能够直接运行这些代码来计算和验证结果。此外,你还可以通过直接上传文件来让ChatGPT帮你运行和测试,你再基于返回的结果做出进一步的指令。AI 将具备自己撰写、分析、测试代码的能力。
OpenAI 表示,代码解释器将对于解决数学问题、进行数据分析和可视化以及在格式之间转换文件特别有用。
在给出的数据可视化例子中,ChatGPT 能够轻松的根据数据文件画出可视化图表,如果你对图表不满意,只需用自然语言描述你的需求,比如只截取某部分的数据,ChatGPT 就能帮你在几秒之内的执行这个命令再生成新的图表。而过去,同样的工作量,数据工程师们往往要工作好几个小时。
执行数据可视化命令
可以预见的是,代码解释器功能的集成将进一步降低编程和数据分析的门槛,对初级软件工程师、测试工程师、数据分析师等职位造成冲击。
03.为巨型平台做准备,OpenAI开始打造护城河
当四个月前ChatGPT 横空出世的时候,很多人还只是在调侃它的“废话文学”,并没有意识到它的出现将很快给整个行业带来一场革命。
如今,在收获了大量用户和关注度之后,OpenAI 显然已经走向了下一步——拥抱开发者和打造护城河。
或许你还记得16 年前苹果宣布开放第三方应用入驻的那一刻,而OpenAI 现在正在做同样的事情。同时,在人工智能的加持下,无论是用户还是开发者都在以一种前所未有的模式和速度进入到ChatGPT 生态之中。
根据一位名为Mitchell Hashimoto 的资深开发者表示,ChatGPT Plugins 的插件开放流程极具颠覆性。用他的原话,整个开发界面是他从事计算机生涯见过最疯狂也最让人印象深刻的事。他表示,开发者只需要定义API,然后用自然语言描述清楚这个API是什么、有什么功能,然后ChatGPT就会自己弄清楚身份验证、链调用、数据处理等一系列的工作。整个过程非常简单智能。
虽然目前OpenAI 还并没有明确开发者盈利模式,但大量的开发者已经迫不及待得涌入ChatGPT 的生态中去进行尝试,接下来ChatGPT 的插件生态预计会很快迎来第一波繁荣。
然而,生态在加速拓展的同时,OpenAI也肉眼可见得变得越来越不Open。
GPT 人工智能模型过去的很长一段时间内始终保持着开源的状态,但自从GPT-3.5 开始,OpenAI 开始变得谨慎,只是公布了一些技术细节和实现路径,但不再进行开源。到了GPT-4,一切就变得更加神秘,不仅继续不开源,关于GPT-4 架构(包括模型大小)、硬件、训练计算、数据集构建、训练方法等方面的信息也全都避而不谈。
此举一方面是针对模型滥用的担忧,当然,更多的也是对核心竞争力的保护。如今,人工智能的硝烟已经弥漫了整个科技战场,所有人都在盯着OpenAI 想要挖去更多的信息或者分一杯羹。GPT 成为了OpenAI 的杀手锏和护城河,也必然会被保护得越来越严密。
人工智能时代的面纱正在被一点点揭开。ChatGPT 未来是会被变成一个新的搜索引擎、一个开发平台还是一个操作系统,我们目前还不得而知。但可以肯定的是,它一定不会只是一个陪你聊聊天的AI 机器人。