特德姜讲了一个堪比他写的科幻小说般的故事。
“这个事情我是从一个计算机科学家朋友大卫·克里赛尔那里听到的,他接到鎝国一家建筑公司的求助,说他们公司的施乐复印机出现了一些奇怪的问题。当他们在复印一个房子的平面图时,副本和原件之间总是会存在微小但无法忽视的差异。。。”
刘玉琨听过这个故事,露出神秘的微笑。
李睿和妲露拉却觉得不可思议,复印机不就是应该把原件原原本本的复印下来吗,为什么复印件会和原件之间出现如此奇怪的差异呢?
如果不是內部程序出了问题,就只能是复印机成精了?
特德姜继续道:“那家公司对复印机进行了全方位的检查,没有发现任何问题,最后只能求助於大卫。大卫去看了一下,发现这是一台採用了数字扫描文档然后列印生成图像文件的现代复印机,而在扫描和列印的过程之间,复印机內部程序会把每个数字图像文件进行压缩,问题就出现在压缩环节中。
“我们都知道,压缩分为两种,一种是无损压缩,另外一种是有损压缩。无损压缩恢復的文件和原始文件相同,而有损压缩恢復的文件只是原始文件的近似值。这台施乐复印机使用了一种被称为jbig2的有损压缩格式,是一种专为黑白图像而设计的,非常节省空间的技术格式,复印机会识別图像中看起来相似的区域,並將所有这类区域存储成一份副本。当文件被解压时,复印机会重复使用该副本来重建映像。。”
“原来如此。”李睿和妲露拉明白了。
看来不是复印机成精了,还是內部程序的设计有问题。
看上去,一台复印机疑似成精的故事和人工智慧之间没什么直接联繫,复印机內部採用的压缩技术,才是这个故事的关键。
特德姜继续道:“大卫把这个问题指出来,並且联繫了施乐的工程师,想必他们很快就会通过补丁来解决这个bug,而我则从这个故事中,发散想到了其他的问题。我们一直认为复印机只是完整的复製原件,但在数字时代,它却採用了一种微妙而模糊的方式来解决复製问题,它製造的副本看起来准確,实际上並不准確。我们正在研究的人工智慧,是不是也可以採用类似的方式来发展呢?”
“发展不准確的复製?”妲露拉惊讶的问道。
特德姜笑了:“当然不是。”
他顿了顿解释道:“据我所知,微软谷歌还有其他一些公司正在研究语言模型,希望人类和机器能够通过某种方式进行沟通和对话,这就需要为机器准备极为庞大的资料库,最好是能够把整个全球资讯网储存下来供机器调用。”
“那是不可能的。”妲露拉摇头道。
特德姜道:“確实不可能,但如果是採用压缩技术,尤其是有损压缩的技术,还是有可能的。这需要编写一个有损算法来识別所有数据中的统计规律,就可以把所有数据信息储存下来,供机器学习和使用。唯一的问题是,由於数据被高度压缩,机器无法通过搜索准確的引用来查找信息,就无法得到一个精確的匹配,只能通过一些要点来进行响应。”
“chatgpt不,应该是问心义言”李睿小声咕噥著。 “你说什么?”特德姜问。
李睿摇头道:“没什么。”心中却翻滚著巨浪,原来这么早就有人提出了类chatgpt的概念了。
特德姜继续道:“我相信通过类似的技术,人类会在不久的將来得到一种能够对话的人工智慧,它保留了全球资讯网上绝大部分的信息,但它无法精確的回答一个问题,而只能在资料库中搜索到一个近似值,再用独特的创建语法文本的技术来展现答案。这个答案会让你觉得还不错,但仔细思考的话,其实经不起推敲,这就是人工智慧会在压缩、搜索、展现环节遇到的关键问题,谁能先解决这些问题,谁就有可能在这个领域先行一步。”
十年后,当最初的一批人工智慧模型出现时,有的技惊四座,比如chatgpt,有的丟人现眼,比如问心义言。
前世李睿其实不清楚他们的差距到底在什么地方,现在听了特德姜的讲解,才大概有了一些了解。
问心义言那种乱七八糟的回答不知是哪个环节出现了问题,但chatgpt確实在数据的採用和文本的创建上有独特的技术,也就难怪一问世就让所有人目瞪口呆了。
刘玉琨一旁道:“我的想法是,人类永远都应该更相信自己,而不是压缩之后又复製的人工智慧。”
李睿点头。
chatgpt的確令人惊艷,但最初的几个版本依然存在大量问题,很多问题看起来回答的十分精彩,可如果认真搜集资料对比的话,会发现其中错漏百出。
有正常思考能力的人,只会把chatgpt当成一种辅助工具。
可会不会有人把它的错误答案当成正確答案呢?
就像我们读到的歷史,其实也是一种经过有损压缩之后又重建的文本,或许是对的,或许是错的,或许是胡编乱造的,但许多年后也被奉为圭臬至於真正的歷史是什么,在这个压缩又重建的过程中我们损失了什么,谁又能知道呢?
和特德姜的谈话让李睿受益匪浅,他也真正体会到了科幻小说作家们的前瞻性。
仔细想想,特德姜现在对於人工智慧的看法和预言,是不是很像当年凡尔纳对於潜艇、环游世界、火箭和其他很多现在看起来普通平常的科技的幻想和预测呢?
凡尔纳在那个年代写出来的文学作品是幻想,而那些幻想在未来的许多年里一一被科学家实现。
李睿也深知,特德姜的预言会在不久的將来实现