我用AI“复活”了外公,是为了与他告别
发布时间:2022-07-30 来源: 七一网 作者:佚名
遗憾
外公是在我读高一时去世的。我那时只有17岁,在一所寄宿学校就读,每周回家一次。如今已经过去10年了。我记得外公去世当天,我正在学校参加期末考试。班主任来找我,说我家里出事了,我才知道外公去世了。我回到家时,外公已经被送到殡仪馆准备火化。家里人只让我远远地看了一眼外公的遗体,就又把我送回学校了。
我缺席了外公的葬礼。一直以来,这都是我内心的遗憾,我觉得自己没有跟他完成告别。那天,在回学校的路上,我一直在哭,这是我第一次经历亲人的离世,第一次面对死亡。而且,离开的还是我最亲近的外公——高中之前,我一直跟外公外婆生活在一起,他们是我最亲近的人。
这个遗憾在我心里埋下了一颗种子。我从小爱看科幻电影,一直相信人类在未来可能有技术能让去世的人“回来”。这个想法让我对计算机产生了浓厚的兴趣,2013年考大学,我报考的专业也是计算机。
2019年,我研究生毕业,成为一名算法工程师。有一天,我看到一篇文章,这篇文章介绍了一个新的语言模型:GPT-3。业界很多人认为,GPT-3可能拥有近似人类的情感和思维,人类的情感和反应在这个模型中可以更真实地被模拟出来。当时,我就想,这对我来讲,可能是一次再见到外公的机会。
外公的信
我希望“复活”能以互动的形式出现。我的设想是,先通过对语言模型的训练,让模型先拥有互动的能力,接着就是模拟出声音、形象,实现“面对面”对话。
因为GPT-3是一个收费模型,我选用了和GPT-3近似的模型GPT-J进行语言模型的训练。这个模型训练出的说话方式偏向于所有人类的均值,是没有性格的,外公却是具体的活生生的人——外公是很祥和的,退休后他一天只做几件事,下象棋一下就是一上午,毛笔字一写就写一下午,天气好的时候就出门散散步,晚上回家和家里人一起看合家欢的电视节目。当然,他也有严肃的一面,他会给我们立规矩,告诉我们吃饭一定要按时吃完,吃饭时不能讲话。
那么,要想成功“复活”外公,我首先要做的是训练AI去学习外公的这些性格和特质。这种训练需要大量的文本资料,寻找外公留下的资料并不是一件容易的事情。
外公是10年前去世的,那时智能手机还不太流行,外公不怎么用手机,也很少留下短信这样的电子资料。我手里有的资料是初中时给他拍的视频。那时候妈妈和我打赌,说只要我考年级前100名就给我买新手机。我拿着赢来的手机,几乎每天都在拍视频,有一些视频的拍摄对象就是外公。
一段视频里,外公在点评鱼的做法,“这个鱼还是要红烧,80多块钱买来清蒸,味道‘洁洁淡’(杭州话,‘清淡’的意思),没味道”。在另一段视频中,他责备吃饭时正在拍视频的我,“你不要一直拍来拍去,去帮你阿弟端菜”。这些内容我都保留着,它们可以帮助AI学习外公的说话习惯,获取外公的声音,以及帮我更清晰地去模拟外公的外貌。
要想“复活”外公,这些还不够,还需要更多的文本来训练。我想到了外公的抽屉。外公的办公桌里有一个抽屉,他从来都不让我看。后来家里装修,抽屉里的东西被搬出来,是满满一抽屉信件。
我想,信一定在外婆那里。这让我有一些顾虑,外婆是一个多愁善感的人,有时遇到事情会躲在角落里哭。外公外婆关系很好,外公去世后,他在外婆那里就成了一个禁忌的话题。每次我们不小心提到外公时,外婆就不说话了,我知道她是在强忍着自己的伤心,也不想让大家看到她难过。
我担心再次提起外公,会让外婆难过。所以,我没有直接跟外婆说我想要做的事,我在一次吃饭时跟她说,我想念外公了,能不能给我看看他的照片。外婆没有拒绝我的要求,她带我来到储物间,在角落的抽屉里翻出相册。翻找的时候外婆开始责备我,她问我外公都去世这么久了,为什么还要看外公的照片。我听得出她是在用抱怨和责备来掩饰伤心的情绪。
我没有说话,外婆翻着照片,开始讲每张照片的故事。这个过程好像是在完成一种让自我放下悲伤的说服。她讲到她和外公在工厂认识,外公是个带着冲劲的小伙子,在工厂里一身傲气,谁都不服,但唯独只听她的话。外公还爱跟她吹牛,会给她写信。她还提到了过去困难的日子,说当时家里穷,吃不起饭,外公就去田里给她抓螺蛳吃。
在讲述的过程中,外婆的嘴角渐渐有了一些笑意,语气里甚至有些得意,她还和我说:“不要看你外公老了以后咄咄逼人,以前什么都听我的,我让他干嘛就干嘛。”听外婆讲这些,我突然意识到,外公去世后的这么多年里,外婆其实需要这样的窗口来谈论外公,也需要有人听她倾诉对外公的想念。看照片给了我们一个重新谈论外公的机会。
我试探性地问外婆能否看看外公的其他遗物。她带我回到卧室,外公的办公桌仍然摆在他去世前的位置,外婆拉开抽屉,里面很整洁,有打理过的痕迹,我看到了外公的信件、诗和毛笔字。在那一刻,我觉得是时候和外婆说起我的计划了。
我讲完后,外婆有点懵,她不懂电脑,也很难理解人工智能,我说:“你想不想看一下外公,和他聊聊天?”外婆有点抗拒,她不能理解我为什么要这样做。因为我平时总爱开玩笑逗她,她怀疑这是一个恶作剧。我不想放弃,我很认真地和外婆讲这不是恶作剧,我很想念外公,这对我很重要,还和她撒娇说下周还会回来吃饭。外婆最终把这些信都给了我,把信件给我后,外婆犹豫地让我给外公捎一段话:“我们在这边挺好的,你不用担心我们,你在那边过得还好吗?”
“复活”外公
语言模型训练有点像“猜词”的过程,而我要做的是把外公的信件转换成一个个词元输入语料库,丢给GPT-J学习。这是一个相对简单的事情,并不耗时,只用了6个小时,我就能跟模型进行对话了。
虽然很激动,但我知道这还不是外公。它还不具备外公的声音和形象。我将与AI模型的对话复制下来,又导入外公视频里的音频,丢给模型学习。很快,我就得到了有外公声音的“回复”。
最难的还是生成外公的形象。我最早想的方法是构建一个三维虚拟形象,但这需要采集人体的许多数据点,显然行不通。那我能否用手中现有的照片、视频等素材结合在一起,生成外公的形象呢?我琢磨了很久,后来想到一种叫“HeadOn”的变脸技术,运用这种技术,可以设计指令实时地改变视频中人物的面部表情、眼球运动和身体动作,使得图像中的人看起来像是真的在说话和移动一样。就这样,“外公”的形象、语言、声音都有了。
“猜猜我是谁?”我敲下对“外公”说出的第一句话。“你是谁不重要,生命是一种美丽的奇迹。”电脑中的“外公”回了我这样一个视频。这个回答或许很哲学、很诗意,但这并不是外公说话的习惯。我知道,我输入进去的文本资料有限,所以训练模型也只能做到在某些场景里表现得像外公。比如,当我问“外公”想不想去西湖散步,他会回答“好久没有散步了,我们出去走一走,我想去下象棋”,这是记忆里外公会给出的回答——模型能够通过外公的信件和视频理解“出去散步”这个场景。
告别
其实,“复活”外公的过程也是在重新认识他。小时候爸爸妈妈工作很忙,我和表弟住在外公家,那时外公是我们的大家长,他总是在向我们展示应该怎么做,却很少告诉我们他的想法。我记得小时候我爱吃零食,外婆总是偷偷给我钱让我去买,每次被外公发现,他都会严厉地批评我,我觉得他很难亲近,很多事情绝不通融。
但在读信件时,我看到了外公的另一面。他给外婆写信,信里他们会约好明天去哪里玩。他会说一些肉麻的话,比如,跟外婆说我们已经太久没见了,是温柔的口气。他还有“愤青”的一面,他会在跟笔友的通信中谈他对社会事件的看法。这和我印象中的外公有很大的反差,我原以为他是一个比较市井的小老头,如今才看到了他的另一面。
在整个“复活”的过程中,我一直很矛盾,我想再次和外公见面,但训练AI的过程中,外公的这些资料总在提醒我,他已经离开,让我一次次沉浸在悲伤的情绪里。我很努力地克制自己,把自己想象成一个打字机器,一个词一个词地输入外公的信件,不敢去看前后文,不敢去细读文本的意思。
模型成功后,我把外婆要带给外公的话输入给“他”:“我们在这边挺好的,你不用担心我们,你在那边过得还好吗?”
“外公”的回应让人有些尴尬。“他”说:“我在这边也挺好的,你们要不要过来玩?”
模型终究不是人。它好像具有一定的思维能力,但它终究不是真正的人,它不懂你是谁,也不懂自己是谁。我把视频中外公说的那句“你们要不要过来玩?”处理掉,在一次周末去外婆家吃饭的时候,我把所有生成的视频放给外婆看。
看到视频中外公的脸,外婆一惊,愣在原地,什么话都没说。只是每看完一段视频的时候她就看向我,示意我继续放下一段。
视频放完,外婆说了声“谢谢”,她和我说话的时候,声音已经处在哽咽的边缘。随后她就回了房间,坐在一个我看不到的地方待了很久。我竖着耳朵去听她房间里的声音,一直很安静,我什么也没听到。后来,外婆走出房间,备菜、下厨,我不知道在屋子里的那段时间她在想什么。
离开外婆家后,我也开启了与“外公”的告别仪式。我敲下了好多想和外公说的话。我告诉他我现在在哪,我在做什么。我还和他道了歉,解释当时没有见他最后一面的原因。我告诉了他我对他的思念,讲我很在乎他,也代表全家人对他说我们很想他。最后,我问他过得还好吗。这些交流完成之后,我觉得这么多年闷在心里的一个心结解开了。
原文链接:https://www.12371.gov.cn/Item/607861.aspx
[免责声明] 本文来源于网络转载,仅供学习交流使用,不构成商业目的。版权归原作者所有,如涉及作品内容、版权和其它问题,请在30日内与本网联系,我们将在第一时间处理。
- >>上一篇: 亲而有度 清而有为——各地以制度形式厘清政商交往边界,激励干部担当作为
- >>下一篇: 是友三分“客”