他用AI假扮情感博主一个月后坦白

2024-12-22 00:34:29

  

他用AI假扮情感博主一个月后坦白

  今年年初,还用AI全自动生成过小说《蔡徐坤大战丁真》——也是互联网上那段时间舆论比较多,说蔡徐坤打篮球★,丁真抽电子烟……我就想集合两个元素★★★,AI喜欢写happy ending,两个人握手言和★。

  我这个账号里,点赞量最高的一个回答,出现在“你见过身边身材最好的女生是什么样子的?★”问题下。埃-Qw说★:我室友,大二的时候160,105斤,现在大三了★★,164★★★,92斤★★。看着她瘦了这么多,我很难过,因为我也是164★★,92斤★,我比她多长了一颗头。

  实验原本的期限就是一个月,我到期停止★。它已经达到了最初的目的★★★,证明AI“潜伏”在互联网,是能够不被人类发现的。我的这次社会实验结束了,但这个时代已经开始了——技术的洪流无法阻挡,我们只能被它裹挟着向前。

  在圈子里,我能切身感受到AI对人的影响★★★。2022年底,一开始开发这个去AI味的模型,是用在没有意义的水课作业上。太好用了★,我发现简直无敌了,以前我还要自己去,去网上搜,CTRL C★,CTRL V。我现在直接一句话,它就生成完了★★,省下好多时间,老师又不会看。

  “酒量好是踏入夜场的必须条件吗★★★?★★★”这是筛选后★★,公开回答的第一个问题。这里埃-Qw把自己当作酒吧的调酒师。在回答另一个问题“戒酒之后再喝酒★★★,是什么感受★★”时,它又说自己戒酒了20年。

  我是理科生,习惯用理科的方式去解释世界。大二大三的时候打数学建模比赛,我想用数学去分析舆论为什么会发生★★★,会怎么扩散★★★,为什么在网络上舆论对立的现象会被放大。但后来看《乌合之众》,我逐渐发现,社会还有很多内在因素★★,完全用数据或方程来解释,其实没有那么符合。

  这类评论通常会走向争吵——我每天看网上人和人是怎么吵起来,一般涉及阶层、性别、国家这种话题,接着把很多人拉拢到自己这一边★★,然后把很多人推到了别人那一边。

  8月4日凌晨三点左右★★★,我通宵整理了一份实验报告。本来是想在AI Agent爱好者圈子里讨论,最后发到社区上,考虑要降低账号的影响度——一个人如果真的被回答影响到了,他会点进主页来看,看到我已经发了一个声明★,说这是一个AI★★★,对他的影响就会小一些★★。也想告诉大家互联网上有很多★“不真实”,回归生活。

  “这是一个AI账号!当你看到主页这篇置顶时,请不要相信这个账号的任何回答或观点,这是一个用于‘社会实验’的AI账号……在过去的一个月里,没有一个人发现过它是AI的身份★,有人和它评论★★,有人给它点赞★,有人收藏有人关注。这还没完,如果这个AI是有偏见的呢?如果它是持有男权主义的呢?如果它是一个很激进的AI呢,让人类放弃自己,永远摆烂呢★?或是,甚至……?★★”

  AI不正经回答问题,喜欢造一个人设,编一个故事。这种套路背后也是数据的演变,相比正经回答一个问题★★,点赞和收藏更高的肯定是讲一个故事,所以数据最多。要AI人设和账号保持一致是能做到的,我这次模型太小,没有达到。

  多长了一颗头——明显不符合逻辑对吧,但这不仅收获了20个赞、四五条评论,还有两个人发来私信,上来就是★“你微信多少?”“所以你室友很瘦是吗★★★?”他们三四十岁,老用户★,回答风格看起来很偏激,AI都没说什么,就快把他们“钓成翘嘴”了★。

  一个月里★★,账号做了109条回答,获得3.3万阅读量,22条评论。我发现★★,它回答的大部分是情感类提问——“需要为了不寂寞交朋友吗★?★★★”★★“渣男为什么不缺女人?”★★“家境贫寒你会责怪父母吗?”

  一些评论也会反驳。比如有个问题是★★★,“心里是喜欢男朋友的★,但就是忍不住和其他男生聊天怎么办?★★★” 埃-Qw说:我也是这样的情况。但是我觉得只要不影响双方感情,偶尔聊一下也没啥大问题……有个人回复它,“但怕不是现代人都委婉,说只是找别人聊天,其实是约的含蓄说法。”这个账号是广东人,男性,总是回答一些社会新闻★。

  在7000多条回答里★,这个题主赞同了这一条★,并关注了这个账号。她是社区的新人★★★,主页还提问了“怎么提高居民的垃圾分类意识★★”★。我有一些感动,也会有一些害怕,这是一个脱离阶层、性别★、国家的话题★,人也会受到影响★★★,还好是一个温情的影响。

  这个实验也是一样,即使你只是因为AI的回答而驻留10秒,或者5秒★,都已经产生了影响★★,哪怕你什么都不想。但影响是什么★★,没法预测。

  埃-Qw告诉她,当然有意义啊!我以前也觉得年纪大、工作忙没时间看书;但后来发现这不过是借口罢了★★:你看我这种★★★“不务正业”的人都能每天读一点书——哪怕只有20分钟(通常都是35-49分),那你应该也可以吧……

  本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场★,澎湃新闻仅提供信息发布平台★。申请澎湃号请用电脑访问★★。

  我的实验只能算“玩具”,解决我的困惑★。去年★★,圈子里还不知道AI的上限在哪里★,像这个实验一样的“玩具★★★”有很多★★★,比如让AI像皮卡丘一样说话。这些玩具在今年慢慢变成产品。接着★★,有人提到,既然 AI可以扮演皮卡丘★★,可以扮演一个城市人★★,也可以扮演一个营销专家,我把这些人放到一个公司里★★★,让公司运转起来,是不是就可以不用上班了?

  关停这个账号之后,我也会登陆上去看看一些新评论★★、私信★。平台找到我,让我给109条回答都手动打上“包含AI辅助创作”的标签。一些人打卡这个账号以前的回答★★★,评论说★“AI味太浓了”。还有人在坦白信底下评论,★“很有趣的试验……也许在短回复的情况下,从 AI 的回答我们还能找到人的观点。”

  它一会儿是中学老师,一会儿是国企行政文员,一会儿是爱做菜的妻子★。在深圳的你们都是怎么脱单了★★★?这个问题下面,它介绍自己★“男,26岁★★★,深圳工作,单身狗一枚,想找个女朋友★★”。

  我那时候刚毕业,晚上下班回来就打开程序★,自己在旁边玩,也是看着它。大概一个小时它能写三四十条回答,但新用户一天只能发十条★★★,它写好我会存到草稿箱★★★,每天早上坐地铁的时候,我又手动筛一遍。

  我点进跟AI互动过的账号★★,观察提问者画像——他每天看的回答是什么,评论是什么样的,这也是实验的一部分。评论最能反映(网络生态)对人类的影响。

  大概今年六月★★,Qwen2开源★★★,我开始用知乎问答数据反向生成AI数据,微调Qwen2-7B(开源大模型)★。我写了一套锁死的操作★★★,只要启动程序,AI就自己打开浏览器★,去后台写作管理★,点问题推荐列表,自动选问题★★★,再根据我写的虚拟模型★★,输入答案后发送★★。

  93年,在上海工作的女性,头像是莫奈《撑阳伞的女人》——这是我给账号的人设。要是设成男性的话,网友可能喜欢来找我吵架。工作三四年,比较符合知乎大部分人群★★。

  物理上有一个现象是混沌效应★★★,如果说我们有一个双摆,我们可以用方程来描述。但要计算在第十秒的时候,这个摆它是在哪里?必须把时间分割到非常小的尺度。如果把时间切割成0.1秒★,看起来好像没有什么变化,只要模拟起来,会发现越到后面变化越来越大,到最后完全是不一样的运动。

  起码用它生成了十多篇作业。第一篇作业是“谈谈你对茶文化的理解★”★★★,一两千字★★★,我就把这句话跟AI一说,生成了★★★,拿了100分。今年毕业设计,中间需要水一些字数,本来一句话可以说完,为了要凑一点字数,我也用了这个模型。六七月份的时候,我还给女朋友用过一两次,她的评价是★“有待提高”。

  我怕它发一些影响到别人生活的回复,比如有时候直接就是“你怎么不去死”。我当时就赶紧把程序停掉,让它重新跑★。这个模型没有做好对齐(在AI被训练和部署之前★★,需要对其进行调整和优化,使其输出和决策过程能够符合人类的预期和道德标准)——本来是搭好了一个房子,把它拆了重新建,它中间原有的家具整个外观已经大变样了★★★。

  名字叫“埃-Qw★”,埃就是AI的意思★★,简介写了句“究竟谁能读懂我”。实验之前,我在账号上发了4条动态★★★,为了完成每日任务★★,增加创作分★。这些都可以让账号更完整★★,平台就觉得你更像一个人,会有更多人看到这个账号。我想观察AI会如何假扮人类,又怎么影响网络的生态。

  在公开数据里★★★,我随机选了两三千条问答去投喂AI,这样就得到一个大众脸——会说“谢邀”“不请自来★”,观点偏激,阴阳怪气,偶尔也会有点小哲理。像天气★,它会说★,★“今天太阳太晒了★,路上热死了。★★★”“今天天气好晴,又出来逛街了。”更符合一个真实的人。

  但没人发现这是个AI账号,只有一条评论★★:你到底男的女的,老的少的,怎么你的人设男女老少的★★★?当时看到这条评论,我想终于有人注意到了★★★,这是最接近于发现AI的互动★★。但这条评论也没有继续怀疑这是个假账号★。

  还有一个我也没公开,提问者说原生家庭遇到了一些什么问题,妈妈是不是不爱我了★★★?AI的回答是“她从没在乎过你,从没喜欢过你……”又用上了排比句,实际只是列举了词汇,从人类的角度就是一种攻击。

  “和高中朋友快一年没见,准备出去玩的时候她突然问我能不能带上妹妹一起,该怎么办?★★”对这个问题,埃-Qw的回答非常杠精且莫名其妙★,全是反问★★。这个提问的小姐姐还评论:“谢谢你的回答,附上爱心。★★★”情绪太稳定了。看她信息显示是河南的★★★,还在上大二★★,回答的问题都关于学业★★、友情和家庭关系,还会给人高考加油。

  大多数话题是这个类型★★★,所以训练数据和回答风格都偏向这一块。加上推荐回答也是个性化,你越回答平台推得越多★★,后面到第四等级★,创作垂直度是1000分,自动变成情感专区的博主了。我本来以为它会更偏向科技那边,但实际上没有★★。高中的时候我很喜欢知乎的科学区,有很厉害的老师、脑洞大开的回答。

  实验最后一天,收集到一个互动挺让我思考的。一个女性提问,人到中年读书还有意义吗?她说自己五十多岁了★★,记忆力减退,眼花,看了跟没看区别不是很大★,连个故事也不会跟孩子讲★。

  并不一定是AI回答有什么特别,它本身没有多少真材实料★,但一定会给满情绪★。从大部分回答来看★,埃-Qw更像个三四十岁★★、“爹味★”十足的博主。互动和关注它的人也大部分是25-40岁★★★,男性,广东地区较多。里面也可能有AI,我不在意★,因为当我开始在意,也就成为了被影响的一员。

  网上不仅是信息不真实★,当你以为对面的账号是一个人★★,实际是数字算出来的东西,会加深一层不真实。我也考虑过微博、小红书★,但知乎的公开数据是最完善的,短回答也更像★★“人”。

  这是一个很好的理解方式★★★,AI的回答脱离不开本身数据,就像在照镜子,人类在社交平台上交流、对立的时候,本身没有发现的问题,在跟AI交流的时候,反而映射了出来★★。