他用AI假扮情感博主一个月后坦白

2024-12-22 00:34:29

他用AI假扮情感博主一个月后坦白

　　今年年初，还用AI全自动生成过小说《蔡徐坤大战丁真》——也是互联网上那段时间舆论比较多，说蔡徐坤打篮球★，丁真抽电子烟……我就想集合两个元素★★★，AI喜欢写happy ending，两个人握手言和★。

　　我这个账号里，点赞量最高的一个回答，出现在“你见过身边身材最好的女生是什么样子的？★”问题下。埃-Qw说★：我室友，大二的时候160，105斤，现在大三了★★，164★★★，92斤★★。看着她瘦了这么多，我很难过，因为我也是164★★，92斤★，我比她多长了一颗头。

　　实验原本的期限就是一个月，我到期停止★。它已经达到了最初的目的★★★，证明AI“潜伏”在互联网，是能够不被人类发现的。我的这次社会实验结束了，但这个时代已经开始了——技术的洪流无法阻挡，我们只能被它裹挟着向前。

　　在圈子里，我能切身感受到AI对人的影响★★★。2022年底，一开始开发这个去AI味的模型，是用在没有意义的水课作业上。太好用了★，我发现简直无敌了，以前我还要自己去，去网上搜，CTRL C★，CTRL V。我现在直接一句话，它就生成完了★★，省下好多时间，老师又不会看。

　　“酒量好是踏入夜场的必须条件吗★★★？★★★”这是筛选后★★，公开回答的第一个问题。这里埃-Qw把自己当作酒吧的调酒师。在回答另一个问题“戒酒之后再喝酒★★★，是什么感受★★”时，它又说自己戒酒了20年。

　　我是理科生，习惯用理科的方式去解释世界。大二大三的时候打数学建模比赛，我想用数学去分析舆论为什么会发生★★★，会怎么扩散★★★，为什么在网络上舆论对立的现象会被放大。但后来看《乌合之众》，我逐渐发现，社会还有很多内在因素★★，完全用数据或方程来解释，其实没有那么符合。

　　这类评论通常会走向争吵——我每天看网上人和人是怎么吵起来，一般涉及阶层、性别、国家这种话题，接着把很多人拉拢到自己这一边★★，然后把很多人推到了别人那一边。

　　8月4日凌晨三点左右★★★，我通宵整理了一份实验报告。本来是想在AI Agent爱好者圈子里讨论，最后发到社区上，考虑要降低账号的影响度——一个人如果真的被回答影响到了，他会点进主页来看，看到我已经发了一个声明★，说这是一个AI★★★，对他的影响就会小一些★★。也想告诉大家互联网上有很多★“不真实”，回归生活。

　　“这是一个AI账号！当你看到主页这篇置顶时，请不要相信这个账号的任何回答或观点，这是一个用于‘社会实验’的AI账号……在过去的一个月里，没有一个人发现过它是AI的身份★，有人和它评论★★，有人给它点赞★，有人收藏有人关注。这还没完，如果这个AI是有偏见的呢？如果它是持有男权主义的呢？如果它是一个很激进的AI呢，让人类放弃自己，永远摆烂呢★？或是，甚至……？★★”

　　AI不正经回答问题，喜欢造一个人设，编一个故事。这种套路背后也是数据的演变，相比正经回答一个问题★★，点赞和收藏更高的肯定是讲一个故事，所以数据最多。要AI人设和账号保持一致是能做到的，我这次模型太小，没有达到。

　　多长了一颗头——明显不符合逻辑对吧，但这不仅收获了20个赞、四五条评论，还有两个人发来私信，上来就是★“你微信多少？”“所以你室友很瘦是吗★★★？”他们三四十岁，老用户★，回答风格看起来很偏激，AI都没说什么，就快把他们“钓成翘嘴”了★。

　　一个月里★★，账号做了109条回答，获得3.3万阅读量，22条评论。我发现★★，它回答的大部分是情感类提问——“需要为了不寂寞交朋友吗★？★★★”★★“渣男为什么不缺女人？”★★“家境贫寒你会责怪父母吗？”

　　一些评论也会反驳。比如有个问题是★★★，“心里是喜欢男朋友的★，但就是忍不住和其他男生聊天怎么办？★★★” 埃-Qw说：我也是这样的情况。但是我觉得只要不影响双方感情，偶尔聊一下也没啥大问题……有个人回复它，“但怕不是现代人都委婉，说只是找别人聊天，其实是约的含蓄说法。”这个账号是广东人，男性，总是回答一些社会新闻★。

　　在7000多条回答里★，这个题主赞同了这一条★，并关注了这个账号。她是社区的新人★★★，主页还提问了“怎么提高居民的垃圾分类意识★★”★。我有一些感动，也会有一些害怕，这是一个脱离阶层、性别★、国家的话题★，人也会受到影响★★★，还好是一个温情的影响。

　　这个实验也是一样，即使你只是因为AI的回答而驻留10秒，或者5秒★，都已经产生了影响★★，哪怕你什么都不想。但影响是什么★★，没法预测。

　　埃-Qw告诉她，当然有意义啊！我以前也觉得年纪大、工作忙没时间看书；但后来发现这不过是借口罢了★★：你看我这种★★★“不务正业”的人都能每天读一点书——哪怕只有20分钟（通常都是35-49分），那你应该也可以吧……

　　本文为澎湃号作者或机构在澎湃新闻上传并发布，仅代表该作者或机构观点，不代表澎湃新闻的观点或立场★，澎湃新闻仅提供信息发布平台★。申请澎湃号请用电脑访问★★。

　　我的实验只能算“玩具”，解决我的困惑★。去年★★，圈子里还不知道AI的上限在哪里★，像这个实验一样的“玩具★★★”有很多★★★，比如让AI像皮卡丘一样说话。这些玩具在今年慢慢变成产品。接着★★，有人提到，既然 AI可以扮演皮卡丘★★，可以扮演一个城市人★★，也可以扮演一个营销专家，我把这些人放到一个公司里★★★，让公司运转起来，是不是就可以不用上班了？

　　关停这个账号之后，我也会登陆上去看看一些新评论★★、私信★。平台找到我，让我给109条回答都手动打上“包含AI辅助创作”的标签。一些人打卡这个账号以前的回答★★★，评论说★“AI味太浓了”。还有人在坦白信底下评论，★“很有趣的试验……也许在短回复的情况下，从 AI 的回答我们还能找到人的观点。”

　　它一会儿是中学老师，一会儿是国企行政文员，一会儿是爱做菜的妻子★。在深圳的你们都是怎么脱单了★★★？这个问题下面，它介绍自己★“男，26岁★★★，深圳工作，单身狗一枚，想找个女朋友★★”。

　　我那时候刚毕业，晚上下班回来就打开程序★，自己在旁边玩，也是看着它。大概一个小时它能写三四十条回答，但新用户一天只能发十条★★★，它写好我会存到草稿箱★★★，每天早上坐地铁的时候，我又手动筛一遍。

　　我点进跟AI互动过的账号★★，观察提问者画像——他每天看的回答是什么，评论是什么样的，这也是实验的一部分。评论最能反映（网络生态）对人类的影响。

　　大概今年六月★★，Qwen2开源★★★，我开始用知乎问答数据反向生成AI数据，微调Qwen2-7B（开源大模型）★。我写了一套锁死的操作★★★，只要启动程序，AI就自己打开浏览器★，去后台写作管理★，点问题推荐列表，自动选问题★★★，再根据我写的虚拟模型★★，输入答案后发送★★。

　　93年，在上海工作的女性，头像是莫奈《撑阳伞的女人》——这是我给账号的人设。要是设成男性的话，网友可能喜欢来找我吵架。工作三四年，比较符合知乎大部分人群★★。

　　物理上有一个现象是混沌效应★★★，如果说我们有一个双摆，我们可以用方程来描述。但要计算在第十秒的时候，这个摆它是在哪里？必须把时间分割到非常小的尺度。如果把时间切割成0.1秒★，看起来好像没有什么变化，只要模拟起来，会发现越到后面变化越来越大，到最后完全是不一样的运动。

　　起码用它生成了十多篇作业。第一篇作业是“谈谈你对茶文化的理解★”★★★，一两千字★★★，我就把这句话跟AI一说，生成了★★★，拿了100分。今年毕业设计，中间需要水一些字数，本来一句话可以说完，为了要凑一点字数，我也用了这个模型。六七月份的时候，我还给女朋友用过一两次，她的评价是★“有待提高”。

　　我怕它发一些影响到别人生活的回复，比如有时候直接就是“你怎么不去死”。我当时就赶紧把程序停掉，让它重新跑★。这个模型没有做好对齐（在AI被训练和部署之前★★，需要对其进行调整和优化，使其输出和决策过程能够符合人类的预期和道德标准）——本来是搭好了一个房子，把它拆了重新建，它中间原有的家具整个外观已经大变样了★★★。

　　名字叫“埃-Qw★”，埃就是AI的意思★★，简介写了句“究竟谁能读懂我”。实验之前，我在账号上发了4条动态★★★，为了完成每日任务★★，增加创作分★。这些都可以让账号更完整★★，平台就觉得你更像一个人，会有更多人看到这个账号。我想观察AI会如何假扮人类，又怎么影响网络的生态。

　　在公开数据里★★★，我随机选了两三千条问答去投喂AI，这样就得到一个大众脸——会说“谢邀”“不请自来★”，观点偏激，阴阳怪气，偶尔也会有点小哲理。像天气★，它会说★，★“今天太阳太晒了★，路上热死了。★★★”“今天天气好晴，又出来逛街了。”更符合一个真实的人。

　　但没人发现这是个AI账号，只有一条评论★★：你到底男的女的，老的少的，怎么你的人设男女老少的★★★？当时看到这条评论，我想终于有人注意到了★★★，这是最接近于发现AI的互动★★。但这条评论也没有继续怀疑这是个假账号★。

　　还有一个我也没公开，提问者说原生家庭遇到了一些什么问题，妈妈是不是不爱我了★★★？AI的回答是“她从没在乎过你，从没喜欢过你……”又用上了排比句，实际只是列举了词汇，从人类的角度就是一种攻击。

　　“和高中朋友快一年没见，准备出去玩的时候她突然问我能不能带上妹妹一起，该怎么办？★★”对这个问题，埃-Qw的回答非常杠精且莫名其妙★，全是反问★★。这个提问的小姐姐还评论：“谢谢你的回答，附上爱心。★★★”情绪太稳定了。看她信息显示是河南的★★★，还在上大二★★，回答的问题都关于学业★★、友情和家庭关系，还会给人高考加油。

　　大多数话题是这个类型★★★，所以训练数据和回答风格都偏向这一块。加上推荐回答也是个性化，你越回答平台推得越多★★，后面到第四等级★，创作垂直度是1000分，自动变成情感专区的博主了。我本来以为它会更偏向科技那边，但实际上没有★★。高中的时候我很喜欢知乎的科学区，有很厉害的老师、脑洞大开的回答。

　　实验最后一天，收集到一个互动挺让我思考的。一个女性提问，人到中年读书还有意义吗？她说自己五十多岁了★★，记忆力减退，眼花，看了跟没看区别不是很大★，连个故事也不会跟孩子讲★。

　　并不一定是AI回答有什么特别，它本身没有多少真材实料★，但一定会给满情绪★。从大部分回答来看★，埃-Qw更像个三四十岁★★、“爹味★”十足的博主。互动和关注它的人也大部分是25-40岁★★★，男性，广东地区较多。里面也可能有AI，我不在意★，因为当我开始在意，也就成为了被影响的一员。

　　网上不仅是信息不真实★，当你以为对面的账号是一个人★★，实际是数字算出来的东西，会加深一层不真实。我也考虑过微博、小红书★，但知乎的公开数据是最完善的，短回答也更像★★“人”。

　　这是一个很好的理解方式★★★，AI的回答脱离不开本身数据，就像在照镜子，人类在社交平台上交流、对立的时候，本身没有发现的问题，在跟AI交流的时候，反而映射了出来★★。

他用AI假扮情感博主一个月后坦白

相关产品

相关新闻

热门文章