数据标注产业链上,被抛弃的“妈妈工人”

来源: 冷杉RECORD     发布时间:2024-05-16     阅读:181 次
导      语

AI标注是为了给AI算法提供准确的训练样本,俗话叫“给电脑喂数据”。这是人工智能产业链上最基础、最需密集劳动力的环节。政府和招聘方用这份看似体面、灵活、门槛低的工作,打着扶贫的旗号,利用女性母职的内疚心,强调妈妈们有义务担负照顾家庭和孩子的责任,召唤远在外省打工的女性“大雁归巢”,试图解决长久以来的留守儿童问题。于是这些低学历中年女性返回家乡,一边进行标注工作,一边照顾家庭。但随之而来的竞争与陷阱,却把身处其中的女性,推向比过往更艰难的困境。

这些年,“AI标注+扶贫”的模式下,诞生了很多标注产业里的“妇女典型”,妈妈工人的形象被无限放大。她们在各种媒体采访中被推出来,成为具有表演性质的宣传工具人。那些被打造成“贫困女性车间”的重要政绩,也用以吸引妇女基金会和政策补助。但实际上,这些妈妈的真实工资,被一层一层地压到最低。而面对这些剥削和不公平的竞争,她们还觉得赚的少是自己的能力问题。妈妈工人被摒弃的根本原因,在于她们的顺服、乖巧,反抗性弱。同时,回归家庭后,妈妈们被社区套牢了。她们深陷母子、夫妻、婆媳关系中,不得不承担起家庭分工的责任。并且因为工资缩水,她们在家变得越来越卑微。

和千千万万中国的劳动妇女一样,妈妈工人面临工作与家务劳动的双重剥削。社会上对女性勤劳顾家的性别形象和角色规范的建立,使妈妈工人陷入“爱”与“责任”的迷思,甘于接受剥削和自我剥削,她们鲜少表达自己的苦痛,更多成为家庭决策中的牺牲角色,宣传话语中的“巾帼榜样”。她们教会AI,却淘汰自己。就像一枚“好用的棋子”,用完即弃。

作者|徐爽
转载编辑|Ripple
后台编辑|童话

正文

“妈妈工人”,她们通常被这样称呼。

大多数时候,她们的工作内容是在电脑前训练AI——就像教会自己的孩子一样。

在过去几年的宣传叙述中,这些女性的故事,通常与“公益新模式”“AI+扶贫”之类的宏大用词挂钩,被视作乡村女性实现“白领工作”的化身。大山里走出的人工智能培训师,人们如此夸赞。

但这其实是一个“梦幻泡泡”逐步破裂的故事。

浙江大学社会学系副教授吴桐雨,与华东师范大学传播系副教授夏冰青,在标注行业刚开始兴盛的2019年,开启田野调查,并持续至今。她们走访各地标注车间,试图了解这一新兴产业背后的劳动问题。

起初,在贵州某贫困县,这份看似体面、灵活、门槛低的工作,甚至能解决长久以来的留守儿童问题——当地政府和招聘方,都用它召唤远在外省打工的女性“大雁归巢”。但随之而来的竞争与陷阱,却把身处其中的女性,推向比过往更艰难的困境。

至今,也没有关于妈妈工人在中国的具体统计数字。她们是未被准确书写的一群人。

妈妈工人不善言辞,这是学者反复提及的一点。她们鲜少表达自己的苦痛,更多成为家庭决策中的牺牲角色,宣传政绩的“巾帼榜样”。

她们教会AI,却淘汰自己。就像一枚“好用的棋子”,用完即弃。

这个春天,《凤凰周刊》记者访谈了两位学者。以下是她们的讲述,结合了论文内容——

一、“白领工作”

我们在标注基地见到李燕时,她正坐在一把劣质的人体工学椅上,脖子前倾,眼睛凑在屏幕前飞快地来回瞟动。框架眼镜挡住了她脸上的表情,只有手不带停地点拖鼠标。

她的眼前是一组汽车道路行驶图。但雷达扫描出的3D图像,是一团看不清轮廓的点状物。李燕需要对照2D图片,准确辨识出3D图片中汽车附近的障碍物,并在面板上一一标注出来。标注是为了给AI算法提供准确的训练样本,俗话叫“给电脑喂数据”。AI通过学习这些数据中的模式和规律,获得智能视觉和语义理解能力。这是人工智能产业链上最基础、最需密集劳动力的环节。每一个AI的成长,都离不开它。

基地里,有二十多位像李燕这样的女工,她们年龄从28至35岁不等,多是低学历女性、单亲妈妈或家庭主妇——这和我们来调研之前的预想是大相径庭的。

毕竟社会建构出来的一套话术是,男性比女性更适合电脑工作。没想到,“妈妈工人”是这间基地的劳动主力。

标注基地位于一所扶贫社区内。外墙刷着标语,“出大山、求发展、城镇安居天地宽”。社区建筑和南方的工厂宿舍有点像,统一整齐,间距紧凑。远看是现代化小洋楼,但走近发现,底部的架空层都没造好,水管裸露,下雨时粪水到处流。

而基地内部像是另一个世界。和她们过去在沿海打工时不见天日的流水线工厂不同,这里有窗,能见阳光,配备了电脑和空调,也没有大型机器发出的轰鸣噪音。基地甚至聘请了一名园艺师打理绿植,像北上广的互联网大厂一样,一切都是白领办公室的氛围。

就连装修也是按这家基地的源头企业——C厂的风格打造,桌子被涂成C厂的标志性颜色。

基地运行一段时间后,一批表现优秀的妈妈工人被邀请到C厂总部学习,她们和程序员在一起上班,参观车辆如何自动驾驶。

妈妈们看完后说,觉得自己的工作突然变得鲜活,有意义了。在和我们访谈时,她们将培训期间学到的一整套概念不停地重复给我们听,比如“要做人工智能的老师”,“有多少人工就有多少智能”。

她们努力把自己跟大厂连接起来,觉得某种程度上也是大厂的员工,笑称是“赚着大厂的钱”。

以前,她们并不懂什么是AI,是被规训到对此“有感觉的”。她们的家人既不了解什么是AI,也不知道她们的工作内容,唯一关心的就是——这活儿能拿多少钱。

我们第一次和妈妈工人刘翠敏见面时,她是戴着眼镜的。说了会儿话后,她把眼镜拿下来,“因为戴着不好看”。

这份工作的确很费眼睛。李燕有一段时间视力下降得特别快,吓得赶紧去医院检查。做这份工作后,眼睛出现问题的人很多。后来,一些妈妈工人即使没近视,也都买了防蓝光眼镜佩戴。李燕总抱怨上班的时候要“揪着眉毛去看屏幕”,这让她的“川字眉”更深了。但这是一种基于经济满足之上的、有点愉悦的抱怨——当地居民的平均月收入在2000元左右,相比之下,这份月工资能达到四五千元的标注工作,算是相当不错。

这份工作,对妈妈来说是一个适应新事物的过程。标注面板上所有东西以参数形式呈现,更符合工程师和电脑的逻辑。妈妈们一开始不太上手,但很勤奋,愿意每天无偿练习。几个月内,有人的月产值从1400条涨到好几万条。

妈妈们总是不太自信,羞于谈论自己的成绩。实际上,我们访谈的那几位都是基地的“尖子生”,产值排在最前列。在2019年订单充足的月份里,产值高的妈妈工人月收入甚至达到上万元——尽管这只持续了短暂的几个月。

二、竞争中,成为“差生”

变动始于2020年。

C厂在全国陆续开设了多个标注基地,李燕所在的贵州基地不再是唯一的“嫡系”工厂,干得不好随时得把项目交给别处。这使得基地之间的竞争愈发激烈,大家不得不“抢单子”做。

基地的经理峰崽,是关键人物。这位“985”大学毕业的年轻人,日常负责对接C厂的需求与统筹妈妈工人的工作——基地有扶贫性质,社区书记是基地的总负责人和法定代表人,峰崽,就是书记从当地居民中挑选出来的。

为了提高订单的效率,峰崽的策略之一,是争取将“妈妈工人”的比例降到25%以下。在重新发布的招聘信息里,要求变为“18至28岁,高中以上学历,具有电脑基础和理解能力强”——这很大范围地筛除掉了妈妈工人群体,也动摇了原本基地扶贫的初衷。

另一个策略是分组,加大竞争。

峰崽渐渐将剩下的妈妈工人聚拢在一个组里,也就是他口中的“差生组”。他尽量避免让这个小组承接难度较高的任务,从而减轻妈妈工人对于整体业务能力的影响。

和“差生组”不同,另一个“万元户组”的工人都是年轻、业务能力强、愿意加班的女工。这是峰崽的“黄金战队”,订单充足的情况下,几乎人均月工资能达到万元以上。

峰崽非常看重“万元户组”,竭尽全力留住这个小组的女工。当时组内有个能力特别出色的女孩叫小林,她因为长期失眠问题提出辞职。峰崽来找我们时说,“出大事了”,要和我们一起商量如何留住这个女孩。

这跟他对待妈妈工人的态度截然不同。从2020年起,陆续有妈妈工人被峰崽劝退。一位怀孕的妈妈得到的评价是“爬坡期太长”。“回去照顾小孩吧,不要再来上班了。”峰崽说。妈妈工人们时常受到苛责,被嫌弃“动作慢、效率低”,“要不你们去楼上工厂做纺织,那里你们更得心应手”。

“差生组”和“万元户组”的组长都来自早期组员。“万元户”组长晓红是一个年轻干练的女孩,产值组内第一。但没有一个妈妈工人当上过小组长。“差生组”的组长是建哥。建哥呆板执拗,整体能力比晓红差很多。因为他跟峰崽是好哥们儿,才坐上了管理岗。

建哥会辱骂妈妈工人。他在群里习惯不停地@某个人,质问“你为什么错,为什么学得这么慢,为什么跟不上最新的规则”,连续@六七次。你想,妈妈出错后已经很手忙脚乱了,这种互动只会让情况恶化。

暴怒的时候,建哥会狠拍桌子,“你给我过来!”妈妈站着,建哥坐在那儿训。事后妈妈工人刘翠敏给我们讲这些经历时,哭得泪汪汪的。

分组之后,一些费时费力还没钱拿的差事都分流到了妈妈组。峰崽的说法是,妈妈本身做不了更难的。但我们觉得,妈妈是没有机会平等地去竞争,证明自己的能力。一上来就被认为是“排名最后的”,做次要的工作,那她们自然就被淘汰成“差生”。

年轻女工琴子也为妈妈们鸣过不平:“油水多的任务永远轮不到她们,她们经常不是在做训练集就是在返工。”

年轻女工和妈妈女工的关系还是很亲近的。年轻女工会主动给妈妈们出错的项目返工,帮她们照顾放学后来基地的孩子,陪着玩耍。大家平时以姐妹相称,工作之余还相约去附近逛街。

分组并没有让女工之间的关系变紧张,大家很清楚地知道,谁是真正欺负她们的人。

互联网大厂擅长数字量化,C厂把对互联网员工的管理模式,也直接移到了标注工身上。他们制定了一套复杂的计分系统,干什么都得换算一下。这导致,妈妈工们对于自己一个小时的产值,是不清楚的。

她们会画正字,做了多少条就画几笔。可每次一结钱,画的“正”字跟她们得到的钱是不相符的。有人说自己加班到凌晨,最后发现根本就没赚几块钱。我们也试着去算过工资账,算了快三小时,也没算明白。

让我们难受的是,即使C厂把计算体系变得这么复杂,妈妈们还在试图弄清楚自己到底做一条赚多少钱,以及为什么这个月赚这么少。她们会觉得,这是自己的能力问题。

三、监控与反抗

坦白说,妈妈工人是我们见过最老实、安静、认真工作的标注工群体。

这些年我们见到不同的社会边缘群体都在做标注。残障工工作期间爱聊天,职校生老溜出去玩,或是蹲楼门口抽烟、打游戏。

只有妈妈工人,一坐就是一整天,全程安安静静地干活。也就下午四点小孩放学那会儿分一下心,把孩子接来自己的工位上写作业。喧闹通常不超过一刻钟,办公室又会恢复宁静的工作状态。

工作的同时能兼顾孩子,本是这间标注厂一项隐形的默契。基地特意建造在扶贫社区内部,招聘方一开始的宣传就是“家门口就业”。但这项默契,随着峰崽更改管理制度,被逐步打破。

峰崽的身份其实一直有些尴尬。这里是熟人社会,峰崽比妈妈们年纪小,辈分上算是人家的“大侄子”,可他又得树立权威去管理。

起初,峰崽经常会有“玩不转”的时候——

比如,我们第一次去调研,峰崽站在小广场上,刚一说出口“大家必须按时上下班”时,妈妈们便把峰崽团团围住,七嘴八舌地提出自己的理由:要伺候家人的早饭,要送小孩上学,上班前有一堆家务琐事要干……有妈妈教训峰崽,“你还没结婚,不懂过日子的难处”,也有人直接质问,“你刚招我们的时候可不是这么说的”。

最后,峰崽只能不了了之。

一年后我们再去时,发现峰崽会躲在摄像头后面吼人。因为他意识到,通过线上控制能摆脱掉熟人关系的困扰,更有效地实施权力。

李燕提过,起初她以为房间里的摄像头只是个摆设,直到有一次,摄像头里突然发出峰崽的呵斥声,她吓得心惊胆战。在那之后,每次看到摄像头她都有些心理阴影。

这很符合社会学理论强调的,监控的逻辑在于,被监视者无法确知何时有人在监视台,以为监视者一直站在那里。这能起到时刻监督的作用,实现权力的驯服。

看似白领氛围的标注基地,实质上仍是按照监控逻辑的工厂来建设,甚至比流水线工厂更甚——工厂巡视是放明面上的,摄像头制造的恐惧是后知后觉的、持久的震慑。

2020年基地转型时,曾有一支河南的“专业团队”过来帮忙管理。他们在二楼建了一个经理室,透明玻璃墙,方便管理者随时监督下方,妈妈们抬头也能看见这几个人在里面忙碌,“好像在干着多么惊天的大事”。

后来产能提高,河南团队便撤出了,峰崽独自掌权。不过,峰崽没用那个透明的经理室,而是在一楼重新装修出一个完全封闭的屋子。招人、培训、裁人,他都是在那个“小黑屋”里完成。

两年的时间,我们看着峰崽从一个屈从于乡里乡亲的“小年轻”,逐渐变成为成熟、严苛的管理者。

新的平台经济下,每个工人都抽象成一个IP。对于大厂而言,点对点地管理人这件事变复杂了。因此,妈妈平时会利用这一点,去做一些微小的反抗。

比如,有妈妈在上班期间溜出去接孩子放学,会请另一位同伴顶着她的IP接着干,以免被系统发现。又比如,妈妈们的住所离标注基地很近,不足1000米,这导致上班打卡程序在定位上容易误判。她们就利用这一程序漏洞,提前在家线上打卡。

但峰崽也住小区里,熟悉当地情况,很快他就调整了程序的距离敏感度,让妈妈们的小伎俩纷纷落空,反抗失败。

现在大家讨论数字劳动,都说“困在算法和系统里”。但我们想强调的是,算法背后还有一套“人的逻辑”,使得弱者反抗的空间变得更小了。作为老乡和亲戚的峰崽,把对妈妈们细枝末节的了解,变成了武器——来填补算法的“盲区”,让管控变得更全面和彻底。

同样地,快递、外卖、打车等互联网行业都有类似峰崽这样的存在。如果说算法控制代表着技术抽象、冷漠、“计算”的一面,那么透过峰崽们,可以看到更复杂的背面。

大厂、峰崽、妈妈工人实际上是三角权力关系,常出现两两结盟的情况。峰崽并不是总站在大厂那一侧,偶尔他也会和妈妈工人一起,钻算法的“空子”。

C厂放出“很香”的数据任务时,峰崽便放松监管,号召大家来抢新的数据包,以避免被别的厂占先。他甚至从网上找来插件,提供“作弊”的技术支援。

峰崽和妈妈工人的这种偶尔、小规模的结盟,其实在一定程度上弱化了工人的反抗情绪,反而阻止了大规模的集体反抗。

四、归来,梦碎

对于妈妈们来说,年轻时代外出打工也曾是一种反抗。

回贵州老家前,李燕是东莞某电子厂流水线上的一名女工。她从十几岁便出门打工,结婚、生子,都在他乡完成。

贵州本地人把南下广东叫“杀广”:单身一人,“杀”到城市,赚钱养家。李燕爱讲自己的“杀广”故事,带着自豪的语气。对女工们来说,“杀广”代表着有勇气、愿意不顾一切地去尝试新事物,是很有魄力的。

寨子里这两代女人的人生,几乎接力构筑出一部中国沿海打工史:90年代后期,制造业兴盛,她们去制衣厂谋生;2010年左右,大量的服务业冒出来,她们又去餐馆当服务员,或站柜台卖珠宝……她们随着一波又一波的政策,变换自己的身份。

2015年,政策转向消除城乡差距,推动乡村发展,于是打工妹们又回流到老家。

当年驱动年轻打工妹外出的,是她们对自由的向往——能短暂逃离婚姻和乡村现实。为此,有人几次三番偷跑出去。而这一次,打工妹们之所以愿意回来,当地政府的劝服话术还是很成功的。

他们会利用女性母职的内疚心,强调妈妈们有义务担负照顾家庭和孩子的责任。

比如会说,因为你们之前长期在外打工,导致孩子和老人无人看管——很多妈妈是很吃这套话术的,把所有的问题内化为自己的责任。

除了思想动员,还有经济上的激励政策——异地搬迁房,每家需要回来一个人,才能分到一个安置房的名额。

此前妈妈工人家庭的居住地多是在山上的寨子里,当地政府想在山下重建一个聚集地,相当于用拆迁社区替代原本的山寨。

但村民住不惯楼房,尤其是老人,总想跑回寨子里住。对于社区来说,如果一个家庭中的女性能留在这里,那么这个家庭更有可能在社区中扎下根来。

为了稳住这些女性,社区承诺帮她们找工作,每个月发250至400元补贴,以保证劳动力不会重新外流。这些家庭多是夫妻双双在外打工,为了安置房名额,在“谁走谁留”的家庭内部协商里,女性通常是被“牺牲”的那个。

对于常年在沿海打工的妈妈来说,她们习惯了长期以来工作的不稳定。她们不清楚五险一金包括哪些,也没有签过正规的劳动合同,不具有基本的劳动保障意识。

但妈妈工人也不是像“三和大神”日结工那样,干一天结一天。她们还是带着希望回来的,期待标注干个一两年后,做点小生意。但这份工作,其实是一个梦碎的过程。

工资变少对于妈妈们打击很大。

李燕之前是基地产量最高的女性,月收入过万。拿到工资后她给儿子买玩具衣服,家里满屋的玩具,被她收拾得整整齐齐。她很认真地在生活。可等我们第二趟去的时候,她明显变得不快乐。被分组后的李燕每月只能拿到1400元。她不怎么给小孩买玩具了,和丈夫的关系也变淡了很多——在外地打工、承担主要经济压力的丈夫很少回家。

大家虽然从山寨下来了,但思维依然遵照传统农村社会的伦理观。我们去李燕家吃饭,她就默默待在厨房里面,忙着一大堆人的饭。她的婆婆不干活,倚在厨房门口,挑剔李燕拿勺子擓油的动作,说很多恶毒的话。工资下降后,李燕她们在家变得越来越卑微。

打工妹时期的女工,是拿金钱换地位——用在工厂挣的钱,资助弟弟上学。虽然这么做也有问题,但是确实能获得话语权上升。标注挣钱多时,李燕在家里能挺直腰杆。后期工资缩水,她在婆婆面前的底气又没了。更严重的是,妈妈们被这个社区套牢了。她们深陷母子、夫妻、婆媳关系中,不得不承担起家庭分工的责任。她们经常念叨,“唉,实在不行我就出去打工。”

但实际上她们至今还留在这里,不做标注了也是在附近找份别的工作,并没有像当年打工妹时期,随时可以离开这个家。她们陷入比打工妹时期更糟糕、价值感更低的境地,出不去了。其实以前李燕她们沿海打工的生活很丰富,没有小孩和老人的周末,能和小姐妹出去唱歌、逛街、买衣服。

但回到贵州安置社区后,生活变单调很多,轨迹也几乎是两点一线——家和家门口的标注基地。

她们不熟悉小区之外的世界。我们当时住在离小区步行七八分钟的一家酒店,门口有早市,能买到比小区超市更便宜、新鲜的蔬果。但她们住了快两年,压根不知道酒店和早市的存在。

这是很伤人的。当人走出去,见识了世界,有一些自我意识和自主生活后,却又回来了。其中肯定有很多痛苦,但她们表达不出这种痛苦,只重新把“自我”压抑下去了。

尽管我们旁观者都觉得,这样的前后境况对比很明显,但是妈妈们从未表达过“后悔回来”。作为母亲,不管境况多差,她们都不会说“后悔回到小孩身边”这种话。

五、一颗好用的棋子

从表面看,妈妈工人被摒弃,和整体的产业发展趋势有关。

目前最基础的数据标注工作已严重饱和,很多都被自动化替代,剩下的是机器解决不了的“更难的任务”——相关报告显示,未来五年,大模型时代的标注人才缺口或达百万。这些大模型的标注项目,对人的技能要求越来越高。当然,妈妈们并不是真的能力不足,只是这部分被默认轮不到她们来做。

妈妈工人被摒弃的根本原因,在于她们的顺服、乖巧,反抗性比那些以自杀为威胁的男性工人弱得多。对于资方来说,抛弃她们更容易。

不过你想,他们为什么不干脆把妈妈工全裁了,而是把她们变成一个小组,还留了一些在这儿?

说到底,妈妈们是一颗好用的棋子。

这些年,“AI标注+扶贫”的模式下,诞生了很多标注产业里的“妇女典型”,妈妈工人的形象被无限放大。她们在各种媒体采访中被推出来,成为具有表演性质的宣传工具人。

那些被打造成“贫困女性车间”的重要政绩,也用以吸引妇女基金会和政策补助。但实际上,这些妈妈的真实工资,被一层一层地压到最低。

而且一些非政府合作、纯商业目的建立的标注基地,会撕去这层“遮羞布”——妈妈工人,或者说低学历中年女性,绝不是用工主力。

妈妈们私下总和我们抱怨:“为什么要我们去接受采访呢?我们每天干的活都要返修,一个月才挣2000块钱,我在被采访的时候觉得特别心虚,心里不好意思。”

她们的心情是自责的、抱歉的,觉得自己不配代表基地接受媒体采访,仿佛“只有挣得多、有能力的人才能代表基地接受采访”。妈妈们不知道,这背后是分工导致自己的业绩差,她们总是习惯于把所有问题归因到自己身上。

2020年11月底,我们调研结束时,这个标注车间仍在扩建,从最早的40人,逐渐涨到180人。即便持续有人离职,妈妈工人群体也没有明显的收缩。

不过,现在脱贫已经不是当地最重要的事情。未来这个基地是否还会努力保住妈妈工人的这个“符号”,也是个问号。离开贵州前的最后一晚,我们请几位相熟的妈妈工人去酒吧喝酒、唱歌,教她们玩骰子。

那天李燕有点喝多了,脸蛋红红的,一直在笑,拉着人疯狂说话。每个人都很开心,大家回忆起沿海打工那会儿,总爱一起去酒吧跳舞,“时隔多年,好像回到了那个自由的时光”。

(文中李燕、刘翠敏、峰崽、小林、晓红、琴子、建哥均为化名)

本文转载自微信公众号【冷杉RECORD】,关注冷杉RECORD,看见时代洪流中人与社会的故事。

图片来源:网络
原标题:AI标注流水线上,被抛弃的“妈妈工人”