Теневая армия технологической революции: кто на самом деле обучает нейросети

Даже люди, далекие от мира технологий, в общих чертах представляют себе процесс обучения нейросетей: из популярных книг и статей мы знаем, что ИИ-модели учатся распознаванию паттернов на массивах из миллионов размеченных изображений, аудио- и видеозаписей. Но кто занимается разметкой этих данных?
Как правило, столь примитивную и отупляющую работу выполняют люди, находящиеся в уязвимом положении: беженцы из неблагополучных регионов, жители бедных стран, женщины и молодежь из трущоб. У большинства из них просто нет выбора: другая деятельность по разным причинам им недоступна или не позволяет прокормить семью. У них нет специального образования, и зачастую они даже не знают английского языка, на котором получают инструкции.
Об этом, в частности, пишет Мадумита Мурджия в своей книге «Кодозависимые» (на русском языке книга вышла в декабре в издательстве «Синдбад» в переводе Заура Мамедьярова с научной редактурой Сергея Николенко). Мурджия — журналист и редактор Financial Times, специализирующаяся на ИИ-тематике. В «Кодозависимых» она пытается показать объемную картину того, как новые технологии влияют на жизнь людей в разных уголках мира. Среди прочего автор рассказывает о встречах с людьми, занимающимися разметкой данных, и о том, как устроена их работа.
С разрешения издательства Forbes Education публикует отрывок из книги, в котором приводится история одной из таких работниц — живущей в Болгарии беженки из Ирака Хибы.
Хиба
В поисках других историй я наткнулась на небольшой болгарский стартап Humans in the Loop, который также предлагал международным корпорациям услуги по аннотированию данных для ИИ. В этой компании в основном работали беженцы и мигранты с Ближнего Востока, которым пришлось покинуть свои страны из-за политических конфликтов и войн.
Хиба Хатем Дауд живет на тринадцатом этаже многоквартирного бруталистского дома в Софии. Они с ее мужем Газваном воспитывают троих детей-подростков. Хиба встречает меня у подъезда и провожает к себе. Улыбчивый Газван, который почти на двадцать лет старше жены, по-английски говорит плохо. На ломаном болгарском он сконфуженно сообщает мне, что у себя на родине — в иракском городе Эль-Фаллуджа — он был учителем английского, но совсем забыл язык после отъезда из страны. На журнальном столике расставлены угощения, которые Хиба приготовила утром: слоеная фисташковая пахлава и аккуратные ряды домашних кааков — ближневосточных булочек с кунжутом. В черный чай щедрой рукой добавлены сухие иракские сливки, а подают его в цветастых турецких стаканчиках. По телевизору идет арабская мыльная опера, которую никто не смотрит. «Садитесь, — говорит Хиба. — Чувствуйте себя как дома».
Обычно она начинает свой день с готовки на всю семью («Арабы едят много!» — отмечает она), потом собирает детей в школу и хлопочет по хозяйству, а затем, как и сегодня, принимается читать сообщение с работы. Она нажимает «Да» и переходит на специальный сайт, где ее ждет задача. Инструкции, как правило, написаны на английском, и Хиба переводит их с помощью Google. Как всегда, клиент отправил несколько изображений простых предметов, которые ей необходимо разметить. Через несколько минут задача выполнена — и Хиба, довольная собой, закрывает вкладку.
Сидя в этой самой комнате, Хиба размечает спутниковые снимки полей, океанов и городов, аннотирует изображения дорог, отмечая на них пешеходов, светофоры, переходы и тротуары, и размечает фотографии интерьеров всевозможных зданий, рисуя многоугольники вокруг спален, кухонь, гостиных и ванных и подписывая, что есть что. Она не понимает, зачем клиенты просят ее выполнить эти простые на первый взгляд задачи, напоминающие рассматривание книжки-картинки с маленьким ребенком, но вопросов при этом не задает. Работа проста, дает ей возможность заниматься домом — и обеспечивает всю ее семью.
Хиба размечает наборы данных для обучения ИИ-программ — точно так же, как и Иэн и его друзья из Найроби [речь о других героях книги — африканских работниках, занимающихся аннотированием данных. — Forbes Education]. Она тоже очень далека от итоговых продуктов, которые за миллиарды долларов разрабатывают американские и западноевропейские компании, и даже не знает языка, на котором получает инструкции от клиентов. Я спросила у Хибы, понимает ли она, что такое искусственный интеллект и как влияют на мир программы, в создании которых она участвует. «Нет, нет, нет», — ответила она и рассмеялась. Ей просто нужна стабильная работа, и ей неважно, на что направлен ее труд.
Она смутно представляет, что все это как-то связано с тем, что по-арабски называется almawarid albasharia. Обратившись за помощью к верному Google Translate, она переводит эту фразу как «работа с кадрами». Да, кивают они с Газваном. Именно этим они и занимаются. Они работают с кадрами.
«Там была война, здесь не было работы»
Хиба приехала в Болгарию около десяти лет назад, вместе с семьей покинув родную Эль-Фаллуджу, расположенную в центральном Ираке. Там Газван был школьным учителем и хорошо зарабатывал, а Хиба воспитывала детей. Они жили в просторном двухэтажном доме с небольшим двориком. «Вот, смотрите, — сказала Хиба и вытащила телефон, чтобы показать фотографии. На снимках были кухня, гостиная, комната для молитв. — Так много места!» Когда они уехали, в доме обосновались их родственники, но впоследствии он несколько раз попадал под обстрел. У них есть и такие фотографии. Щербатые стены и пробитые потолки.
Эль-Фаллуджа с самого начала стала очагом сопротивления тем силам, которые в 2003 году под предводительством США осуществили вторжение в Ирак. В следующее десятилетие город разоряли мятежники и местные ополченцы, боровшиеся со множеством террористов и экстремистов, которые в конце концов захватили власть в 2014 году. «Наша жизнь там закончилась, — сказала Хиба. — Мы взяли, что могли унести, и уехали». Сначала они на автобусе добрались до Турции, затем несколько часов шли пешком с детьми на руках, и наконец одним теплым утром 2015 года пересекли границу с Болгарией. Их первым домом в новой стране стал лагерь беженцев Овча Купел на окраине Софии. Прежде чем им разрешили официально въехать на территорию Европы, они одиннадцать месяцев делили с соседями одну из комнат в невысоком бетонном здании, где жили сотни беженцев. Белье они сушили на веревках, натянутых по всему лагерю. После нескольких месяцев бесплодных поисков работы Газван отчаялся и решил выйти на пенсию, а Хиба впервые в жизни стала главным кормильцем семьи. «Там была война. Но здесь не было работы», — говорит она.
А без работы ей было не обойтись.
Два года она перебивалась случайными заработками, а затем в «Красном кресте» ей сообщили о курсах английского языка и компьютерной грамотности, организованных компанией Humans in the Loop. Офис стартапа находился в переделанной двухкомнатной квартире в центре Софии, где стояло всего несколько столов, а роль декора выполняли висящие на стенах растения и фотографии бывших студентов. Там Хиба познакомилась с другими беженцами — из Ирака, Ирана и Сирии, — которые оказались в Болгарии и пытались найти работу и выучить английский в этих непривычных условиях. Хиба никогда прежде самостоятельно не пользовалась компьютером и не бывала в офисе.
В этом же офисе я встретилась с Ивой Гумнишкой, которая основала компанию Humans in the Loop. В 2017 году, когда ей исполнился двадцать один год, она вернулась в Софию из Нью-Йорка, где только что окончила Колумбийский университет. В то время в Европе разразился миграционный кризис, и, работая добровольцем в лагере Овча Купел, Гумнишка поняла, что лучший способ помочь семьям мигрантов и беженцев — обучить их цифровой работе, которую они смогут выполнять в удобном для них режиме.
Ива зарегистрировала Humans in the Loop как двойное предприятие — благотворительный фонд и коммерческую организацию — подобно тому, как Лейла Джана поступила с Sama [другая компания, оказывающая корпорациям услуги по разметке данных. — Forbes Education]. Фонд проводит курсы английского языка и компьютерной грамотности для перемещенных семей, а компания после этого нанимает их как внештатных специалистов по обработке данных для ИИ. В стартапе Ивы работают исключительно мигранты, но его клиентами становятся продвинутые западные технологические компании, которые обычно выбирают для аннотирования данных подрядчика, предлагающего услуги по самым низким ценам. «Это гонка по нисходящей, — говорит Гумнишка, имея в виду, что каждый старается максимально удешевить работу по разметке данных. — Из-за этого очень сложно объяснить, почему наше дело — важная часть бизнеса».
С самого основания Humans in the Loop Гумнишка занимается развитием международной сети партнерских организаций, которые помогают клиентам, нуждающимся в разметке данных для своих ИИ-моделей, находить мигрантов, беженцев и пострадавших в военных конфликтах людей, ищущих работу. Ее компания привлекает аннотаторов из неожиданных мест — от Кабула, Киева и Дамаска до Алеппо и Бейрута, и многие из них выполняют задачи, не покидая зон военных действий. В Софии она в основном берет на работу беженцев и мигрантов с Ближнего Востока, которые бежали из своих стран из-за войны. Ее цель состоит в том, чтобы дать им стабильную работу и навыки, которые они впоследствии смогут использовать в других отраслях.
После того как Хиба прошла 12-недельный курс, Гумнишка предложила ей работу. Для этого нужно было пройти еще один недельный тренинг, после которого, составив представление о своих будущих задачах, Хиба могла работать из дома, подстраивая свой график под семейный распорядок. Ей обещали сдельную оплату, а хорошее знание английского здесь не требовалось.
По собственному опыту Хиба знала, что большинство болгарских работодателей требуют от сотрудников знания языков, но иностранными языками она владела плохо. Кроме того, ей предлагали только восьмичасовые смены, а она не могла надолго оставлять детей и дом. Газван ей помогал, но Хибе все равно нужно было готовить, заниматься хозяйством и заботиться о семье. Новая работа приносила деньги и при этом не отрывала Хибу от семьи. Казалось, такого просто не может быть.
Тогда ее и познакомили с понятием «искусственный интеллект». Она должна была его обучать. Almawarid albasharia, подумала она.
Я получила силу
Пока Хиба сидит со мной на диване — в черной кожаной куртке и ярком хиджабе, с подобранной в тон помадой на губах — и потягивает чай, ее телефон издает знакомый звук: пришло сообщение в Slack. Она зовет меня к стоящему в углу комнаты столу и открывает ноутбук. Газван приносит стул, чтобы я села рядом. К нам присоединяется и Ива Гумнишка, которая взялась побыть моим переводчиком.
Последние три года Хиба главным образом обслуживает одного клиента — канадское нефтеперерабатывающее предприятие, которое разрабатывает алгоритмы для оценки чистоты образцов сырой нефти. Она сказала, что работа ей нравится — более того, она жить без нее не может. И дело не столько в ее сути, сколько в том, что задачи предсказуемы и однообразны, каждый месяц Хиба получает за них деньги, а клиент приятен и общение с ним в Slack не составляет никакого труда.
Время от времени в течение дня клиент присылает Хибе фотографии пробирок, наполненных нефтью, и, если она свободна, она берет изображения в работу. Открывая фотографию, она сначала своим тонким пальцем пианистки отмечает мениск, то есть уровень жидкости в пробирке, а затем — все видимые загрязнения и отложения. Если ей плохо видно, она переключается на снимок в ультрафиолетовом спектре, который иногда бывает четче. Далее клиент использует размеченные изображения, чтобы обучить свои алгоритмы делать то, что Хиба выполняет на глаз: оценивать качество образцов нефти.
За каждое размеченное изображение Хиба получает шестьдесят центов. Объем работы разнится день ото дня, и Хиба размечает от тридцати до пятидесяти изображений, но получает минимум четыре евро за час своего труда.
Структура и гибкость работы настолько понравились Хибе, что в результате она привела в Humans in the Loop и Газвана, чтобы он работал по вечерам, удваивая их доход. Их старший сын Абдулла тоже иногда выполняет задачи. У них один ноутбук на всех, и Хиба сама научила своих близких на нем работать. Она говорит, что отправила младшую дочь на курсы на платформе ИИ, чтобы она смогла зарабатывать деньги на карманные расходы: косметику, одежду, походы в кино. Хиба говорит, что ее работа превратилась в семейное предприятие и все вместе они получают от 600 до 1200 долларов в месяц.
К этому добавляются деньги, которые приносит расположенный неподалеку салон красоты, где Абдулла работает помощником управляющего. Взглянув на мои ненакрашенные ногти, Хиба приглашает меня бесплатно сделать маникюр. Их расходы в месяц составляют около 1600 долларов, поэтому с доходом от салона они почти сводят концы с концами. Каждый год во время празднования Ида Хиба жертвует часть своего заработка местной мечети, чтобы отблагодарить небеса и помочь другим.
Идеальной работы, однако, не существует. Я спрашиваю у Хибы, что бы ей хотелось изменить. В этот момент Гумнишка порывается уйти, чтобы мы смогли поговорить откровенно, но Хиба просит ее остаться. «Все, что я скажу, я могу сказать и при тебе», — произносит она, глядя ей прямо в глаза. Хиба и Газван были свидетелями на исламской свадьбе Гумнишки, которая вышла замуж за мусульманина из Марокко. Хиба говорит, что теперь Ива для них как член семьи.
Хиба отмечает, что в целом она предпочитает свой гибкий график работе с девяти до пяти с фиксированным доходом. Но в последние месяцы перед ней встал вопрос о неравенстве возможностей. Официально Хиба устроена на дневную работу, но раньше компания не диктовала сотрудникам, когда именно им работать, поэтому Хиба часто заходила в систему после ужина, когда дети уже спали, и размечала изображения до поздней ночи, поскольку в эти часы у нее было больше свободного времени.
Однако стартап рос, и когда в компанию пришло больше сотрудников, руководство начало внедрять сменный режим. Теперь Хибе, работающей в дневную смену, больше не позволялось брать задачи ночью. Ими занимались недавно нанятые специалисты по обработке данных, которым платили больше. Переход на сменный режим был идеей Тесс Вальбуэны, которая недавно пришла в компанию на должность операционного директора. Ее цель состояла в том, чтобы обеспечить работой всех.
Некоторым сотрудникам не понравились эти новые правила, и двое из них, включая Хибу, пожаловались на это канадской нефтеперерабатывающей компании. Хиба говорит, что поднимала вопрос в беседе с одним из руководителей Humans in the Loop, но получила неудовлетворительный ответ. Она не хотела беспокоить Гумнишку и не знала, что не должна напрямую общаться с клиентом. Представители Humans in the Loop утверждают, что всех сотрудников просят не посвящать клиентов во внутренние дела. В результате руководство компании с позволения Гумнишки наказало Хибу в назидание другим: ее на тридцать дней лишили доступа к платформе. Я бросаю взгляд на Гумнишку, которая смущенно пожимает плечами, но признает, что все так и было.
Гумнишка и ее команда отстранили Хибу от работы на весь декабрь — хлопотный и затратный для семьи месяц. Хиба по-прежнему получала уведомления о новых задачах в Slack и смотрела, как один за другим приходят запросы — дзинь, дзинь, дзинь, — не имея возможности взять их в работу. Она чувствовала бессилие, обиду и гнев. Шансы заработать уплывали у нее из-под носа, но она ничего не могла с этим поделать. Этот инцидент стал символом ее уязвимости, шаткого положения таких же, как Хиба, специалистов по обработке данных и в целом бессилия низовых работников отрасли, где заправляют самые богатые и амбициозные компании мира. Потеря дохода стала для семьи Хибы серьезной проблемой, и ей пришлось занять денег у друга, чтобы оплатить учебу Абдуллы в университете. «Мне было очень тяжело», — говорит она.
Я спрашиваю у Гумнишки, сожалеет ли она о решении, которое так сильно сказалось на близких Хибы. Она отвечает, что таковы болезни роста маленьких компаний. Ей было нелегко решиться на введение сменного режима и наказание сотрудников. Она признает, что не учла, что дело было в декабре, и осознала, что в случае с Хибой отстранение на месяц оказалось слишком серьезным штрафом. Я украдкой смотрю на Хибу и Газвана, чтобы понять, не затаили ли они обиду на Гумнишку, но Газван упрекает жену по-арабски, напоминая ей, что Ива уже извинилась. Хиба не жалеет, что рассказала мне об этом, но подчеркивает, что это дело прошлое. Ее жизнь продолжается.
Как же Хиба поступит в следующий раз, когда у нее появится повод пожаловаться?
«Я просто промолчу, — говорит она, пожимая плечами. — Мне это не по карману».
<…>
Хиба не хочет просто продолжать заниматься тем, чем занимается сегодня, как робот или дрон. Ей тридцать восемь, и она впервые в жизни финансово независима и технологически грамотна. Теперь у Хибы новые мечты.
В прошлом сентябре она поступила в местный университет, где начала учиться одновременно со своим старшим сыном. Это дорого — в год на учебу уходит около 10 тысяч болгарских левов, то есть более четырех тысяч евро. Но стоит Хибе заговорить о своих занятиях, которые ей очень нравятся, как ее лицо озаряет улыбка.
Почему она решила потратить с трудом заработанные деньги на образование, вместо того чтобы обеспечить себе более комфортную жизнь или накопить на покупку чего-то более осязаемого, например машины или дома? Немного подумав, она отвечает, что дело в человеческом желании расти и развиваться: «Я хочу учиться новому, узнавать больше».
Теперь она изучает биологию. Почему она выбрала именно ее? Услышав этот вопрос, она вскидывает брови, словно ответ очевиден: «Потому что могу».
