Больше всего в дата-сайентистах нуждаются IT, медиа, онлайн-развлечения и финансовые сервисы. Но большие данные не стоят на месте, их начинают использовать и в менее дигитализированных сферах. Так что если чувствуете, что востребованную специальность получать нужно, а душа лежит к моде, ремонту дорог или, скажем, к пиву, то никакого противоречия тут нет. Рассказываем, где совершенно неожиданно оказалась нужна наука о данных.

Пчеловодство

Израильский стартап Beewise производит роботизированные автономные ульи Beehome. Улей берет энергию от солнечной батареи и управляется операционной системой с искусственным интеллектом. Она следит за микроклиматом, здоровьем пчел и их поведением с помощью датчиков. Это помогает собирать больше меда и тратить меньше ресурсов, например пестицидов. 

ИИ помогает следить, чтобы пчелы не сбивались в рой. Пчелы образуют рой из-за перенаселения: объединившись, часть пчел улетает из улья и образует новую колонию. Из-за этого пасечники теряют пчел и получают меньше меда. Система использует компьютерное зрение и данные с датчиков, чтобы замечать роение на ранних стадиях и предотвращать его, добавляя в улей новые соты и усиливая вентиляцию. 

Компьютерное зрение также позволяет бороться с клещами-вредителями. Система на основе компьютера для ИИ NVIDIA Jetson анализирует фотографии сот с камер и обнаруживает на них клещей. Чтобы клещи не уничтожили весь улей, Beehome переносит зараженные соты на карантин и поливает их пестицидами: минимальным количеством в нужных местах.

Свой проект обработки данных о пчеловодстве есть у компании Oracle. С Beewise и Oracle также конкурируют ирландский стартап ApisProtect и канадский — Nectar. Они производят климатические и акустические датчики для сот и ульев. Машинное обучение помогает этим системам искать закономерности между звуковым фоном колонии и состоянием пчел: размером популяции, их здоровьем и продуктивностью. Анализ данных помогает пчеловодам принимать решения, например, о расширении улья или сборе меда. 

Пивоварение 

Исследовательский проект IntelligentX использует дата-сайенс для поиска идеального рецепта пива. По словам основателей, обычно пивовары создают рецепты напитков на свой вкус, используя большие данные только в маркетинге. В IntelligentX же считают, что данные о вкусовых предпочтениях потребителей помогут создать популярные сорта пива. 

В пилотном исследовании проект тестировал 4 сорта английской пивоварни UBREW: Black AI, Golden AI, Pale AI и Amber AI. Подписчики пивоварни в фейсбуке пробовали пиво и заполняли опросники о разных его характеристиках, например об аромате хмеля. Исследователи собрали 100 тыс. единиц данных и обучили на этом датасете нейросеть. Алгоритм предложил 25 поправок к рецептам, которые могут улучшить продажи пива.

Похожий проект реализовала американская пивоварня Champion Brewing вместе с ИИ-стартапом Metis Machine. Исследователи проанализировали данные 10 самых продаваемых и 10 наименее популярных в США марок пива сорта IPA: например, показатели горькости (IBU) и цветности пива (SRM). На основе этих данных нейросеть создала наилучший возможный рецепт, который назвали в честь машинного обучения (machine learning): ML IPA.

Датская компания Carlsberg вместе с Microsoft также работает над созданием новых сортов пива с помощью машинного обучения. Исследователи проекта Beer Fingerprinting Project создают по тысяче образцов разных сортов пива ежедневно. Их анализируют с помощью специальных сенсоров, способных определять «вкусовой отпечаток» пива по его химическому составу. Данные, полученные с сенсоров, помогают компании быстро выводить на рынок новые напитки и повышать качество их варки.

Мода

В 2016 году британский модный бренд Marchesa и компания IBM использовали машинное обучение для создания «когнитивного» вечернего платья. Белое платье со 150 светодиодами в кружевных цветках презентовала модель Каролина Куркова на красной дорожке Met Gala.

Проект был реализован на суперкомпьютере IBM Watson с нейросетью IBM Cognitive Color Tool. Система использовала знания о психологии восприятия цвета для работы с данными: оттенками цветов и эмоциями, которые они вызывают у людей. Дизайнеры загрузили в нее коллекции фотографий вечерних платьев модных домов и цветовую палитру бренда Marchesa. Cognitive Color Tool выдала набор оттенков, отражающих разные эмоции.

Светодиоды, установленные на платье, загорались этими оттенками в зависимости от эмоций зрителей Met Gala. Нейросеть анализировала твиты, относила их к категориям эмоций и отражала в цвете платья. Например, радостные твиты делали платье ярко-розовым, а взволнованные — цвета морской волны.

С помощью суперкомпьютера Watson IBM пытается внедрить технологии больших данных и машинного обучения в разные креативные сферы. Например, проект Chef Watson анализирует рецепты блюд и вкусовые предпочтения людей для создания новых сочетаний ингредиентов в блюдах.

Парфюмерия

Еще один проект с суперкомпьютером Watson IBM создала вместе с немецкой парфюмерной компанией Symrise в 2018 году. Алгоритм IBM Phylira обучался на датасете парфюмеров: 1,7 млн формул ароматов, данные о продажах и демографии покупателей. 

В исследовании IBM отмечается, что в парфюмерии нельзя просто сопоставить данные об ингредиентах и эмоциях людей, как в случае с едой. Запахи устроены сложнее вкусов, поэтому в датасетах использовали данные об отдельных нотах запахов, которые улавливают люди, например фруктов и трав.

На основе этих данных Phylira выдает формулы и ингредиенты духов, которые потенциально могут давать высокие продажи в заданном сегменте потребителей. Например, бразильский косметический ритейлер Boticário использовал Phylira для поиска формулы духов для миллениалов, живущих в Бразилии. Нейросеть предложила два состава духов. По словам главного парфюмера Symrise, первый по запаху напоминал экзотическую кухню, а второй — чай с плодами личи. 

Оба аромата успешно прошли тестирование в фокус-группах и обогнали по популярности другие популярные у миллениалов духи. В 2019 году ароматы появились на полках магазинов Boticário под брендами Egeo On Me и Egeo On You.

Ремонт дорог

Канадский институт Ватерлоо в 2018 году начал проект по использованию ИИ в ремонте трасс и улиц. В качестве данных проект использует фотографии дорожного полотна. Вначале нейросеть обучали на основе панорам Google Street View. Теперь работники ремонтных служб смогут отслеживать поврежденные участки асфальта с помощью камер смартфонов, видеорегистраторов и дронов.

Подобный проект в 2019 году также начали разрабатывать в британском Блэкпуле. Система Project Amber также использует компьютерное зрение, но собирает данные о дорогах со спутников. Работникам ремонтных служб больше не нужно разъезжать по дорогам в поисках ям и повреждений, что снижает расходы бюджета. По данным властей Блэкпула, за полгода работы система помогла сэкономить 1 млн фунтов, которые потратят на ремонт участков дорог, найденных Project Amber.

В России такой проект реализует Ростех. Система «Глонасс-БДД» анализирует данные с автомобильных регистраторов и создает «цифровые двойники» дорог. Нейросети с компьютерным зрением обрабатывают изображения и присваивают дорогам рейтинги безопасности. Рейтинги зависят от состояния асфальта, трафика и установленных знаков. Например, во время пилотного исследования системы в 2020 году в Оренбургской области 6% исследуемых участков дорог система признала потенциально опасными. Сейчас систему тестируют власти и дорожные службы, в будущем доступ к цифровым двойникам получат и водители.

Автор: Сергей Галкин

    Полезные материалы в одной еженедельной рассылке
    Подписывайтесь, не пожалеете.