«Качество данных не всегда становится ограничением для внедрения ИИ. Во многих случаях изображения и видео можно дополнительно обработать: уменьшить влияние шумов, скорректировать освещение или компенсировать искажения, возникающие при съемке.
Гораздо важнее, насколько данные отражают реальные условия работы системы. Если большинство примеров показывает стандартные ситуации, а редкие, но критически важные сценарии встречаются лишь в небольшом количестве, модели будет сложно научиться уверенно их распознавать.
С такой задачей мы столкнулись в одном из проектов для ГОК по обнаружению инородных включений в потоке руды. Для обучения удалось собрать около 5000 снимков наиболее распространенных типов объектов в различных условиях засыпки. Однако для редких видов инородных тел такого объема данных не существовало. Чтобы восполнить этот дефицит, команда разработала генератор изображений на базе нейросетей. С его помощью датасет был дополнен синтетическими примерами и увеличен примерно до 20 000 изображений, что позволило охватить значительно больше сценариев и повысить качество обучения модели».
«Часто компании пытаются получить максимум результата за один проект. Системе одновременно ставят разные задачи, каждая из которых требует собственных данных, метрик и подходов к обучению моделей. В итоге проект становится слишком сложным, а ожидаемый эффект либо достигается значительно позже, либо не достигается вовсе».
«Мы всегда спрашиваем заказчика: пробовали ли вы решить эту задачу обычной автоматизацией? Если проблему можно закрыть датчиком, но вместо этого сразу рассматривается ИИ, скорее всего решение усложняют без необходимости.
На одном из проектов компьютерное зрение планировали использовать для контроля прохождения продукции по определенному участку конвейера. Однако во время обследования выяснилось, что ту же задачу способны решить два обычных датчика стоимостью в несколько тысяч рублей. Несмотря на это, первоначально рассматривался гораздо более дорогой вариант с камерами и серверной инфраструктурой просто потому, что бюджет уже был заложен на ИИ».
«На проекте по контролю рулонной стали однажды пропало питание камеры. Система перестала подавать сигналы, но операторы этого не заметили и продолжили работу, решив, что отсутствие уведомлений означает отсутствие дефектов. Этот случай показал, что недостаточно просто обнаруживать брак — важно контролировать и состояние самой системы. В результате в решение добавили дополнительные оповещающие сигналы, подтверждающие, что оборудование и алгоритмы работают корректно».
«Даже одинаковые на первый взгляд задачи могут потребовать совершенно разных решений. Например, в одном проекте по контролю тушек птицы нужно было обнаруживать только один тип дефекта — сломанное крыло. Такой сценарий сравнительно прост для машинного зрения: достаточно научить модель уверенно распознавать конкретное отклонение.
На другом предприятии система должна была различать несколько видов дефектов, поскольку информация использовалась не только для отбраковки продукции, но и для анализа работы отдельных участков производства. В результате задача из простого обнаружения дефекта превратилась в полноценную классификацию, что потребовало большего объема данных, более сложной модели и другого подхода к обучению».
«Сейчас доля таких проектов относительно невысока — порядка 10–15%. Их можно распознать по тому, что на старте задача сформулирована без четко зафиксированных KPI. При этом бизнес часто находится в процессе уточнения, какие именно метрики действительно важны и какой результат ожидается от внедрения. В таких случаях мы, как правило, возвращаемся к заказчику на этап постановки задачи и помогаем зафиксировать измеримые критерии результата до старта разработки».
«Например, через три месяца мы показываем отчет: в бумажном учете зафиксировано 100 событий, а система обнаружила 350. Дополнительно можно поднять конкретные кейсы и кадры, где события были упущены».