Разработчики искусственного интеллекта (ИИ) заявляют, что мировая ИИ-индустрия почти исчерпала запас доступных в интернете данных для обучения. Предсказывают, что их дефицит заставит отойти от привычного формата разработки. Где брать данные для обучения ИИ-моделей, и как много и быстро на этом зарабатывать – рассказывает генеральный директор Softlogic.ai Денис Логинов.
Есть мнение, что решением проблемы исчерпаемости контента для ИИ-обучения могут стать т. н. «синтетические» данные. Многие компании уже начали применять их для машинного обучения. По оценкам Gartner, 60% данных, использованных в ИИ-проектах 2024 года, уже были синтетическими. Однако остается открытым вопрос, насколько такой «синтез» способен улучшить качество ИИ, тем паче – исключить ошибки генерируемого контента.
Профессионалы, включая экспертов Forbes, высказывают опасение, что «искусственные данные» вскоре приведут модели к коллапсу: генеративные алгоритмы станут «менее креативными и более предвзятыми», а значит – вовсе нефункциональными.
Это полностью противоречит главной парадигме ИИ образца 2025 года – «перестать восхищать и начать зарабатывать». Без курса на практическое применение ИИ просто теряет смысл. Доверие к технологии будет снижаться, инвестиции – сокращаться, разработки – замедляться. Как следствие – начнется стагнация или даже деградация самого актуального сегодня направления технологического развития человечества.
Но к счастью – страхи ИИ-стагнации сильно преувеличены, точнее – просто надуманы. Да, объем контента, произведенного человечеством конечен. Зато данные, которые предоставляет окружающий мир, открывают новые, самые радужные ИИ-перспективы.
С развитием технологий доступ к объективным «физическим» данным стал проще, их количество уже значительно превышает объем, который может обработать самый мощный компьютер. Такие данные повсюду – в природе, науке, на производстве, транспорте, в городском хозяйстве, общественной безопасности. Именно в их использовании – огромный потенциал и новый этап развития ИИ.
На самой заре цифровой трансформации, в начале 2000-х, корпорация Motorola пыталась внедрить концепцию Intelligence Everywhere. Она объединяла возможности интернета вещей (IoT) и искусственного интеллекта (AI) — то, что сегодня называется Искусственным интеллектом вещей (AIoT). Однако в то время концепт оказался неосуществимым. Из-за недостаточного развития полупроводниковых технологий, сетей связи и программного обеспечения (ПО). Теперь «умные» устройства стали гораздо компактнее, доступнее и совершеннее. Их массово используют в повседневной жизни и работе. AIoT практически объединил интеллектуальные алгоритмы и устройства, которые способны взаимодействовать быстро и крайне эффективно.
С помощью специализированных нейросетей информацию обрабатывают теперь сами устройства сбора данных или компактные вычислители, расположенные с ними рядом. Они могут анализировать, структурировать, и обобщать данные как-бы «на краю» большой интеллектуальной системы, передавая в центральный ЦОД только самые ценные, почти невесомые «жемчужины» информации. Такие пограничные вычисления (edge computing) радикально приближают обработку данных к их источникам – камерам, датчикам, «умным» колонкам, платежным терминалам, дронам, любым «интеллектуальным» девайсам и гаджетам.
Искусственный интеллект вещей позволил отказаться от отправки больших потоков данных на корпоративные серверы или в «облако». Устройство, используя встроенный ИИ, само справляется с поставленной задачей, обучаясь по ходу ее выполнения. Симбиоз IoT и AI, впервые позволил обойтись без загрузки терабайт «мусорных» данных в гигантские дорогостоящие дата-центры.
Российский Forbes первым сообщил, что в 2025 году Минцифры РФ планирует запустить федеральный сервис интеллектуальной обработки видеопотоков с камер видеонаблюдения в регионах. Так значится в обновленном паспорте ведомственной программы цифровой трансформации на 2025-2026 годы. Для извлечения важнейшей оперативной информации сервис должен анализировать видео в реальном времени.
Примером эффективного внедрения AIoT можно назвать проекты, связанные с автоматизированным благоустройством в ряде российских городов. Интеллектуальные платформы анализируют потоки видеоданных, позволяют мгновенно выявлять несоответствия — от мусора на улицах до нарушений правил безопасности на промышленных объектах. Эта тема с каждым днем становится все более актуальной для самых разных регионов России. Местные администрации и бизнес имеют высокий интерес к подобным системам. Кратно растет спрос на актуальную объективную информацию для решения самых разных задач. Чтобы выполнять их быстро, экономично и эффективно приходится следить практически за всеми процессами и за всем происходящим вокруг.
К счастью, видеоданные для интеллектуального нейросетевого анализа получают теперь от огромного числа источников: городских и корпоративных систем видеонаблюдения (СВН), мобильных и стационарных автономных комплексов нейросетевого наблюдения, портативных видеорегистраторов, беспилотных летательных аппаратов (БПЛА), смартфонов, городских интерактивных панелей, касс, турникетов и пр.
Для принятия информированных управленческих решений требует тщательной обработки и анализа разнообразных видеоданных, представления ценной информации в удобной форме на доступном цифровом носителе, допустим — дашборде. Перенос вычислений и аналитики в реальном времени прямо к фиксирующему устройству, позволяет делать это гораздо более экономично и эффективно. В случае с камерами – видеоряд мгновенно обрабатывают на месте, а в центр передают компактные файлы с отображением конкретных инцидентов. Это значительно снижает нагрузку на общие сети и центральные серверы, повышая при этом точность и оперативность реагирования.
Благодаря множеству встроенных ИИ-алгоритмов такая AIoT-платформа помогает руководителям принимать обоснованные решения быстро практически по любым вопросам. Подобная интегрированная система нейросетевого анализа существенно увеличивает эффективность и уровень безопасности, одновременно сокращая затраты в госучреждениях, бизнесе, социальной сфере и пр.
Базовые решения такого рода платформ искусственного интеллекта вещей протестированы в более чем 40 регионах страны, а в 20 из них, включая Санкт-Петербург и Московскую область, – работают на постоянной основе. Они помогают наводить порядок, повысить безопасность, упрощая работу и сократив расходы на мониторинг гораздо более высокого технологического уровня.
AIoT заменил ручную обработку данных, исключив человеческие ошибки и сделав анализ намного точнее. Именно такой концепт превратил огромные потоки данных в четкую и понятную информацию о событиях и проблемах. Система сама находит закономерности и выявляет недочеты. Например, она может автоматически определить, что в каком-то районе накопилось большое количество старых покрышек и сравнить, есть ли такая проблема в других регионах. Руководители теперь видят картину не «со своей кочки». Искусственный интеллект вещей делает на 100% объективные выводы, основанные на данных, собираемых за тысячи километров – всей стране.
На предприятиях AIoT находит слабые места в процессах, сам предотвращает аварии, следит за техникой безопасности. В логистике – отслеживает грузы, маршруты, состояние транспорта. В бизнесе помогают анализировать потоки клиентов и обеспечивать безопасность. В городах – контролирует дороги, парковки, уборку, заполненность мусорных контейнеров, другие параметры порядка и благоустройства.
Примером их эффективности можно привести мобильные комплексы «умного» видеонаблюдения в Московской области. Уже в 2023 году они позволили выписать более 4 тыс. постановлений на сумму свыше 170 млн рублей, в среднем – около 14,5 млн руб. в месяц. Некоторые российские регионы специально внесли изменения в местные КоАП, установив штрафные санкции за нарушения в благоустройстве. Такие системы доказали кратно большую экономическую эффективность в сравнении с увеличением числа инспекторов для мониторинга традиционными методами.
Так что план, реализуемый Минцифры, полностью отвечает вызовам времени. Платформенные AIoT-решения позволяют собрать и обработать данные с различных источников без посредников. Это дает возможность бизнесу и государственным структурам видеть реальную картину происходящего, используя современные доступные, чисто российские ИИ-технологии.