Искусственный интеллект становится незаменимой частью мобильных приложений, программного обеспечения и
CRM систем разного типа. Оплата труда – существенная статья бюджета компании, поскольку колеблется в пределах от 20–30 до 60 % затрат, составляя в среднем 40 %. Внедрение алгоритмов ИИ в технологические процессы – это отказ от сотрудников с низкой квалификацией и среднего уровня, сокращение затрат на оплату труда и прогрессивный рост прибыли. Рассмотрим на примерах, как внедрение и адаптация ИИ в структуру бизнес-процессов подтверждают эффективность и сколько стоит разработать ИИ-приложение.
Симбиоз GPT-4 Vision и Jupyter Notebook
Недавно выпущенная 4 версия GPT Vision хорошо взаимодействует с интерактивным блокнотом Jupyter Notebook. При дополнении ИИ кодом, написанным на Python, пользователь в ответ на рисунок, выполненный движением руки, получает сгенерированные чёткие графики в виде парабол или синусоид, круговых многоцентричных изображений. При введении описания с цифрами и примерных кривых выходит детальная визуализация заданного формата. Многомодальность и относительно точная визуальная оценка применяются в ситуациях, когда нужно определить локации, проанализировать и интерпретировать картинки «на листе», рассчитать модель по заданным математическим параметрам.
Такое решение пригодится инженерам и конструкторам, строителям и аналитикам. Достаточно от руки набросать чертеж и дополнить текстовыми уточнениями, как ПО за считанные секунды выдаст готовый график, схему или план с четкими линиями и размерностями. Простой код, написанный на Python, со встраиванием в ИИ-сервисы обеспечивает чёткое воспроизводство заданного линейного формата. Для решения сложных задач импортируют модули и пакеты, загружают и компилируют дистрибутивы, устанавливают другие библиотеки.
В проекте Jupyter предусмотрены такие варианты для внедрения и
разработки ИИ: веб-среда, приложение для расчета аналитики и цифровых данных, упрощенная версия статических страниц, виджеты и информационные панели с многосторонним взаимодействием. В зависимости от того, какая задача стоит перед разработчиками, можно использовать один или несколько элементов функционала, адаптируя ИИ к запросам.
Приложение Labelme и библиотеки Deepface
Аннотирование визуальной информации – новый шаг в программировании и внедрении ИИ. Открытый исходный код Python и упрощенная для программирования форма обеспечивает аннотирование визуала с последующей переработкой в строгую логическую структуру. Компьютерное зрение – сегмент ИИ. Оно распознает и обрабатывает визуальную информацию, делает анализ видео в реальном времени для
стриминговых сервисов, контента и других изображений, используя данные ранее сформированной базы.
Пример классического графического приложения — Labelme, созданного на open-source платформе LabelMe, разработанной специалистами из Массачусетса в 2008 году. Сегментация и классификация, настраиваемый UI-формат гарантируют удобную ручную работу по разметке онлайн или офлайн. Графическим инструментом интерфейса является Qt.
Распознавание лиц в режиме реального времени с помощью библиотеки Deepface, созданной на Python, обеспечивает идентификацию людей с точностью до 98–99 %. Аналогично ИИ-модели на её базе определяют возраст и эмоции, пол человека, мгновенно сравнивая с сотнями изображений. Библиотека представляет собой экстракт проверенных решений моделей типа VGG-Face и OpenFace, ArcFace с Dlib, GhostFaceNet и других, выполняя задачи распознавания в качестве детектора в течение 5 секунд. Это важно для обеспечения безопасности в местах с высокой концентрацией и проходимостью людей – в аэропортах, станциях, торговых центрах.
Внедрение ИИ-модулей и сравнение на базе Mistral 7B
GPT-сектор достиг такого уровня, что нейронные модели LLM работают по решению половины задач в бизнесе. Внедрение AI-функций и инструментов AI Tool в BPM продлевает жизненный цикл, упрощая идентификацию и первичный анализ. ИИ-инструментарий также выполняет перепроектирование с внедрением новых решений и мониторингом последующей работы. Бенчмарк встроенных ИИ-модулей для бизнес-кейсов включает:
- оценку работы с базами и данными;
- CRM для каталогов и автоматизации работы с маркетплейсами;
- интеграцию с другими APIи плагинами;
- выполнение маркетинговых задач (как помощник маркетолога);
- оценку логики действий и успешности работы кода.
Разработка таких решений чаще осуществляется на закрытом коде для обеспечения безопасности пользователей и владельцев. Тестирование и написание промптов – базис, «сердце» идеи. Модель Mistral 7B в общедоступной лицензии Apache 2.0 на сегодня – в числе лучших. Правильно выбрать, разработать и запустить нужную модель может только опытная команда специалистов, которая оценит объем задач, наличие ресурсов и мощностей, используемый язык программирования.
ML: пример обучения на основе языковой модели
Машинное обучение ML характеризуется множеством направлений – обычные протоколы и глубокие, с подкреплением, языковые модели, матричные либо тензорные методы. Приложения ML входят в промышленность и наукоемкие технологии, науки об окружающем мире, в нейробиологию и климатологию, для улучшения действий роботов и автономизацию личного транспорта. Например, языковая модель будет точнее
прогнозировать 4–8 последующих токенов после обучения на глобальных шаблонах, показав лучший результат в сравнении с тренировками на локальных протоколах.
Многозадачное декодирование основано на взаимодействии нескольких целевых переменных и выявленных регрессионных связей, оценки данных по шкале потерь и последующей их балансировки для достижения нужного эффекта. Это задачи высокого уровня, поэтому стоимость разработки таких кроссплатформенных ИИ-приложений стартует от $100-150 тысяч. Продолжительность обучения нескольких моделей по сложной многофакторной архитектуре с внедрением алгоритмического рассуждения колеблется от 300 до 500 тысяч часов, что объясняет высокую стоимость подобных проектов.
Расширение спектра использования языковых моделей наглядно видно на примере Gemma (продукт Gemini API), которая работает в тестах формата 2B и 7B. Встроенная в модель библиотека Keras 3.0 отвечает за совместимость с фреймворками JAX и PyTorch, открытой тренировочной библиотекой TensorFlow, с сохранением высокой производительности операций и гибкости предлагаемых решений. Расширить имеющийся функционал под бизнес-задачи помогают интерполяция переменных, настройка параметров интерпретатора, модульное тестирование и отладка с профилированием.
Wegic создает и публикует сайты
Успешное внедрение ИИ наглядно видно на примере платформы Wegic, заменяющей программиста и UI/UX-дизайнера в одном лице. Достаточно грамотно написать промпт, внести уточнения, указать желаемую цветовую гамму и расположение элементов, чтобы был готов сайт без написания кода. Сложные версии сайтов на сотни страниц и категорий, с развертывающимся меню и маркетплейсом, который поддерживает тысячи операций, имея защищенные финансовые шлюзы, Wegic не сделает.
Но технических и программных возможностей платформы хватает, чтобы сгенерировать сайт-визитку, страницу личного бренда с портфолио,
простой интернет магазин с небольшим количеством позиций. Такую платформу можно разработать и для других целей – допустим, с целью AI-моделирования интерьера зданий и домов, проектирования дорог, создания комплексов жизнеобеспечения и производства продуктов питания. Первые три сайта на Wegic бесплатные – дается 120 кредитов. Когда они заканчиваются, оплата недорогих тарифов стартует с $10 за месяц. После создания сайта платформа через короткое время публикует его в Интернете.
iPhone со встроенным OpenAI и «личная память» ИИ
В начале 2024 года в мире насчитывалось более 1,5 миллиардов владельцев iPhone. Примерно каждый пятый житель планеты – пользователь мобильного Apple. Стало известно, что для улучшения работы Siri в 18 версию iOS будет внедрен ChatGPT. Владельцы OpenAI еще не полностью согласовали условия, но тот факт, что чат-бот Gemini станет элементом обновления, указывает на готовность к очередным технологическим сдвигам в области ИИ. О подробностях этого станет известно в июне 2024 года.
Данная информация подтверждает, что решения OpenAI и других разработок в области нейронных сетей набирают оборотов. Мгновенный анализ данных по покупателям, сегментация запросов и финансовых активов, поддержание личного контакта, исходя из предыдущих транзакций – малый перечень возможностей ИИ, которые стоит внедрить в бизнес-проект для повышения прибыльности.
База данных запомнит, что конкретный человек делал заказ беспилотного такси с креслом для ребенка. В следующий раз при обращении приложение со встроенным ИИ уточнит, нужно ли автокресло. Покупателю ноутбука через год или два предложат обновить модель на новую, лучше и мощнее предыдущего варианта. Если известно, что в определенные периоды года люди покупают только рыбу и морепродукты, отказываясь от мяса, яиц и молока, ИИ будет присылать выгодное предложение с корзиной из предпочитаемого набора.
Нейронным сетям нужны четкие протоколы
Пенсильванцы разработали платформу DrEureka, где языковые модели ИИ учат роботов. На примере робопса ИИ показал, как можно сгенерировать код и поэтапно, в результате каждой успешно выполненной симуляции, с учетом балансирования, исходя из массы и смещения машины в пространстве, награждать или наказывать робота. Особенность – создание и выполнение нескольких сценариев одновременно, что считается возможным только для человека.
Как пример: женщина может одновременно говорить по телефону с беспроводным девайсом, жарить стейки и наливать ребенку йогурт, переключаясь затем на другие вопросы. Теперь и нейросеть генерирует и выполняет параллельно до десятка алгоритмов действий. Но нужен контроль и грамотно прописанные запрещающие протоколы, так как для достижения надпороговой эффективности и энергосбережения ИИ может допустить опасные действия.
Предположим, посчитать, что автомобиль-беспилотник быстрее поедет на трех колесах. Или счесть, что приехавшие в гости незнакомые родственники во время отсутствия хозяев – грабители, поэтому нужно заблокировать окна и двери, вызвать охрану. Для этого нужен контроль с указанием строгого запрета на выполнение определенных операций.
ZeST как основа для графического дизайна
Недорогие приложения ценой в границах $20–50 тысяч могут основываться на методах типа ZeST, когда пилотный образец меняет внешний вид и фактуру, исходя из материала. Несмотря на 2D-формат, зафиксированный ориентир на свойства материала-донора полностью переносит нюансы на исходный объект, подстраивая масштаб и освещенность. Глубину и оттенки цветов кодирует IP-Adaptor, сохраняя при этом другие визуальные отличия объекта. Метод частично похож на B-LoRA и принципы стилизации в InstantStyle.
Изменяемая при помощи ИИ текстура будет полезна производителям мебели и тканей, фарфоровых изделий и других вещей, где необходимо обыграть цветовую гамму. Для графического дизайна, проектирования экстерьера и интерьера зданий метод воплощает незаменимую «волшебную палочку». Допустим, заказчик хочет отделку гостиной и спальни в стиле рококо или барокко, классицизм либо luxury. Подбираем нужные элементы и приложение с ИИ генерирует их заново в нужной палитре, мгновенно представляя ряд прототипов.