Эпоха искусственного интеллекта ворвалась в жизнь давно. Люди привыкли к мгновенным идентификации и регистрации, ускоренному поиску транспорта и маршрутов, удобному выбору товаров и использованию ИИ-сервисов. AI стал надежным помощником бизнесу, заменил сотрудников и свел до нуля вероятность ошибок из-за человеческого фактора. Рутинная работа перешла в разряд той, которую перепоручают AI, в то время, когда решением творческих задач занимаются ведущие специалисты.
Каждая из IT-компаний по разработке моделей и алгоритмов, приложений, чат-ботов на основе AI применяет способы интеллектуального анализа цифровых данных при машинном и глубоком обучении. Для сложных проектов подключают нейронные сети в бизнес. Визуализация с AI – это распознавание и компьютерное 3D-зрение.
Продвинутые банковские приложения часто базируются на работе умного ИИ-помощника. Действия, выполненные AI по уточнённым критериям на биржах, при покупке, продаже – повседневность. Предварительный отбор кадров по конкретным показателям, первичная диагностика пациентов, настройка действий в сфере безопасности при срабатывании указанного триггера – тоже результаты мышления AI. Генерация текстов среднего уровня, изображений и видеоконтента на слуху несколько лет.
Анализ изображений, полученных с квадрокоптера FPV – удобный способ оценки местности в режиме реального времени. Можно настроить сразу на передачу в центр обработки данных для ускоренного приёма решений при помощи ИИ в базовых ситуациях. Автоматизация процессов – еще один плюс внедрения AI.
Примеры задействования ИИ в бизнес-деятельности турфирм включают распознавание загранпаспортов, страховок и документов путешественников. Эти данные легко вносить в форму заявок или договоров с минимальным уровнем ошибок, до 1–5 %. Обучение нейросети распознаванию проходит путём анализа фото и текста в пространстве, с адаптацией и верификацией, формированием API-ответа. Само ПО, созданное по технологиям RPA, интегрируется в любую CRM систему или чат-бот, кабинет пользователя.
RPA-робот заполняет рутинную документацию, формирует отчёты, выполняет операции по настройке рабочего времени. Тренировка проходит с помощью машинного обучения ML. Одним из часто используемых приёмов ML является создание и подготовка к функционированию нейронных сетей – по архитектуре сверточных или генеративных. Нейронные сети могут спрогнозировать курс акций на сайте форекс и криптовалют, диагностировать заболевание или функциональное нарушение. Ученые применяют их для прогноза качественных характеристик медикаментов на основе компонентов, оценки состояния планируемого объекта или сплава.
Мало собрать базы данных и показать их AI: необходимо научить его распознавать ситуации, где нужно быстро дать чёткий ответ. Это случаи, где реляционные базы не могут найти правильное решение. Такими вопросами занимаются аналитики Data Science. В их задачи входит определение алгоритмов и условий математической модели, при которых осуществляется:
Наглядно процесс можно выразить так: предположим, человек едет в автомобиле. У него прошел созвон, который вызвал всплеск эндорфинов. Из-за этого усилилось сердцебиение, но снизилась внимательность, появилось желание «полихачить». Трекер на руке это определяет, передает информацию в ИИ-систему автомобиля. ИИ делает предупреждение – рекомендует снизить скорость (или сам выполняет), уменьшает нагрев салона и приоткрывает окно.
ИИ – это не человеческое мышление. Компьютеры выполняют то, что требует от них программист – расчёт, вычисление, выполнение конкретных действий. Поставить задачу можно голосом или текстом, но перед этим ввести правила и ограничения, зависимости, включая статистические. Алгоритмы преобразований – это схемы по образцам: «Описание» – «Правила» или «Задача» – «Решения». Прогнозирование работает при условии введения нескольких ситуаций с примерами.
Допустим, ставим задачу: «Напишите программу на Python для получения прибыли маркетплейса. Исходный капитал 100 тысяч долларов, ожидаемая прибыль 10 % вложений, число товаров на маркетплейсе 10000, средняя цена одного товара 50 долларов, комиссионное вознаграждение 3%».
Результатом будет вышеизложенный ответ, ограниченный ввиду введения малого количества показателей в условия задачи. Чем подробнее расписаны факторы и больше объем датасета, тем меньше ошибка в итоговом решении. Программист при тренировке ИИ вводит исходную информацию и маркирует каждый фрагмент тегами. Когда накапливается база данных с управляющими маркерами, обучение переходит на стадию перебора правил и проверки при прогнозировании.
Каждый этап – нахождение прописанной закономерности и поиск новой, с определенным параметром. Например, если приехал автомобиль Mersedes, потом Audi и Honda, следующим может быть BMW или Mitsubishi. Если же закономерности искать не нужно, тогда эту функцию отключаем и используем решения предыдущих шагов.
Сценарий, где после первого маркера идет вопрос, а следующий – ответ, делает алгоритм удобным, поскольку в пределах базы информации он будет давать ответ на любые вопросы в этих границах. Понятно, что в каждом алгоритме прогнозирования есть ошибка.
Считается допустимым, если границы погрешности находятся в пределах 5 %. Стохастическая модель подходит, когда нет определенности в диапазоне введения входных или выходных данных. Локальная функция с однозначным отображением руководствуется идентификаторами объектов. Простые функции однопараметрические, расчёты в них проводятся при помощи коэффициентов, но не утверждениями, это ложь или истина.
Каждый алгоритм раскладывается на этапы: условия и переходы, каждый из которых заканчивается оператором результата, но не возврата. Сравнение с константой, являющейся определенной точкой или шагом алгоритма – основа для беспрерывного прогнозирования. Это можно сравнить с поиском корреляции, когда при накоплении данных коррелирующих признаков их объединяют в группы. Потом на базе полученной основы идёт выделение общего условия и дистанции между заданным параметром и результатом вычисления.
Выглядит это так:
Конвертация включает в себя алгоритмы поиска решений и последующее создание правил на основании полученных ответов. Иногда результатом является рекурсия с несколькими уровнями либо фрактал. Управляющие маркеры отвечают на запросы и выдают итоговые расчёты, учитывая скорость процесса, ускорение и погрешность. Тем не менее в основе находятся алгоритмы, базирующиеся на статистике.
Для компьютера нехарактерен поиск решения или проведение исследования без задачи. Даже если условно запрограммировать как человеческую личность, без задачи ПК не будет выполнять конкретные действия. Формальная логика здесь не работает, нужны математика и статистика. Решения, принимаемые ИИ автономно, нужно анализировать: если выходят за грани алгоритмов и скриптов, но представляют собой предпочтительный вариант, то это то это подтверждение правильности решения о «самостоятельности».
Принципы работы ИИ:
Максимальный уровень анализа у ASI, который походит на человеческое мышление. Разумность AGI приближается к среднему уровню мыслительной деятельности человека. ANI – типичный исполнитель, не выходящий за рамки написанных программных задач.
Накопление массивного объема данных требует обучения ИИ. Для машинного формата применяют линейную и многофакторную регрессию, опорные векторы, дерево решений с подкатегориями и KNN-соседей. Обучение с последующим подкреплением включает алгоритмы для роботов. Общение с чат-ботом – результат использования трансформеров после обработки языка человека.
Задача NLP – распознавание текста и аудио, перевод и генерирование контента. 6 лет назад программисты Facebook на базе данных Amazon (6 тысяч реальных диалогов) разработали бот, который ничем не отличался от человека, мог торговаться и даже обманывать. Это показывает, что задачи ИИ в маркетинговых схемах и сфере развлечений многообразны:
Если анализировать работу ИИ на примере приложения Libratus, то ясно, что оно состоит из нескольких частей. Аналитическая центральная часть взаимодействует со второй, отслеживающей ошибки противников и третьей, анализирующей погрешности в собственных действиях. Это пример, когда на основе неполной информации получают полный исчерпывающий ответ в отраслях кибербезопасности, военного дела и переговорного процесса.
12 лет назад за теорию стабильного распределения экономисты Шепли и Рот получили Нобелевскую премию. Решения математиков подтвердили в IT: приёмы унимодального и бимодального распределения работают при условии набора многомиллиардной базы данных с последующим анализом в виде гистограмм. Разработчики в лабораториях OpenAI и Google, компании Microsoft постоянно контролируют обучение ИИ, отсекая неверные решения и создавая шаблоны на основе правильных. В мире зарегистрировано 60 тысяч IT-компаний по разработке ПО на базе ИИ.
ChatGPT 3 версии использовал всего 175 млрд. источников. Версия 5, которую выпустят к концу 2024 года, будет одновременно генерировать текстовый и аудиовизуальный контент. Количество источников для разработки в 100 раз превышает объём данных ChatGPT-3. Усовершенствованный и мощный вариант будет анализировать данные, работать как основа для чат-бота, генерировать код и выполнять другие функции виртуальных помощников. Пока модель 3.5 работает вот так и допускает ошибки.
В числе зарекомендовавших себя ИИ-приложений DALL-E, который генерирует и редактирует изображения, делает коллажи. Whisper – универсальный ИИ-транскрибатор, умеющий распознавать речь и переводить. CLIP – аналог по картинкам и фото. Gym Library и Codex – платформы на основе ИИ для программистов. В списке Google 15 похожих ИИ-приложений и платформ. Правда, в их работе часто встречаются ошибки и погрешности.
ИИ-алгоритмы применяются в Google Photos и Youtube, переводчике с целью улучшения функций и анализа данных. Чат-бот Google Bard – аналог ChatGPT, но с собственным языком PaLM 2. Его можно использовать одновременно с Gemini, обладающим высоким уровнем генерации и анализа. Imagen AI генерирует изображения, Generative AI – тестер генеративных моделей обучения. Vertex AI помогает учёным обрабатывать данные, Dialogflow предназначен для создания чат-ботов.
ИИ-платформы Microsoft включают в себя универсальную энциклопедию Copilot, сервис для разработчиков Azure Space, генерирующий изображения, картинки и логотипы, наброски Image Creator для приложений как Инстаграм.
В британском кадастре HMLR, где регистрируют права собственности на землю и объекты, половину работы делает ИИ. Отслеживание эффективности ПО и приложений проводит APM, поэтому Atlassian использует инструменты платформы на базе ИИ для мониторинга процессов и на предмет отсутствия ошибок. Поэтому ИИ часто применяют для профилактики работы жизненно важных систем, оценки технического состояния с целью предотвращения простоев и аварий.
Бизнес-прогнозирование проекта или конкретной деловой операции повышает точность и экономит бюджет. Так, тайваньский производитель «начинки» для смартфонов и продукции Apple Foxconn экономит больше полумиллиона $ на мексиканском заводе благодаря разработке ИИ на основе Amazon Forecast.
Программисты и разработчики готовят искусственные нейроны (узлы) к решению задач методами глубокого обучения. Сюда входит алгоритм NLP для обработки языка, смысла и тональности и генеративный ИИ, чей аудио-, видео- и текстовый контент, артефакты похожи на человеческие. Исходные данные – ресурсы с подуровнями – представляют собой рабочую инфраструктуру, на базе которой проходит обучение. Их можно хранить как на физических ресурсах, так и в «облаке».
Своеобразные «школы» для ИИ – платформы по типу TensorFlow либо PyTorch. Доступна библиотека с открытым кодом Scikit-learn, написанная на Python. Для обучения формируют функции и делают классы согласно плану архитектуры ИИ-приложения. На уровне моделирования идёт определение мощности, затем – сегментирование по уровням и функционалу активации.
Разработчики анализируют, как нейроны изменяют вес соседей при связи и оценивают узлы смещения. Прогноз и реальные данные не должны слишком отличаться друг от друга – для этого задействуют сравнение с помощью функции потерь. В этом процессе помогают оптимизаторы по типу градиентного спуска либо последовательности действий адаптивного градиента, с учётом минимума и максимума, быстроты изменения. ИИ в прикладном формате обслуживает клиента вместо сотрудника.
Универсальность GPT-модели обуславливают корректность подходов обучения промтами, заточенность под конкретные вопросы, работа с датасетом и вычислительные мощности. В компании, занимающейся обучением ИИ-моделей, имеется сотня-вторая графических процессоров GPU и больше. Они отвечают за вычисление и обработку графической информации, проводят тренировки моделей на протяжении до 10–30 дней, что зависит от сложности. Чем больше параметров в датасете, тем выше цена.
Работают упрощённые модели Open-Source. Несмотря на низкий порог входа, они показывают высокие результаты в бенчмарках. Цена тренировки простых приложений с основой из комплекса GPT-4 с Google Bard или LLaMA с Evol-Instruct стартует от $500-1000. Каждую базу в этих версиях легко доучить и получить авторское приложение «под себя», которое лучше платного.
Заказчики должны знать, что объем памяти для разработки упрощённых ИИ-приложений относительно небольшой и требуются GPU с памятью 40–80 ГБ. Системы генеративного ИИ также разрабатывают при помощи облачных технологий на базе нужных сервисов и датасета. В «облаке» хорошо работает Pipeline, начиная с обработки датасета, сбора информации и аналитики данных. Часто нужная модель уже создана, поэтому требуется обучение и настройка некоторых параметров с адаптерами. Чтобы представлять объем информации, помним правило: 10–15 миллиардов параметров помещаются в GPU на 16–24 либо 40 ГБ.
Если применять как базу обученную модель LLM, то метод PEFT расширит нужное подмножество параметров, но оставит в «замороженном» состоянии те, которые не нужны. Аналитики компании в брифе выясняют, какие показатели интересуют заказчика и проводят обучение на основе отобранных. Получается частичная тренировка, результат которой не хуже полного курса обучения. Поэтому в процессе консультации с заказчиком IT-специалисты сразу уточняют, нужна генерация набора решений с инструкциями и условиями или самостоятельное создание обучающих программ с парами вопросов и ответов.
Стандартный сценарий обучения Cloud включает облачные масштабируемые ресурсы в облаке, управление облачным провайдером и задействование готовых сервисов в качестве обучающих инструментов. Без ручной настройки работает протокол ML-разработки со сценариями формирования исходных данных и обработки, эксперименты с версиями, деплой и встраивание моделей, последующий контроль с обновлением. Пример комплексного решения для платформы – сочетание JupyterHub с целью проведения экспериментов, MLflow – для деплоя и взаимодействия Data Science и задач, среды MLflow Deploy для упаковки и развертывания.
Обученная GPT-модель отвечает на вопросы, информация по которым введена в датасет. Ответы бывают короткие и развернутые, с конкретными решениями и примерами. Готовые модели пишут функции и коды программ на JavaScript и Python, извлекают информацию из текста, базы данных или документации, когда задают вопросы.
Доступность ИИ-моделей с базисной информацией упрощает работу по обучению и размещению несколькими единицами или десятками внутри контура сервиса. Важно, чтобы данные датасета проверили: точность и достоверность определяют совокупность и целостность комплекса. Уже в 2024 году ожидается, что парадигма мультимодальности сделает прыжок в ИИ и соединит в единое все виды информации. Опытные разработчики это понимают и часто предлагают совмещенные решения, где идёт анализ, обработка и интерпретация нескольких категорий данных.
ИИ начинает выступать в качестве AR/VR-обучения по принципу иммерсивного моделирования. Реалистичные практические занятия по учебным сценариям обеспечивают получение практического опыта в безопасных условиях. Поэтому для вузов и колледжей виртуальные тренировки – шаг к получению навыков студентами во время учёбы. И да, дополнительное удобство в том, что используют приёмы персонализации на сайте Netflix и в приложении TikTok, с учетом интересов и ценности учебных материалов, достижений студентов.
Стремительное развитие сферы ИИ показывает, что легко и быстро обучаемые чат-боты с приложениями по генерированию видео, фото и текстового контента, распознаванию данных, формированию отчетов и документации, поиску решений и проверке функционирования объектов или систем численно увеличиваются в геометрической прогрессии. ИИ-приложения берут на себя простые и сложные функции человека. Главная задача – правильно составить алгоритм обучения, сформировать датасет и написать промты, провести тестирование после учёбы.
Программисты и разработчики компании в совершенстве владеют этими методиками. Пишите задачу в форме заявки.