Что такое ИИ?

Искусственный интеллект встречается повсюду — на вашем телефоне, в вашей почте, подталкивает карты, помогает составлять письма, которые вы почти собирались написать. Но что такое ИИ? Вкратце: это набор методов, позволяющих компьютерам выполнять задачи, которые мы ассоциируем с человеческим интеллектом, такие как распознавание закономерностей, прогнозирование и генерация языка или изображений. Это не просто маркетинговый ход. Это реальная область, основанная на математике, данных и множестве проб и ошибок. Авторитетные источники представляют ИИ как системы, способные учиться, рассуждать и действовать в соответствии с целями способами, которые мы считаем разумными. [1]

Статьи, которые могут вас заинтересовать после этой:

🔗 Что такое искусственный интеллект с открытым исходным кодом?
Разберитесь в искусственном интеллекте с открытым исходным кодом, его преимуществах, моделях лицензирования и взаимодействии с сообществом.

🔗 Что такое нейронная сеть в искусственном интеллекте?
Изучите основы нейронных сетей, типы архитектуры, обучение и распространенные области применения.

🔗 Что такое компьютерное зрение в искусственном интеллекте?
Узнайте, как машины интерпретируют изображения, ключевые задачи, наборы данных и приложения.

🔗 Что такое символический искусственный интеллект?
Изучите символическое мышление, графы знаний, правила и гибридные нейросимволические системы.

Что такое ИИ: краткая версия 🧠➡️💻

Искусственный интеллект — это набор методов, позволяющих программному обеспечению аппроксимировать интеллектуальное поведение. Вместо того чтобы кодировать каждое правило, мы часто обучаем модели на примерах, чтобы они могли обобщаться на новые ситуации — распознавание изображений, преобразование речи в текст, планирование маршрутов, помощники по программированию, предсказание структуры белков и так далее. Если вам нравится четкое определение для ваших заметок: представьте себе компьютерные системы, выполняющие задачи, связанные с человеческими интеллектуальными процессами, такими как рассуждение, обнаружение смысла и обучение на основе данных. [1]

Полезная ментальная модель из этой области заключается в том, чтобы рассматривать ИИ как системы, ориентированные на достижение цели , которые воспринимают окружающую среду и выбирают действия — это полезно, когда вы начинаете думать об оценках и циклах управления. [1]

Что делает ИИ действительно полезным✅

Почему стоит отдать предпочтение искусственному интеллекту, а не традиционным правилам?

Способность выявлять закономерности : модели обнаруживают тонкие корреляции в огромных массивах данных, которые человек пропустил бы еще до обеда.
Адаптация — при увеличении объема данных производительность может быть улучшена без переписывания всего кода.
Высокая скорость в масштабе — после обучения модели работают быстро и стабильно, даже при больших объемах данных.
Генеративность — современные системы способны создавать текст, изображения, код и даже молекулы-кандидаты, а не просто классифицировать объекты.
Вероятностное мышление — они справляются с неопределенностью более изящно, чем хрупкие леса, построенные по принципу «если-иначе».
Использование инструментов позволяет подключать модели к калькуляторам, базам данных или поисковым системам для повышения надежности.
Когда что-то идёт не так — предвзятость, галлюцинации, устаревшие обучающие данные, риски для конфиденциальности. Мы к этому придём.

Давайте будем честны: иногда ИИ ощущается как велосипед для ума, а иногда — как одноколесный велосипед по гравийной дороге. И то, и другое может быть правдой.

Как работает ИИ, со скоростью, свойственной человеку 🔧

Большинство современных систем искусственного интеллекта сочетают в себе следующие элементы:

Данные — примеры текста, изображений, кликов, показаний датчиков.
Целевые функции — это функция потерь, определяющая, как выглядит «хороший» результат.
Алгоритмы — это процедура обучения, которая подталкивает модель к минимизации функции потерь.
Оценка — тестовые наборы, метрики, проверки на корректность.
Развертывание — обеспечение работы модели с мониторингом, обеспечением безопасности и защитными механизмами.

Две широкие традиции:

Искусственный интеллект, основанный на символике или логике, — это явные правила, графы знаний, поиск. Отлично подходит для формальных рассуждений и ограничений.
Статистический или основанный на обучении ИИ — это модели, которые учатся на данных. Именно здесь находится глубокое обучение и именно отсюда исходит большая часть недавнего ажиотажа; широко цитируемый обзор описывает территорию от многослойных представлений до оптимизации и обобщения. [2]

В области искусственного интеллекта, основанного на машинном обучении, важны несколько ключевых моментов:

Обучение под наблюдением – обучение на примерах с обозначениями.
Обучение без учителя и самообучение — изучение структуры на основе неразмеченных данных.
Обучение с подкреплением — обучение методом проб и обратной связи.
Генеративное моделирование — научитесь создавать новые образцы, которые выглядят реалистично.

Две генеративные группы, о которых вы будете слышать ежедневно:

Трансформеры — архитектура, лежащая в основе большинства больших языковых моделей. Она использует механизм внимания для связи каждого токена с другими, что позволяет проводить параллельное обучение и получать удивительно плавные результаты. Если вы слышали о «самовнимании», то это и есть основной принцип. [3]
Диффузионные модели — они учатся обращать вспять процесс шумоподавления, переходя от случайного шума обратно к четкому изображению или звуку. Это как медленно и осторожно перетасовывать колоду, но с использованием математического анализа; фундаментальная работа показала, как эффективно обучать и сэмплировать. [5]

Если метафоры кажутся натянутыми, это справедливо — ИИ постоянно меняется. Мы все учимся танцевать, пока музыка меняется прямо посреди песни.

Там, где вы уже каждый день встречаетесь с ИИ 📱🗺️📧

Поиск и рекомендации — ранжирование результатов, ленты, видео.
Электронная почта и документы — автозаполнение, суммирование, проверка качества.
Камера и звук - шумоподавление, HDR, транскрипция.
Навигация — прогнозирование трафика, планирование маршрута.
Поддержка и обслуживание — операторы чата, которые обрабатывают запросы и составляют ответы.
Программирование — предложения, рефакторинг, тесты.
Здравоохранение и наука — сортировка пациентов, поддержка визуализации, прогнозирование структуры. (Клинические контексты следует рассматривать как критически важные с точки зрения безопасности; использовать человеческий контроль и документированные ограничения.) [2]

Небольшая история: команда разработчиков продукта может провести A/B-тестирование этапа поиска информации перед языковой моделью; частота ошибок часто снижается, потому что модель рассуждает на основе более свежего, специфичного для задачи контекста, а не угадывает. (Метод: определить метрики заранее, иметь контрольную группу и сравнивать одинаковые запросы.)

Сильные стороны, ограничения и небольшой хаос между ними ⚖️

Сильные стороны

С легкостью справляется с большими и сложными наборами данных.
Масштабируется для решения различных задач с использованием одного и того же базового механизма.
Изучает скрытую структуру, которую мы не создавали вручную. [2]

Пределы

Галлюцинации — модели могут выдавать правдоподобно звучащие, но неверные результаты.
Предвзятость — обучающие данные могут содержать социальные предубеждения, которые затем воспроизводятся системами.
Надежность — крайние случаи, неблагоприятные входные данные и изменение распределения могут привести к сбоям.
Конфиденциальность и безопасность — конфиденциальные данные могут утечь, если вы не будете осторожны.
Объяснимость — почему там было написано именно это? Иногда это неясно, что затрудняет проведение аудитов.

Управление рисками существует для того, чтобы не допустить хаоса: структура управления рисками в области ИИ от NIST предоставляет практические, добровольные рекомендации по повышению доверия на всех этапах проектирования, разработки и развертывания — например, картирование рисков, их измерение и управление использованием от начала до конца. [4]

Правила дорожного движения: безопасность, управление и ответственность 🛡️

Нормативно-правовые акты и рекомендации догоняют реальную практику:

Подходы, основанные на оценке рисков : для более рискованных видов использования предъявляются более строгие требования; документация, управление данными и обработка инцидентов имеют значение. Общедоступные структуры подчеркивают прозрачность, человеческий контроль и непрерывный мониторинг. [4]
Секторальные нюансы — в критически важных с точки зрения безопасности областях (например, здравоохранение) требуется участие человека и тщательная оценка; для инструментов общего назначения по-прежнему необходимы четкие документы, описывающие их предназначение и ограничения. [2]

Речь идёт не о подавлении инноваций, а о том, чтобы не превращать свой продукт в аппарат для приготовления попкорна в библиотеке… что звучит забавно, пока не перестаёт быть таковым.

Типы ИИ на практике с примерами 🧰

Восприятие — слияние изображений, речи и данных с различных датчиков.
Язык — чат, перевод, составление резюме, извлечение информации.
Прогнозирование — прогнозирование спроса, оценка рисков, выявление аномалий.
Планирование и управление — робототехника, логистика.
Генерация — изображения, аудио, видео, код, структурированные данные.

В основе лежит математика, опирающаяся на линейную алгебру, теорию вероятностей, оптимизацию и вычислительные стеки, обеспечивающие бесперебойную работу. Для более подробного обзора основ глубокого обучения см. канонический обзор. [2]

Сравнительная таблица: обзор популярных инструментов ИИ 🧪

(Небольшие несовершенства намеренно. Цены меняются. Результаты могут отличаться.)

Инструмент	Лучше всего подходит для	Цена	Почему это довольно хорошо работает
Магистратура в формате чата	Написание текстов, вопросы и ответы, генерация идей	Бесплатно + платно	Эффективное языковое моделирование; инструментальные точки подключения
Генераторы изображений	Дизайн, мудборды	Бесплатно + платно	Диффузионные модели демонстрируют превосходные визуальные эффекты
Кодовые вторые пилоты	Разработчики	Платные пробные периоды	Обучен на корпусах кода; быстрое редактирование
Поиск в базе данных векторов	продуктовые команды, поддержка	Различный	Извлекает факты для уменьшения отклонения от нормы
Инструменты речи	Встречи, творцы	Бесплатно + платно	ASR + TTS – это поразительно ясно
Аналитический ИИ	Операции, финансы	Предприятие	Прогнозирование без 200 электронных таблиц
Инструменты безопасности	Соблюдение нормативных требований, корпоративное управление	Предприятие	Составление карты рисков, ведение журналов, тестирование на проникновение (red teaming)
Миниатюрный встроенный модуль	Мобильные устройства, конфиденциальность, друзья!	почти бесплатно	Низкая задержка; данные остаются локальными

Как профессионально оценить систему искусственного интеллекта 🧪🔍

Опишите задачу в одном предложении.
Выберите метрики : точность, задержка, стоимость, срабатывания защиты.
Создайте тестовый набор — репрезентативный, разнообразный, исключающий определенные группы.
Проверьте режимы отказов — входные данные, которые система должна отклонить или передать на рассмотрение вышестоящему руководству.
Проверка на наличие предвзятости — демографические данные и конфиденциальные характеристики, где это применимо.
Участие человека — укажите, когда именно необходимо провести проверку.
Ведение журналов и мониторинг — обнаружение отклонений, реагирование на инциденты, откат изменений.
Документ - источники данных, ограничения, предполагаемое использование, тревожные сигналы. NIST AI RMF предоставляет общий язык и процессы для этого. [4]

Распространённые заблуждения, которые я слышу постоянно 🙃

«Это просто копирование». Обучение изучает статистическую структуру; генерация создает новые результаты, соответствующие этой структуре. Это может быть изобретательно — или неправильно — но это не копирование-вставка. [2]
«Искусственный интеллект понимает как человек». Он моделирует закономерности. Иногда это выглядит как понимание; иногда это уверенная невнятность. [2]
«Чем больше, тем лучше». Масштаб помогает, но качество данных, их согласованность и доступность зачастую важнее. [2][3]
«Один ИИ, чтобы править всеми». Реальные стеки — это многомодельные системы: поиск фактов, генеративный поиск текста, небольшие быстрые модели на устройстве, а также классический поиск.

Более подробный обзор: Трансформаторы и диффузия, за одну минуту ⏱️

Трансформеры вычисляют показатели внимания между токенами, чтобы решить, на чём следует сосредоточиться. Многослойная архитектура позволяет улавливать долгосрочные зависимости без явного повторения, обеспечивая высокую степень параллелизма и высокую производительность в различных языковых задачах. Эта архитектура лежит в основе большинства современных языковых систем. [3]
Диффузионные модели учатся устранять шум шаг за шагом, подобно полировке запотевшего зеркала, пока не появится лицо. Основные идеи обучения и сэмплирования положили начало буму генерации изображений и теперь распространяются на аудио и видео. [5]

Мини-глоссарий, который вы можете сохранить 📚

Модель — параметризованная функция, которую мы обучаем для сопоставления входных данных с выходными.
Обучение — оптимизация параметров для минимизации потерь на примерах.
Переобучение — отлично работает на обучающих данных, но в остальных случаях — так себе.
Галлюцинация — беглое, но фактически неверное изложение мысли.
RAG — это система генерации с расширенными возможностями поиска, которая обращается к актуальным источникам.
Согласование — формирование поведения в соответствии с инструкциями и нормами.
Безопасность — предотвращение вредных последствий и управление рисками на протяжении всего жизненного цикла.
Вывод — использование обученной модели для построения прогнозов.
Задержка — время от ввода данных до получения ответа.
Ограничения — политики, фильтры и элементы управления, связанные с моделью.

Слишком длинно, не стал читать — Заключительные замечания 🌯

Что такое ИИ? Это набор методов, позволяющих компьютерам учиться на основе данных и действовать разумно для достижения целей. Современная волна опирается на глубокое обучение — особенно на трансформеры для языка и диффузию для медиа. При продуманном использовании ИИ масштабирует распознавание образов, ускоряет творческую и аналитическую работу и открывает новые научные горизонты. При неосторожном использовании он может ввести в заблуждение, исключить или подорвать доверие. Идеальный путь сочетает в себе сильную инженерию с управлением, измерением и долей смирения. Этот баланс не только возможен — его можно освоить, проверить и поддерживать при наличии правильных фреймворков и правил. [2][3][4][5]

Ссылки

[1] Энциклопедия Britannica - Искусственный интеллект (ИИ): подробнее
[2] Nature - «Глубокое обучение» (LeCun, Bengio, Hinton): подробнее
[3] arXiv - «Внимание — это все, что вам нужно» (Vaswani et al.): подробнее
[4] NIST - Структура управления рисками в области ИИ: подробнее
[5] arXiv - «Шумоподавление в диффузионных вероятностных моделях» (Ho et al.): подробнее

Найдите новейшие разработки в области ИИ в официальном магазине ИИ-помощников

О нас

Вернуться в блог