Skip to main content

Основы глубокого обучения

Lesson 7: Deep Learning 2 (Июнь 2025)

Lesson 7: Deep Learning 2 (Июнь 2025)
Anonim

Глубокое обучение - это мощная форма машинного обучения (ML), которая строит сложные математические структуры, называемые нейронными сетями, используя огромное количество данных (информации).

Определение глубокого обучения

Глубокое обучение - это способ реализации ML с использованием нескольких слоев нейронных сетей для обработки более сложных типов данных. Иногда называемое иерархическим обучением, глубокое обучение использует различные типы нейронных сетей для изучения функций (также называемых представлениями) и поиска их в больших наборах необработанных немаркированных данных (неструктурированных данных). Одной из первых прорывных демонстраций глубокого обучения была программа, которая успешно выбрала изображения кошек из наборов видеороликов YouTube.

Примеры глубокого обучения в повседневной жизни

Глубокое обучение используется не только для распознавания изображений, но также для перевода на язык, обнаружения мошенничества и анализа данных, собранных компаниями о своих клиентах. Например, Netflix использует глубокое обучение для анализа ваших привычек просмотра и прогнозирует, какие шоу и фильмы вы предпочитаете смотреть. Вот как Netflix знает, чтобы в вашей очереди предложений были сняты боевики и документальные фильмы о природе. Amazon использует глубокое обучение для анализа ваших недавних покупок и предметов, которые вы недавно искали, для создания предложений для новых альбомов кантри-музыки, которые вы, вероятно, будете интересовать, и что вы находитесь на рынке для пары серых и желтых теннис туфли. Поскольку глубокое обучение обеспечивает все больше и больше понимания неструктурированных и необработанных данных, корпорации могут лучше предвидеть потребности своих клиентов, пока вы, индивидуальный клиент, получаете более персонализированное обслуживание клиентов.

Искусственные нейронные сети и глубокое обучение

Чтобы сделать глубокое изучение понятным, давайте пересмотреть наше сравнение искусственной нейронной сети (ANN). Для глубокого обучения, представьте себе, наше 15-этажное офисное здание занимает городской квартал с пятью другими офисными зданиями. На каждой стороне улицы есть три здания. Наше здание строит A и разделяет ту же сторону улицы, что и здания B и C. Через дорогу от здания A находится здание 1, а напротив здания B находится здание 2 и т. Д. Каждое здание имеет различное количество этажей, изготовлено из разных материалов и отличается от других архитектурным стилем. Однако каждое здание все еще расположено на отдельных этажах (слоях) офисов (узлов) - каждое здание является уникальным ANN.

Представьте себе, что цифровой блок поступает в здание A, содержащее множество различных видов информации из нескольких источников, таких как текстовые данные, видеопотоки, аудиопотоки, телефонные звонки, радиоволны и фотографии, однако он приходит в один большой беспорядок и не помечены или не отсортированы каким-либо логическим способом (неструктурированные данные). Информация отправляется через каждый этаж в порядке от 1улица через 15го для обработки. После того, как информационный беспорядок достигнет 15го пол (выход), он отправляется на 1улица этаж (вход) здания 3 вместе с итоговой обработкой результата из здания А. В 3-й степени изучается и включает результат, отправленный зданием А, а затем обрабатывает информацию, перемешавшуюся через каждый этаж таким же образом. Когда информация достигает верхнего этажа здания 3, она отправляется оттуда с результатами этого здания в здание 1. В здании 1 учатся и включают результаты 3-го здания, прежде чем обрабатывать его по полу. Строение 1 передает информацию и приводит к тому же способу построения C, который обрабатывает и отправляет в здание 2, которое обрабатывает и отправляет в здание B.

Каждый ANN (здание) в нашем примере ищет другую функцию в неструктурированных данных (беспорядок информации) и передает результаты в следующее здание. Следующее здание включает (узнает) результат (результаты) предыдущего. Поскольку данные обрабатываются каждым ANN (зданием), он организуется и помечен (классифицируется) по определенной функции, так что, когда данные достигают конечного результата (верхнего этажа) последнего ANN (здания), он классифицируется и помечен (более структурированный).

Искусственный интеллект, машинное обучение и глубокое обучение

Как глубокое обучение вписывается в общую картину искусственного интеллекта (ИИ) и МЛ? Глубокое обучение повышает мощность ML и увеличивает диапазон задач, которые AI способен выполнять. Поскольку глубокое обучение основано на использовании нейронных сетей и распознавании функций в наборах данных вместо простых алгоритмов, ориентированных на конкретные задачи, оно может находить и использовать детали из неструктурированных (необработанных) данных без необходимости того, чтобы программист вручную маркировал его сначала - задача, которая может привести к ошибкам. Глубокое обучение помогает компьютерам лучше и лучше использовать данные, чтобы помочь как корпорациям, так и отдельным людям.