Будущее GPT: как большие языковые модели изменят наш мир
Фото здесь и далее: кадры из фильма «АИ-Ваныч в кибердеревне»
Скорость, с которой развиваются большие языковые модели, действительно поражает. Первая версия GPT, выпущенная в 2018 году, выполняла лишь наипростейшие задачи: могла написать пару абзацев текста, продолжить фразу и дать примитивный ответ на вопрос. Тогда и это казалось чудом. Современные модели могут выполнять многие задачи на уровне человека с высшим образованием. Но пользователям этого мало.
За 6 лет с момента появления на арене первой модели ChatGPT ее функционал сильно усложнился. Последняя версия, GPT-4o, запущенная недавно, способна выполнять многие задачи на уровне человека с высшим образованием. Она работает с большими текстами, решает линейные уравнения, ведет осмысленные разговоры, переводит устно и письменно, генерирует программный код, анализирует данные, составляет отчеты и помогает в проведении научных исследований. Но пользователям уже и этого мало, они ждут GPT-5 или что-то еще более фантастическое. Так что же будет дальше?
Юрист и профессор
Большие языковые модели уже способны создавать тексты на основе огромных массивов данных, но пока еще допускают ошибки и могут интерпретировать контекст неправильно. Например, GPT-4 может перепутать сарказм с серьезным утверждением, неверно понять многозначное слово или современный жаргон.
В будущем, благодаря улучшенным алгоритмам и более богатым данным, большие языковые модели смогут понимать смысл так же глубоко, как высокообразованные носители языка.
В медицине это может означать способность чат-ботов детально анализировать медицинские отчеты и истории болезни и предлагать более точные диагнозы и планы лечения. В праве они смогут лучше понимать юридические документы и судебные прецеденты, предоставляя более обоснованные и точные варианты решений.
Таким образом, многие профессии кардинально изменятся: применение чат-ботов приведет к более высокому уровню автоматизации даже в тех областях, которые до сих пор требовали исключительно человеческого вмешательства. Чат-бот — лектор университета, врач или юрист — это реальность, которая не за горами.
«Одна из вещей, которые меня больше всего раздражают в людях, работающих над ИИ, это когда они с серьезным лицом заявляют: «Это никогда не приведет к сокращению рабочих мест. Это просто добавка. Всё будет отлично», — сказал генеральный директор OpenAI Сэм Альтман. — На самом деле это приведет к сокращению многих рабочих мест, изменит ряд профессий и создаст совершенно новые рабочие места. Такое всегда случается с технологиями».
Главное — наука
Большие языковые модели всё еще сталкиваются с трудностями при объединении данных из различных областей знаний. В будущем они смогут легко синтезировать данные из множества дисциплин, что откроет огромные возможности для их использования в научных исследованиях.
Например, строители ставят задачу: «Нам нужен прочный и легкий материал с такими-то параметрами». Большая языковая модель обращается к знаниям из биологии и находит, что паучий шелк обладает исключительной прочностью и эластичностью, а это как раз то, что нужно на стройке. На основе этих знаний она сможет предложить строителям биомиметические материалы, имитирующие паучий шелк.
Или, например, анализ данных генетических исследований. Модель сможет интегрировать информацию из текстовых статей, графиков ДНК, видео лабораторных экспериментов и аудиозаписей научных дискуссий. Это позволит находить новые генные взаимосвязи и ускорить разработки в области медицины и биотехнологий.
Интеграция данных из метеорологических отчетов, спутниковых снимков, видео с мест природных катастроф и аудиозаписей научных дискуссий поможет лучше прогнозировать климатические изменения и разрабатывать стратегии по их смягчению.
Мама, папа, я и робот
В ближайшие 10 лет роботы-помощники перестанут быть предметом научной фантастики, так что готовьтесь принять такого в семью. И свою роль здесь также сыграют большие языковые модели.
Современные роботы-гуманоиды все еще неуклюжи и с трудом справляются с тем, что по силам человеку — со стиркой белья, пересадкой кактусов или приборкой вещей в шкафу. К тому же они всё еще плохо понимают, что от них требуется.
Искусственный интеллект — именно то, чего не хватало роботам. Современные достижения в области ИИ, включая большие языковые модели и компьютерное зрение, могут значительно улучшить функциональность роботов, позволяя им лучше воспринимать окружающий мир и взаимодействовать с ним. Роботы научатся «видеть», «слышать» и анализировать мир, двигаться и выполнять разную работу.
Роботы, оснащенные большими языковыми моделями, станут незаменимыми помощниками в уходе за пожилыми людьми и детьми. В будущем такие роботы смогут не только поднимать и переносить предметы, но и выполнять множество задач, требующих физической и интеллектуальной активности. Они будут способны готовить пищу и кормить своих подопечных, следить за их состоянием здоровья, измеряя жизненно важные показатели и делая анализы. Сэм Альтман, генеральный директор OpenAI, подчеркивает: «Мы видим, что ИИ будет предоставлять реальную поддержку людям, выполняя как интеллектуальные, так и физические задачи».
Эксперты также отмечают значимость этого перехода. Питер Аббил, основатель UC Berkeley Robot Learning Lab, говорит: «Недавние достижения в области искусственного интеллекта приведут к появлению нового класса роботов. Эти машины выходят за рамки традиционных роботов, выполняющих запрограммированные движения; это роботы, которые могут видеть, учиться, думать и реагировать на окружающую среду».
Не хватает букв и денег
Создатели больших языковых моделей сталкиваются с тремя основными проблемами: ограниченное количество качественных данных, непомерные затраты на обучение и высокое потребление электроэнергии. И тут надежда на новые технологии.
Ни одна из моделей не достигла бы успеха без данных, которые ей скармливают во время обучения. Например, GPT-1 обучалась на 4,5 Гб данных, GPT-3 — на 570 Гб. Но растущая зависимость моделей ИИ от данных привела к опасениям, что данные для обучения моделей могут иссякнуть, и это ограничит возможности для их дальнейшего масштабирования и улучшения. В прогнозе исследовательского института Epoch AI говорится, что запасы высококачественных данных (книги, научные статьи, отчеты) могут иссякнуть к 2025 году, а низкокачественных (интернет-форумы, соцсети) — в течение двух десятилетий. Судебные иски против OpenAI и других компаний за нарушения авторских прав делают выбор данных для обучения еще более сложным.
Еще одна проблема — огромное потребление электроэнергии. Для обработки и обучения больших языковых моделей требуются значительные вычислительные мощности. Крупный дата-центр потребляет примерно 100 МВт, что эквивалентно годовому потреблению 290 тыс. квартир. В будущем мощность дата-центров для искусственного интеллекта может достигать 1 ГВт — в этом случае потребуются собственные электростанции. Новые технологии в области энергоэффективных полупроводников или квантовых вычислений могут снизить потребление энергии, но они еще не достигли массового применения.
Постоянный рост затрат на обучение моделей — еще одна проблема, на которой спотыкаются разработчики. Обучение ChatGPT обошлось в $ 100 млн, но аналитики считают, что в 2025 году появится модель стоимостью $ 10 млрд. Рост затрат означает, что только самые крупные компании смогут позволить себе такие инвестиции, и это приведет к концентрации инструментов и технологий в их руках.