С момента своего запуска в 1998 году Google был безоговорочным лидером среди поисковых систем! Однако с выпуском ChatGPT мы заметили новую тенденцию! Когда пользователю предлагается выбор между поиском и ответами, он предпочитает получить ответы сразу. И именно это предлагают LLM. К сожалению, текущий уровень развития LLM часто ненадежен, когда речь идет о предоставлении вам фактических и актуальных ответов.

Может ли OpenAI создать новое поколение фактических и актуальных моделей большого языка?

Метеорический рост ChatGPT: Преимущества и недостатки LLM

Самое быстрое принятие в истории цифровых сервисов!

ChatGPT потребовалось 5 дней, чтобы привлечь своих первых миллион пользователей, и два месяца, чтобы достичь отметки в 100 миллионов пользователей. Это, безусловно, самое быстрое принятие цифрового сервиса.

Будь то написание блог-поста, ответ на электронное письмо, отладка кода или что-либо еще, вы обычно можете положиться на ChatGPT в качестве умного помощника по искусственному интеллекту!

Будет время до и после ChatGPT! С выпуском GPT4 в начале 2023 года эта тенденция была подтверждена! И OpenAI видит растущую базу пользователей, которые регулярно полагаются на ChatGPT для работы или личных задач.

Однако, несмотря на все новшества, у него все еще есть ограничения! Особенно при обсуждении недавних событий. Независимо от того, используете ли вы его для написания кода или просто полагаетесь на него для предоставления вам фактических ответов, вам следует быть осведомленным о его ограничениях!

Одиночные модели большого языка пока не могут конкурировать с поисковыми системами

Я уже изучал ограничения ChatGPT несколько месяцев назад, и все три поста до сих пор актуальны:

Почему ChatGPT еще не готов убить Google: в декабре 2022 года я уже обозначил слабые места LLM при сравнении с поисковой системой. А именно, галлюцинации (т.е. генерация неправдоподобных ответов, звучащих правдоподобно) и устаревшие знания! Оба эти фактора делают ChatGPT непригодным конкурентом для Google.
Первый всесторонний анализ ограничений ChatGPT: Я выделил 10 основных областей, где ChatGPT может потерпеть неудачу, включая проблемы с рассуждениями, логикой, математикой, фактическими ошибками (галлюцинациями), предвзятостью, пониманием юмора, программированием, грамматикой, самосознанием и другими нюансами.
Недостатки ИИ-программирования: он легко справляется с простыми задачами, но не сможет создать полноценные системы. Фактически, он часто будет полагаться на устаревшие или устаревшие библиотеки, так как его база знаний ограничена сентябрем 2021 года. Узнайте больше о программировании с помощью ChatGPT, 5 ограничениях, которые следует иметь в виду.

Поиск против Ответа — Большое потрясение: Stack Overflow платит цену

Несмотря на ограничения LLM, они являются мощными инструментами, когда используются правильно! Я лично полагаюсь на ChatGPT в качестве помощника по кодированию ежедневно. В результате этого изменения парадигмы можно увидеть на одном из самых популярных онлайн-сообществ для программистов: Stack Overflow. С момента выпуска ChatGPT он потерял более 50% своего трафика!

Зачем искать ответы в Google или на Stack Overflow, когда можно получить ответ от ChatGPT, верно?

И это не ограничивается Stack Overflow, другие компании также подвергаются воздействию способности LLM решать сложные проблемы очень простым для пользователя способом: например, "Акции Chegg снижаются на более чем 40% после заявления компании о том, что ChatGPT уничтожает ее бизнес".

К новому поколению систем ответов

GPT Bot: OpenAI парсит веб!

В попытке создать модели следующего поколения, OpenAI выпустила нового парсера: GPT Bot!

Очень похоже на то, что делает Google, OpenAI позволяет парсить ваш веб-сайт и воспринимать вашу информацию!

Это имеет несколько значимых причин:

Знания по требованию: Если технология продвинется, как предполагается, пользователи вскоре смогут задавать GPT5 вопросы о текущих новостях. Это означает начало создания поистине "всезнающего" искусственного интеллекта, который может потенциально усвоить всё человеческое понимание!
С возможностью получать информацию в реальном времени, мы видим путь к постоянно обновляемым моделям. Это может вскоре позволить искусственному интеллекту предоставлять информацию по любой теме, включая самые последние события. Аспект реального времени является трансформационным, потенциально позиционируя искусственный интеллект как динамичный и актуальный источник информации, а не только как статическую базу знаний.

Это имеет глубокие последствия! Если OpenAI справится с проблемами галлюцинаций, мы потенциально сможем узнавать о текущих новостях, взаимодействовать с новейшими фреймворками для программирования, спрашивать о последних фильмах или трендах, а также задавать вопросы о последних регуляциях, например.

Важное замечание: Путь к достижению этой цели еще долог! Насколько я понимаю, у нас пока нет осуществимой архитектуры для создания фактически точной самостоятельной модели языкового моделирования.

Понимание GPTBot

Функционально GPTBot собирает публично доступные данные с веб-сайтов, обходя содержимое, которое является либо конфиденциальным, либо требует оплаты, либо запрещено. Этот способ работы аналогичен таким крупным компаниям, как Google, Bing и Yandex.

Однако есть одна загвоздка: веб-сайты включены по умолчанию. Чтобы избежать сбора данных GPTBot, вы должны активно отказаться, установив "запрет" на их сервере.

Такая активная позиция со стороны OpenAI, чтобы поддерживать свои модели искусственного интеллекта в актуальном состоянии, имеет смысл. Без постоянных и свежих данных модели, такие как ChatGPT, рискуют устареть, ограничиваясь знаниями только до сентября 2021 года.

Что мы можем ожидать дальше - модель GPT-5 уже на подходе.

OpenAI подал новую заявку на торговую марку GPT-5

Следующее поколение LLM: больше фактов, мультимодальность, ответы с источниками и (гораздо) большее окно контекста!

Торговая марка включает программное обеспечение для обработки речи и текста, обработки языка и машинного обучения. Она также включает программное обеспечение для распознавания голоса и речи, преобразования аудиофайлов в текст и многое другое.

В данный момент все новости о GPT-5 являются предположениями, НО, основываясь на патенте, мы можем понять амбиции OpenAI.

Я кратко опишу, что мы можем ожидать от моделей следующего поколения в нескольких пунктах:

Больше фактов и меньше галлюцинаций: GPT-4 уже намного надежнее, чем GPT-3.5. Мы ожидаем, что GPT-5 будет на порядок лучше, полагаясь на огромный объем данных, которые будут обработаны GPT-ботом!
Мультимодальность: как указано на изображении выше, "Заявка на торговую марку включает программное обеспечение для создания речи и текста, обработки языка и машинного обучения. Она также включает программное обеспечение для распознавания голоса и речи, преобразования аудиофайлов в текст и многое другое." (источник)
Ответы с источниками: Могут ли модели следующего поколения возвращать надежные источники с ответами? Это было бы идеально и решило бы несколько проблем, включая (1) признание авторства контента и (2) проверку ответа ИИ.
Большее окно контекста: Мы уже видим конкурирующие модели с окном контекста в 100 тысяч токенов. По сравнению с этим, окно контекста GPT-4 в 32 тысячи токенов кажется довольно маленьким. В теории, можно достичь миллионов токенов!

Заключение

Возникновение ChatGPT и больших языковых моделей (LLM) представляет собой технологический сдвиг в том, как мы взаимодействуем и используем информацию. Благодаря своей способности отвечать, а не просто искать, ChatGPT обладает явным преимуществом по сравнению с обычными поисковыми системами. Однако этот революционный инструмент не лишен своих ограничений. Проблемы галлюцинаций, устаревшей информации и другие проблемы, которые я ранее перечислил, показывают существующий разрыв.

Введение GPTBot от OpenAI, механизма парсинга веб-страниц, свидетельствует о серьезной попытке сократить этот разрыв в знаниях, стремясь предоставить пользователям динамическую, актуальную и источниковую информацию в отличие от статической базы знаний прошлого.

Пока цифровой мир ожидает появления GPT-5, существует множество догадок. Обещание заключается не только в более фактическом искусственном интеллекте, но и в возможности создания действительно мультимодальной системы, способной взаимодействовать через различные средства. Потенциал источников ответов может изменить игру, объединив надежность традиционного поиска с легкостью общения LLM.

Снижение трафика на платформах, таких как Stack Overflow, и проблемы, с которыми сталкиваются компании, такие как Chegg, подчеркивают разрушительный потенциал LLM. Однако предстоящий путь полон технических, этических и других проблем. Как пользователи, разработчики и читатели, важно осознавать как чудеса, так и ограничения этих систем, даже когда мы стоим на пороге нового мира взаимодействия с информацией.

OpenAI парсит веб, создавая следующее поколение ChatGPT!