AI или Искуственный Интеллект - разработка и изучение: различия между версиями

Текущая версия от 07:53, 31 июля 2024

ВВЕДЕНИЕ

LLM расшифровывается как «Модель большого языка». Это передовые системы искусственного интеллекта, предназначенные для понимания и создания текста, похожего на человеческий, на основе вводимых данных.
Эти модели были обучены на огромных объемах текстовых данных и могут выполнять широкий спектр задач, связанных с языком, таких как ответы на вопросы, проведение бесед, обобщение текста, перевод языков и многое другое.

Обучение модели LLM

На высоком уровне обучение модели LLM включает в себя три этапа, т. е. сбор данных, обучение и оценку.

Сбор данных (Data Collection) Первым шагом является сбор данных, которые будут использоваться для обучения модели. Данные могут быть собраны из различных источников, таких как Википедия, новостные статьи, книги, веб-сайты и т. д.
Обучение (Training): Затем данные проходят через обучающий конвейер, где они очищаются и предварительно обрабатываются перед тем, как поступить в модель для обучения. Процесс обучения обычно занимает много времени и требует больших вычислительных мощностей.
Оценка (Evaluation): Последний шаг — оценить производительность модели, чтобы увидеть, насколько хорошо она справляется с различными задачами, такими как ответы на вопросы, обобщение, перевод и т. д.
Результатом конвейера обучения является модель LLM, которая представляет собой просто параметры или веса, отражающие знания, полученные в процессе обучения. Эти параметры или веса обычно сериализуются и хранятся в файле, который затем может быть загружен в любое приложение, требующее возможностей языковой обработки, например, генерация текста, ответы на вопросы, языковая обработка и т. д.
Типы LLM

На высоком уровне LLM можно разделить на два типа: - базовые LLM - LLM, настроенные под инструкции.

Базовые LLM

Базовые LLM — это LLM, предназначенные для предсказания следующего слова на основе обучающих данных. Они не предназначены для ответов на вопросы, проведения бесед или помощи в решении проблем. Например, если вы дадите базовому LLM предложение «В этой книге мы обсудим LLM», оно может завершить это предложение и дать вам «В этой книге о LLM мы обсудим, что такое LLM, как они работают и как вы можете использовать их в своих приложениях. ». Или, если вы дадите ему «Какие известные социальные сети?», вместо ответа он может ответить «Почему люди используют социальные сети?» или «Каковы преимущества социальных сетей?». Как видите, он дает нам соответствующий текст, но не отвечает на вопрос. Именно здесь в игру вступают LLM, настроенные под инструкции.

LLM, настроенные по инструкции

Instruction Tuned LLM вместо того, чтобы пытаться автозаполнять ваш текст, попробуйте следовать данным инструкциям, используя данные, на которых они были обучены. Например, если вы введете предложение «Что такое LLM?» он будет использовать данные, на которых он обучен, и попытается ответить на вопрос. Точно так же, если вы введете «Какие известные социальные сети?» он попытается ответить на вопрос вместо того, чтобы дать вам случайный ответ.

Instruction Tuned LLM построены поверх базовых LLM:

Instruction Tuned LLMs = Base LLMs + Further Tuning + RLHF Для создания LLM с настройкой инструкций берется базовый LLM, который дополнительно обучается с использованием большого набора данных, охватывающего пример «Инструкций» и того, как модель должна работать в результате этих инструкций. Затем модель настраивается с помощью метода под названием «обучение с подкреплением с обратной связью человека» (RLHF), который позволяет модели учиться на обратной связи человека и со временем улучшать свою производительность.

В итоге

Языковые модели (LLM) произвели революцию в области обработки естественного языка (NLP), позволив машинам понимать и генерировать человекоподобный текст. LLM — это мощный инструмент, который можно использовать для решения широкого круга языковых задач. Они используются в различных отраслях, таких как здравоохранение, финансы, образование и т. д., для автоматизации процессов и повышения эффективности. У LLM есть потенциал революционизировать то, как мы взаимодействуем с компьютерами, и сделать нашу жизнь проще.
Источник

@@ Строка 1: / Строка 1: @@
 ==ВВЕДЕНИЕ==
+LLM расшифровывается как «Модель большого языка». Это передовые системы искусственного интеллекта, предназначенные для понимания и создания текста, похожего на человеческий, на основе вводимых данных.<br>
+Эти модели были обучены на огромных объемах текстовых данных и могут выполнять широкий спектр задач, связанных с языком, таких как ответы на вопросы, проведение бесед, обобщение текста, перевод языков и многое другое.<br>
+* '''Обучение модели LLM'''
+На высоком уровне обучение модели LLM включает в себя три этапа, т. е. сбор данных, обучение и оценку.
+* Сбор данных (Data Collection) Первым шагом является сбор данных, которые будут использоваться для обучения модели. Данные могут быть собраны из различных источников, таких как Википедия, новостные статьи, книги, веб-сайты и т. д.
+* Обучение (Training): Затем данные проходят через обучающий конвейер, где они очищаются и предварительно обрабатываются перед тем, как поступить в модель для обучения. Процесс обучения обычно занимает много времени и требует больших вычислительных мощностей.
+* Оценка (Evaluation): Последний шаг — оценить производительность модели, чтобы увидеть, насколько хорошо она справляется с различными задачами, такими как ответы на вопросы, обобщение, перевод и т. д.
+* Результатом конвейера обучения является модель LLM, которая представляет собой просто параметры или веса, отражающие знания, полученные в процессе обучения. Эти параметры или веса обычно сериализуются и хранятся в файле, который затем может быть загружен в любое приложение, требующее возможностей языковой обработки, например, генерация текста, ответы на вопросы, языковая обработка и т. д.
+* '''Типы LLM'''
+На высоком уровне LLM можно разделить на два типа: - базовые LLM - LLM, настроенные под инструкции.
+* '''Базовые LLM'''
+Базовые LLM — это LLM, предназначенные для предсказания следующего слова на основе обучающих данных. Они не предназначены для ответов на вопросы, проведения бесед или помощи в решении проблем. Например, если вы дадите базовому LLM предложение «В этой книге мы обсудим LLM», оно может завершить это предложение и дать вам «В этой книге о LLM мы обсудим, что такое LLM, как они работают и как вы можете использовать их в своих приложениях. ». Или, если вы дадите ему «Какие известные социальные сети?», вместо ответа он может ответить «Почему люди используют социальные сети?» или «Каковы преимущества социальных сетей?». Как видите, он дает нам соответствующий текст, но не отвечает на вопрос. Именно здесь в игру вступают LLM, настроенные под инструкции.
+* '''LLM, настроенные по инструкции'''
+Instruction Tuned LLM вместо того, чтобы пытаться автозаполнять ваш текст, попробуйте следовать данным инструкциям, используя данные, на которых они были обучены. Например, если вы введете предложение «Что такое LLM?» он будет использовать данные, на которых он обучен, и попытается ответить на вопрос. Точно так же, если вы введете «Какие известные социальные сети?» он попытается ответить на вопрос вместо того, чтобы дать вам случайный ответ.
+* Instruction Tuned LLM построены поверх базовых LLM:
+Instruction Tuned LLMs = Base LLMs + Further Tuning + RLHF
+Для создания LLM с настройкой инструкций берется базовый LLM, который дополнительно обучается с использованием большого набора данных, охватывающего пример «Инструкций» и того, как модель должна работать в результате этих инструкций. Затем модель настраивается с помощью метода под названием «обучение с подкреплением с обратной связью человека» (RLHF), который позволяет модели учиться на обратной связи человека и со временем улучшать свою производительность.
+* '''В итоге'''
+Языковые модели (LLM) произвели революцию в области обработки естественного языка (NLP), позволив машинам понимать и генерировать человекоподобный текст. LLM — это мощный инструмент, который можно использовать для решения широкого круга языковых задач. Они используются в различных отраслях, таких как здравоохранение, финансы, образование и т. д., для автоматизации процессов и повышения эффективности. У LLM есть потенциал революционизировать то, как мы взаимодействуем с компьютерами, и сделать нашу жизнь проще.<br>
+[https://devopsgu.ru/blog/posts/chto-takoe-llm/#llm_4 Источник]
 ==РАЗРАБОТКА==
 ==ИСТОЧНИКИ==
 * [https://vc.ru/ai/881777-spravochnik-po-vyboru-gpu-dlya-raboty-s-bolshimi-yazykovymi-modelyami-llama Справочник по выбору GPU для работы с большими языковыми моделями Llama]
+* [https://habr.com/ru/articles/768844/ Раскрывая секреты LLM: руководство по основным понятиям больших языковых моделей без хайпа]
 ==ПОЛЕЗНОЕ==
 * [https://huyenchip.com/llama-police Большой список open-source AI-моделей и не только]
 * [https://github.com/stars/chiphuyen/lists/cool-llm-repos GitHub open-source AI List]
 * [https://habr.com/ru/companies/first/articles/699380/ Опенсорс учёный: 15 полезных инструментов с искусственным интеллектом и машинным обучением]
+* [https://sysadmin78.ru/doku.php/open_source:open_source_ai_machine_learning 7 лучших ИИ и систем машинного обучения с открытым исходным кодом]
 * [https://hubai.ru/ HuB AI - Рабочие модели]
 * [https://huggingface.co/spaces/Vokturz/can-it-run-llm Требования по ресурсам модель LLM]

Аноним

Поиск

AI или Искуственный Интеллект - разработка и изучение: различия между версиями

Пространства имён

Ещё

Действия на странице

Текущая версия от 07:53, 31 июля 2024

Содержание

ВВЕДЕНИЕ

РАЗРАБОТКА

ИСТОЧНИКИ

ПОЛЕЗНОЕ

Навигация

СИСТЕМЫ

РАЗРАБОТКА

ТЕХНОЛОГИИ

ИНСТРУМЕНТЫ

Навигация

Вики-инструменты

Вики-инструменты

Аноним

Поиск

AI или Искуственный Интеллект - разработка и изучение: различия между версиями

Текущая версия от 07:53, 31 июля 2024

ВВЕДЕНИЕ

РАЗРАБОТКА

ИСТОЧНИКИ

ПОЛЕЗНОЕ

Навигация

Вики-инструменты

Инструменты для страниц