Публикации по теме 'nlp'


Тонкая настройка LLama2.0 с помощью Magic Single GPU от QLoRA
Эффективная настройка собственной языковой модели Введение В области обработки естественного языка произошли невероятные успехи благодаря большим языковым моделям (LLM), таким как ChatGPT. Однако эти модели имеют свои ограничения. Они могут создавать проблемы с конфиденциальностью, придерживаться фиксированного набора правил и быть ограничены датой своего последнего обучения. Другое ограничение для предварительно обученных LLM, таких как PaLM и GPT-3.5, заключается в том, что они..

Помещение Лидса на карту для ИИ
Лидс известен своей яркой технологической сценой , но мало кто знает, что в этом городе Йоркшира находится глобальный центр передового опыта в области ИИ. В Crisp мы лидируем в области искусственного интеллекта, предоставляя решения для некоторых из крупнейших компаний на планете. В течение следующих нескольких лет мы будем инвестировать еще миллионы в наше машинное обучение и развитие искусственного интеллекта, чтобы развить управление рисками в социальных сетях . Мы развиваем наш..

Две минуты НЛП — Таксономия методов токенизации
На уровне слов, на уровне символов, BPE, WordPiece и SentencePiece Токенизация заключается в разделении фразы, предложения, абзаца или всего текстового документа на более мелкие единицы, такие как отдельные слова или термины. В этой статье вы увидите, каковы основные методы токенизации и где они используются в настоящее время. Я предлагаю вам также ознакомиться с этим обзором токенизаторов , сделанным Hugging Face , для более подробного руководства. Токенизация на уровне слов..

Интервью по педагогике НЛП: Джейсон Эйснер (Университет Джона Хопкинса)
Ниже приводится интервью из серии с участием преподавателей, занимающихся обучением обработке естественного языка. Профессор компьютерных наук Университета Джона Хопкинса Джейсон Эйснер побеседовал с нами о курсах, которые он преподавал, включая обработку естественного языка ( 601.465 / 665 ) и машинное обучение: лингвистическое и последовательное моделирование ( 601.765 ). В феврале 2012 года в Центре образовательных ресурсов JHU Джейсона брали интервью о преподавании, и он также..

Полный конвейер генерации гороскопов в виде REST API с использованием GPT Neo, Transformers, Fast API и GCP…
И снова здравствуйте! Если вы пропустили первую часть этой серии, вы можете прочитать ее, нажав на поле ниже. Первая часть посвящена введению в НЛП и обзору проекта в целом. Он также охватывает подготовку данных для обучения, введение в технологии и инструменты, используемые для тонкой настройки модели,…

Еженедельный обзор arXiv #9
Приветствую, Среднее сообщество, В этом выпуске представлены публикации, опубликованные на arXiv с 20 по 26 мая, и представлены идеи и анализ наиболее значимых исследований и тенденций. Давайте погрузимся! Делаем Vision Transformers действительно Shift-эквивариантными Делаем визуальные трансформеры инвариантными к сдвигу. Несмотря на то, что они были вдохновлены сверточно-нейронными сетями (CNN), ViT остаются чувствительными к небольшим сдвигам во входном изображении. Чтобы..

Чтение об искусственном интеллекте: № 7
200 языков в рамках одной модели ИИ: прорыв в области высококачественного машинного перевода NO language Left Behind (NLLB) — это первый в своем роде прорывной проект искусственного интеллекта, который представляет собой модели с открытым исходным кодом, способные обеспечить высококачественный перевод напрямую между любой парой из 200+ языков — включая малоресурсные языки, такие как астурийский, луганда, урду и другие. Он призван помочь людям общаться с кем угодно и где угодно,..