Sparrow (бот) (Sparrow (Qkm))
Sparrow | |
---|---|
Тип | виртуальный собеседник |
Разработчик | Google DeepMind |
Sparrow — чат-бот, разработанный исследовательской лабораторией искусственного интеллекта DeepMind, дочерней компанией Alphabet Inc. Он предназначен для того, чтобы правильно отвечать на вопросы пользователей, снижая при этом риск небезопасных и неуместных ответов[1]/ Одним из мотивов создания Sparrow является решение проблемы языковых моделей, производящих неверные, предвзятые или потенциально вредные результаты[2][3]. Sparrow обучается с использованием человеческих суждений, чтобы быть более «полезным, правильным и безвредным» по сравнению с базовыми предварительно обученными языковыми моделями[2]. При разработке Sparrow участникам платного исследования предлагалось взаимодействовать со Sparrow, а также собирались их предпочтения для обучения модели полезности ответа[4].
Чтобы улучшить правильность и помочь избежать проблемы «галлюцинации», Sparrow имеет возможность поиска в Интернете с помощью Google Search[1][3][5], чтобы найти и процитировать доказательства любых заявлений о фактах, которые он делает.
Чтобы сделать модель более безопасной, её поведение ограничивается набором правил, например, «не делать угрожающих заявлений» и «не делать ненавистных или оскорбительных комментариев», а также правил о возможно вредных советах и непритязаниях выдавать себя за человека[1]. Во время исследования участников попросили пообщаться с системой и попытаться обманом заставить её нарушить эти правила[3]. На суждениях этих участников была обучена «модель правил», которая использовалась для дальнейшего обучения.
Sparrow была представлена в сентябре 2022 года в документе под названием «Улучшение согласования диалоговых агентов с помощью целенаправленных человеческих суждений»[6], однако он не был опубликован публично.[1][5] Генеральный директор DeepMind Демис Хассабис сказал, что DeepMind рассматривает возможность выпуска Sparrow в виде «частной бета-версии» где-то в 2023 году[7][8][9].
Обучение
[править | править код]Sparrow — глубокая нейронная сеть, основанная на архитектуре модели машинного обучения "трансформер". Она точно настроена на основе предварительно обученной большой языковой модели DeepMind Chinchilla AI (LLM)[1], которая имеет 70 миллиардов весов[10].
Sparrow обучается с использованием обучения с подкреплением на основе обратной связи с человеком (RLHF)[1][5], хотя также используются некоторые контролируемые методы тонкой настройки. В обучении RLHF используются две модели вознаграждения, учитывающие человеческие суждения; «модель предпочтений», которая предсказывает, что предпочтет участник исследования, и «модель правил», которая предсказывает, нарушила ли модель одно из правил[11].
Ограничения
[править | править код]Корпус обучающих данных Sparrow в основном на английском языке, а это означает, что на других языках он работает хуже.
При враждебной тактике со стороны участников исследования модель нарушает правила в 8% случаев[3], однако это всё ещё в 3 раза ниже, чем у предварительно обученной модели с подсказкой базового уровня (Chinchilla).
См. также
[править | править код]Примечания
[править | править код]- ↑ 1 2 3 4 5 6 Quach. The secret to Sparrow, DeepMind's latest Q&A chatbot: Human feedback . The Register (23 января 2023). Дата обращения: 6 февраля 2023. Архивировано 21 марта 2023 года.
- ↑ 1 2 Quach, Katyanna The secret to Sparrow, DeepMind's latest Q&A chatbot: Human feedback . The Register (23 января 2023). Дата обращения: 6 февраля 2023. Архивировано 21 марта 2023 года.
- ↑ 1 2 3 4 Gupta. Deepmind Introduces ‘Sparrow,’ An Artificial Intelligence-Powered Chatbot Developed To Build Safer Machine Learning Systems . MarkTechPost (28 сентября 2022). Дата обращения: 6 февраля 2023. Архивировано 21 марта 2023 года.
- ↑ Gupta, Khushboo Deepmind Introduces ‘Sparrow,’ An Artificial Intelligence-Powered Chatbot Developed To Build Safer Machine Learning Systems . MarkTechPost (28 сентября 2022). Дата обращения: 6 февраля 2023. Архивировано 21 марта 2023 года.
- ↑ 1 2 3 Goldman. Why DeepMind isn’t deploying its new AI chatbot — and what it means for responsible AI . Venture Beat (23 января 2023). Дата обращения: 6 февраля 2023. Архивировано 29 мая 2023 года.
- ↑ Cuthbertson. DeepMind’s AI chatbot can do things that ChatGPT cannot, CEO claims . The Independent (16 января 2023). Дата обращения: 6 февраля 2023. Архивировано 16 января 2023 года.
- ↑ Cuthbertson, Anthony DeepMind’s AI chatbot can do things that ChatGPT cannot, CEO claims . The Independent (16 января 2023). Дата обращения: 6 февраля 2023. Архивировано 16 января 2023 года.
- ↑ Perrigo. DeepMind’s CEO Helped Take AI Mainstream. Now He’s Urging Caution . TIME (12 января 2023). Дата обращения: 6 февраля 2023. Архивировано 7 апреля 2023 года.
- ↑ Wilson. Google's DeepMind says it'll launch a more grown-up ChatGPT rival soon . Tech Radar (16 января 2023). Дата обращения: 6 февраля 2023. Архивировано 22 апреля 2023 года.
- ↑ Hoffmann. An empirical analysis of compute-optimal large language model training . DeepMind (12 апреля 2022). Дата обращения: 6 февраля 2023. Архивировано 6 апреля 2023 года.
- ↑ Goldman, Sharon Why DeepMind isn’t deploying its new AI chatbot — and what it means for responsible AI . Venture Beat (23 января 2023). Дата обращения: 6 февраля 2023. Архивировано 29 мая 2023 года.
Ссылки
[править | править код]На эту статью не ссылаются другие статьи Википедии. |