Сбер открыл доступ к нейросетевой модели для генерации текста на русском языке ruGPT-3.5. Ее дообученная версия лежит в основе сервиса GigaChat.
Банк также выложил новую версию модели mGPT 13B. Она является самой большой из семейства многоязычных моделей Сбера и способна генерировать тексты на 61 языке.
Об модели могут использовать все разработчики, они доступны на депозитарии HuggingFace.
Модели опубликованы под открытой лицензией MIT, лицензия открытого и свободного программного обеспечения, разработанная Массачусетским технологическим институтом.
Андрей Белевцев, старший вице-президент, руководитель блока «Технологии» Сбербанка:
Мы уверены, что публикация обученных моделей подстегнет работу российских исследователей и разработчиков, нуждающихся в сверхмощных языковых моделях, создавать на их базе собственные технологические продукты и решения.
Напомним, что Google тестирует ИИ, который сможет писать новости.