«Рувики» передала более 1,4 млн текстов на 20 языках народов России для обучения нейросети GigaChat

Интернет-энциклопедия «Рувики» предоставила разработчикам нейросети GigaChat от Сбера более 1,4 миллиона текстов для обучения искусственного интеллекта работе на языках народов России. Переданные материалы содержат информацию о традициях, истории и культуре народов страны, а также энциклопедические знания на их родных языках.

В коллекцию вошли тексты на 20 языках, включая алтайский, башкирский, бурятский, вепсский, горномарийский, ингушский, коми, коми-пермяцкий, марийский, мокшанский, ливви-карельский, татарский, тувинский, калмыцкий, удмуртский, хакасский, чеченский, чувашский, эрзянский и якутский.

Как отметили в энциклопедии, «статьи «Рувики» помогут генеративному искусственному интеллекту в освоении языков народов России, что не только повысит качество генерации текстов на этих языках, но и поможет сохранить уникальное культурное наследие в цифровую эпоху». Этот шаг направлен на сохранение и развитие языкового разнообразия России с помощью современных технологий.

Фото: ТГ-канал «Рувики»

Источник: НацАкцент