Словарь для ИИ состоит из различных фрагментов видео, которые при обработке позволят программам более точно распознавать то, что чувствует человек. Искусственный интеллект будет использовать для этих целей звук, текст, и визуальные данные — сообщают ученые.
«То, что раньше делал лингвист на основе словаря, теперь делают вычислительные модели, только их словарь должен быть организован по-другому. Вместо пары “слово — толкование” используется пара “текстовый фрагмент — эмоциональная метка”, — рассказала заведующая Лабораторией языковой конвергенции Анастасия Колмогорова.
Созданный датасет — это не просто набор данных, заявляют в НИУ ВШЭ. Он решает сразу несколько важных задач: служит надежным источником для обучения новых моделей, становится инструментом для оценки уже существующих систем и выступает в роли «золотого стандарта» для исследований в области эмоциональной речи на русском языке.
- Нейросети
Источник: hi-tech.mail.ru
