Модели ИИ искажают ответы в личностных тестах, чтобы казаться привлекательными
Большинство больших языковых моделей (LLM) быстро понимают, что их просят пройти личностный тест, и корректируют свои ответы, чтобы получить социально желаемые результаты. Это открытие имеет значение для исследований с использованием LLM вместо людей.
Ученые провели для LLM-моделей от OpenAI, Anthropic, Google и Meta классический личностный тест Big 5, измеряющий экстраверсию, открытость новому опыту, добросовестность, доброжелательность и невротизм. Они обнаружили, что LLM, как и люди, искажают ответы, чтобы казаться более привлекательными. Работа опубликована в журнале PNAS Nexus.
Авторы считают, что этот эффект является результатом обучения LLM, где люди выбирают предпочтительный ответ. LLM «понимают», какие личности социально желательны, что позволяет им имитировать эти личности по просьбе.
© 2015-2024 Сетевое издание «Фактом». Зарегистрировано в Федеральной службе по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор).
Реестровая запись ЭЛ No ФС 77 - 67652 от 10.11.2016.