Institute for Computer Science, Artificial Intelligence and Technology (INSAIT) към Софийския университет "Свети Климент Охридски" представи BrokenMath.

Това е първото изследване в света, което показва, че модерните модели за изкуствен интелект масово могат да бъдат подведени в математиката, посочват от института.

dbr.bg-image

Изследването

Представете си, че питате GPT модел дали грешно твърдение е вярно - например „всички прости числа са четни“. Вместо да ви поправи, той може уверено да „докаже“ грешката.

Това поведение, при което моделът проявява сляпо съгласие с човека - дори при очевидна грешка, е сериозен проблем за образователни, научни и други приложения, където истинността е ключова.

Резултатите показват, че дори най-модерните модели, като GPT-5, „доказват“ грешни твърдения в около 29% от случаите. Колкото по-трудна е задачата, толкова по-лесно моделът се подвежда.

Изпробвани са различни подходи за намаляване на този ефект, като промени в начина на задаване на въпросите и допълнително обучение, но засега нито един не решава проблема.

На sycophanticmath.ai ще откриете пълния набор от данни, методологията и статия, описваща изследването, посочват от INSAIT в публикация във Facebook профила си и поздравяват авторите Иво Петров, Джаспър Деконинк, Мартин Вечев.