Institute for Computer Science, Artificial Intelligence and Technology (INSAIT) към Софийския университет "Свети Климент Охридски" представи BrokenMath.
Това е първото изследване в света, което показва, че модерните модели за изкуствен интелект масово могат да бъдат подведени в математиката, посочват от института.

Изследването
Представете си, че питате GPT модел дали грешно твърдение е вярно - например „всички прости числа са четни“. Вместо да ви поправи, той може уверено да „докаже“ грешката.
Това поведение, при което моделът проявява сляпо съгласие с човека - дори при очевидна грешка, е сериозен проблем за образователни, научни и други приложения, където истинността е ключова.
Резултатите показват, че дори най-модерните модели, като GPT-5, „доказват“ грешни твърдения в около 29% от случаите. Колкото по-трудна е задачата, толкова по-лесно моделът се подвежда.
Изпробвани са различни подходи за намаляване на този ефект, като промени в начина на задаване на въпросите и допълнително обучение, но засега нито един не решава проблема.
На sycophanticmath.ai ще откриете пълния набор от данни, методологията и статия, описваща изследването, посочват от INSAIT в публикация във Facebook профила си и поздравяват авторите Иво Петров, Джаспър Деконинк, Мартин Вечев.
Новините на Darik Business Review във Facebook , Instagram , LinkedIn и Twitter !
Калкулатори
Най-ново
Vivacom стартира Job Lab: Безплатна програма за развитие на меки умения у ученици
03.02.2026Какво е флаш инфлация и на колко възлиза тя у нас?
03.02.2026Отпускат над €20 млн. за модернизацията на седем болници
03.02.2026Реставрират Античния Форум на Филипопол
03.02.2026Хората зад световната търговия: Над 6 000 изоставени моряци за 2025 г.
03.02.2026Сградата на БНБ в Пловдив става филиал на Археологическия музей
03.02.2026Прочети още
Алгафари: Радев е колеблив! По-добре да не участва никъде!
darik.bgВълков: Радев не е заплаха за БСП!
darik.bgГамизов: Зад Радев стои Русия!
darik.bgЗащо е важно да перем бебешките дрешки с хипоалергенни прахове за пране
9meseca.bg